2014
PROSITE
UNIVERSIDAD NACIONAL
AUTNOMA DE MXICO
FACULTAD DE ESTUDIOS
SUPERIORES CUAUTITLN
BIOINFORMTICA
GRUPO: 2001
BIOQUMICA DIAGNSTICA
ALUMNAS:
CASILLAS SILVA KARINA ITZEL
PEDRAZA MELNDEZ ANGLICA ITZEL
PROFESORAS:
M en C MARITERE DOMNGUEZ
ROJAS
pBQD LARISA ANDREA
GONZLEZ SALCEDO
Prosite es una base de datos que proporciona diversa informacin acerca de las
protenas. Puesto puesto que los datos que maneja resultan un tanto
complejos, es necesario antes abordar conceptos que sean de utilidad para su
comprensin e interpretacin.
Protenas: Conformacin estructural, dominios
Las protenas son polmeros lineales de aminocidos. Desempean una gran
cantidad de funciones: estructurales, como el colgeno; transportadoras, como
la hemoglobina o los citocromos; adems de aquellas funciones catalticas que
ejecutan las enzimas y que resultan esenciales en la homeostasis del
metabolismo. En una protena podemos distinguir varios niveles de organizacin.
Una estructura primaria, que hace referencia a la secuencia de aminocidos
en la cadena polipeptdica y en la que se incluyen todos los enlaces covalente
entre diversos residuos; los enlaces peptdicos y los puentes disulfuro.
Una estructura secundaria, que se refiere a las disposiciones regulares en el
espacio de residuos covalentes en la cadena poli peptdica. Ciertas secuencias
de aminocidos favorecen las hlices o las cadenas , as como giros que
conectan unas estructuras regulares con otras. Algunos elementos con
estructura secundaria forman agregados regulares consecutivos que determina
un nivel de organizacin superior, que denominamos estructura supersecundaria
o motivos. Algunos de estos se combinan, generalmente, para formar
compactas estructuras globulares que llamamos dominios.
Un dominio se define, como una parte de una cadena polipeptdica que puede
plegarse independientemente en una estructura terciaria estable. Los dominios
pueden ser tambin unidades de funcin independientes dentro de la
estructura de las protenas.
Los motivos de las protenas se pueden clasificar en 3 grupos principales segn
la manera de conectarse los motivos estructurales.
Dominios alfa: la parte central est constituida exclusivamente por alfa
hlice.
Dominios beta: la parte central est formada por hojas beta
antiparalelas.
Dominios alfa/beta formados por combinaciones que constituyen una
hoja beta paralela rodeada de hlice alfa.
Los dominios tienen una funcin especfica, como la de unirse a una molcula o
llevar a cabo reacciones enzimticas. Pueden presentarse claramente
separados formando zonas lobulares o interaccionar fuertemente con otros
dominios. La relacin entre la estructura de un dominio y la funcin es
compleja, a veces una determinada funcin es realizada por un dominio
individual, mientras que en otras ocasiones la uncin requiere la existencia de
ms de un dominio.
Un ejemplo de un dominio son los dedos de zinc. Son un conjunto de pequeos
motivos estructurales de protenas que pueden coordinar uno o ms iones de
zinc para ayudar a estabilizar sus pliegues.
Un nivel de estructuracin superior a stos es la estructura terciaria, o
disposicin espacial de todos y cada uno de los tomos que componen la
molcula. Una protena con una determinada estructura terciaria puede estar
constituida por uno o varios dominios, que pueden llegar a tener funciones
especficas y separadas. La estructura terciaria constituye el ltimo nivel de
organizacin estructural de una protena monomrica.
Sin embargo, existen macromolculas oligomricas, formadas por la asociacin
no covalente de varias cadenas polipeptdicas. Este nivel de jerarquizacin
superior se llama estructura cuaternaria. Representa, por tanto, la disposicin
espacial de las diversas subunidades de una protena oligomrica.
PROSITE
Prosite es una base de datos que se compone de una gran coleccin de firmas
biolgicamente significativas que son descritas como patrones o perfiles. Cada
firma es vinculada a una documentacin que proporciona informacin biolgica
til sobre la familia de protenas, o del dominio, sitio funcional identificado por
la firma.
La ltima versin de Prosite contiene 1329 patrones y 552 perfiles.
La informacin que se obtiene de Prosite puede ser origen de su nombre,
ocurrencia taxonmica, arquitectura del dominio, funcin, estructura en 3D,
principales caractersticas de la secuencia, tamao del dominio y algunas
referencias.
Los patrones o expresiones regulares son herramientas tiles para identificar
regiones cortas y bien conservadas, tales como los sitios catalticos, sitios de
unin, modificaciones post-transcripcionales (PTMs) o dedos de zinc.
Los perfiles son matrices de puntuacin que se encargan de detectar motivos
similares, es decir, son tablas con scores para cada posicin del motivo y
penalizaciones por apertura de gaps.
Prosite tiene una larga experiencia en la documentacin y anotacin detallada
de los dominios, las familias y los sitios funcionales. Esta informacin se
almacena principalmente en texto y es usada por los bilogos que leen los
diversos documentos y toman sus propias decisiones sobre la funcin de su
protena de inters de acuerdo con las sugerencias de Prosite.
Prosite coincide en UniProt (UniProtKB) o entradas de PDB que estn ya
precalculadas y almacenadas en una base de datos relacionada (PostgreSQL)
que se mantiene en colaboracin con Swiss- Prot.
Actualmente existen varias herramientas para construir perfiles eficientes
sobre la base de MSA. Todas estas herramientas se han diseado para
recuperar protenas muy divergentes.
El link de acceso para el sitio de Prosite es:
http://prosite.expasy.org/
Al acceder a la pgina se observa de la siguiente forma:
Prosite ofrece diversos servicios a los cuales se tiene acceso mediante
pestaas que se encuentran resaltadas en el cuadro de color verde, las cuales
son: ScanProsite, ProRule, Documents, Downloads, Links Y Funding, estos se
explican a detalle ms adelante.
Para realizar una bsqueda se puede utilizar la opcin de Search. En este
cuadro de bsqueda, representado por el cuadro color rojo, se puede
introducir el cdigo de acceso de UniProt, nombre de la protena, dominio, etc.
As mismo tambin se pueden colocar parmetros de bsqueda como son los que
se encuentran en el cuadro azul, esto para facilitar la bsqueda de la
informacin.
Otra forma de realizar una bsqueda puede ser mediante el ingreso de la
secuencia proteica en formato FASTA. sta se coloca en el cuadro de
bsqueda marcado con color morado.
Prosite en su pgina principal permite el acceso a herramientas como lo son:
PRATT: permite generar de forma interactiva los patrones conservados a
partir de una serie de protenas no alineados.
My domains- Imagine creator: permite personalizar la imagen de los dominios.
SCAN PROSITE
Es una herramienta de bsqueda dentro de ProSite que permite buscar por
formato FASTA o por identificador UniProt, adems tambin permite
seleccionar el tipo de bsqueda que se desea hacer. Esta consta de 3 opciones:
Opcin 1 Permite presentar las secuencias de protenas para escanear contra
la coleccin de motivos de PROSITE.
Opcin 2 Permite presentar MOTIVOS y escanearlos contra los almacenados
en esta base de datos.
Opcin 3 - Presentar las secuencias de protenas y motivos para escanear uno
contra el otro.
Para poder llevar a cabo mejor esta bsqueda Prosite gua al usuario por una
serie de pasos, estos son 3:
En el paso 1 es donde se introduce la secuencia de la protena, para esto se
puede realizar de dos formas: Se puede introducir un mximo de 10 secuencias
diferentes a comparar o elegir una base de datos con la informacin de las
secuencias y dada.
Para facilitar y agilizar este paso se proporciona una serie de ejemplos en la
forma en que se tienen que introducir estas secuencias, estos ejemplos esta n
resaltados en color rojo.
En el paso 2 se seleccionan los parmetros de exclusin para el alineamiento,
estos son:
Excluir motivos con una alta probabilidad de ocurrencia
Excluir a los perfiles del escaneo
Correr el escaneo con una alta sensibilidad: Ejecuta la exploracin a
un nivel bajo (muestra coincidencias dbiles).
Cuadro de bsqueda
para introducir en
formato FASTA
Por ltimo el paso 3, aqu se seleccionan las opciones de la forma en que se
presentan los resultados.
Estos pueden ser: En formato grfico, vista simple, texto, FASTA, tabla.
PRORULE
Es una herramienta en la cual se introduce la secuencia en el cuadro de
bsqueda y se permite elegir la opcin de bsqueda deseada. Existen 6
opciones de bsqueda proporcionadas por ProRule.
Las opciones de bsqueda son las que estn resaltadas en un cuadro de color
verde y son las siguientes:
by ProRule description: En esta se encuentran enlistadas de forma alfabtica el conjunto de datos que contiene esta base de datos.
Cuadro
de
bsqueda
Tambin proporciona el ID (Cdigo de identificacin) y AC (Cdigo de
acceso), as como una breve descripcin de cada entrada. Se observa de
la siguiente forma:
by enzyme class: Clasificacin enzimtica de acuerdo a la establecida en el ao de 1964 por la Comisin de Enzimas de la Unin Internacional de
Bioqumica. Dividiendo a las enzimas en 6 grandes grupos:
Al seleccionar uno de los grupos da el acceso a las enzimas que forman
parte de cada grupo.
Descripcin ID AC
by UniProtKB feature key: Entradas de UniProt que tienen informacin en PROSITE, se muestra el nmero de identificacin de UniProt as
como su nombre. Se muestra de la siguiente forma:
by GO term: Permite buscar protenas a partir del componente celular, funcin molecular o por el proceso biolgico en el que participa. Se
observa de la siguiente forma:
Al darle click a una de las 3 opciones se despliegan de manera ms detallada
cada uno de sus componentes.
Nombre Nmero de identificacin
by taxonomic scope: En esta se filtran los resultados de acuerdo a la clasificacin taxonmica.
by PROSITE entry name: Muestra el nombre de la protena en PROSITE contra la descripcin y numero de acceso que ProRule le asigna. Se
muestra de la siguiente forma:
DOCUMENTS
Son una coleccin de documentos que sirven de gua para el usuario dentro de
ProSite tal como el manual para el usuario tanto de Prosite como ProRule y
algunos links a otras pginas.
DOWNLOADS
Se muestran las modificaciones que se han hecho en los ltimos meses a la
pgina y a los manuales que est ofrece. La forma en que se despliega esta
opcin es la siguiente:
LINKS
Presenta links a las pginas de las cuales se obtienen recursos e informacin.
Se muestra de la siguiente forma:
FUNDING
Se muestran los principales colaboradores tanto financieros como de recursos
que ayudaron a la creacin y sustentabilidad de ProSite.
BSQUEDA
Para realizar la bsqueda de una protena se puede realizar mediante el ingreso
de la secuencia de aminocidos de la protena, o el cdigo de UniProt.
Posteriormente Prosite te muestra la secuencia completa de aminocidos de la
protena, en este caso se realiz la bsqueda de la protena BRCA 1:
Tambin se muestra el nombre de la protena completo Breast cancer type 1
susceptibility protein, su nombre alternativo RING finger protein 53, as como
el organismo del que proviene, en este caso Homo sapiens.
En esta seccin se muestran los perfiles de los dominios, en qu lugar se
encuentran y la cantidad de aminocidos, as como un link que permiten acceder
a otras ventanas para poder encontrar ms informacin acerca de estos
dominios. En el caso de esta protena contiene 3 dominios:
2 BRCT: Se encuentra del aminocido 1642-1736y el otro de 1756-1855.
ZF_RING_2: Zinc finger RING-type: Se encuentra del aminocido 24-
65.
En esta parte se muestran los patrones que contiene la protena, en este caso
solo se encuentra 1:
ZF_RING_1: Zinc finger RING-type: Se encuentra del aminocido 39-48.
Su secuencia es: CdHiFCkfCM.
Los patrones son secuencias cortas de residuos que se encuentran conservadas
entre las protenas de diferentes especies.
Prosite permite obtener informacin ms especfica de los dominios y
patrones. A continuacin se muestran los datos obtenidos de cada uno de los
patrones y dominios.
Zinc finger RING-type (ZN_RING_2)
Muchas protenas contienen un RING finger el cual tiene un rol muy importante
en la va de ubiquitinacin. Esta va generalmente involucra 3 tipos de enzimas
E1, E2, E3. En el caso de la protena BRCA 1, contiene a la enzima E3, la cual es
responsable del reconocimiento del sustrato.
Esta es la seccin tcnica del perfil del dominio ZN_RING_2, del cual se puede
obtener la informacin siguiente:
Domain architecture view of Swiss-Prot proteins matching PS50089:
Muestra todas las protenas dentro de Swiss-Prot que poseen el mismo
perfil del dominio o motivo, de manera grfica. En este caso este dominio
se encuentra en 1501 protenas diferentes, entre las cuales estn las
siguientes:
Clustal format, color, condensed view: Se muestra el alineamiento de
secuencias entre especies en la que los aminocidos ms conservados se
muestran ms oscuros en relacin a los menos conservados que son
claros.
Clustal format, color: Se presentan solamente parte de la secuencia del
domino o motivo de estudio que se encuentra ms conservada. Al igual que
en el caso anterior los aminocidos ms conservados se muestran ms
oscuros en relacin a los menos conservados que son claros.
Clustal format, plain text: Se presenta solamente parte de la secuencia
del domino o motivo de estudio que se encuentra ms conservada.
Fasta format: Presenta cada uno de los alineamientos en formato
FASTA.
En los formatos anteriores los - identifican sitios de ausencia de uno o varios
aminocidos, los . Identifican los puntos de semiconservacin entre dos
aminocidos diferentes, y los * identifican a los aminocidos idnticos o
identidad.
Retrieve the sequence logo from the alignment: Muestra grficamente
el grado de conservacin de los aminocidos en un alineamiento entre
secuencias. Dependiendo el grado de conservacin es el tamao de la
letra que representa a cada aminocido.
De acuerdo a los formatos anteriores se puede resumir que los aminocidos que
se encuentran ms conservados de la protena BRCA 1 son Histidina y Cistena.
Matching PDB structures: Nos muestra todas las entradas que coinciden
con la bsqueda y as como informacin del mtodo de obtencin de la
protena y su estructura en 3D.
BRCT domain profile
El gen de susceptibilidad al cncer de mama contiene en su extremo C-terminal
dos copias de un dominio conservado que fue nombrado BRCT de BRCA1 C-
terminal. Este dominio de aproximadamente 95 aminocidos se encuentra en
una gran variedad de protenas implicadas en la reparacin de ADN,
recombinacin y control del ciclo celular. El dominio BRCT no se limita a la C-
terminal de las secuencias de protenas y se puede encontrar en mltiples
copias o en un solo ejemplar como en RAP1 y TdT. Los datos recientes indican
que las funciones de dominio BRCT como un mdulo de interaccin protena-
protena.
Esta es la seccin tcnica del perfil del dominio BRCT, del cual se puede
obtener la informacin siguiente:
Domain architecture view of Swiss-Prot proteins matching PS50172:
Este dominio se encuentra en 1005 protenas diferentes, entre las cuales
estn las siguientes:
Clustal format, color, condensed view:
Clustal format, color:
Clustal format, plain text:
Fasta format:
Retrieve the sequence logo from the alignment:
De acuerdo a los formatos anteriores se puede resumir que los aminocidos que
se encuentran ms conservados de la protena BRCA 1 son Glicina y Arginina.
Matching PDB structures:
Zinc finger RING-type (ZN_RING_1)
Una serie de protenas eucariticas y virales contienen un dominio rico en
cistena conservada de 40 a 60 residuos (llamados C3HC4 dedo de Zinc o dedo
"anillo" ) que se une dos tomos de Zinc. Hay dos variantes diferentes, el tipo
C3HC4 y el tipo C3H2C3 , que est claramente relacionado a pesar del
diferente patrn de cistena / histidina. El ltimo tipo se denomina a veces
como " de tipo dedo RING - H2 " .
Esta es la seccin tcnica del perfil del patrn ZF_RING_1 Zinc finger
RING-type, del cual se puede obtener la informacin siguiente:
El patrn es: C-x-H-x-[LIVMFY]-C-x(2)-C-[LIVMYA]
_ Aminocidos conservados.
_ Cualquier aminocido puede ocupar esta posicin.
_ Aminocidos que pueden ocupar esta posicin.
_ Cualquier aminocido puede ocupar las dos posiciones siguientes.
_ Aminocidos que no pueden ocupar esta posicin.
Top Related