Predicción de la estructura tridimensional de proteínas

download Predicción de la estructura tridimensional de proteínas

If you can't read please download the document

description

Predicción de la estructura tridimensional de proteínas. Dr. Alfonso Méndez Tenorio. Métodos para la predicción de estructura tridimensional (3D). - PowerPoint PPT Presentation

Transcript of Predicción de la estructura tridimensional de proteínas

  • Prediccin de la estructura tridimensional de protenasDr. Alfonso Mndez Tenorio

  • Mtodos para la prediccin de estructura tridimensional (3D)Modelacin por homologa (homology modeling): Si la similitud es mayor al 30% un alineamiento de secuencias puede utilizarse para llevar a cabo un alineamiento estructural.Enrollamiento (threading): Hay familias de protenas con plegamientos especficos. Se busca cual es la familia con la que encaja mejor el ncleo de la protena.ab-initio: Se trata de predecir la estructura a partir de los valores de las interacciones atmicas.

  • Pasos a seguir en la modelacin por homologaReconocimiento del molde y alineamiento inicial.Correccin del alineamiento.Generacin de la cadena principal.Modelacin de rizos.Modelacin de la cadenas laterales.Optimizacin del modelo.Validacin del modelo.

  • 1fdx AYVINDSC-- IACGACKPEC PVNIIQGSI- -YAIDADSCI DCGSCASVCP VGAPNPED5fd1 AFVVTDNCIK CKYTDCVEVC PVDCFYEGPN FLVIHPDECI DCALCEPECP AQAIFSED *.*. *.* * * **. . . * .* ** **. * . ** * .** 1fdx sss hhh sss sss hhhhh sss 5fd1 sssss hhh sssss sssss hhhh sssss

    1fdx 5fd1Prediccin de estructura tridimensional por modelacin por homologa. La estructura tridimensional de la ferrodoxina de Azotobacter vinelandii es conocida (No. Acceso PDB: 5fd1). Esta estructura se utiliz para predecir la estructura de la ferrodoxina 1fdx (no conocida). En este tipo de prediccin se hace un alineamiento estructural entre las dos secuencias, el cual se refina tomando en cuenta las interacciones entre los tomos. En este caso la estructura a modelar es mas pequea y se muestra tambin la prediccin de la estructura secundaria (s=beta plegada, h=alfa hlice). Prediccin llevada a cabo con los programas Modeller version 6 y DeepView..

  • Distribucin de arquitecturas de dominios.

  • Descripcin de la red neuronal implementada en GenTHREADER

  • Ejemplo de GeneTHREAD

  • Validacin de predicciones de estructura tridimensional

  • Crecimiento de la base de datos PDB (1972-2005)

  • Algunas definiciones importantes.Factor R: Es una medida de las diferencias entre los factores de la estructura calculados a partir del modelo y aquellos obtenidos de los datos experimentales (una medida de las diferencias en los patrones de difraccin observados y calculados). Entre ms pequeo sea este valor mejor se ajusta el modelo a los datos experimentales (se desea que el factor R < 0.2). Factor G: Es una medida de que tan apropiada o inusual es una propiedad estereoqumica. Se calcula como logaritmo de probabilidad a partir de estructuras observadas.

  • Patrn de difraccin experimental y calculado

  • Algunas definiciones importantes.Desviacin de la raiz cuadrada de las medias (RMSD): Es una medida para verificar el ajuste entre dos molculas.

    Radio de van der Waals: Se puede interpretar como la mitad de la distancia entre dos tomos (del mismo elemento) en donde la fuerzas de atraccin y repulsin estn balanceadas exactamente.Superficie de van der Waals: Es una esfera que recubre cada tomo y cuyo radio es igual al radio de van der Waals.Superficie de densidad electrnica: Una capa que rodea un tomo en donde se concentra la mayor densidad de electrnica (derivada de la teora cuntica).

    dist=Distancia entre pares de tomos

  • Las estructuras PDB en bases de datos pueden tener errores.Algunas estructuras depositadas en bases de datos como el PDB pueden tener errores, los cuales puden ser menores o tpicos (la estructura es en general correcta pero tiene algunos errores aleatorios experimentales) o serios (cadena polipeptdica incorrecta, asignacin de estructura secundaria incorrecta, coneccin equivocada de los elementos de la estructura secundaria).Para modelacin se requiere escoger moldes de buena calidad (resolucin < 2, Factor R < 0.2).

  • Algunos errores serios de estructuras PDB

  • Modelos protena nsp13 SARSCell, Vol. 113, 701702, June 13, 2003.

  • Tipos de pruebas de validacinCaractersticas estereoqumicas de la protena (Procheck, What If).Contactos entre residuos (What if, Probe).Parmetros energticos y campos electrostticos (Potencial de Campo de Fuerza, Energa Optimizada Discreta de la Protena-DOPE) (ProSa-II, Modeller).Pruebas de ajuste entre modelos (RMSD).

  • Pruebas para verificar una estructura.Dichas pruebas se pueden llevar a cabo sobre estructuras PDB reales, o bien sobre modelos de molculas. Generalmente los valores de las pruebas tienen valores normales basados en una compilacin de datos de estructuras validadas.Es factible que en estructuras correctas se presenten algunas variaciones con respecto a valores tpicos. Dichas variaciones no necesariamente indican que el modelo sea incorrecto (pueden ser variaciones reales, por ejemplo conformaciones especiales en el sitio activo).Sin embargo, cuando se presenta una gran cantidad de anormalidades en la estructura esto generalmente indica que hay defectos graves en el modelo o que este es incorrecto.

  • Pruebas de validacin con Procheck (I-III)Grficas de Ramachandran: Valores de los ngulos Psi-Phi para todos los aminocidos (excepto Gly y Pro). Idealmente se espera que al menos 90% de los aminocidos se encuentren en las regiones mas favorables que se observan comnmente en las protenas. Grficas de Ramachandran de cada residuo. Se presentan las grficas por separado para cada aminocido. Las reas favorables en cada grfica fueron derivadas de un conjunto de 163 protenas no homlogas cristalizadas y analizadas con alta resolucin. Los aminocidos localizados en regiones desfavorables son marcados en cada grfica. Grficas Chi1-Chi2: Muestra los ngulos de torsin chi1 y chi2 de las cadenas laterales para todos los tipos de residuos con grupos R lo suficientemente grandes para tener ambos ngulos. Se destacan aquellos residuos con valores inusuales de los ngulos.

  • Pruebas de validacin con Procheck (IV)Parmetros de la cadena principal. Las seis grficas muestran como la estructura (representada por el cuadro negro) se compara con estructuras refinadas de resolucin similar. La banda obscura representa resultados de las estructuras refinadas. La lnea del centro representa la media y el ancho de la banda es equivalente a una desviacin estndar de la media (en algunos casos la tendencia depende de la resolucin). Se analizan 6 propiedades:Calidad de la grfica de Ramachandran.Planaridad del enlace peptdico (desviacin estndar del ngulo de torsin omega).Interacciones incorrectas de no unin (nmero de contactos incorrectos por 100 residuos).Distorsin tetrahdrica (desviacin estandar del ngulo de torsin zeta).Energa de puentes de hidrgeno de la cadena principal.Factor G total. Medicin de la normalidad total de la estructura (es el promedio de los factores G de cada residuo).

  • Pruebas de validacin con Procheck (V)Parmetros de la cadena lateral: Incluye 5 grficas que muestran como la estructura se compara con otras de la misma resolucin (similar interpretacin a la anterior). Se analizan las siguientes propiedades:Desviacin estndar del ngulo de torsin negativo chi 1 menos impedido.Desviacin estndar de los ngulos de torsin trans.Desviacin estndar de los ngulos de torsin chi1 ms impedidos.Desviacin estandar ponderada de todos los ngulos de torsin chi 1Desviacin estndar de los ngulos de torsin chi 2 trans.

  • Pruebas de validacin con Procheck (VI)Propiedades de los residuos. Incluye varias pruebas:a-c muestran algunas propiedades opcionales que pueden seleccionarse de 14 pruebas distintas. Se resaltan valores inusuales (mas all de 2 deviaciones estndar de los valores ideales).d muestra asignaciones de la estructura secundaria segn Kabash y Sander (1983) (hlices H G y cadenas plegadas E). El sombreado denota una aproximacin a la accesibilidad. e muestra la secuencia y el sombreado indica si los ngulos de cada residuo se encuentran en regiones favorables o no.f muestra un histograma con desviaciones estandar mximas de algunas propiedades para cada residuo. Las propiedades evaluadas se describen en un archivo out (longitudes de enlace, por ejemplo). g muestra factores G de cada residuo. Los cuadros obscuros denotan factores inusuales.

  • Pruebas de validacin con Procheck (VII-VIII)Distribuciones de las longitudes de enlace de la cadena principal. Los histogramas muestran distribuciones de las longitudes de enlace en la cadena principal para toda la estructura. Se resaltan valores que se alejan ms all de 2 desviaciones estandar. Algunas veces aparecen flechas indicando que algunos valores han salido incluso de la grfica. Desviaciones importantes se muestran en las grficas de simetrias distorsionadas.Distribuciones de los ngulos de enlace en la cadena principal. Similar a la anterior solo que aqu se presentan valores para los ngulos de enlace de la cadena principal.

  • Pruebas de validacin con Procheck (IX-X)Distancias RMS a la planaridad. Las graficas muestran distancias RMS (desviaciones) a la planaridad de diferentes grupos normalmente planos aromticos (Phe, Tyr, Trp, His) y grupos planares terminales (Arg, Asn, Asp, Gln, Glu). Las desviaciones mximas por defecto son 0.03 y 0.02 y se resaltan valores inusuales.Grficas de geometras distorsionadas. Se muestran todos aquellos grupos con longitudes y angulos de enlace de la cadena principal que presentan valores inusuales (distorsionados). Se presenta el valor ideal, el obtenido y la diferencia entre ambos.

  • Pruebas de validacin con What IfVerificacin de ngulos de enlace.Verificacin longitudes de enlace (dos partes: una compara los valores con datos normales y otra verifica si hay direccionalidad significativa que indicara un refinamiento inadecuado de la estructura de rayos X).Anlisis de donadores de puentes de hidrgeno enterrados (no accesibles por el solvente).Anlisis de choques. Verifica superposiciones de cada residuo que sobrepasen sus radios de van der Waals. Verificacin de nombres de cadenas. Verifica tramos discontinuos de residuos con el mismo nombre de cadena.Verificacin del desplazamiento (flip) de los planos del enlace peptdico. Las desviaciones de la planaridad son comparadas con una base de datos.Verificacin de nomenclatura. Se detectan nombres que no se ajusten a las convenciones de la IUPAC.

  • Pruebas de validacin con What IfAnlisis de quiralidad. Verifica la quiralidad de un tomo expresada en la forma de dihedros impropios A-X-Y-Z para un tomo A con tres atomos conectados X-Y-Z. El valor es de 35 para atomos quirales y 0 si la configuracin es plana. Se destacan residuos con valores inusuales.Anlisis del doblaje de Prolinas. Las prolinas pueden tener dos conformaciones llamadas anterior y posterior. Se listan casos de conformaciones inusuales.Verificacin de calidad. Se asigna un valor para cada residuo y uno para toda la estructura. El resultado representa la calidad del empacamiento. Se evala si cada residuo se encuentra en medio de residuos favorables o desfavorables. El valor global menor de 3 indica que la protena no es globular, -3 a 2 mal refinamiento, -2 a 1 baja resolucin o protena modelada, mayor que 1 la protena es aparentemente globular.

  • Pruebas de validacin con What IfVerificacin de rotmeros de la cadena principal. Si la conformacin del rotmero se acerca a los de la base de datos, su valor ser cercano a 1, si est muy alejada, su valor se acercar a 0.Verificacin de simetra, verifica la informacin presente en las secciones CRYST1 y SCALE en el archivo PDB.Verificacin de los ngulos de torsin. Se verifican los ngulos de torsin de todos los residuos excepto para los C y N terminales y se comparan con los de una base de datos. La desviacin no debe ser mayor que 2 desviaciones estandar de la media.Posicin del agua. Se verifica la disposicin de grupos de molculas de agua entorno a la protena.Ocupacin atmica. Todas los grados de ocupacin de los tomos deben estar entre 0 y 1.

  • Prueba de los contactos entre todos los tomos.Es una prueba relativamente reciente (1999). De una estructura se adicionan todos los tomos de hidrgeno (los cuales muchas veces se omiten en los modelos PDB) y se optimizan sus posiciones (programa Reduce). Se evalan todos los contactos entre los tomos a partir de los radios de van der Waals y se almacena la estrutura como kinemage (programa Probe).El programa Mage lee la estructura y la muestra utilizando un cdigo de colores en el cual los contactos correctos se muestran en verde, contactos aceptables se ilustran en color amarillo o anaranjado y los contactos incorrectos se representan en color rojo.

  • DOPE (Discrete optimized protein energy)Es un valor valor estadstico de la energa potencial de la protena). Podemos considerarla la energa potencial del plegamiento de la protena el cual depende de la posicin de cada uno de los aminocidos.Los potenciales DOPE para protenas con la misma estructura y alto grado de similitud son muy similares. Por lo tanto, la energas del modelo y molde deben ser muy similares. Sitios en los cuales la energa del modelo se diferenca grandemente de la del molde corresponden generalmente a regiones incorrectamente modeladas.

  • Otras pruebas para verificar una estructura.Pruebas de dinmica molecular.Pseudoenerga, energa potencial media o energa de enrrollamiento. Valores de estas energas mayores que cero indican que tal arreglo de los residuos no fue observado en las protenas empleadas para el entrenamiento del modelo. Energa de campo: Una mediad emprica del campo energtico de cada residuo. El clculo se basa en el mtodo de Gromos96. Valores mayores que cero permiten visualizar residuos con geometras incorrectos o con contactos incorrectos muy cercanos.