SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

80
SELECCION DE “TEMPLATES” SELECCION DE “TEMPLATES” Y ALINEAMIENTO Y ALINEAMIENTO

Transcript of SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

Page 1: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

SELECCION DE “TEMPLATES” SELECCION DE “TEMPLATES” Y ALINEAMIENTOY ALINEAMIENTO

Page 2: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

Energía

XNativa

Page 3: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

• Búsqueda homólogos con estructura conocida

• Selección homólogos de interés (miembros más cercanos, criterios adicionales)

• Obtención del alineamiento de la secuencia con los homólogos

• Cálculo del modelo • Contraste del modelo • Experimentación• “Feed-back” con el modelo

Page 4: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

Búsqueda de homólogos de Búsqueda de homólogos de estructura conocidaestructura conocida

Page 5: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

SIMILITUD ENTRE SECUENCIAS

INDICA SIMILITUD ENTRE

ESTRUCTURAS Y FUNCION

Page 6: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

HOMOLOGIA Y COMPARACION DE SECUENCIAS

SIMILITUD ENTRE SECUENCIAS

HOMOLOGIA

(Mismo orígen evolutivo)

Page 7: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

ALINEAMIENTO DE SECUENCIAS

AGGVIIIQVGAGGVL-IQVG

AGGVIIIQVG AGGVLIQVG

Page 8: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

IMPORTANCIA ALINEAMIENTO

• Detección homólogos

• Construcción modelo estructural

Page 9: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

Búsqueda de homólogos

SECUENCIA INCOGNITAATTVG...LMN

BASE DE DATOS DE SECUENCIAS

AGLM...WTKRTCGGLMN..HICGWRKCPGL...

Page 10: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

COMPARACION SECUENCIAS

• Construir alineamiento óptimo

• Puntuar candidato

Page 11: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

COMPARACION DE COMPARACION DE SECUENCIASSECUENCIAS

• HOMOLOGIA ALTA: HOMOLOGIA ALTA:

AWTRRATVHDGLAWTRRATVHDGLMMEDEFAAEDEFAA AWTRRATVHDGLAWTRRATVHDGLCCEDEFAAEDEFAA

• HOMOLOGIA BAJA: HOMOLOGIA BAJA:

AWTAWTRRRRATATAWTAWTKLKLATAVVVATAVVVFEFEGLGLCCEDEEDEWGGWGG

VVHDHDGLGLMMEDEEDEFAAFAA

Page 12: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

Búsqueda de homólogos

• PUNTUACION SECUENCIAS BASE DATOS (Proteínas estructura conocida)

• LOCALIZACION CANDIDATO CON MAYOR PUNTUACION

• PREDICCION FUNCIONAL/ESTRUCTURAL POR ASOCIACION/”HERENCIA”

Page 13: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

PROBLEMAS HABITUALES

• Solo hay familiares remotos:

– BAJA SIMILITUD DE SECUENCIA

– DIFICIL TENER BUENOS ALINEAMIENTOS

Page 14: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

ALINEAMIENTO DE SECUENCIAS

• OBTENER EL ALINEAMIENTO OPTIMO

• NECESARIO: – METODO PARA PUNTUAR AMINOACIDOS

COMPARADOS

– METODO PARA CONSTRUIR LOS ALINEAMIENTOS

Page 15: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

MATRIZ DE IDENTIDADES

A C D ...Y

A 1 0 0 ...0C 0 1 0 ...0 .....Y 0 0 .....1

Page 16: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.
Page 17: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

NUMERO TOTAL DE ALINEAMIENTOS

DOS SECUENCIAS DE LONGITUD N Y M:

N + M

N

N = M = 1000 10600

Page 18: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

HERRAMIENTAS BASICAS

• MATRIZ COMPARACION AMINOACIDOS (Dayhoff, 1972)

• ALGORITMOS DE COMPARACION DE SECUENCIAS (Needleman & Wunsch, 1970).

Page 19: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

MATRIZ DE DAYHOFF

log(fij/qi.qj)

PUNTUACION DE LOS AMINOACIDOS ALINEADOS

fij: frecuencia de mutación de residuo i al j

qi, qj: frecuencia de los residuos i, j

Page 20: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

MATRIZ DE DAYHOFF

• REFLEJA LAS PROPIEDADES FISICO-QUIMICAS DE LOS AMINOACIDOS:

propensidades de estructura secundaria

hidrofobicidad

volumen

Page 21: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

MATRICES COMPARACION SECUENCIAS

• BLOSUM62 (Henikoff & Henikoff, 1992): derivada a partir de la comparación bloques de secuencias

• GONNET (Gonnet et al, 1992): alineamiento masivo de secuencias

Page 22: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

ALGORITMO NEEDLEMAN & WUNSCH

R G F QR 1 0 0 0Y 0 0 0 0G 0 1 0 0Q 0 0 0 1

R G F QR 3 1 1 0Y 2 1 1 0G 1 2 1 0Q 0 0 0 1

R_GFQRYG_Q

Page 23: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

GAPS (INSERCIONES/DELECIONES)

• LOCALIZADOS EN LOOPS

Page 24: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

??CandidatoCandidato

Page 25: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

GAPS (INSERCIONES/DELECIONES)

• ESQUEMAS DE PUNTUACION:– DEPENDIENDO DE ESTRUCTURA 2a– VALOR CONSTANTE– FUNCION LINEAL

go + n . gl

Page 26: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

PROGRAMACION DINAMICA

• VENTAJAS: PROPORCIONA UN ALINEAMIENTO REPRODUCIBLE Y OPTIMO

• DESVENTAJAS: ES LENTO

Page 27: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

METODOS SUBOPTIMOS

• 10 – 100 MAS RAPIDOS

• PROPORCIONAN ALINEAMIENTOS SUBOPTIMOS

• BLAST, FASTA

Page 28: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

BLAST

• BLAST (Altschul et al, 1990):

localiza pequeños fragmentos comunes

extenderlos hasta que la puntuación cae

Page 29: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

BLAST

• RAPIDO, segundos EXPLORAR GENBANK, PDB

• FILTROS BAJA COMPLEJIDAD

• INDICES DE FIABILIDAD

Page 30: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

ESTADISTICA

• INDICE DE REFERENCIA:

E: número de falsos positivos esperado

• Búsquedas esporádicas: 0.01 – 0.001

• Búsquedas masivas (anotación genoma) : 10-6

Page 31: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

LIMITES COMPARACION LIMITES COMPARACION SECUENCIASSECUENCIAS

• EXISTENCIA DE PARENTESCOS EXISTENCIA DE PARENTESCOS INDETECTABLESINDETECTABLES

• PREDICCIONES ESTRUCTURALES DE PREDICCIONES ESTRUCTURALES DE BAJA CALIDAD EN MUCHOS CASOSBAJA CALIDAD EN MUCHOS CASOS

Page 32: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

THE TWILIGHT ZONE

• IDENTIDAD INFERIOR AL 25 %

• SIMILITUD ESTRUCTURAL: HOMOLOGIA REMOTA Y ANALOGIA

Page 33: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

THE TWILIGHT ZONE

• HOMOLOGIA REMOTA: ORIGEN EVOLUTIVO COMUN. E.G. HEMOGLOBINAS

• ANALOGIA: CONVERGENCIA ESTRUCTURAL. E.G. HEMOGLOBINA Y COLICINA

Page 34: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.
Page 35: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

USO DE ALINEAMIENTOS MULTIPLES

• SIMILITUD BAJA, DOS SECUENCIAS:SIMILITUD BAJA, DOS SECUENCIAS:

AVTTGLNMWTTAKRPGMDDFYTILLPGLMNCIGLFTAIDMHFFGRKPACEEYFTLVVDGLCNCI

• SIMILITUD BAJA, SECUENCIASMULTIPLES:SIMILITUD BAJA, SECUENCIASMULTIPLES:

ALTTGIDMMWTTAKRPPDMDDYYTIIIPGLLMNCIAVTTGLNMMWTTAKRPPGMDDFYTTILLPGLLMNCIGVTTTGLNMMYFTARRPPGLDEFYTTLVLRTLLCMCLGIFTTDIDMMHFYVKKPPGLDEFFTTLVLRTLLCMAA

GIFTTDIDMMHFYVKKPPGLDEFFTTLVLRTLLCMAA

AVTTGLNMMWTTAKRPPGMDDFYTTILLPGLLMNCIGLFTTALNMMHFFGRKPPACEEYFTTLVVDGLLCNCI

Page 36: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.
Page 37: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

ALINEAMIENTOS MULTIPLES

• RESIDUOS CONSERVADOS: RELEVANTES PARA FUNCION O ESTRUCTURA

• PUNTUACION PONDERA LA CONSERVACION

Page 38: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

PSI-BLAST

• BUSQUEDA UTILIZANDO ALINEAMIENTOS MULTIPLES:– BUSQUEDA BASE DE DATOS– CONSTRUCCION POSITION-SPECIFIC

SCORE– ITERAR

Page 39: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

PSI-BLAST

• PSI-BLAST NO ENCUENTRA LO QUE NO HAY EN LA PRIMERA BUSQUEDA BLAST

• DEFINIR E PARA LA INCLUSION DE SECUENCIAS (0.01)

Page 40: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

THREADING/FOLD RECOGNITION

• ESTRATEGIA SIMILAR COMPARACION DE SECUENCIAS

• USO BASE DE DATOS ESTRUCTURAL

• DIFERENTE PUNTUACION CANDIDATOS

Page 41: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

ATTWV....PRKSCTATTWV....PRKSCT

..........

10.510.5 5.2>> ..........

CANDIDATO SELECCIONADOCANDIDATO SELECCIONADO

Page 42: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

COMPARACION SECUENCIA-COMPARACION SECUENCIA-ESTRUCTURAESTRUCTURA

• EVALUAR “EL GRADO DE AJUSTE DE LA SECUENCIA A LA ESTRUCTURA”

• UTILIZAR PROPIEDADES DIVERSAS: DISTANCIAS INTERRESIDUO, ESTRUCTURA SECUNDARIA, ETC

Page 43: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

Selección templates: uso Selección templates: uso información adicionalinformación adicional

Proyecto: 2HNQ ....HYTTWPDFGVP...

CANDIDATO: 1YTS ....HVGNWPDQTAV...

Proyecto: 2HNQ .....HCSAGIGRS...

CANDIDATO: 1YTS .....HSRAGVGRT...

................

1YTS, 2HNQ: TIROSINA-FOSFATASA1YTS, 2HNQ: TIROSINA-FOSFATASA

Page 44: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

SELECCION “TEMPLATES”

• Varios candidatos, similitudes bajas (30% - 35 %)

• Bibliografía: sólo SSAO en H.Polymorpha y E.coli con TPQ en orientación correcta (modelos previos erróneos).

Page 45: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

RESTRICCIONES CENTRO ACTIVO

Page 46: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

SELECCION “TEMPLATES”

• Preferible X-ray sobre NMR

• Uso información experimental (e.g. centro activo)

• Preferible sin ligandos unidos, o generar dos modelos

• Vigilar la presencia de contactos en el cristal

• Preferible nativo sobre mutante

Page 47: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

EL ALINEAMIENTO

Page 48: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

ALINEAMIENTOS

• SECUENCIA - CANDIDATO

• Entre candidatos estructurales

Page 49: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

ALINEAMIENTO ENTRE CANDIDATOS

• Alineamientos estructurales, ya disponibles (HOMSTRAD), mediante software (SAP, Taylor & Orengo, 1989).

• Mejor pocos candidatos estructurales, y similares

Page 50: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

ALINEAMIENTO TEMPLATES

Page 51: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

ALINEAMIENTO SECUENCIAS-CANDIDATOS

• Relación entre similitud estructural y % identidad

• Límite inferior del modelado: 30 %

• Porcentaje diseño de fármacos: > 70 %.

Page 52: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

Similitud secuencia - estructura

Rms

% Ident.

Page 53: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.
Page 54: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.
Page 55: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.
Page 56: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.
Page 57: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.
Page 58: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.
Page 59: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.
Page 60: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

EL ALINEAMIENTO

• Baja similitud de secuencia => alineamiento baja calidad

• Número de resíduos alineados => limita calidad modelo (NW en GCG vs. BLAST)

Page 61: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

Energía

XNativa

Page 62: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

Energía

XNativa

Page 63: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

Energía

XNativa

Page 64: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

Energía

XNativa

Page 65: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

Energía

X

Nativa

Page 66: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

ALINEAMIENTO Y MODELADO

Nativa

Modelo

Page 67: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

CALIDAD ALINEAMIENTO

• Uso de potenciales fuerza media (PROSA)

• Uso de propiedades composicionales (GCG)

• Análisis de propiedades locales

Page 68: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.
Page 69: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.
Page 70: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.
Page 71: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.
Page 72: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

CALIDAD DEL ALINEAMIENTO

• Test globalTest global: comparar la secuencia con N pérmutas (N=1000).

• Calcular el Z-score resultante

• Si (alineamientos 100-200 aas):• Z > 15 Ideal

• 5 < Z <= 15 70 % resíduos core bien alineados

• Z <= 5 Problemáticos

Page 73: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

HHHHH--------HHHHHHHHHH-----HHHHHHHHHHHH-------HH

LYLTIHSDHEGGNVSAHTSHLVGSALSDPYLSFAAAMNGLAGPLHGLAN

LMVKVLDAVRGSPAINVAVHVFRKAADDTWEPFASGKTSESGELHGLTT

EEEEEEE----EE----EEEEEEE-----EEEEEEEE-----EE-----

• Alineamiento: citrate synthase - transthyritin

• Z-score: 7.55

Page 74: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

CALIDAD LOCAL

• Zonas mayor calidad: independientes de pequeños cambios en los parámetros del alineamiento (posible utilizando GCG)

• Zonas de mayor calidad: presentes en los alineamientos subóptimos

Page 75: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

ALINEAMIENTOS SUBOPTIMOS

• Zonas comunes en los alineamientos subóptimos son las más fiables: alinear ALLIM vs. ALLM

Sc. 7 Sc.6

ALLIM ALLIM

ALL-M AL-LM

Page 76: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

Alineamiento localAlineamiento local

Proyecto: 2HNQ ....HYTTWPDFGVP...

CANDIDATO: 1YTS ....HVGNWPDQTAV...

Proyecto: 2HNQ .....HCSAGIGRS...

CANDIDATO: 1YTS .....HSRAGVGRT...

................

1YTS, 2HNQ: TIROSINA-FOSFATASA1YTS, 2HNQ: TIROSINA-FOSFATASA

Page 77: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

ALINEAMIENTO LOCAL

• Presencia de motivos PROSITE

• Adicionalmente: fijar estructura del motivo al construir el modelo.

Page 78: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

ESTRATEGIA

• Utiliar siempre que sea posible:

– Alineamientos estructurales para los templates (vigilar orígen: alineamientos sencillos o múltiples)

– Alineamientos múltiples (e.g. Pfam) para alinear la secuencia a los templates

– Análisis visual

Page 79: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

•Obtener alineamiento Pfam SSAO

•Obtener alineamiento HOMSTRAD 1spu, 1a2v de Pfam

•Eliminar 1spu, 1a2v de Pfam

•Alineamiento Homstrad con Pfam mediante CLUSTALW

ALINEAMIENTO SSAO RATON CON LAS TEMPLATES

Page 80: SELECCION DE “TEMPLATES” Y ALINEAMIENTO. Energía X Nativa.

CONCLUSIONES: SENTIDO COMUN !!

• Analizar la calidad de los candidatos: ello decide el límite del modelado y del problema

• Examinar el alineamiento, y eventualmente generar varios modelos (buscar consistencia con datos experimentales)