Análisis filogenético y Construcción de dendrogramas

51
Análisis filogenético y Construcción de árboles

Transcript of Análisis filogenético y Construcción de dendrogramas

Page 1: Análisis filogenético y Construcción de dendrogramas

Análisis filogenético y Construcciónde árboles

Page 2: Análisis filogenético y Construcción de dendrogramas

Lectura de un árbol filogenético: Significado de los grupos monofiléticos

Un árbol filogenético es un diagrama que representa la línea de descendencia evolutiva de las diferentes especies, organismos o de los genes de un ancestro común

Page 3: Análisis filogenético y Construcción de dendrogramas

Lectura de un árbol filogenético: Significado de los grupos monofiléticos

Estas filogenias tienen como fin apreciar las abrumadoras evidencias que apoyanla teoría de la evolución propuesta por Charles Datrwin, quien fue uno de losprimeros científicos en utilizarlas para explicar sus estudios.

Page 4: Análisis filogenético y Construcción de dendrogramas

Lectura de un árbol filogenético: Significado de los grupos monofiléticos

¿Qué es exactamente una filogenia?

¿Cómo se deben leer e interpretar estos diagramas?

¿Cómo se construyen este tipo de diagramas?

Lo representado en un árbol filogenético

Page 5: Análisis filogenético y Construcción de dendrogramas

Cuatro ranitas de Darwin

Cuatro ranitas de Darwin (fila superior)Conectadas con sus padre (fila inferior)

B

A G4

G3

Page 6: Análisis filogenético y Construcción de dendrogramas

2013

2012

2011

2010

2009

G5

G4

G3

G2

G1

En varias generaciones, cada individuo dará lugar a unnúmero variable de crías por generación.

Page 7: Análisis filogenético y Construcción de dendrogramas

Eliminando las imágenes de los individuos, el recuadro anteriorse inserta en una población mayor con más unionesgeneracionales.

Page 8: Análisis filogenético y Construcción de dendrogramas

En una escala de tiempo evolutiva, la migración de genes entre laspequeñas poblaciones, entretejiendo los linajes, llevándolos aconformar una sola especie.

Page 9: Análisis filogenético y Construcción de dendrogramas

VICARIANZADurante la evolución muchas veces los linajes sufren dedivisiones a causa de un fenómeno conocido comoVICARIANZA

• Aislamientos• Migraciones• Fenómenos ambientales

Page 10: Análisis filogenético y Construcción de dendrogramas

Como consecuencia de la VICARIANZA, los linajes que sedesarrollan separadamente con cada vez más diferentes,hasta el punto en que pueden llegar a conformar especiestotalmente diferentes.

Page 11: Análisis filogenético y Construcción de dendrogramas

Ejemplo: Pinzón de las Islas Galápagos o Pinzón de Darwin.

Este fue uno de los ejemplos más importantes presentados porCharles Darwin como prueba de su teoría de la evolución de lasespecies.

Page 12: Análisis filogenético y Construcción de dendrogramas

¿Cómo clasificar las especies?

Page 13: Análisis filogenético y Construcción de dendrogramas

BA

A B C D

Pasado

Futuro

Cuatro especies descendientes

Linaje único ancestral

Linaje extinguido

Page 14: Análisis filogenético y Construcción de dendrogramas

A B C D

Ancestro común de A, B, C y D

Ancestro común de C y D

Ancestro común de A y B

Representación de la clasificación de cuatro especies (A, B, C, D).Las especies A y B comparten un ancestro común más recienteque con las especies C y D. Si la relación fuese entre A y C, A y D,B y C o bien B y D, el ancestro común sería el círculo amarillo. Delmismo modo, C y D comparten un ancestro en común másreciente entre si que el de las especies A y B.

Page 15: Análisis filogenético y Construcción de dendrogramas

El léxico de un árbol filogenético

Page 16: Análisis filogenético y Construcción de dendrogramas

Bacterias Aves Marsupiales HOMO

Nodo(Evento de especiación)

Terminales/Taxa

Raíz(normalmente sin etiqueta)

Organismos individuales,especies o grupos deespecies. Siempre ycuando representen unarama separada del árbol.En ciertos contextospueden corresponder agenes individuales.

Page 17: Análisis filogenético y Construcción de dendrogramas

Mamíferos Lagartos Cocodrilos Aves

Clado o grupo monofolético

Un clado es una pieza de una filogenia que incluyeun linaje ancestral y todos los descendientes de eseancestro. Este grupo ancestral tiene la propiedad dela MONOFILIA, por lo que también puede ser referidocomo un grupo monofilético.

Un grupo monofiletico puede ser identificado visualmenteya que es un pedazo de un árbol grande que puede sercortado de raíz con un solo corte.

Page 18: Análisis filogenético y Construcción de dendrogramas

Grupo no monofolético

Mamíferos Lagartos Cocodrilos Aves

Si un árbol tiene que ser cortado en dos lugares paraextraer un determinado conjunto de taxones, los taxonesconstituyen un grupo NO Monofilético.

Page 19: Análisis filogenético y Construcción de dendrogramas

Mamíferos Lagartos Cocodrilos Aves

Actualmente se incluye a las Aves dentro del cladoReptilia.

Page 20: Análisis filogenético y Construcción de dendrogramas

¿Cómo se lee un árbol filogenético?

Page 21: Análisis filogenético y Construcción de dendrogramas

B C DA B C DA

B

C DA

Un árbol filogenético representa la historia de la ramificación de un ancestrocomún. En este contexto debe quedar en claro que lo importante es laramificación y no lo importante de las ramas (a menos que se indique).

En la figura, todos los árboles contienen la misma información.

Page 22: Análisis filogenético y Construcción de dendrogramas

A B C D A

B

C

D

D

Regla general• Rotar• Girar• TorcerSin llegar a cortar la línea

Del mismo modo, distintos diagramas pueden representar la misma informaciónpero de distintas maneras.

Los árboles representan líneas evolutivas que no poseenforma, por lo que pueden ponerse los orígenes tanto en lapunta izquierda o derecha de la imagen sin alterar elresultado final de la línea

Page 23: Análisis filogenético y Construcción de dendrogramas

ABCDE A BCDE A B CD E

Page 24: Análisis filogenético y Construcción de dendrogramas

Cladograma : es el modelo básico y simplemente muestra la distancia al ancestro común entérminos relativos. Las ramas son de igual longitud por lo cual no indican el tiempo evolutivo.

Filograma : contiene información adicional dada por la longitud de las ramas. Los númerosasociados con cada rama corresponden a un atributo de las secuencias, tal como cantidad decambio evolutivo. Es aditivo. Métricos.

Dendrograma : tipo especial de árbol aditivo en el cual los extremos del árbol son equidistantes dela raíz y son proporcionales al tiempo de divergencia.

D

A

C

B

Sin medición

D

A

C

B

Cambio genético

6

1

5

1

1

3

D

A

C

B

Tiempo

Cladograma Filograma Dendrograma

Page 25: Análisis filogenético y Construcción de dendrogramas

Construcción de arboles filogenéticos

Page 26: Análisis filogenético y Construcción de dendrogramas

Datos a utilizar:

• Polimorfismos de restricción.

• SNPs

• Secuencias de ADN.

• Secuencias de ARN.

• Polimorfismos de longitud.

AGCGAGAGCGAGGATGACGGCTGGGAGATTGGGTATCTCGACCGGACGTCAGCGATAGTGAGGATGACGGCTGGGATATTGGGTATCTCGACCGGTCCTCAGCGATAGTGAGGATGACGGCTGGGATATTGGGTATCTCGACCGGTCCTCAGCGAGAGCGAGGATGACGGCTGGGAGATTGGGTATCTCGACCGGACGTCAGCGAGAGCGAGGATGATGGCTGGGAGATTGGGTATCTCGACCGGACGTC

TCAGAAATTGAAAGGGCTGTTACCCATTGAAGAAAAGAAAGAAAAATTTATCAGAAATTAAAAAGGTCTTTACCCGTTGAAGAGAAGACCGAGACATTTATCAGAAATTAAAAAGGTCTTTACCCGTTGAAGAGAAGAACGAAACATTCATCAGAAATTGAAAGGGCTGTTACCCATTGAGGAAAAGAAAGAAAAATTTATCAGAAATTGAAAAGGCTATTACCCATTGAAGAAAAGAAAGAAAAATTTA

Page 27: Análisis filogenético y Construcción de dendrogramas

Principales métodos

1. Métodos por distancia

2. Máxima parsimonia

3. Máxima verosimilitud

Neighbor-Joining (Matrices no ultramétricas, árbol sin raíz)

UPGMA (distancias ultramétricas, árbol con raíz)

A B C

A

B

C

D

Page 28: Análisis filogenético y Construcción de dendrogramas

1. Métodos por distancia

Page 29: Análisis filogenético y Construcción de dendrogramas

• Si el árbol tiene raíz, la distancia es ultramétrica

Dados tres taxones cualesquiera, A,B,C, se tiene:

1. Hay uno que equidista de los otros dos. (En el casode la figura, el A)

2. Esa distancia es mayor que la distancia entre los dosrestantes.

dAC = v1 + v2 + v4 = v1 + v2 + v3 = dAB > dBC

• La distancia medida en un árbol es “aditiva”

Page 30: Análisis filogenético y Construcción de dendrogramas

ABCDE

MATRICES DE DISTANCIA

Page 31: Análisis filogenético y Construcción de dendrogramas

0 6 8 86 0 8 88 8 0 08 8 2 0

A B C D

A

B

C

DA B C D

1

3 3

3

1 1

MATRICES DE DISTANCIA

Page 32: Análisis filogenético y Construcción de dendrogramas

A

Pi k

HI

HS

HS

Hi Hi

HS HS

HT

Hi

Representa la disminución de la heterocigosis originada porel apareamiento aleatorio a nivel metapoblacional .

Representa la disminución de la heterocigosis originada por elapareamiento aleatorio a nivel intra-subpoblacional . Puedealcanzar valores positivos (déficit de heterocigotos), negativos(exceso de heterocigotos) o, simplemente 0, cuando laspoblaciones se encuentran en equilibrio de Hardy-Weinberg,situación en la que FIS coincide con el coeficiente deconsanguineidad.

Este parámetro se denomina índice de fijación yrepresenta la disminución de la heterocigosisoriginada por el apareamiento aleatorio a nivel inter-subpoblacional . Oscila entre 0, cuando todas laspoblaciones tienen las mismas frecuencias génicas y1 cuando las poblaciones están fijadas para alelosdistintos, es decir son diferentes.

El tratamiento jerárquico de las poblaciones subdiv ididas.

Paso 2 : Definición de los estadísticos F de Wright.

Page 33: Análisis filogenético y Construcción de dendrogramas

FST

FST FST

FST FST FST

A B C D

ABCD

A B C D

MATRICES DE DISTANCIA (FST)

Page 34: Análisis filogenético y Construcción de dendrogramas

REYNOLDS, WEIR Y COCKERHAM DE 1983Esta medida supone que surjan diferencias genéticas debido a que solo la derivagenética.

COEFICIENTE DE DIVERGENCIA ENTRE POBLACIONES (GST; NEI, 1978)Similar al FST aunque permite incluir un número ilimitado de alelos por loci.

DISTANCIA GENÉTICA ESTANDAR DE NEI (1972)Esta medida supone que las diferencias surgen debido a mutaciones genéticas yla deriva genética.

DISTANCIAS GENÉTICASINDICE DE FIJACIÓN (FST: WRIGHT 1951)Representa la disminución de la heterocigosis originada por el apareamientoaleatorio a nivel inter-subpoblacional. Oscila entre 0, cuando todas laspoblaciones tienen las mismas frecuencias génicas y 1 cuando las poblacionesestán fijadas para alelos distintos, es decir son diferentes.

Page 35: Análisis filogenético y Construcción de dendrogramas

COEFICIENTE DE DIVERGENCIA ENTRE POBLACIONES (GST; NEI, 1978)

Esta medida supone que las diferencias surgen debido a mutaciones genéticas y la deriva genética.

MATRICES DE DISTANCIA

DST = HT - HS

GST = DST + HT

Diversidad entre poblaciones

Coeficiente de divergencia

Page 36: Análisis filogenético y Construcción de dendrogramas

Población N° Alelo 1 Alelo 2

A 33 0,47 0,53

B 42 0,78 0,22

75

Cálculo de las medias ponderadas para cada alelo

p1= (��∗�,��)(��∗�,��)� = 0,6436

p2= (��∗�, �)(��∗�,��)� = 0,3564

Page 37: Análisis filogenético y Construcción de dendrogramas

Población N° Alelo 1 Alelo 2

A 33 0,47 0,53

B 42 0,78 0,22

75

Cálculo de la heterocigosis total esperada (H&W)

�� = 1 − � ���

HT = 1 – [(0,64)2 + (0,36)2]

HT = 0,460,460,460,46

Page 38: Análisis filogenético y Construcción de dendrogramas

Población N° Alelo 1 Alelo 2

A 33 0,47 0,53

B 42 0,78 0,22

75

Cálculo de la heterocigosis esperada para cada subpoblación (H&W)

�! = 1 − � ���

HA = 1 – [(0,47)2 + (0,53)2]HA = 0,500,500,500,50

�% = 1 − � ���

HB = 1 – [(0,78)2 + (0,22)2]HB = 0,340,340,340,34

Page 39: Análisis filogenético y Construcción de dendrogramas

Población N° Alelo 1 Alelo 2

A 33 0,47 0,53

B 42 0,78 0,22

75

Cálculo de la heterocigosis esperada para la población (H&W)

HS = [(NA*HA) + (NB*HB)]/NT

HS = 0,410,410,410,41

HS = [(33*0,50) + (42*0,34)]/75

Page 40: Análisis filogenético y Construcción de dendrogramas

Población N° Alelo 1 Alelo 2

A 33 0,47 0,53

B 42 0,78 0,22

75

Cálculo de la diversidad entre poblaciones

DST = HT - HS

DST = 0,050,050,050,05

DST = 0,46 – 0,41

Page 41: Análisis filogenético y Construcción de dendrogramas

Población N° Alelo 1 Alelo 2

A 33 0,47 0,53

B 42 0,78 0,22

75

Cálculo de la diversidad entre poblaciones

./� = 0/���

./� = �,� �,�1= 0,11

Page 42: Análisis filogenético y Construcción de dendrogramas

GST

GST GST

GST GST GST

A B C D

ABCD

A B C D

COEFICIENTE DE DIVERGENCIA ENTRE POBLACIONES (GST)

Neighbor-Joining

UPGMA

Page 43: Análisis filogenético y Construcción de dendrogramas

CONSTRUCCIÓN DE UN ÁRBOL FILOGENÉTICO USANDO EL MÉT ODO UPGMA

El método UPGMA (Método de agrupamiento por pares con media aritmética noponderada) es el método de agrupamiento más simple hasta ahora desarrollado.

Características

• Construye un árbol por un método de agrupamiento secuencial.

• Dada una matriz de distancias, éste inicia mediante la agrupación de los dos taxones con lamenor distancia

• Un nodo interior es colocado en el punto medio entre ellos y se crea una matriz reducida alconsiderar el nuevo grupo como un único taxón.

• Las distancias entre este nuevo taxón compuesto y el resto de los taxones se calculan para crear dicha matriz.

• El mismo proceso de agrupamiento se repite creándose una nueva matriz reducida.

• Se produce una iteración continúa hasta que todos los taxones se inserten en el árbol.

• El último taxón añadido se considera como grupo externo lo que produce un árbol con raíz.

Page 44: Análisis filogenético y Construcción de dendrogramas

Ejemplo de construcción de un árbol filogenético us ando el método UPGMA (tomado del libro de Xiong)

A B C D

A

B 0,40

C 0,35 0,45

D 0,60 0,70 0,55

A

C

0,175

0,175

A-C B

B �,���,� � = 0,425

D �,1��, � = 0,575 0,70

B0,425/2=0,212

B-A-C

D �,���,1��, � = 0,617

D0,617/2=0,309

Page 45: Análisis filogenético y Construcción de dendrogramas

CONSTRUCCIÓN DE UN ÁRBOL FILOGENÉTICO USANDO EL MÉT ODO MÁXIMA PARSIMONIA (MP).

• El método de MP selecciona el árbol que tiene el mínimo número de cambios evolutivos, i.e.,el árbol cuyas ramas tengan promedio la mínima longitud.

• Se basa en el principio conocido como Navaja de Occam (Occam’s razor) formulado porWilliam Ockham en el siglo XIV.

• Este principio hace referencia a un tipo de razonamiento basado en una premisa muysimple: en igualdad de condiciones la solución más sencilla es probablemente lacorrecta .

• Esto es porque la solución más simple requiere el menor número de suposiciones y deoperaciones lógicas.

Page 46: Análisis filogenético y Construcción de dendrogramas

• Para el análisis filogenético, la parsimonia es una buena suposición.

• Siguiendo este principio, un árbol con el menor número de substituciones esprobablemente la mejor opción para explicar las diferencias entre los taxonesestudiados.

• Esta perspectiva se justifica por el hecho de que los cambios evolutivos que sucedendentro de lapsos de tiempo cortos son relativamente raros.

• Esto implica que un árbol con cambios mínimos es muy probable que sea una buenaestimación del verdadero árbol.

• Al minimizar los cambios, el método minimiza el ruido filogenético debido a lahomoplasia (cambio evolutivo paralelo que hace que dos organismos presenten unmismo carácter adquirido independientemente) y a la evolución independiente.

CONSTRUCCIÓN DE UN ÁRBOL FILOGENÉTICO USANDO EL MÉT ODO MÁXIMA PARSIMONIA (MP).

Page 47: Análisis filogenético y Construcción de dendrogramas

CONSTRUCCIÓN DEL ÁRBOL

• La construcción del árbol filogenético de MP funcionabuscando todas las posibles topologías de árboles yreconstruyendo secuencias de ancestros que requierenel mínimo número de cambios evolutivos a lassecuencias actuales.

• Para ahorrar tiempo de cómputo, sólo un pequeñonúmero de sitios, que tienen información filogenéticaimportante, son usados en la determinación del árbol.

• Estos sitios son llamados sitios informativos , loscuales son definidos como sitios que tienen al menosdos tipos diferentes de caracteres, cada unoocurriendo al menos dos veces.

Ejemplo de extracción de sitios informativos

Page 48: Análisis filogenético y Construcción de dendrogramas

Sitios informativos y no-informativos.

• Los sitios informativos son los que pueden a menudo ser explicados median unatopología de árbol única.

• Los sitios no-informativos son constantes o tienen cambios que ocurren una sola vez.

• Los sitios constantes obviamente no son útiles para evaluar diferentes topologías.

• Los sitios con cambios ocurriendo una sola vez tampoco son útiles porque pueden serexplicados por múltiples topologías.

• Los sitios no-informativos son desechados en el proceso de construcción de un árbolfilogenético de MP.

Dr.

CONSTRUCCIÓN DEL ÁRBOL

Page 49: Análisis filogenético y Construcción de dendrogramas

Etapas de la construcciónUna vez que los sitios informativos son identificados y los no-informativos sondescartados, el mínimo número de substituciones en cada sitio informativo es calculadopara una topología dada.

El número total de cambios en todos los sitios informativos son sumados para cadaposible topología y el árbol con el más pequeño número de cambios es elegido como elmejor.

ConsideracionesLa clave para contar un número mínimo de sustituciones para un sitio particular esdeterminar los estados del carácter ancestral en los nodos internos.

Debido a que estos estados de caracteres ancestrales no se conocen directamente,pueden existir múltiples soluciones posibles.

En este caso, el principio de parsimonia se aplica para elegir los estados de los caracteresque resultan en un mínimo número de sustituciones.

CONSTRUCCIÓN DEL ÁRBOL

Page 50: Análisis filogenético y Construcción de dendrogramas

La inferencia de una secuencia ancestral se realiza en dos pasos

1. Se recorre el árbol de las hojas hacia la raíz para determinar todos los posibles estados de los caracteres ancestrales

2. Se recorre el árbol de la raíz hacia las hojas para asignar secuencias ancestrales que exigen el número mínimo de sustituciones (puntaje de parsimonia)

CONSTRUCCIÓN DEL ÁRBOL

Page 51: Análisis filogenético y Construcción de dendrogramas

• ClustalW Alineamiento (Gratis)• AFLPsurv 1,0 (Gratis).• Populations (Muy útil con microsatélites, Gratis)• NJ-Plot• PHYLIP 3,695 (Gratis)• Codoncode Aligner (muy útil con secuencias DNA, RNA, Prot.• MEGA 3.1 (Muy fácil de manejar)• PAUP* (POP STAR) (Es el más sofisticado y versátil) • Graficar con Treeview, Treeilustrator, TreeGraph (Todos gratis).

PROGRAMAS UTILIZADOS EN LA CONSTRUCCIÓN DE ARBOLES

Nota: En azul se destacan los programas utilizados en clases.