T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... ·...

71
T ´ ECNICAS INTELIGENTES EN BIOINFORM ´ ATICA Evoluci´ on Molecular y Filogenia Ignacio P´ erez Hurtado de Mendoza Grupo de investigaci´on en Computaci´on Natural Dpto. Ciencias de la Computaci´ on e Inteligencia Artificial Universidad de Sevilla aster Universitario en L´ ogica, Computaci´ on e Inteligencia Artificial Curso 2013-14

Transcript of T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... ·...

Page 1: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

TECNICAS INTELIGENTES EN BIOINFORMATICA

Evolucion Molecular y Filogenia

Ignacio Perez Hurtado de MendozaGrupo de investigacion en Computacion Natural

Dpto. Ciencias de la Computacion e Inteligencia ArtificialUniversidad de Sevilla

Master Universitario en Logica, Computacion e Inteligencia Artificial

Curso 2013-14

Page 2: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014Introducción

• La comparación entre secuencias de genomas de distintos organismos de la misma especie y de especies diferentes nos muestra que los genomas no son estáticos sino dinámicos.

• Cambios o mutaciones aparecen en el genoma de un único individuo. Estas pueden ser neutrales, defectuosas o ventajosas.

• Si una mutación aparece en la línea germinal de un organismo puede ser transmitida a sus descendientes. De esta forma una mutación puede extenderse en una población y fijarse dando lugar a polimorfismos, existencia de diferentes variantes de una misma secuencia de DNA llamados alelos.

• Los polimorfismos más frecuentes son los SNPs (single nucleotide polymorphisms) seguidos de los STR (short tandem repeats) y por último indels. Finalmente, pueden darse transposiciones, inversiones y duplicaciones.

Page 3: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014Filogenia Molecular

• La filogenia consiste en la inferencia de las relaciones evolutivas entre las especies existentes. Tradicionalmente se basaba en el estudio de carácteres morfológicos y fisiológicos hasta principios de 1980s con la obtención de las secuencias de los primeras proteínas y genes.

• Actualmente se basa en la comparación entre secuencias biológicas dando lugar a la filogenia molecular.

• Los principales objetivos de la filogenia molecular son:

– Determinar una relación jerárquica entre las especies existentes según su relación evolutiva.

– Estimar el tiempo de divergencia entre las especies, i.e. tiempo de existencia de su ancestro en común más cercano.

Page 4: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014Análisis Filogenético

• El estudio filogenético se divide en cinco pasos:

– Paso 1: Selección de las secuencias biológicas a analizar.

– Paso 2: Alineamiento múltiple de las secuencias biológicas.

– Paso 3: Selección del modelo estadístico de evolución molecular de las correspondientes secuencias.

– Paso 4: Construcción de árboles filogenéticos.

– Paso 5: Evaluación de los árboles construídos.

Page 5: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014Análisis Filogenético

• El estudio filogenético se divide en cinco pasos:

– Paso 1: Selección de las secuencias biológicas a analizar.

– Paso 2: Alineamiento múltiple de las secuencias biológicas.

– Paso 3: Selección del modelo estadístico de evolución molecular de las correspondientes secuencias.

– Paso 4: Construcción de árboles filogenéticos.

– Paso 5: Evaluación de los árboles construídos.

Page 6: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 1: Selección de las secuencias biológicas a analizar

• Los estudios filogenéticos se basan en la comparación de secuencias biológicas (DNA o AA) homólogas. El estudio de las diferencias entre ellas nos permiten estimar la relación evolutiva entre las correspondientes especies y su tiempo de divergencia (existencia de un ancestro en común).

• Para obtener secuencias homólogas podemos recurrir:

– Bases de datos tales como Refseq, Uniprot o HomoloGenehttp://www.ncbi.nlm.nih.gov/homologene

– Resultados de alineamientos utilizando BLAST.http://blast.ncbi.nlm.nih.gov/Blast.cgi

Page 7: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014Análisis Filogenético

• El estudio filogenético se divide en cinco pasos:

– Paso 1: Selección de las secuencias biológicas a analizar.

– Paso 2: Alineamiento múltiple de las secuencias biológicas.

– Paso 3: Selección del modelo estadístico de evolución molecular de las correspondientes secuencias.

– Paso 4: Construcción de árboles filogenéticos.

– Paso 5: Evaluación de los árboles construídos.

Page 8: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 2: Alineamiento Múltiple de Secuencias

• El alineamiento múltiple de las secuencias biológicas analizadas es el paso crucial en el estudio filogenético ya que consiste en la comparación entre las distintas secuencias.

• Es necesario comprobar los siguientes puntos:

– Eliminar secuencias no homólogas, aquellas que no muestran alineamiento. Se deber realizar un alineamiento de pares de secuencias y ver su significancia.

– Si el alineamiento no es bueno y estamos seguros de la homología entre las secuencias modificar los parámetros de penalización por la inserción y extensión de huecos.

– Normalmente no se conoce la secuencia completa de las correpondientes secuencias y aparecen muchos huecos. Es necesario eliminar las columnas que corresponde a hueco (manualmente o indicárselo al correspondiente programa).

– Dualidad entre alineamiento múltiple y árbol filogenético.

Page 9: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014Análisis Filogenético

• El estudio filogenético se divide en cinco pasos:

– Paso 1: Selección de las secuencias biológicas a analizar.

– Paso 2: Alineamiento múltiple de las secuencias biológicas.

– Paso 3: Selección del modelo estadístico de evolución molecular de las correspondientes secuencias.

– Paso 4: Construcción de árboles filogenéticos.

– Paso 5: Evaluación de los árboles construídos.

Page 10: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 3: Modelos estadísticos de Evolución Molecular o Modelos de Substitución de DNA y AA.

• Una vez realizado el alineamiento múltiple podemos pasar a la estimación de la distancia genética entre las distintas secuencias.

• La distancia genética entre dos secuencias homólogas se define como el número de sustituciones acumuladas entre ellas desde que divergieron de un ancestro común.

• La estimación de la distancia genética no es trivial ya que no todas las sustituciones son observables especialmente en secuencias con muchas sustituciones.

Page 11: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014Paso 3: Modelos de Sustitución de Aminoácidos

• El análisis filogenético se basa en la correcta elección del model de sustitución correspondiente:

– P-distance o distancia de Hamming o grado de divergencia: Consiste en contar la frecuencia relativa de cambios entre dos secuencias de un alineamiento múltiple. Si tenemos un alineamiento de longitud N con n diferencias la p-distance se define como:

p = n / N

Page 12: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014Paso 3: Modelos de Substitución de Aminoácidos

• El análisis filogenético se basa en la correcta elección del model ode substitución correspondiente:

– P-distance o distancia de Hamming o grado de divergencia: Consiste en contar la frecuencia relativa de cambios entre dos secuencias de un alineamiento múltiple. Si tenemos un alineamiento de longitud N con n diferencias la p-distance se define como:

d = n / N

Page 13: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014Paso 3: Modelos de Sustitución de Aminoácidos

• Secuencias homólogas muy divergentes acumulan un gran número de sustituciones lo cual hace que no todas sean observables. Por lo tanto, es necesario corregir aquellas substituciones observables.

• La corrección de Poisson es una de las más ampliamente utilizadas:

d = - ln(1 – p) donde p es frecuencia relativa observable

Page 14: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014Paso 3: Modelos de Sustitución de Aminoácidos

Page 15: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014

Page 16: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014Paso 3: Modelos de Sustitución de Nucleótidos

• El cálculo de la distancia genética entre secuencias de nucleótidos es más difícil debido entre otras razones a la redundancia del código genético.

• Existen diferentes modelos de sustitución de nucleótidos que persiguen conseguir una mejor estimación de la distancia genética, es decir, una mejor estimación de número real de sustituciones entre dos secuencias homólogas dadas las sustituciones obervables.

• Estos modelos en general asumen que el proceso de evolución de las secuencias de nucleótidos pueden representarse usando cadenas de Markov. Es decir, asumen que el estado actual de una secuencia tan sólo depende del estado precedente.

Page 17: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 3: Modelos de Sustitución de NucleótidosEl Modelo de Jukes-Cantor

• El modelo de Jukes-Cantor es el modelo más simple que propone una corrección del número de sustituciones observables.

• Asume que la probabilidad de mutar un nucleótido por otro es independiente de la posición de dicho nucleótido y del nucleótido en sí:– La probabilidad de cambiar A por C, G o T es idéntica, a/3.– De igual forma para C, G y T.

Page 18: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 3: Modelos de Sustitución de NucleótidosEl Modelo de Jukes-Cantor

A G

T C

α/3

α/3

α/3

α/3

α/3

α/3

Page 19: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 3: Modelos de Sustitución de NucleótidosEl Modelo de Jukes-Cantor

• El modelo de Jukes-Cantor es el modelo más simple que propone una corrección del número de sustituciones observables.

• Asume que la probabilidad de mutar un nucleótido por otro es independiente de la posición de dicho nucleótido y del nucleótido en sí:– La probabilidad de cambiar A por C, G o T es idéntica, a/3.– De igual forma para C, G y T.

Page 20: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 3: Modelos de Sustitución de NucleótidosEl Modelo de Jukes-Cantor

• El modelo de Jukes-Cantor es el modelo más simple que propone una corrección del número de sustituciones observables.

• Asume que la probabilidad de mutar un nucleótido por otro es independiente de la posición de dicho nucleótido y del nucleótido en sí:– La probabilidad de cambiar A por C, G o T es idéntica, a/3.– De igual forma para C, G y T.

Page 21: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 3: Modelos de Sustitución de NucleótidosEl Modelo de Kimura-2 parámetros

• Kimura propuso un refinamiento del modelo de Jukes-Cantor que tiene en cuenta la mayor probabilidad de observar transiciones que observar transversiones.

• Por lo tanto depende de dos parámetros:– La probabilidad de observar una transición, a.– La probabilidad de observar una transversión, b.

Page 22: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 3: Modelos de Sustitución de NucleótidosEl Modelo de Kimura-2 parámetros

A G

T C

β

β

β

β

α

α

Page 23: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 3: Modelos de Sustitución de NucleótidosEl Modelo de Kimura-2 parámetros

• Kimura propuso un refinamiento del modelo de Jukes-Cantor que tiene en cuenta la mayor probabilidad de observar transiciones que observar transversiones.

• Por lo tanto depende de dos parámetros:– La probabilidad de observar una transición, a.– La probabilidad de observar una transversión, b.

Page 24: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 3: Modelos de Sustitución de NucleótidosEl Modelo de Kimura-2 parámetros

• Kimura propuso un refinamiento del modelo de Jukes-Cantor que tiene en cuenta la mayor probabilidad de observar transiciones que observar transversiones.

• Por lo tanto depende de dos parámetros:– La probabilidad de observar una transición, a.– La probabilidad de observar una transversión, b.

• Donde P y Q es la frecuencia relativa de transciones y transversiones respectivamente.

• Existen otros mucho modelos de sustitucion como por ejemplo GTR (General time reversable) que considera una probabilidad para cada tipo de transición y transversión.

Page 25: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 3: Modelos de Sustitución de NucleótidosLa distribución Gamma

• Todos los modelos de sustitución vistos hasta ahora asumen que las sustituciones son independientes de la posición.

• Las probabilidades de sustitución son uniformes a lo largo de toda la secuencia. Esto no se cumple siempre.

• Con frecuencia se usa una corrección basada en la distribución gamma para representar la zona de la secuencia donde se da una mayor probabilidad de sustitución.

Page 26: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 3: Modelos de Sustitución de NucleótidosSelección de Modelos de Substitución

• Dado un alineamiento múltiple de secuencias existe una gran variedad de posibles modelos a elegir para representar la evolución de las distintas secuencias.

• La selección de modelos es una rama de la estadística dedicada a clasificar la bondad de los distintos modelos posibles buscando un compromiso entre la complejidad del modelo (número de parámetros) y el ajuste a los datos disponibles.

• MEGA permite realizar este análisis basado en los Criterios de Información Bayesianos y de Akaike (BIC y AIC).

Page 27: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014Análisis Filogenético

• El estudio filogenético se divide en cinco pasos:

– Paso 1: Selección de las secuencias biológicas a analizar.

– Paso 2: Alineamiento múltiple de las secuencias biológicas.

– Paso 3: Selección del modelo estadístico de evolución molecular de las correspondientes secuencias.

– Paso 4: Construcción de árboles filogenéticos.

– Paso 5: Evaluación de los árboles construidos.

Page 28: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosDefiniciones y propiedades básicas

• Los principales objetos de estudio de la filogenia molecular: establecimiento de las relaciones jerárquicas entre especies según su relación evolutiva y la estimación del tiempo de divergencia entre especies se representan utilizando árboles filogenéticos.

Page 29: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosDefiniciones y propiedades básicas

• Los principales objetos de estudio de la filogenia molecular: establecimiento de las relaciones jerárquicas entre especies según su relación evolutiva y la estimación del tiempo de divergencia entre especies se representan utilizando árboles filogenéticos.

Nodos

Page 30: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosDefiniciones y propiedades básicas

• Los principales objetos de estudio de la filogenia molecular: establecimiento de las relaciones jerárquicas entre especies según su relación evolutiva y la estimación del tiempo de divergencia entre especies se representan utilizando árboles filogenéticos.

Ramas o Aristas

La longitud de las ramas representa la distancia genética.Cladograma, todas las ramas son de la misma longitud.Filograma, las ramas de distinta longitud representan la distancia filogenética.

Page 31: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosDefiniciones y propiedades básicas

• Los principales objetos de estudio de la filogenia molecular: establecimiento de las relaciones jerárquicas entre especies según su relación evolutiva y la estimación del tiempo de divergencia entre especies se representan utilizando árboles filogenéticos.

Nodos externosHojasTaxonesOTUs (Operational Taxonomic Unit)

Page 32: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosDefiniciones y propiedades básicas

• Los principales objetos de estudio de la filogenia molecular: establecimiento de las relaciones jerárquicas entre especies según su relación evolutiva y la estimación del tiempo de divergencia entre especies se representan utilizando árboles filogenéticos.

Nodos internosAncestros comunes

Page 33: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosDefiniciones y propiedades básicas

• Los principales objetos de estudio de la filogenia molecular: establecimiento de las relaciones jerárquicas entre especies según su relación evolutiva y la estimación del tiempo de divergencia entre especies se representan utilizando árboles filogenéticos.

Clado: conjunto de todos los taxones y ancestros comunes que desciendende un nodo en concreto

Page 34: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosDefiniciones y propiedades básicas

• Los principales objetos de estudio de la filogenia molecular: establecimiento de las relaciones jerárquicas entre especies según su relación evolutiva y la estimación del tiempo de divergencia entre especies se representan utilizando árboles filogenéticos.

Clado: conjunto de todos los taxones y ancestros comunes que desciendende un nodo en concreto

Page 35: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosDefiniciones y propiedades básicas

• Los principales objetos de estudio de la filogenia molecular: establecimiento de las relaciones jerárquicas entre especies según su relación evolutiva y la estimación del tiempo de divergencia entre especies se representan utilizando árboles filogenéticos.

Clado: conjunto de todos los taxones y ancestros comunes que desciendende un nodo en concreto

Page 36: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosDefiniciones y propiedades básicas

• Los principales objetos de estudio de la filogenia molecular: establecimiento de las relaciones jerárquicas entre especies según su relación evolutiva y la estimación del tiempo de divergencia entre especies se representan utilizando árboles filogenéticos.

Clado: conjunto de todos los taxones y ancestros comunes que desciendende un nodo en concreto

Page 37: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosDefiniciones y propiedades básicas

• Los principales objetos de estudio de la filogenia molecular: establecimiento de las relaciones jerárquicas entre especies según su relación evolutiva y la estimación del tiempo de divergencia entre especies se representan utilizando árboles filogenéticos.

Clado: conjunto de todos los taxones y ancestros comunes que desciendende un nodo en concreto

Page 38: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosDefiniciones y propiedades básicas

• Los principales objetos de estudio de la filogenia molecular: establecimiento de las relaciones jerárquicas entre especies según su relación evolutiva y la estimación del tiempo de divergencia entre especies se representan utilizando árboles filogenéticos.

Clado: conjunto de todos los taxones y ancestros comunes que desciendende un nodo en concreto

Page 39: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosDefiniciones y propiedades básicas

• Existen dos tipos de árboles según la existencia de un nodo destacado llamado raíz:

– Los árboles enraizados poseen un nodo llamado raíz que corresponde con el ancestro común a todos los taxones. En un árbol enraizado podemos establecer una relación temporal.

– Los árboles no enraizados carecen de raíz y por lo tanto de relación temporal.

• Existen principalmente dos métodos para determinar la raíz de un árbol no enraizado:

– Se añade un outgroup, un taxón que conocemos es el más alejado del resto, y determinamos la raíz en el punto medio de la arista que lo une a clado formado por el resto de taxones.

– Se determina la rama de mayor longitud y se establece la raiz en su punto medio.

pasado

1

2 3 4

5

6

7 8

9

4

5

87

1

2

36

presente

Page 40: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosDefiniciones y propiedades básicas

• Existen dos tipos de árboles según la existencia de un nodo destacada llamado raíz:

– Los árboles enraizados poseen un nodo llamado raíz que corresponde con el ancestro en común entre todos los taxones. En un árbol enraizado podemos establecer una relación temporal.

– Los árboles no enraizados carecen de raíz y por lo tanto de relación temporal.

• Existen principalmente dos métodos para determinar la raíz de un árbol no enraizado:

– Se añade un outgroup, un taxón que conocemos es el más alejado del resto, y determinamos la raíz en el punto medio de la arista que lo une a clado formado por el resto de taxones.

– Se determina la rama de mayor longitud y se establece la raiz en su punto medio.

pasado

4

5

87

1

2

36

presente1

2 3 4

5 6Outgroup

7 9

10

raíz

8

Page 41: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosMétodos de Construcción de Árboles

• Existen una gran variedad de métodos para la construcción de árboles filogenéticos. Principalmente se dividen en cuatro grupos:

– Métodos basados en distancia

– Métodos de máxima parsimonia

– Métodos de máxima verosimilitud

– Métodos de inferencia bayesiana

Page 42: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosMétodos de Construcción de Árboles

• Existen una gran variedad de métodos para la construcción de árboles filogenéticos. Principalmente se dividen en cuatro grupos:

– Métodos basados en distancia

– Métodos de máxima parsimonia

– Métodos de máxima verosimilitud

– Métodos de inferencia bayesiana

Page 43: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosMétodos basados en distancia

• Los métodos basados en distancia tienen como primer paso el cálculo de las distancias genéticas entre todos los pares de secuencias según el correspondiente modelo de sustitución seleccionado.

• Estos modelos resumen toda la información de un alineamiento múltiple en la correspondiente matriz de distancias ignorando el resto de la información (otros métodos también tienen en cuenta esta información).

• Los principales métodos de construcción de árboles filogenéticos basados en distancia son:

– UPGMA (Unweighted Pair Group Method with Arithmetic mean)

– Neighbour Joining

• El algoritmo de Neighbour Joining se usa ampliamente debido a su velocidad y a que bajo ciertas condiciones devuelve árboles con buenas propiedades.

Page 44: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosUPGMA

Etapa 1. Calcular la matriz de distancias según el modelo de sustitución seleccionado.

1 2

3

4

5

1 2 3 4 5

1

2 0.1

3 0.8 0.8

4 0.8 1 0.3

5 0.9 0.9 0.3 0.2

Page 45: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosUPGMA

Etapa 2. Determinar las dos secuencias con la menor distancia genética entre ellas y unirlas para formar un primer clúster. Añadir un primer nodo interno para representar el ancestro en común entre dichas secuencias. Se asume que las dos ramas que unen este ancestro en común con los dos taxones son de la misma longitud (la mitad de la distancia entre dichas secuencias). Recalcular la matriz de distancias.

1 2

3

4

5

1 2

3

4

5

Page 46: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosUPGMA

Etapa 2. Determinar las dos secuencias con la menor distancia genética entre ellas y unirlas para formar un primer clúster. Añadir un primer nodo interno para representar el ancestro en común entre dichas secuencias. Se asume que las dos ramas que unen este ancestro en común con los dos taxones son de la misma longitud (la mitad de la distancia entre dichas secuencias). Recalcular la matriz de distancias.

1 2

3

4

5

1 2

3

4

5

1 2

6

Page 47: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosUPGMA

Etapa 2. Determinar las dos secuencias con la menor distancia genética entre ellas y unirlas para formar un primer clúster. Añadir un primer nodo interno para representar el ancestro en común entre dichas secuencias. Se asume que las dos ramas que unen este ancestro en común con los dos taxones son de la misma longitud (la mitad de la distancia entre dichas secuencias). Recalcular la matriz de distancias.

1 2

3

4

5

1 2

3

4

5

1 2

6

(1,2) 3 4 5

(1,2)

3 0.8

4 0.9 0.3

5 0.9 0.3 0.2

Page 48: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosUPGMA

Etapa 3. Determinar las siguientes dos secuencias con la menor distancia genética entre ellas. Estas pueden ser dos secuencias originales o contener al ancestro en común añadido. Unir las correspondientes secuencias en un clúster. Añadir un nodo interno para representar el ancestro en común. Recalcular la matriz de distancias.

1 2

3

4

5

1 2

3

4

5

1 2

3

4

5

1 2

6

Page 49: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosUPGMA

Etapa 3. Determinar las siguientes dos secuencias con la menor distancia genética entre ellas. Estas pueden ser dos secuencias originales o contener al ancestro en común añadido. Unir las correspondientes secuencias en un clúster. Añadir un nodo interno para representar el ancestro en común. Recalcular la matriz de distancias.

1 2

3

4

5

1 2

3

4

5

1 2

3

4

5

1 2

6

4 5

7

Page 50: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosUPGMA

Etapa 3. Determinar las siguientes dos secuencias con la menor distancia genética entre ellas. Estas pueden ser dos secuencias originales o contener al ancestro en común añadido. Unir las correspondientes secuencias en un clúster. Añadir un nodo interno para representar el ancestro en común. Recalcular la matriz de distancias.

1 2

3

4

5

1 2

3

4

5

1 2

3

4

5

1 2

6

4 5

7

(1,2) 3 (4,5)

(1,2)

3 0.8

(4,5) 0.9 0.3

Page 51: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosUPGMA

Reiterar este proceso hasta que todas las secuencias estén incluidas en un único clúster que representará la raíz del árbol.

1 2

3

4

5

1 2

3

4

5

1 2

3

4

5

1 2

3

4

5

Page 52: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosUPGMA

Reiterar este proceso hasta que todas las secuencias estén incluidas en un único clúster que representará la raíz del árbol.

1 2

3

4

5

1 2

3

4

5

1 2

3

4

5

1 2

3

4

5

1 2

6

4 5

7

3

8

Page 53: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosUPGMA

Reiterar este proceso hasta que todas las secuencias estén incluidas en un único clúster que representará la raíz del árbol.

1 2

3

4

5

1 2

3

4

5

1 2

3

4

5

1 2

3

4

5

1 2

6

4 5

7

3

8

(1,2) (4,5,3)

(1,2)

(4,5,3) 0.85

Page 54: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosUPGMA

Reiterar este proceso hasta que todas las secuencias estén incluidas en un único clúster que representará la raíz del árbol.

1 2

3

4

5

1 2

3

4

5

1 2

3

4

5

1 2

3

4

5

1 2

3

4

5

1 2

6

4 5

7

3

8

9

Page 55: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosNeighbour Joining

• Neighbour Joining es el método de construcción de árboles filogenéicos basado en distancias más popular. Es rápido lo cual permite formar árboles con decenas de taxones. Además bajo ciertas condiciones produce árboles con buenas propiedades.

• Al contrario de UPGMA Neighbour joining produce ramas de distinta longitud.

• Neighbour Joining produce árboles no enraizados. Por lo tanto, para añadir una raíz debemos añadir un outgroup o determinar la rama de mayor longitud.

Page 56: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosNeighbour Joining

• El primer paso de este algoritmo posiciona a todos los taxones en una estructura en forma de estrella.

• Seguidamente determina los dos taxones vecinos más cercanos y añade un nuevo nodo representando su ancestro en común más cercano.

Page 57: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosNeighbour Joining

• Este algoritmo de basa en encontrar taxones vecinos y unirlos progresivamente añadiendo su ancestro en común.

• Decimos que dos nodos son vecinos en un árbol filogenético si están conectados entre sí por un único nodo interno.

• Test de vecindad o la condición 4-puntos:

Dados i y j dos vecinos genéricos podemos afirmar que los nodos 1 y 2 son vecinos si la anterior condición es verdadera.La suma de la distancia entre vecinos es menor a la suma de las distancias entre no vecinos.

Page 58: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosNeighbour Joining

• Para determinar la longitud de las ramas añadidas al nuevo nodo se utiliza la llamada fórmula de los tres puntos:

Page 59: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosMétodos de Construcción de Árboles

• Existen una gran variedad de métodos para la construcción de árboles filogenéticos. Principalmente se dividen en cuatro grupos:

– Métodos basados en distancia

– Métodos de máxima parsimonia

– Métodos de máxima verosimilitud

– Métodos de inferencia bayesiana

Page 60: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosMáxima Parsimonia

• En lugar de resumir toda la información de un alineamiento multiple en las distancias genéticas entre secuencias en este tipo de métodos se tienen encuenta las columnas de nucleótidos o aminoácidos alineadas.

• La principal hipótesis de este metodo de construcción de árboles consiste en asumir que es preferible considerar el menor número de cambios o mutaciones posibles para explicar la evolución de las secuencias analizadas a considerar escenarios más complejos.

• De esta forma se busca el arbol filogenético tal que la suma de las longitudes de sus ramas sea la menor posible.

Page 61: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosMáxima Parsimonia

• ¿Cuál es la explicación más simple o árbol filogenético más simple que puede explicar la evolución de las secuencias AAG, AAA, GGA, AGA?

AAG AAA GGA AGA

AAAAAA

1 1 AGA

AAG AGA AAA GGA

AAAAAA

1 2AAA

AAG GGA AAA AGA

AAAAAA

1 1AAA 12

Coste = 3Coste = 4Coste = 4

1

Page 62: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosMáxima Parsimonia

• La contrucción de árboles filogenéticos utilizando máxima parsimonia se divide en tres pasos:

– Paso 1: Identificación de posiciones informativas en un alineamiento múltiple, es decir, se excluyen aquellas posiciones que no cambian en ninguna secuencia y aquellas que no se repiten más de una vez.

– Paso 2: Construcción de todos los árboles filogenéticos posibles si trabajamos con menos de 12 taxones o utilización de un algoritmo aproximado que construya sólo los árboles más relevantes.

– Paso 3: Coste de cada árbol según la longitudes de sus ramas y selección del arból con la menor puntuación. .

Page 63: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosMétodos de Construcción de Árboles

• Existen una gran variedad de métodos para la construcción de árboles filogenéticos. Principalmente se dividen en cuatro grupos:

– Métodos basados en distancia

– Métodos de máxima parsimonia

– Métodos de máxima verosimilitud

– Métodos de inferencia bayesiana

Page 64: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 4: Construcción de Árboles FilogenéticosMáxima Verosimilitud

• El método de construcción de árboles por máxima verosimilitud es uno de los más costosos computacionalmente pero uno de los más fiables.

• Este método asocia a cada árbol posible una probabilidad calculada según un modelo de substitución (Jukes-Cantor, Kimura 2-parámetros, etc)

• El árbol con mayor probabilidad o verosimilitud es seleccionado.

Page 65: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 ¿Qué método de construcción de árboles elegir?

Seleccionar secuenciasbiológicas

Obtener un alineamiento múltiple

Determinar la similitud entre las secuencias

Fuerte similitud Máxima Parsimonia

Poca similitud Neighbour-Joining

Muy Poca similitud Máxima verosimilitud

Evaluación delárbol construído

Derminar modelode substitución

Derminar modelode substitución

Page 66: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014Análisis Filogenético

• El estudio filogenético se divide en cinco pasos:

– Paso 1: Selección de las secuencias biológicas a analizar.

– Paso 2: Alineamiento múltiple de las secuencias biológicas.

– Paso 3: Selección del modelo estadístico de evolución molecular de las correspondientes secuencias.

– Paso 4: Construcción de árboles filogenéticos.

– Paso 5: Evaluación de los árboles construidos.

Page 67: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 5: Evaluación de Árboles FilogenéticosBootstrapping

• Una vez construído un árbol filogenético debemos evaluar su robustez.

• ¿Con cuánta frecuencia se obtiene un orden de ramificación dado considerando secuencias similares a las utilizadas?

• El método de evaluación de árboles más extendido consiste en Bootstrapping.

Page 68: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014 Paso 5: Evaluación de Árboles FilogenéticosBootstrapping

• En este método las secuencias similares a las utilizadas se construyen como permutaciones con repetición de las columnas del correspondiente alineamiento múltiple.

• Con este nuevo alineamiento se construye un nuevo árbol.

• Este proceso se repite un número de veces prefijado.

• A cada ramificación se le asigna el porcentaje de veces que aparece en los árboles construidos.

• Se asume que una ramificación es significativa si aparece más del 50%-70% de las veces. El resto de las ramificaciones pueden condensarse dando lugar a politomía. Usualmente se construye además el árbol consenso que recoge el orden de ramificación más frecuente.

Page 69: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014

Page 70: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014

Page 71: T ECNICAS INTELIGENTES EN BIOINFORM ATICA …marper/docencia/bioinformatics/temas/ignacio... · proteínas y genes. ... • La distancia genética entre dos secuencias homólogas

www.cs.us.es/~fran/iab2014

IAB2014IAB2014

This work is licensed under the Creative Commons Attribution-NonCommercial NoDerivs 3.0 Unported License. To view a copy of this license, visit http://creativecommons.org/licenses/by-nc-nd/3.0/.