Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf ·...

36
Adyacencias generalizadas en genes, Ancho de Banda y Agrupamientos en la evolución de la levadura Edgar HERNÁNDEZ VENTURA CINVESTAV-Zacatenco 24 de Junio de 2010 Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 1/1

Transcript of Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf ·...

Page 1: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadas en genes, Ancho deBanda y Agrupamientos en la evolución de la

levadura

Edgar HERNÁNDEZ VENTURA

CINVESTAV-Zacatenco

24 de Junio de 2010

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 1 / 1

Page 2: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 2 / 1

Page 3: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadas Introducción

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 3 / 1

Page 4: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadas Introducción

Introducción

La sintenia o conservación del orden genético es una propiedadmuy informativa de los genomas procariotas

Permite estudiar las relaciones evolutivas entre organismos ypredecir la función de las proteínas y la interacción entre ellas.

Ayuda a comprender las fuerzas que actúan modelando losgenomas y su significado funcional y evolutivo

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 4 / 1

Page 5: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadas Introducción

Introducción

Analizar la sintenia es difícil puesto que si ponemos énfasis a laigualdad de contenido y el orden, solamente regiones muypequeñas satisfacerán las condiciones.

Si se permite la reorganización de los genes indiscriminadamente,perderemos de vista la conservación local del orden de unconjunto de genes.

Existen pocos métodos para analizar la sinténia eficientemente.

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 5 / 1

Page 6: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadas Introducción

Introducción

En este artículo se presenta un método para analizar la influenciade la sintenia de genes en la filogenia de un conjunto de genomas.

Se utilizan los genomas de la levadura puesto que están bastanteestudiados.

Para el análisis de la sintenia se utiliza agrupación por AdyacenciaGeneral (GA).

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 6 / 1

Page 7: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadas Introducción

Introducción

Levadura son los diversos hongos microscópicos unicelularesimportantes para la descomposición mediante fermentación dediversos cuerpos orgánicos.

Son organismos eucariotas

Existe una Base de Datos biológica llamada Yeast Gene OrderBrowser (YGOB) especifica para levadura.http://wolfe.gen.tcd.ie/ygob/

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 7 / 1

Page 8: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadas Definiciones

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 8 / 1

Page 9: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadas Definiciones

Definiciones

Definición 1Sea GS = (VS,ES) y GT = (VT,ET) dos grafos con un conjunto no vacíode vértices en común V = VS ∩ VT. Decimos que un subconjunto deC ⊆ V es un Agrupamiento de Adyacencia General si el conjunto devértices de un componente conexo de GSt = (V,ES ∩ ET).

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 9 / 1

Page 10: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadas Definiciones

Definiciones

Definición 2Para la comparación de genomas, podemos considerar VX el conjuntode genes en el genoma X. Para los genes g y h en VX en el mismocromosoma en X, sea gh ∈ EX si el número de genes entre g y h en X esmenor que θ, donde θ ≥ 1 es el parámetro de vecindad

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 10 / 1

Page 11: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadas Definiciones

Definiciones

Si θ =∞ tenemos todos los conjuntos de sintenia o los conjuntosde genes en común entre 2 cromosomas, uno en cada genoma.

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 11 / 1

Page 12: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadas Definiciones

Definiciones

Sea∏

el conjunto de todos los ordenamientos de V. Recordemos queel ancho de banda de un grafo G(V,E) está definido como

B(G) = m«ınp∈

∏ m«axuv∈E|p(u)− p(v)| (1)

En un genoma S, cada cromosoma X determina el orden físico entrelos genes que tiene.

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 12 / 1

Page 13: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadas Definiciones

Definiciones

Proposición 1El ancho de banda en un grafo B(GS) = θ mientras aya al menos 2θ + 1genes en el cromosoma X en el genoma SBosquejo de pruebaLa distancia mayor entre dos posiciones no puede ser mayor que θ y ladistancia menor no puede ser menor que θ puesto que no se puedemeter 2θ vértices en un intervalo de tamaño < 2θ + 1

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 13 / 1

Page 14: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadas Definiciones

Definiciones

Proposición 1El ancho de banda en un grafo B(GS) = θ mientras aya al menos 2θ + 1genes en el cromosoma X en el genoma SBosquejo de pruebaLa distancia mayor entre dos posiciones no puede ser mayor que θ y ladistancia menor no puede ser menor que θ puesto que no se puedemeter 2θ vértices en un intervalo de tamaño < 2θ + 1

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 14 / 1

Page 15: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadas Definiciones

Definiciones

Proposición 2

B(GST) = m«axc∈C

B(C) (2)

donde C es el conjunto de componentes conexos de GSTBosquejo de pruebala distancia máxima de las posiciones de dos vértices en la unión de STes igual a la distancia máxima de 2 vértices en el componente másgrande de su intersección

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 15 / 1

Page 16: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadas Definiciones

Definiciones

Cluster de separación máxima(max-gap)

Está definición de agrupación es usada empíricamente en los estudiosde genomas

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 16 / 1

Page 17: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadas Definiciones

Definiciones

Definición 3 Sea θ ≥ 1. Sean VC ⊆ VC ∩ VC un conjunto de r vérticescorrespondientes a genes en el mismo cromosoma XS en el genoma S ytodos los genes en el cromosoma XT en el genoma T.Sea g1, g2, . . . , gr un conjunto de etiquetas en estos genes de acuerdo asu orden en XS. Sea h1, h2, . . . , hr un conjunto de etiquetas en estosgenes de acuerdo a su orden en XT. pS(· ) y pT(· ) indicarán la posiciónde los genes en XS y XT respectivamente, entonces si

PS(gi+1)− PS(gi) ≤ θyPT(hi+1)− PT(hi) ≤ θ (3)

para todo 1 ≤ i, j ≤ r− 1, entonces VC satisface el criterio deagrupación de separación máxima.

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 17 / 1

Page 18: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadas Definiciones

Definiciones

Proposición 3 Todo agrupamiento de Adyacencia General comoparámetro θ satisface el criterio de separación máxima con el mismovalor de θ. Esto no aplica en sentido inverso.

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 18 / 1

Page 19: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadas Comparación de los genomas de levadura

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 19 / 1

Page 20: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadas Comparación de los genomas de levadura

Comparación de los genomas de levadura

R será el tetraploide ancestro de S. Cerevisiae y C. Glabrata. Estedendrográma fue hecho a través de experimentación.

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 20 / 1

Page 21: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadas Comparación de los genomas de levadura

Comparación de los genomas de levadura

Tetraploide

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 21 / 1

Page 22: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadas Comparación de los genomas de levadura

Comparación de los genomas de levadura

La línea punteada es con el criterio de agrupamiento de distanciamáxima.Como se puede ver entre más agrupamientos se puedan formar máscerca estén jerarquicamente más agrupamientos se podrán formar conel método de Adyacencia General.

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 22 / 1

Page 23: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadas Comparación de los genomas de levadura

Comparación de los genomas de levadura

Como se puede observar hay un mayor número de genes comunesentre linajes iguales que entre especies comunes. Esto quiere decir quehay menor divergencia evolucionaria.También se puede ver que hay mayor divergencia en la especia CG.Las líneas delgadas son SCA-CGB y SCB-CGA

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 23 / 1

Page 24: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadas Comparación de los genomas de levadura

Comparación de los genomas de levadura

Muestra las distribuciones de los agrupamientos formados con el nodoR y los demás nodos.µ representa la media del tamaño del agrupamiento.Esto muestra que los agrupamientos más pequeños se integran aagrupamientos más grandes a medida que que θ incrementa

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 24 / 1

Page 25: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadasAgrupamientos en los nodos ancestrales de la filogenia de la

levadura

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 25 / 1

Page 26: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadasAgrupamientos en los nodos ancestrales de la filogenia de la

levadura

Agrupamientos en los nodos ancestrales de lafilogenia de la levadura

Muestra el tamaño medio de los agrupamientos para diferentestamaños de θR tiene agrupamientos más pequeños porque está más alejadocronológicamente de los otros genomas.

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 26 / 1

Page 27: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadas Ancho de banda de los agrupamientos

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 27 / 1

Page 28: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadas Ancho de banda de los agrupamientos

Ancho de banda de los agrupamientos

Muestra el número total de los genes en todos los agrupamientos paradiferentes θSe muestran cifras bastante estables para todos excepto R.

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 28 / 1

Page 29: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadas Ancho de banda de los agrupamientos

Ancho de banda de los agrupamientos

A medida que θ aumenta el número de agrupamientos disminuye,pero porque los agrupamientos más pequeños son agregados dentrode agrupamientos más grandes.

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 29 / 1

Page 30: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadas Ancho de banda de los agrupamientos

Ancho de banda de los agrupamientos

Conflictos en los agrupamientos entre Genenomas.dos agrupamientos, cada uno en un genoma diferente están enconflicto a menos que uno sea subconjunto del otro o sean disjuntos.

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 30 / 1

Page 31: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadas Algoritmos

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 31 / 1

Page 32: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadas Algoritmos

Algoritmos

Inferir el ancho de banda es NP-hard.Pero para un θ dado se puede calcular en tiempo O(nθ+1) y en espacioΘ(nθ+1). demostrado por SaxeGurari y Sudborough mejoraron el algoritmo a un tiempo O(nθ) y enespacio Θ(nθ) en el cual se usa un arreglo para almacenar lascombinatorias posibles.En la implementación de este artículo usaron un mapa y mejoró elespacio de almacenamiento a Θ(K) donde K es el número de lascombinaciones posibles el cual es mucho menor que Θ(nθ) aunque sele agrega un tiempo de O(lgn) para buscar en el mapa.

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 32 / 1

Page 33: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadas Conclusiones

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 33 / 1

Page 34: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadas Conclusiones

Conclusiones del artículo

Aunque el número de agrupamientos GA con los de separaciónmáxima son similares, GA preserva mejor el orden de genes deestos.

La separación de los linajes A y B está validado por el número deagrupamientos entre especies.

El parámetro de vecindad permite controlar la distribución de lostamaños de los agrupamientos y su tamaño.

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 34 / 1

Page 35: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadas Conclusiones

Conclusiones acerca del artículo (obvias)

Han encontrado un buen método eficiente para determinar ladistancia filogenética entre genomas.

Puede encontrar diferentes linajes dentro de una misma especiecomparándolo con otra.

Mejoraron un algoritmo de grafos, implementándolo siendo de elárea de la biología molecular

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 35 / 1

Page 36: Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf · Si se permite la reorganización de los genes indiscriminadamente, ... Bosquejo de

Adyacencias generalizadas Conclusiones

Conclusiones acerca del artículo (no tan obvias)

Este artículo a pesar de ser de biología molecular tiene rigormatemático para la demostración de grafos, una mejora deimplementación en el algoritmo y un análisis estadístico basadoen un conjunto exhaustivo de pruebas.

La comprensión de los resultados obtenidos son soportados por elconocimiento del área, no por los resultados mismo

Sería interesante usar la diferencia de los ordenamientos de losgenomas y las nuevas posiciones que tomaron para inferir porquese conservaron ciertos genes y que función realizan.

Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 36 / 1