Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf ·...
Transcript of Adyacencias generalizadas en genes, Ancho de Banda y ...ertello/bioinfo/geneAdjacenciesBMP.pdf ·...
Adyacencias generalizadas en genes, Ancho deBanda y Agrupamientos en la evolución de la
levadura
Edgar HERNÁNDEZ VENTURA
CINVESTAV-Zacatenco
24 de Junio de 2010
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 1 / 1
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 2 / 1
Adyacencias generalizadas Introducción
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 3 / 1
Adyacencias generalizadas Introducción
Introducción
La sintenia o conservación del orden genético es una propiedadmuy informativa de los genomas procariotas
Permite estudiar las relaciones evolutivas entre organismos ypredecir la función de las proteínas y la interacción entre ellas.
Ayuda a comprender las fuerzas que actúan modelando losgenomas y su significado funcional y evolutivo
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 4 / 1
Adyacencias generalizadas Introducción
Introducción
Analizar la sintenia es difícil puesto que si ponemos énfasis a laigualdad de contenido y el orden, solamente regiones muypequeñas satisfacerán las condiciones.
Si se permite la reorganización de los genes indiscriminadamente,perderemos de vista la conservación local del orden de unconjunto de genes.
Existen pocos métodos para analizar la sinténia eficientemente.
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 5 / 1
Adyacencias generalizadas Introducción
Introducción
En este artículo se presenta un método para analizar la influenciade la sintenia de genes en la filogenia de un conjunto de genomas.
Se utilizan los genomas de la levadura puesto que están bastanteestudiados.
Para el análisis de la sintenia se utiliza agrupación por AdyacenciaGeneral (GA).
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 6 / 1
Adyacencias generalizadas Introducción
Introducción
Levadura son los diversos hongos microscópicos unicelularesimportantes para la descomposición mediante fermentación dediversos cuerpos orgánicos.
Son organismos eucariotas
Existe una Base de Datos biológica llamada Yeast Gene OrderBrowser (YGOB) especifica para levadura.http://wolfe.gen.tcd.ie/ygob/
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 7 / 1
Adyacencias generalizadas Definiciones
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 8 / 1
Adyacencias generalizadas Definiciones
Definiciones
Definición 1Sea GS = (VS,ES) y GT = (VT,ET) dos grafos con un conjunto no vacíode vértices en común V = VS ∩ VT. Decimos que un subconjunto deC ⊆ V es un Agrupamiento de Adyacencia General si el conjunto devértices de un componente conexo de GSt = (V,ES ∩ ET).
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 9 / 1
Adyacencias generalizadas Definiciones
Definiciones
Definición 2Para la comparación de genomas, podemos considerar VX el conjuntode genes en el genoma X. Para los genes g y h en VX en el mismocromosoma en X, sea gh ∈ EX si el número de genes entre g y h en X esmenor que θ, donde θ ≥ 1 es el parámetro de vecindad
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 10 / 1
Adyacencias generalizadas Definiciones
Definiciones
Si θ =∞ tenemos todos los conjuntos de sintenia o los conjuntosde genes en común entre 2 cromosomas, uno en cada genoma.
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 11 / 1
Adyacencias generalizadas Definiciones
Definiciones
Sea∏
el conjunto de todos los ordenamientos de V. Recordemos queel ancho de banda de un grafo G(V,E) está definido como
B(G) = m«ınp∈
∏ m«axuv∈E|p(u)− p(v)| (1)
En un genoma S, cada cromosoma X determina el orden físico entrelos genes que tiene.
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 12 / 1
Adyacencias generalizadas Definiciones
Definiciones
Proposición 1El ancho de banda en un grafo B(GS) = θ mientras aya al menos 2θ + 1genes en el cromosoma X en el genoma SBosquejo de pruebaLa distancia mayor entre dos posiciones no puede ser mayor que θ y ladistancia menor no puede ser menor que θ puesto que no se puedemeter 2θ vértices en un intervalo de tamaño < 2θ + 1
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 13 / 1
Adyacencias generalizadas Definiciones
Definiciones
Proposición 1El ancho de banda en un grafo B(GS) = θ mientras aya al menos 2θ + 1genes en el cromosoma X en el genoma SBosquejo de pruebaLa distancia mayor entre dos posiciones no puede ser mayor que θ y ladistancia menor no puede ser menor que θ puesto que no se puedemeter 2θ vértices en un intervalo de tamaño < 2θ + 1
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 14 / 1
Adyacencias generalizadas Definiciones
Definiciones
Proposición 2
B(GST) = m«axc∈C
B(C) (2)
donde C es el conjunto de componentes conexos de GSTBosquejo de pruebala distancia máxima de las posiciones de dos vértices en la unión de STes igual a la distancia máxima de 2 vértices en el componente másgrande de su intersección
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 15 / 1
Adyacencias generalizadas Definiciones
Definiciones
Cluster de separación máxima(max-gap)
Está definición de agrupación es usada empíricamente en los estudiosde genomas
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 16 / 1
Adyacencias generalizadas Definiciones
Definiciones
Definición 3 Sea θ ≥ 1. Sean VC ⊆ VC ∩ VC un conjunto de r vérticescorrespondientes a genes en el mismo cromosoma XS en el genoma S ytodos los genes en el cromosoma XT en el genoma T.Sea g1, g2, . . . , gr un conjunto de etiquetas en estos genes de acuerdo asu orden en XS. Sea h1, h2, . . . , hr un conjunto de etiquetas en estosgenes de acuerdo a su orden en XT. pS(· ) y pT(· ) indicarán la posiciónde los genes en XS y XT respectivamente, entonces si
PS(gi+1)− PS(gi) ≤ θyPT(hi+1)− PT(hi) ≤ θ (3)
para todo 1 ≤ i, j ≤ r− 1, entonces VC satisface el criterio deagrupación de separación máxima.
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 17 / 1
Adyacencias generalizadas Definiciones
Definiciones
Proposición 3 Todo agrupamiento de Adyacencia General comoparámetro θ satisface el criterio de separación máxima con el mismovalor de θ. Esto no aplica en sentido inverso.
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 18 / 1
Adyacencias generalizadas Comparación de los genomas de levadura
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 19 / 1
Adyacencias generalizadas Comparación de los genomas de levadura
Comparación de los genomas de levadura
R será el tetraploide ancestro de S. Cerevisiae y C. Glabrata. Estedendrográma fue hecho a través de experimentación.
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 20 / 1
Adyacencias generalizadas Comparación de los genomas de levadura
Comparación de los genomas de levadura
Tetraploide
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 21 / 1
Adyacencias generalizadas Comparación de los genomas de levadura
Comparación de los genomas de levadura
La línea punteada es con el criterio de agrupamiento de distanciamáxima.Como se puede ver entre más agrupamientos se puedan formar máscerca estén jerarquicamente más agrupamientos se podrán formar conel método de Adyacencia General.
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 22 / 1
Adyacencias generalizadas Comparación de los genomas de levadura
Comparación de los genomas de levadura
Como se puede observar hay un mayor número de genes comunesentre linajes iguales que entre especies comunes. Esto quiere decir quehay menor divergencia evolucionaria.También se puede ver que hay mayor divergencia en la especia CG.Las líneas delgadas son SCA-CGB y SCB-CGA
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 23 / 1
Adyacencias generalizadas Comparación de los genomas de levadura
Comparación de los genomas de levadura
Muestra las distribuciones de los agrupamientos formados con el nodoR y los demás nodos.µ representa la media del tamaño del agrupamiento.Esto muestra que los agrupamientos más pequeños se integran aagrupamientos más grandes a medida que que θ incrementa
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 24 / 1
Adyacencias generalizadasAgrupamientos en los nodos ancestrales de la filogenia de la
levadura
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 25 / 1
Adyacencias generalizadasAgrupamientos en los nodos ancestrales de la filogenia de la
levadura
Agrupamientos en los nodos ancestrales de lafilogenia de la levadura
Muestra el tamaño medio de los agrupamientos para diferentestamaños de θR tiene agrupamientos más pequeños porque está más alejadocronológicamente de los otros genomas.
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 26 / 1
Adyacencias generalizadas Ancho de banda de los agrupamientos
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 27 / 1
Adyacencias generalizadas Ancho de banda de los agrupamientos
Ancho de banda de los agrupamientos
Muestra el número total de los genes en todos los agrupamientos paradiferentes θSe muestran cifras bastante estables para todos excepto R.
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 28 / 1
Adyacencias generalizadas Ancho de banda de los agrupamientos
Ancho de banda de los agrupamientos
A medida que θ aumenta el número de agrupamientos disminuye,pero porque los agrupamientos más pequeños son agregados dentrode agrupamientos más grandes.
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 29 / 1
Adyacencias generalizadas Ancho de banda de los agrupamientos
Ancho de banda de los agrupamientos
Conflictos en los agrupamientos entre Genenomas.dos agrupamientos, cada uno en un genoma diferente están enconflicto a menos que uno sea subconjunto del otro o sean disjuntos.
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 30 / 1
Adyacencias generalizadas Algoritmos
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 31 / 1
Adyacencias generalizadas Algoritmos
Algoritmos
Inferir el ancho de banda es NP-hard.Pero para un θ dado se puede calcular en tiempo O(nθ+1) y en espacioΘ(nθ+1). demostrado por SaxeGurari y Sudborough mejoraron el algoritmo a un tiempo O(nθ) y enespacio Θ(nθ) en el cual se usa un arreglo para almacenar lascombinatorias posibles.En la implementación de este artículo usaron un mapa y mejoró elespacio de almacenamiento a Θ(K) donde K es el número de lascombinaciones posibles el cual es mucho menor que Θ(nθ) aunque sele agrega un tiempo de O(lgn) para buscar en el mapa.
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 32 / 1
Adyacencias generalizadas Conclusiones
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 33 / 1
Adyacencias generalizadas Conclusiones
Conclusiones del artículo
Aunque el número de agrupamientos GA con los de separaciónmáxima son similares, GA preserva mejor el orden de genes deestos.
La separación de los linajes A y B está validado por el número deagrupamientos entre especies.
El parámetro de vecindad permite controlar la distribución de lostamaños de los agrupamientos y su tamaño.
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 34 / 1
Adyacencias generalizadas Conclusiones
Conclusiones acerca del artículo (obvias)
Han encontrado un buen método eficiente para determinar ladistancia filogenética entre genomas.
Puede encontrar diferentes linajes dentro de una misma especiecomparándolo con otra.
Mejoraron un algoritmo de grafos, implementándolo siendo de elárea de la biología molecular
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 35 / 1
Adyacencias generalizadas Conclusiones
Conclusiones acerca del artículo (no tan obvias)
Este artículo a pesar de ser de biología molecular tiene rigormatemático para la demostración de grafos, una mejora deimplementación en el algoritmo y un análisis estadístico basadoen un conjunto exhaustivo de pruebas.
La comprensión de los resultados obtenidos son soportados por elconocimiento del área, no por los resultados mismo
Sería interesante usar la diferencia de los ordenamientos de losgenomas y las nuevas posiciones que tomaron para inferir porquese conservaron ciertos genes y que función realizan.
Edgar HERNÁNDEZ VENTURA (CINVESTAV) Adjacencias Generalizadas 24 de Junio de 2010 36 / 1