Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos...

36
Últimos 11,600 años Estudio de la biodiversidad del Lago de Chalco usando metagenómica Dra. Barbara Moguel Instituto de Geología, UNAM

Transcript of Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos...

Page 1: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

Últimos 11,600 años

Estudio de la biodiversidad del Lago de Chalco usando metagenómica

Dra. Barbara Moguel

Instituto de Geología, UNAM

Page 2: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

Genómica

• La genética se refiere al estudio de un solo gen y sus productos.

Es el estudio de la organización, estructura y función de loscomplementos totales de los genes y otros DNAs dentro de las células de un organismo.

La genómica se puede diferenciar de la genética, ya que toma en cuenta la función e interacción de multiples genes, DNA no codificante (INTRONES), DNA intergénico (secuencias de DNA localizadas entre agrupaciones de genes) y la arquitectura genómica.

Organ, Chris Department of Organismic and Evolutionary Biology, Harvard University, Cambridge, Massachusetts. 2008

Page 3: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

Genomica

Se divide en genomica estructural y genomica funcional

La genomica estructural:Se refiere a la fase inicial del análisis del genoma, que incluye la construcción de mapas genéticosy físicos de un genoma, la identificacion y la anotacion de las características de los genes y la comparación de las estructuras del genoma.

José A. MOLINETB. (CINVESTAV)Mapeo, Ensamble y Comparación Genómica

La genomica functional:Se refiere al análisis de la expresión global y función de los genes de un genoma.

Page 4: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

• Por lo tanto, los conocimientos de la investigación paleogenómica son indispensables para una comprensión completa de la naturaleza y la evolución de los genomas.

Paleogenéticapaleogenómica

+ de 1000 a.c

Poblaciones recientes

Poblaciones antiguas

La paleogenómica se enfoca en recuperar y comprender la información genómica en varias especies extintas.

El estudio de la paleogenómica incluye remanentes o no de fósilesoriginales y sus fuentes de datos primarios.

Page 5: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

Procedimiento

A. MuestreoB. FiltradoC. PurificaciónD. Construcción de libreríasE. SecuenciaciónF. Bioinformática

A. Control de calidadB. EnsambladoC. Predicción de marcos de lecturaD. Anotación E. Análisis estadísticos

G. Presentación de datosEnvironmental Shotgun Sequencing (ESS)Wooley, 2010

Page 6: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

MUESTREO

Page 7: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

Extracción DNA: lisados de cada muestra

Más superficiales Más profundas

Page 8: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

Secuenciación

Es un método que nos permite descubrir como es la secuencia del ADN.

Pro

fun

did

ad c

ove

rtu

ra

Genomas de referencia

Page 9: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

9

CASO IDEAL

Supongamos que tenemos las siguientes secuencias:

ACCGT CGTGC TTAC TACCGT

Una posible manera de ensamblarlas :

--ACCGT------CGTGC TTAC------TACCGT--

TTACCGTGC

Las secuencias fueron alineadas ignorando los espacios de las extremidades. Se trata de alinear en la misma columna bases que sean iguales.

Page 10: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

10

COMPLICACIONES

1. secuencias reales muy largas

2. Errores

Inserciones, deleciones , sustituciones

Fragmentos quiméricos

Contaminación

Regiones repetidas

3. Orientación desconocida

5. Pérdida de cobertura

Page 11: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

Análisis bioinformático

Page 12: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

Primeros Resultados

Superficial 50cm 100 cm

150 cm 200 cm 250 cm

Page 13: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

Algunos resultados

Page 14: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

Parámetros utilizados 27.06.2017

E-value 10% ident 90Largo 15Min. Abundance 1Best hit

Page 15: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

Tabla de metadatos

MGRAST samp_name Depth Age Temp Salinity

mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

mgm4736462.3 S2-2 0 0 TEMPERED FRESH_WATER

mgm4736465.3 50-1 50 5,000 TEMPERED FRESH_WATER

mgm4736468.3 50-2 50 5,000 TEMPERED FRESH_WATER

mgm4736463.3 100-1 60 5,700 TEMPERED FRESH_WATER

mgm4736464.3 100-2 85 6,500 TEMPERED FRESH_WATER

mgm4736461.3 100-3 175 7,000 WARM HYPERSALINE

mgm4736467.3 100-4 135 7,700 WARM HYPERSALINE

mgm4736469.3 200-1 160 8,700 WARM HYPERSALINE

mgm4736460.3 200-2 185 9,600 WARM HYPERSALINE

mgm4736466.3 200-3 210 10,000 WARM HYPERSALINE

mgm4736470.3 200-4 235 11,600 COLD SUBSALINE

Page 16: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

Tamaño de los fragmentos secuenciados por muestra

Page 17: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

Sensibilidad de la predicción taxonómica

#familias #géneros

Refseq 524 994

RDP 329 757

SSU 458 1010

LSU 519 970

Phylum

ClaseOrdenFamiliaGenero

MG-RAST

Page 18: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

Bases de datos utilizadas para anotación

• RefSeq: genomas completos

• RDP: basa en 16S para Bacterias y Arqueas y 28S para hongos

• LSU: Sub-unidad grande ribosomal.

• SSU: Sub unidad pequeña ribosomal

• Subsistemas: evalúa funciones de proteínas

Page 19: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

Análisis: base de datos (R, phyloseq)

• Riqueza por familia total

• Riqueza familia separado por dominio

• Riqueza género separado por dominio

• Abundancia por phylum separado por dominio (graf. Barras)

• Abundancia por género por dominio (heatmap)

• Agrupación de muestras por 3 índices de diversidad β (Cluster)

• Ordenación de las muestras por la distancia Bray-curtis, por salinidad y temperatura (PCoA)

• Ordenación taxonómica por phylum (PCoA)

Page 20: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

LSU: análisis diversidad/riqueza familia

Page 21: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

LSU: análisis diversidad/riqueza familia

Bacteria

Archea

Eukaryota

Page 22: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

LSU: análisis diversidad/riqueza género

Bacteria

Archea

Eukaryota

Page 23: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

LSU: análisis abundancia

Bacteria

Archea

Eukaryota

Page 24: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

LSU: Heatmap top_100 gen_bacteria

Page 25: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

LSU: Heatmap top_100 gen_archea

Page 26: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

LSU: Heatmap top_100 gen_eukarya

Page 27: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

LSU: Heatmap top_10 gen_bacteria

Page 28: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

LSU: Heatmap top_10 gen_archea

Page 29: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

LSU: Heatmap top_10 gen_eukarya

Page 30: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

Diversidad βMuestras superficiales

Page 31: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

PCoA análisis Bray-Courtis distance por temp

Page 32: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

PCoA análisis Bray-Courtis distance por salinidad

Page 33: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

LSU:PCoA análisis taxa

Page 34: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

Subsistemas: funciones de proteínas

Page 35: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER

Heatmap funciones

Page 36: Estudio de la biodiversidad del Lago de Chalco usando … · 2020. 5. 8. · Tabla de metadatos MGRAST samp_name Depth Age Temp Salinity mgm4736471.3 S1-1 0 0 TEMPERED FRESH_WATER