Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El...

35
Principios de la Secuenciación Masiva Jorge Fernández Ordenes. PhD. Subdepto Genética Molecular Instituto de Salud Pública de Chile. 13 de Noviembre 2014

Transcript of Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El...

Page 2: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

Secuenciamiento de ADN

• El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro bases A, T, C y G del genoma de un organismo o de cualquier fragmento de DNA.

Page 3: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

• Primera generación: secuenciamiento capilar

(Sanger). Dye terminator. ABI, 3130; ABI

3500 (MLST, MLVA)

• Segunda generación: secuenciamiento

masivo. Roche 454, Illumina GAIIx, Hiseq,

Miseq, NextSeq , Ion Torrent PGM, Proton.

• Tercera generación: PacBio, Nanopore

Generación de secuenciadores

Page 4: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

1 lectura 1 lectura

Secuenciamiento de primera generación (electroforesis capilar,

método Sanger)

Page 5: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

Millones de lecturas

Secuenciamiento Masivo

Page 6: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

1990: Lanzamiento Proyecto Genoma Humano

2003: Finalización Proyecto Genoma Humano

Con secuenciamiento masivo: Genoma humano secuenciado en un par

de semanas

Page 7: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

Diferencias ???

Tamaño del equipo secuenciador Rendimiento (cantidad de información entregada) Tamaño de las lecturas en pb Química utilizada

Plataformas

Page 8: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

Fundamento básico Secuenciamiento masivo

Etapa de diferenciación QUIMICA entre las distintas plataformas

Page 9: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

Principales Químicas NGS

Pirosecuenciación

Semiconducción

Fluorescencia dNTPs

Page 10: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

Resultados «visibles» según Química

Semiconducción Pirosecuenciación

Page 11: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

Resultados «visibles» según Química

Fluorescencia dNTPs

Page 12: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

Chip con tecnología semiconductora Plancha con microcircuitos que detecta cambios de voltaje (H+)

¿Dónde ocurre la secuenciación?

En cada pocillo se detectan cambios de voltaje asociados a la entrada de un nucleótido y se va generando una secuencia

Sobre esta plancha hay millones de pocillos sensores

Page 13: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

¿Dónde ocurre la secuenciación?

Matriz (Flow cell) con oligonucleótidos adosados a la superficie

DNA se une a oligos complementarios y forma

un puente

Mediante PCR se multiplican las moléculas en puente generando un

cluster

Las moléculas se linearizán para comenzar

la síntesis (polimerasa)

Page 14: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

Ensamble de los read (secuencias)

Page 15: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

Ensamble de las secuencias por consenso

Page 16: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

Archivos entregan resultado de secuencias

- .fastq - .bam - .bai - .sam - .sff

TODOS requieren de un Análisis Bioinformático avanzado, no es posible analizarlo «manualmente».

Softwares que ensamblan genomas de novo

Softwares que alinean secuencias usando genoma de referencia

Softwares que permiten visualizar los alineamientos de forma gráfica

Softwares que analizan secuencias para determinar variantes

Page 17: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

Aplicaciones Secuenciamiento Masivo

Estudio de Muestras en Paralelo

Muestra 1

Muestra 2

Muestra 3

Muestra 4

Muestra 5

Muestra 6

Barcode 1

Barcode 2

Barcode 3

Barcode 4

Barcode 5

Barcode 6

POOL

Secuenciamiento

Hasta 96 muestras en paralelo

Page 18: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

Aplicaciones Secuenciamiento Masivo

Estudio de Muestras Complejas

Extracción DNA desde saliva Preparación librería Secuenciamiento Análisis bioinformático

Kidd et al., 2014

Page 19: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

Aplicaciones Secuenciamiento Masivo

Estudio de Mutaciones en profundidad

Permite caracterizar mutaciones poco frecuentes en una población, incluso aquellas con frecuencias menores al 1%.

Permite determinar poblaciones dentro de una muestra.

Page 20: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

Usando la variaciones en las secuencias (SNP) podemos entender las relaciones entre las cepas

Cuando los SNP son compartidos por los aislados, es una evidencia de que ellos pueden estas Relacionados y se pueden agrupar.

Page 21: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

Aplicaciones NGS

Estudio de Virulencia en muestras

C. difficile 4,4 mb

Linfogranuloma venéreo

Page 22: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

Gran desafío: Bioinformática

Page 23: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

Instituto de Salud Pública de Chile

National Microbiology Laboratory Canadá

Dr. Gary Van Domselaar

Use of NML bioinformatics server cluster

Human resources training

Collaborative research

Page 24: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

Estudios preliminares realizados en el Instituto de Salud Pública de Chile

Page 25: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

spe

100

95

spe

Key

M-090-14

M-092-14

M-125-11

M-046-14

M-048-14

M-054-14

M-081-14

año

.

.

.

.

.

.

.

Subtipo genetico

Cl-Nm-Spe-060

Cl-Nm-Spe-060

Cl-Nm-Spe-060

Cl-Nm-Spe-030

Cl-Nm-Spe-030

Cl-Nm-Spe-031

Cl-Nm-Spe-031

Grupo

W135

W135

W135

W135

W135

W135

W135

porA VR1

5

5

5

5

5

5

5

porA VR2

2

2

2

2

2

2

2

procedencia

.

.

.

.

.

.

.

N°Lab

.

.

.

.

.

Fecha

.

.

.

.

.

.

.

Nombre

.

.

.

.

.

.

.

Apellido 1

.

.

.

.

.

.

.

Apellido 2

.

.

.

.

.

.

.

Edad

.

.

.

.

.

.

.

Sexo

.

.

.

.

.

.

.

SS

.

.

.

.

.

.

Muestra

.

.

.

.

.

.

.

Diag clinico

.

.

.

.

.

.

.

fHbp

.

abcZ

.

.

.

.

.

.

.

adk

.

.

.

.

.

.

.

aroE

.

.

.

.

.

.

.

fumC

.

.

.

.

.

.

.

gdh

.

.

.

.

.

.

.

pdhC

.

.

.

.

.

.

.

pgm

.

.

.

.

.

.

.

MLST ST

11

11

11

11

11

11

11

MLST CC

ST-11 complex/ET-37 complex

ST-11 complex/ET-37 complex

ST-11 complex/ET-37 complex

ST-11 complex/ET-37 complex

ST-11 complex/ET-37 complex

ST-11 complex/ET-37 complex

ST-11 complex/ET-37 complex

Las cepas M-090-14 y M-092-14 corresponden a casos clínicos que trabajaban en el mismo lugar. Ambas cepas correspondían a pacientes de sexo masculino entre 46 y 49 años aisladas el 20 de Julio del 2014.

Serosubtipo

Serogrupo

W

W

W

W

W

W

W

Subtipificación de N. meningitidis W mediante

PFGE

Page 26: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

Estadísticas ensamble

Statistics for contig lengths: M-46-14 M-48-14 M-59-14 M-81-14 M-90-14 M-92-14 M-125-11

Min contig length: 78 78 78 78 78 78 78

Max contig length: 176,537 169,533 168,162 168,068 132,633 169,539 108,004

Mean contig length: 6084.11 6305.73 5969.38 5289.90 5532.40 6826.23 5924.66

N50 contig length: 35,230 32,503 31,709 29,902 26,909 35,690 31,633

Statistics for numbers of contigs:

Number of contigs: 350 338 358 404 385 312 361

Number of contigs >=1kb: 113 119 132 131 138 114 124

Number of contigs in N50: 19 20 19 22 23 19 22

Statistics for bases in the contigs:

Number of bases in all contigs: 2,129,437 2,131,338 2,137,039 2,137,118 2,129,973 2,129,783 2,138,803

Number of bases in contigs >=1kb: 2,065,190 2,063,466 2,073,857 2,063,068 2,064,785 2,070,542 2,070,499

GC Content of contigs: 51.75 % 51.77 % 51.73 % 51.76 % 51.77 % 51.75 % 51.76 %

Coverage genome all contigs (%) 97,0 97,1 97,4 97,4 97,0 97,0 97,4

Coverage genome contigs >=1kb (%) 94,1 94,0 94,5 94,0 94,1 94,3 94,3

Page 27: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

Z2491 Serogrupo A FAM18 Serogrupo C NM_w135_M17661 draft serogrupo W135 Similitud de CDS > 80%

Comparación de los aislados de N. meningitidis mediante Pangenoma

Page 28: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

M-92-14 M-90-14

Ejemplo resultado obtenido en BIGSDB, genes de virulencia

Page 29: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

Árbol Filogenético Core SNPs

Page 30: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

Tabla Core SNPs

strain M-46-14 w135_M7124 M-48-14 M-92-14 M-90-14 M-81-14 M-125-11 M-126-11 M-59-14 M-14-12

M-46-14 0 1439 52 1210 1212 1056 1036 701 673 650

w135_M7124 1439 0 1421 1351 1349 1336 635 856 848 807

M-48-14 52 1421 0 1186 1188 1034 1010 677 649 626

M-92-14 1210 1351 1186 0 8 835 966 613 617 588

M-90-14 1212 1349 1188 8 0 837 964 611 621 586

M-81-14 1056 1336 1034 835 837 0 927 582 510 549

M-125-11 1036 635 1010 966 964 927 0 449 439 398

M-126-11 701 856 677 613 611 582 449 0 92 57

M-59-14 673 848 649 617 621 510 439 92 0 59

M-14-12 650 807 626 588 586 549 398 57 59 0

Cepa de referencia w135_M7124, relacionada al brote durante la temporada de Hajj,

Meca año 2000.

Page 31: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

Estudio de resistencia a carbapenemasas

Se aisló cepa S. marcescens

Resistencia a carbapenemasas positiva

Tipo de KPC 2

PFGE subtipo nuevo

Se aisló cepa K. pneumoniae

Resistencia a carbapenemasas positiva

Tipo de KPC 2

PFGE subtipo nuevo

ST 454, CC 347

Purificación plasmidial

Purificación plasmidial

Secuenciamiento Masivo: Ambas cepas presenta el mismo plásmido que contienen la región KPC

Abril 2014

Page 32: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

Plásmido pNE1280

Tn4401f, región KPC

Page 33: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

Comparación aislados de plásmido de K. pneumoniae, Serratia marcescens con pNE1280

Aislado Tamaño % cobertura

pNE1280 66532 bp 100

Plásmido 1. Serratia marcescens

61436 bp 92.34

Plásmido 2. K. pneumoniae

64551 bp 97.02

% cobertura en elación a plásmido de referencia pNE1280

Page 34: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

Comparación plásmidos aislados de K. pneumoniae y Serratia marcescens.

• Plásmido1: aislado S. marcescens • Plásmido2: aislado K. pneumoniae

Page 35: Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro

Gracias