Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El...
Transcript of Principios de la Secuenciación Masiva · 2015-01-16 · Secuenciamiento de ADN •El...
Principios de la Secuenciación Masiva
Jorge Fernández Ordenes. PhD. Subdepto Genética Molecular
Instituto de Salud Pública de Chile.
13 de Noviembre 2014
Secuenciamiento de ADN
• El secuenciamiento de DNA es el proceso por medio del cual se determina el orden exacto de las cuatro bases A, T, C y G del genoma de un organismo o de cualquier fragmento de DNA.
• Primera generación: secuenciamiento capilar
(Sanger). Dye terminator. ABI, 3130; ABI
3500 (MLST, MLVA)
• Segunda generación: secuenciamiento
masivo. Roche 454, Illumina GAIIx, Hiseq,
Miseq, NextSeq , Ion Torrent PGM, Proton.
• Tercera generación: PacBio, Nanopore
Generación de secuenciadores
1 lectura 1 lectura
Secuenciamiento de primera generación (electroforesis capilar,
método Sanger)
Millones de lecturas
Secuenciamiento Masivo
1990: Lanzamiento Proyecto Genoma Humano
2003: Finalización Proyecto Genoma Humano
Con secuenciamiento masivo: Genoma humano secuenciado en un par
de semanas
Diferencias ???
Tamaño del equipo secuenciador Rendimiento (cantidad de información entregada) Tamaño de las lecturas en pb Química utilizada
Plataformas
Fundamento básico Secuenciamiento masivo
Etapa de diferenciación QUIMICA entre las distintas plataformas
Principales Químicas NGS
Pirosecuenciación
Semiconducción
Fluorescencia dNTPs
Resultados «visibles» según Química
Semiconducción Pirosecuenciación
Resultados «visibles» según Química
Fluorescencia dNTPs
Chip con tecnología semiconductora Plancha con microcircuitos que detecta cambios de voltaje (H+)
¿Dónde ocurre la secuenciación?
En cada pocillo se detectan cambios de voltaje asociados a la entrada de un nucleótido y se va generando una secuencia
Sobre esta plancha hay millones de pocillos sensores
¿Dónde ocurre la secuenciación?
Matriz (Flow cell) con oligonucleótidos adosados a la superficie
DNA se une a oligos complementarios y forma
un puente
Mediante PCR se multiplican las moléculas en puente generando un
cluster
Las moléculas se linearizán para comenzar
la síntesis (polimerasa)
Ensamble de los read (secuencias)
Ensamble de las secuencias por consenso
Archivos entregan resultado de secuencias
- .fastq - .bam - .bai - .sam - .sff
TODOS requieren de un Análisis Bioinformático avanzado, no es posible analizarlo «manualmente».
Softwares que ensamblan genomas de novo
Softwares que alinean secuencias usando genoma de referencia
Softwares que permiten visualizar los alineamientos de forma gráfica
Softwares que analizan secuencias para determinar variantes
Aplicaciones Secuenciamiento Masivo
Estudio de Muestras en Paralelo
Muestra 1
Muestra 2
Muestra 3
Muestra 4
Muestra 5
Muestra 6
Barcode 1
Barcode 2
Barcode 3
Barcode 4
Barcode 5
Barcode 6
POOL
Secuenciamiento
Hasta 96 muestras en paralelo
Aplicaciones Secuenciamiento Masivo
Estudio de Muestras Complejas
Extracción DNA desde saliva Preparación librería Secuenciamiento Análisis bioinformático
Kidd et al., 2014
Aplicaciones Secuenciamiento Masivo
Estudio de Mutaciones en profundidad
Permite caracterizar mutaciones poco frecuentes en una población, incluso aquellas con frecuencias menores al 1%.
Permite determinar poblaciones dentro de una muestra.
Usando la variaciones en las secuencias (SNP) podemos entender las relaciones entre las cepas
Cuando los SNP son compartidos por los aislados, es una evidencia de que ellos pueden estas Relacionados y se pueden agrupar.
Aplicaciones NGS
Estudio de Virulencia en muestras
C. difficile 4,4 mb
Linfogranuloma venéreo
Gran desafío: Bioinformática
Instituto de Salud Pública de Chile
National Microbiology Laboratory Canadá
Dr. Gary Van Domselaar
Use of NML bioinformatics server cluster
Human resources training
Collaborative research
Estudios preliminares realizados en el Instituto de Salud Pública de Chile
spe
100
95
spe
Key
M-090-14
M-092-14
M-125-11
M-046-14
M-048-14
M-054-14
M-081-14
año
.
.
.
.
.
.
.
Subtipo genetico
Cl-Nm-Spe-060
Cl-Nm-Spe-060
Cl-Nm-Spe-060
Cl-Nm-Spe-030
Cl-Nm-Spe-030
Cl-Nm-Spe-031
Cl-Nm-Spe-031
Grupo
W135
W135
W135
W135
W135
W135
W135
porA VR1
5
5
5
5
5
5
5
porA VR2
2
2
2
2
2
2
2
procedencia
.
.
.
.
.
.
.
N°Lab
.
.
.
.
.
Fecha
.
.
.
.
.
.
.
Nombre
.
.
.
.
.
.
.
Apellido 1
.
.
.
.
.
.
.
Apellido 2
.
.
.
.
.
.
.
Edad
.
.
.
.
.
.
.
Sexo
.
.
.
.
.
.
.
SS
.
.
.
.
.
.
Muestra
.
.
.
.
.
.
.
Diag clinico
.
.
.
.
.
.
.
fHbp
.
abcZ
.
.
.
.
.
.
.
adk
.
.
.
.
.
.
.
aroE
.
.
.
.
.
.
.
fumC
.
.
.
.
.
.
.
gdh
.
.
.
.
.
.
.
pdhC
.
.
.
.
.
.
.
pgm
.
.
.
.
.
.
.
MLST ST
11
11
11
11
11
11
11
MLST CC
ST-11 complex/ET-37 complex
ST-11 complex/ET-37 complex
ST-11 complex/ET-37 complex
ST-11 complex/ET-37 complex
ST-11 complex/ET-37 complex
ST-11 complex/ET-37 complex
ST-11 complex/ET-37 complex
Las cepas M-090-14 y M-092-14 corresponden a casos clínicos que trabajaban en el mismo lugar. Ambas cepas correspondían a pacientes de sexo masculino entre 46 y 49 años aisladas el 20 de Julio del 2014.
Serosubtipo
Serogrupo
W
W
W
W
W
W
W
Subtipificación de N. meningitidis W mediante
PFGE
Estadísticas ensamble
Statistics for contig lengths: M-46-14 M-48-14 M-59-14 M-81-14 M-90-14 M-92-14 M-125-11
Min contig length: 78 78 78 78 78 78 78
Max contig length: 176,537 169,533 168,162 168,068 132,633 169,539 108,004
Mean contig length: 6084.11 6305.73 5969.38 5289.90 5532.40 6826.23 5924.66
N50 contig length: 35,230 32,503 31,709 29,902 26,909 35,690 31,633
Statistics for numbers of contigs:
Number of contigs: 350 338 358 404 385 312 361
Number of contigs >=1kb: 113 119 132 131 138 114 124
Number of contigs in N50: 19 20 19 22 23 19 22
Statistics for bases in the contigs:
Number of bases in all contigs: 2,129,437 2,131,338 2,137,039 2,137,118 2,129,973 2,129,783 2,138,803
Number of bases in contigs >=1kb: 2,065,190 2,063,466 2,073,857 2,063,068 2,064,785 2,070,542 2,070,499
GC Content of contigs: 51.75 % 51.77 % 51.73 % 51.76 % 51.77 % 51.75 % 51.76 %
Coverage genome all contigs (%) 97,0 97,1 97,4 97,4 97,0 97,0 97,4
Coverage genome contigs >=1kb (%) 94,1 94,0 94,5 94,0 94,1 94,3 94,3
Z2491 Serogrupo A FAM18 Serogrupo C NM_w135_M17661 draft serogrupo W135 Similitud de CDS > 80%
Comparación de los aislados de N. meningitidis mediante Pangenoma
M-92-14 M-90-14
Ejemplo resultado obtenido en BIGSDB, genes de virulencia
Árbol Filogenético Core SNPs
Tabla Core SNPs
strain M-46-14 w135_M7124 M-48-14 M-92-14 M-90-14 M-81-14 M-125-11 M-126-11 M-59-14 M-14-12
M-46-14 0 1439 52 1210 1212 1056 1036 701 673 650
w135_M7124 1439 0 1421 1351 1349 1336 635 856 848 807
M-48-14 52 1421 0 1186 1188 1034 1010 677 649 626
M-92-14 1210 1351 1186 0 8 835 966 613 617 588
M-90-14 1212 1349 1188 8 0 837 964 611 621 586
M-81-14 1056 1336 1034 835 837 0 927 582 510 549
M-125-11 1036 635 1010 966 964 927 0 449 439 398
M-126-11 701 856 677 613 611 582 449 0 92 57
M-59-14 673 848 649 617 621 510 439 92 0 59
M-14-12 650 807 626 588 586 549 398 57 59 0
Cepa de referencia w135_M7124, relacionada al brote durante la temporada de Hajj,
Meca año 2000.
Estudio de resistencia a carbapenemasas
Se aisló cepa S. marcescens
Resistencia a carbapenemasas positiva
Tipo de KPC 2
PFGE subtipo nuevo
Se aisló cepa K. pneumoniae
Resistencia a carbapenemasas positiva
Tipo de KPC 2
PFGE subtipo nuevo
ST 454, CC 347
Purificación plasmidial
Purificación plasmidial
Secuenciamiento Masivo: Ambas cepas presenta el mismo plásmido que contienen la región KPC
Abril 2014
Plásmido pNE1280
Tn4401f, región KPC
Comparación aislados de plásmido de K. pneumoniae, Serratia marcescens con pNE1280
Aislado Tamaño % cobertura
pNE1280 66532 bp 100
Plásmido 1. Serratia marcescens
61436 bp 92.34
Plásmido 2. K. pneumoniae
64551 bp 97.02
% cobertura en elación a plásmido de referencia pNE1280
Comparación plásmidos aislados de K. pneumoniae y Serratia marcescens.
• Plásmido1: aislado S. marcescens • Plásmido2: aislado K. pneumoniae
Gracias