Acidos Nucleicos secuensiacion

16
Métodos de secuenciación de ácidos nucleicos. Gonzalo Greif . Unidad de Biología Molecular. Institut Pasteur Montevideo. 1. Un poco de historia 2. Secuenciación por método de Maxxam y Gilbert 3. Secuenciación por método de Sanger a. Avances en el método de Sanger (19861996) b. Proyecto Genoma Humano 4. Algunos Métodos de secuenciado masivo a. Pirosecuenciación b. Secuenciado por hibridización (Illumina) c. Otro métodos d. Aplicaciones 1. Un poco de historia. Pasaron 15 años desde el descubrimiento de la estructura de doble hélice del ADN en 1953 hasta la determinación de la primera secuencia de ADN de forma experimental. Algunas de las razones que provocaron esta demora fueron: 1. Las propiedades químicas similares de las diferentes moléculas de ADN dificultaban su aislamiento. 2. El largo de las moléculas de ADN, mucho mayores que las cadenas polipeptídicas de las proteínas, hacían inabordable la secuenciación completa. 3. No se conocían ADNasas específicas. La secuenciación de proteínas se basaba en el uso de proteasas que cortaban en determinados aminoácidos. Sin embargo, algunas moléculas de ARN no ofrecían estas dificultades, en particular las moléculas de ARN de transferencia eran pequeñas y se podían purificar individualmente. Además se conocían ARNasas baseespecíficas y se desarrollaron métodos análogos a los utilizados para proteínas. La primer secuencia de un ácido nucleico fue obtenida por Holley y sus colaboradores en 1965 y correspondía al ARN de transferencia de alanina de Escherichia coli. Un evento importante en el desarrollo de los métodos de secuenciación de ADN fue el descubrimiento de las enzimas de restricción de tipo II en 1970. Estás enzimas reconocen y cortan el ADN en secuencias específicas (en general entre 4 y 6 bases de largo). Estas enzimas proporcionaron un método general para fragmentar largas moléculas de ADN en pequeñas piezas para luego ser separadas por electroforesis en geles de agarosa. A mediados de la década del 70, Frederick Sanger publica el método “másmenos” (“plusminus” method) que permitía la secuenciación de fragmentos de ADN utilizando la enzima ADN polimerasa de E. coli. A fines de esta misma década, Maxxam y Gilbert publican un método alternativo de secuenciación de ADN (método químico) y el mismo Frederick Sanger publica el método que luego se convertiría en el más utilizado durante los siguientes 30 años (método enzimático), como veremos en el punto 3.

description

secuensiacion de los acidos nucleicos, metodos utilizados

Transcript of Acidos Nucleicos secuensiacion

  • Mtodosdesecuenciacindecidosnucleicos.GonzaloGreif.UnidaddeBiologaMolecular.InstitutPasteurMontevideo.

    1. Unpocodehistoria2. SecuenciacinpormtododeMaxxamyGilbert3. SecuenciacinpormtododeSanger

    a. AvancesenelmtododeSanger(19861996)b. ProyectoGenomaHumano

    4. AlgunosMtodosdesecuenciadomasivoa. Pirosecuenciacinb. Secuenciadoporhibridizacin(Illumina)c. Otromtodosd. Aplicaciones

    1. Unpocodehistoria.

    Pasaron15aosdesdeeldescubrimientode laestructuradedoblehlicedelADNen1953hastaladeterminacindelaprimerasecuenciadeADNdeformaexperimental.Algunasdelasrazonesqueprovocaronestademorafueron:

    1. LaspropiedadesqumicassimilaresdelasdiferentesmolculasdeADNdificultabansuaislamiento.

    2. EllargodelasmolculasdeADN,muchomayoresquelascadenaspolipeptdicasdelasprotenas,hacaninabordablelasecuenciacincompleta.

    3. NoseconocanADNasasespecficas.Lasecuenciacindeprotenassebasabaenelusodeproteasasquecortabanendeterminadosaminocidos.

    Sin embargo, algunas molculas de ARN no ofrecan estas dificultades, en particular lasmolculas de ARN de transferencia eran pequeas y se podan purificar individualmente.Adems se conocan ARNasas baseespecficas y se desarrollaron mtodos anlogos a losutilizadosparaprotenas.LaprimersecuenciadeuncidonucleicofueobtenidaporHolleyysuscolaboradoresen1965ycorrespondaalARNde transferenciadealaninadeEscherichiacoli.Un evento importante en el desarrollo de los mtodos de secuenciacin de ADN fue eldescubrimientode lasenzimasde restriccinde tipo IIen1970.Estsenzimas reconocenycortanelADNensecuenciasespecficas(engeneralentre4y6basesdelargo).Estasenzimasproporcionaronunmtodo generalpara fragmentar largasmolculasdeADN enpequeaspiezas para luego ser separadas por electroforesis en geles de agarosa. Amediados de ladcadadel70,FrederickSangerpublicaelmtodomsmenos (plusminusmethod)quepermita la secuenciacinde fragmentosdeADNutilizando laenzimaADNpolimerasadeE.coli. A fines de estamisma dcada,Maxxam y Gilbert publican unmtodo alternativo desecuenciacindeADN(mtodoqumico)yelmismoFrederickSangerpublicaelmtodoqueluegoseconvertiraenelmsutilizadodurante lossiguientes30aos (mtodoenzimtico),comoveremosenelpunto3.

  • 2

    El mfebrepubli

    En eparadeuncadadesdepoliacdeesEl mpoliacADN.

    2. Secuenci

    todo de seero de 1977caraelmtoelartculodesecuenciarunADNmarcunade lasbe el extremcrilamidaysstamolculatodo propcrilamida,y

    acinqumicecuenciacinen el Volu

    ododesecueescribenelpunamolculcado radioacbases.Elcormo marcadoseparandod.puesto estabenesteprim

    ca.n qumica pmen 74 (nenciacinenzrocedimientladeADN.Etivamenteerteparcialdo hasta laichosfragme

    ba limitadomerartculo

    Elqu(18dimestpHinteelproy thidtim

    Endur(mo

    FigupoIntUntenqueposcolsl

    Mto

    propuesto po2) de la re

    zimticaquetodeestamElprocedimienunextremecadabasebase dndeentosporta

    por la capmuestran la

    mtodoutilimica produ8M hidracinametilsulfatoetratamientneutro, entensoparalascontrario, eovocaunpattenues dedracina)prodminas.laFigura1,rante la secuostradoene

    ura 1. Se mliacrilamida cerpretacin:a banda intenueenlasegue lasituacinsicin. Una bumna en laopresenteen

    odosdesecu

    or Maxxamevista PNAS,everemosenmanera:Desentodetermmo,cortndoe,generaune fueron cmao,espo

    pacidad deaposibilidad

    izaba4reaccuce cortes ea, 2M NaClcortaenAdetoqumicostonces se osguaninasyel tratamientrninversoguaninas). Educeelclivaj

    semuestraeuenciacindelartculode

    muestran loscon cada unaLa secuenciaensa en la pundacorrespo inversacorrebanda que apmisma posicinlaltimacol

    enciacinde

    y Gilbert, f10meses a

    nlasiguientearrollamosumina lasecueoloconagensetde fragmlivados. Utiosibledeterm

    resolucinddesecuen

    cionesqumiespecficame. Una reacceninasyGuaecalientalaobtiene un ptenuesparanto posterio(bandasinteEl ltimo tjetantoenc

    elpatrndedeun fragm1977).

    cuatro cara de las reacse lee de a

    primera columondenaunaAespondeaunparece en lan indica unumnacorresp

    ecidosnuclGonzalo

    fue publicadantes que Seseccin.unanuevatencianucleontesqumicomentosmarlizando geleminarlasecu

    de los geleciar100bas

    icas.Unareaente en Citocin con 50aninas;siluereaccina9patrn de balasadeninar a un pHensasdeaderatamientocitosinascom

    ebandasobtentode64

    rriles del gecciones de clibajo hacia armna y una bAdenina,mienaGuaninaentercera y cua C. y una bpondeaunaT

    leicos.oGreif

    2

    do enSanger

    cnicaotdicaosenrcadoses deuencia

    es desesde

    accinosinas0 mMegode90Caandasas.Porcidoeninas(18Mmoen

    tenidobases

    l deivaje.rriba.andantrasnesauartaandaT.

  • Fred

    Fuequeprot(195

    En1dnResocomunaobtu(m

    En1losc

    En1Fuen

    Lectu

    3

    Endicmtohabapartirdificusecuemto

    As, esecueaspeccapila(finalpremlaapcidoprinclosse

    derickSange

    elaprimerap lasprotenastenas deber58).

    1962,Sangercnde Francis Colvercomoomoestudiando tcnicaaplicuvo por ellotododesecue

    1992,elWellccentrosdesec

    1985seretirntes:http://www.

    urasrecomendad

    3. Secuenci

    ciembrede1odoparadetan ya publicrdelcualhaultad en la iencia hicieroodosdesecuelmtodo penciacin dectostecnolar, etc.) perizado en el

    mioNobelenaricindeloosnucleicos.ipiodenuclecuenciadore

    er(1918)Frederick Saesperabaquedecidi realirealizandouncontinutrabel transcursoordenanlosa

    personaenobseranmolcuan tenerun

    comienzaatrrick, John Kebtenerlasecuoprimero la fcable luegoalsu segundoenciacinqu

    comeTrustycuenciacind

    ysededicap.dnaftb.org/23/b

    das:NobelLectu

    acinenzim1977sepubterminar lascado dos aabanlogradonterpretacion que Sangenciacindepropuesto pe cidos nucgicosymetormitieron, cao 2003)Qumicapo

    ossecuenciaAunas,muetidos termesdeIllumin

    nger naci eneFredsiguierizar una carrnPh.D.conAbajandoconCo de la inveaminocidose

    btenerlasecuulasordenadaordeno secu

    rabajarenellendrew y otrouenciadeADformadeseclADN (elmtpremio Nobmica)yPaulB

    elMedicalRdndesellev

    principalmente

    io.html/http://wre(FrederickSan

    tica.licaeltrabajsecuenciasdos antes, unoobtenerdon de los reger y sus coecidosnuclor Sanger ecleicos hastaodolgicos(aomo hito fupor estemrlainvencidores454sechasdelasnminadores,dna.

    Mto

    n Rendcomberasuspasos,sera en CiencAlbertNeuberC.Chibnallidestigacin, Saenlaprotena

    enciadeaminasy,poranauencia. Por es

    aboratoriodeos trabajabanNeralaextenuenciarARNtodode secuel tambin eBerg(ADNrec

    esearchCounadelanteelp

    ealcuidadodwww.sanger.ac.uk

    ger,1980).

    odeSanger,debasesennmtodo dossecuenciasultados y aolaboradoreeicos.en 1977 se ca la actualidautomatizacundamental,todo. En 19ndeestemediouncamnuevastecnodescritopor

    odosdesecu

    e, Inglaterra esinembargoecias. Continuger,enmetabentificandolosnger imagina.

    nocidosdeuloga, losgenste trabajoo

    eBiologaMon con problemnsinnatural(unamolculenciacinporen Qumica ccombinante).

    ncilestablecieproyectoGeno

    desujardn.k/about/people/

    ,NicklenyCounamolcude secuenciaasde70basealgunos erros siguieran

    convirti endad. La incoin,mtodo, la secuenc980 Frederictodo(verrembioenlateologasdeseSanger,com

    enciacinde

    en 1918.DeenlaUniversi su formacibolismodeamsaminocidos las formas

    unaprotena(nesyelADNbtuvo suprim

    lecular,tambmas relacionadesutrabajolamspequerdideoxinuclecompartido co

    eronelSangeromaHumano

    biographies/fsan

    oulsonquepladeADN. acin (mtodesdelbacteores que podtrabajando

    elmtodorporacin dosdedetecciciacin delck Sangerobecuadro).Reecnologadeecuenciacinmoveremos

    ecidosnuclGonzalo

    padremdicdaddeCambn en Cambminocidos.Lsdelainsulinen las cule

    (lainsulina).PquecodificamerpremioN

    inenCambrados con el Aoanterior.Fueea) logrobtetidos).En1on Walter Gi

    r Institute,un.

    nger.html

    proponeunnSangeryCodomsmenrifagoX1dan ocurrirpara mejora

    ms utilizademejoras ein,electrofgenoma hubtuvo su segecinen2005secuenciacimasivautilimsadelan

    leicos.oGreif

    3

    o, seridgeridgeLuegona,enes se

    ProbestasNobel

    ridge,ADN.eas,tener1980,ilbert

    node

    nuevooulsonnos) a74.Laen laar los

    do deen losforesismanogundo5,conndezanelnteen

  • ElmcadendideoFiguADN(Figu

    Enelreaccextendebepresetrifos

    Figura2

    Figura3naciente

    todo enzimna de ADNoxinucletidoura2).Lainimpide quera3).

    artculoejecin:Debidondindose,erahaberseencia de unasfato (uno

    2.Estructurade

    .Esquemademeluegodelainc

    mtico de Saque est sios(esdecirncorporacine una nueva

    emplifican,doaqueeldentonces la tincorporadoamezcla dede ellos m

    unnucletido

    mecanismodescorporacinde

    anger, utilizaendo sintetnucletidosdeunabasea base pued

    de forma cladTnocontieterminacin.Siuncebade ddTTP yarcado radi

    (ej.dATP)yun

    sntesisdeADNeundidoxinucle

    Mto

    a una ADN pizada en lugqueensucaeconestasca incorporas

    ara,que sucenegrupo3ocurreespedoryunmoldTTP, as coiactivamente

    dideoxinucle

    N(1),y(2)impoetido.

    odosdesecu

    polimerasa egares especarbono3nocaractersticase y la snte

    ede cundohidroxilo, lecficamenteldesonincubomo los otre con 32p),

    tido(ddATP).

    osibilidaddeco

    enciacinde

    e inhibidoreficos, particocontienenasenunmolesis de ADN

    utilizandidacadenanoeen lasposbadosconAros tres deo, se obtien

    ntinuarelongac

    ecidosnuclGonzalo

    s que finalizcularmenteelgrupohidlculanacienN es interrum

    deoxiTiminaopuedecontsicionesdnDNpolimeraoxiribonucleoe un mezc

    cindecadena

    leicos.oGreif

    4

    zan lautilizadroxilontedempida

    en latinuardedTasaenosidoscla de

    a

  • fragmesframuesparamezcsecue

    Lasse

    Figuraprincip

    mentostodosaccionadapostra ladistribcada uno d

    claenparaleenciadebase

    ecuenciasob

    4.Esta imagenpiodelmtodo

    sconelmismorelectroforbucindelode los cuatrloenelgel,es(Figura4

    btenidascon

    nseencuentradedideoxinucle

    moextremoresisdesnatusresiduosTro nucletidseobtieneu

    4y5).

    estemtod

    en laNobelLeetidostermin

    Figura 5.Se tratamezclasimagensLas lectudeacuerdnucletid

    Mto

    5yconresuralizanteenTiminaenelos en reaccunpatrnde

    oalcanzaban

    ecturedeF.Saadores.

    Estaimagencodeun autorad(una para cadeleenlassecuerasserealizandoalaaparicidodediferencia

    odosdesecu

    iduosddTenngelesdeacADNsintetizciones indepebandasap

    nhasta200

    angerde1980.

    orrespondealadiografa dndeda dideoxinucleenciasdeADNdeabajo(frag

    ndelasbandaaentamao.

    enciacinde

    nelextremocrilamidaelzado.Utilizanpendientes,partirdelcua

    basesdelarg

    En lamismas

    asegundafigure semuestra laetido termina(enestecasougmentosmsps.Laresolucin

    ecidosnuclGonzalo

    o3.Siestampatrndebndoterminay corriendoalsepuedel

    go.

    seejemplificae

    adelartculodamigracin deador utilizado).unfragmentodequeos)haciandelgel,permi

    leicos.oGreif

    5

    mezclaandasadores cadaeerla

    el

    eSanger(PNASe las cuatrodif. A la derechelbacterifagoaarriba(msgitesepararban

    S,1977).ferentesha de laoX174.grandes),dasde1

  • a

    I.

    En 19primecontmolenunLas snucle

    II

    LaemprimesecueUSA)secueEn 19secueConedesarestracopiaVentede43

    a. Avancesy.Secuenciaci986 Hood yerreportedeerminadoresculafluorescnnicotubosecuencias oetidos.

    I.SecuenciacmpresaAppler secuenciaenciadelpri.Laaparicienciacin.El992,Venterenciacincoestaplataforrrollodelaetegia consisa) y clonarlaerreporta33millonesde

    a.

    ymejorasenincontermy colaboradoeautomatizasfluorescentcentedifereo(Figura).Asobtenidas, co

    cinautomtliedBiosysteador autommergenporndelossecprimerodefundael Inn30equiposrma instaladestrategiaESteenhaceras de forma37geneshuesecuencias

    b.

    nelmtodominadoresfluores, en colaacindelastescomovanteunidaasimismo,lason esta nue

    tica.ems, fue laptico (ABI 37rCraigVenteuenciadoreseellosfueelstitute forGs.da,sedemueT(expressedcopiasdeAaleatoria p

    umanosnoccorrespond

    Fipadepasele

    c.

    Mto

    deSanger(1uorescentes(aboracin csecuenciaciriantedelmcadadideoxsecuenciapueva variante

    pionera y ld70A) aparecerysuscoleautomticoNIH,dndeGenomicRes

    estraelpoddsequencetADN apartirara luego seonocidos.Lientesa130

    gura6.Enestaaracadabase)elgel(cadacoloaraconvertiresecuenciadeADctura53.

    odosdesecu

    19771996).(dyeterminaon AppliedndeADN,q

    mtododeSainucletido,uedeserlederan de un

    deren instruce en 1987,egasdelNatospermitilaese instalarosearch (TIGR

    erde lasectag)paraeldrdelARNmecuenciar. Eabasededa0organismo

    afiguraseejem(a),secorrenorrepresentausassealesenDN (c). La flech

    enciacinde

    atorsequencBiosystems

    queestableceanger.Estvaypermitere

    daatravsdn largo de e

    umentosdey con l seionalInstitutainstalacinon6secuencR) y expande

    uenciacinadescubrimienmensajero ceEn 1991, conatosdeESTosdiferentes

    mplificacomoetodas lasreacunabase)(b)yelectroferograha a la izquierd

    ecidosnuclGonzalo

    cing).(ABI) publicelasecuencarianteutilizealizarlareaeuncomputentre 500 y

    secuenciaci logra conoteofHealthndefacilidadciadoresABIe la capacid

    automticacntodegeneselular (ADNcn esta estracontieneho.

    nlugarde4cacionesenunsedesarrollanaamasquereprda indica ladir

    leicos.oGreif

    6

    can eliacinzaunaaccintador.1000

    n.Elcer la(NIH,desdeI3700.ad de

    conels.Estac=ADNategia,yms

    rriles(unonicocarrilalgoritmosresentanlareccinde

  • Mtodosdesecuenciacindecidosnucleicos.GonzaloGreif

    7

    b. ProyectoGenomahumano:Lasecuenciacindelgenomahumanosevolviunobjetivorealizableunavezestablecidaslasmetodologas de secuenciacin de ADN. La discusin formal comenz en 1985 en EstadosUnidos.En1990,sepresentunproyectode5aosenelcongresodeEstadosUnidos(HumanGenomeProject).Seestimabaqueelproyectodurara15aosyelcosto rondara los3milmillones de dlares. El proyecto estableca el objetivo demapear y secuenciar diferentesorganismos modelo adems de humano. Entre ellos E. coli, S. cerevisiae, C. elegans, D.melanogaster y el ratn (Mus domesticus). El proyecto se convirti en un esfuerzo decolaboracininternacionalentrediversoscentrosdesecuenciacinenEstadosUnidos,EuropayJapn.Cadacentrosefocalizenregionesparticularesdelgenoma,quepermitieranobtenerunmapa.En1994sepublicunmapadetalladodelgenomahumanoqueincluaelmapeode5840lociconunamediadeespaciadode0,7cM(1centiMorgan=106bases).En1998,elproyectopblico,compitiendoahoracon laempresaCelera (propiedaddeCraigVenter)adoptalossecuenciadorescapilaresdeAppliedBiosystems(ABI3700). En1999elproyectoGenomahumanohaba secuenciadomsdemilmillonesdebasesysepubliclasecuenciacompletadeuncromosomahumano(elcromosoma22).Para el mismo tiempo, Celera, comenz asecuenciarelgenomahumanocon laestrategiade whole genome shotgun sequencingdesarrollada por C. Venter (explicada msadelante). La secuenciacin comenz ensetiembrede1999yenjuniode2000serealizun ensamblaje inicial de las secuenciasobtenidas. Los datos de Celera permitieron elensamblaje del genoma humano con unacobertura de 5X (ver Cobertura). Adems seaumentlacobertura3Xconlosdatospblicos.El 25 de junio de 2000, en la Casa Blanca, elpresidente Clinton junto a Francis Collins(responsabledelproyectopblico,NIH) yCraigVenter, anunciaron pblicamente la versinborrador del genoma humano realizada tantoporelesfuerzopblicocomoprivado(Figura7).Enfebrerode2001,sepublicaronlosborradoresdelconsorciopblicoydelprivadoenScienceyNature(Figura8).Finalmenteenelao2004sepubliclaversinfinaldelgenomahumano.

    Cobertura(Coverage):La cobertura es elnmeropromediodesecuencias que representan a undeterminado nucletido en la secuenciatotalreconstruida.Puedesercalculadaapartirdellargooriginaldelgenoma(G),elnmero de secuencias (N) y el largopromediodelassecuencias(L)como:Cobertura=NxL/GEjemplo.Ungenomahipotticode2000bases,secuenciadocon24secuenciasde350 bases de promedio de largo tieneunacoberturade:24x(350/2000)=4,2X.Este valor significa que el genoma fuesecuenciado 4,2 veces. Cunto mayorcobertura, menor posibilidades deerroresenlasecuenciafinal.

  • Whol

    Elmclonaobtensolapasin eminflue

    En19mejor(Haemcolaboratn

    En20JCVSFtrabaj

    egenomeShotododeWhorloenplsminidas,lassecuan(Figura9).mbargo Ventenzae,1,8Mb)

    95,Venterysrados de secmophilus influoradores, com).006se fundF,etc.).Setrajando.

    ra9.Esquemaeradosalazar

    otgunsequenleGenomeShidos y secuenuenciassealinElmtodofuer fue el primyproponerlo

    sugrupodecidcuenciacinuenzae).EnTmenzaron en

    el J.CraigVetadeunaorg

    adesecuenciaryensamblaj

    ncingyCraigVhotgunconsisnciarambashneanyensameutilizadopomero en utilocomoestrate

    denutilizarnupara realizarIGRanalizarmtonces la sec

    nter Instituteganizacinlde

    acinconlaeedelasecuen

    Mto

    Figura7.Fohumanoe Figura8.Tlosborrad

    Venter:steenlafragmhebras (elpasmblanparafororSangeren1izarlo para seegiaparasecu

    uevasherramr la primermsde50 gecuenciacin d

    e (JCVI)por laerengenmi

    estrategiadeSnciautilizando

    odosdesecu

    otodelanzamnWashington

    apasderevistdoresdelgeno

    mentacinalasode clonadormarcontigsb1982paraensecuenciar unuenciarelgen

    mientascompusecuencia deenomasmicrode genomas d

    aunindevacaanivelmu

    Shotgun.Secuoprocesamien

    enciacinde

    mientodeborrn(Clinton,Ven

    tasNatureySomahumano.

    azardelADNo luego fueebasndoseensamblarelfaggenoma deomahumano

    utacionalesase un organisobianos.Ventdemayor tam

    riasorganizacundialconm

    uenciacindentoinformtic

    ecidosnuclGonzalo

    radordelgenonter,Collins).

    Sciencede200

    detodoelgeeliminado).Unlassecuenciagolambda(48mayor tama

    o.

    scomolosmsmo de vidater yalgunodmao (mosca

    ciones (TIGR,sde400cien

    fragmentosco.

    leicos.oGreif

    8

    oma

    01con

    enoma,na vezasque8,5kb),o (H.

    todosa librede sus, rata,

    TCAG,ntficos

  • Mtodosdesecuenciacindecidosnucleicos.GonzaloGreif

    9

    4. AlgunosMtodosdesecuenciadomasivoPasaroncercade30aosdesde lapublicacindelmtododeSanger,hastaqueaparecierauna nueva tecnologa de secuenciacin de cidos nucleicos que no fuera el mtodo dedideoxinucleotidosterminadores.Laprincipalcaractersticadeestasnuevasmetodologasesla posibilidad de secuenciado masivo de forma paralela, esto significa que el nmero desecuenciasobtenidasduranteunacorridasuperamuchasveceselmximode96secuenciasporcorridaqueseobtienenconlossecuenciadorescapilaresdeltimageneracinqueutilizanelmtododesecuenciadodeSanger.

    A partir del desarrollo del mtodo de pirosecuenciacin (primer mtodo de secuenciadomasivo utilizado, 2005), surgen nuevas alternativas de secuenciacin que utilizan elmismoprincipio de dideoxinucleotidos terminadores en sus protocolos, aunque con mejorasinnovadoras.

    Estosnuevosmtodosdesecuenciadomasivonoofrecenlecturastanlargascomoelmtodoclsico de Sanger, aunque en pocos aos se hamejorado sustancialmente el largo de lassecuenciasobtenidasyenalgunoscasosalcanzanlongitudescomparablesaSanger.

    a. Pirosecuenciacin:

    Elprimermtododesecuenciadomasivoonextgenerationsequencing(NGS),fuepublicadoen2005enNature,y llevadoalmercadopor laempresa454 (luegoadquiridaporRoche).Elresumen de este artculo explica: Describimos un mtodo escalable, un sistema desecuenciacin altamenteparalelizable conun rendimiento significativamentemayorque losinstrumentosdeelectroforesiscapilar.Elaparatopermitesecuenciar25millonesdebases,con99% de precisin en una corrida de 4 horas (este rendimiento es 100 veces superior a lacantidaddebasessecuenciadasenesetiempoenunsecuenciadorde96capilares).

    En el primer artculo, publican la secuenciacin de novo del genoma de Mycoplasmagenitaliumalcanzandocubrirel96%delgenomayconunaprecisinde99,96%enunacorrida.

    Elmtodoconsisteen4pasos:1. FragmentacindelADN(oARN).2. Ligacindeoligonucletidos(adaptadores)encadaunodelosextremos.3. Amplificacinclonal(mediantePCRenemulsin).4. Secuenciadoporsntesisusandounprotocolodepirosecuenciacinoptimizadoenun

    soporteslidoyenescaladepicolitros.Ms en detalle, luego de fragmentar elADN, se ligan oligonuclotidos adaptadores a cadaextremo del ADN. Estas secuencias adaptadoras comunes a todos los fragmentos sernutilizadas,tantoparaligarcadafragmentoalasesferas,comosecuenciasdondeseunirnloscebadores de la PCR y adems presenta la secuencia donde se unir el cebador desecuenciacin.Unavezligadoslosadaptadores,seliganalasbeads(esferasquecontienenelcomplementarioaunodelosadaptadoresensusuperficie),porunmtododedilucinlmite,demododeobtenerunnicofragmentounidoaunaesfera.Sebusca,entonces,obtenerencadabeadunnicofragmentodeADN,elmismoesamplificadomediantePCRenemulsin.

  • PCReLa Pindepesferobtenfragmmicelreactmicro

    Figuracomplemulsframgecofactmilesfragme

    Luegopreseplacaunbepodesecue

    enemulsinCR en emupendientes.Uas que contner un nicmentodeADlas de aceitetivos necesaoreactoresd

    a 10. Esquemaementariasauin (aguaaceitentoyencontrores).(3)Luegode reaccionesentounidoaun

    o de finalizentaron ampa(picoTiterpead(Figura1mos decirenciadoresd

    (emPCR):ulsin permUnavezobtetienen unoo fragmentoDN)esemulse independiarios para lndeselleva

    de la PCR enunode losadate)de tal formramosademsoserealizaunaenparalelo. (4nabead.

    ada esta replificacin. Lplate),tiene11).Encadaque tenem

    de96capilare

    ite realizarenidalalibrede los adapo por esferasionadaenuentes cadalevar adelaaadelantela

    n emulsin. (1aptadoresquemaqueen cadatodos los reacaPCRconvenci4) Luegoden

    eaccin, seLasmismas1,6millonespocillosuced

    mos 1,6 miesaproximad

    Mto

    en un nieradefragmptadores prea. Luego launamezclada uno de ellonte la reacareaccinde

    1) Se liga a caseencuentrana gotade aceitctivosnecesarioonal,peroencciclosde reacc

    rompe la eson depositsdepocillos,derunareallones de sdamente.

    odosdesecu

    ico tubos mmentosquesesentes en lpoblacin ddeaguayacos con unaccin. El reePCRdeform

    ada bead un fen la superficte encontremoospara llevaracadatuboderecin, seobtien

    emulsin ytadas en layencadauaccindesecsecuenciado

    enciacinde

    miles de resernsecuenlos fragmende esferas (ceite,demonica esferaesultado finamaindepend

    fragmento mediede lasmismosunanicabeadelante laPCReaccinserealie unaamplific

    se recuperaplaca de seunodeelloscuencia,porres de 1 c

    ecidosnuclGonzalo

    acciones denciados,seutos, demodcada una codotaldeoba y con todoal, son milediente(Figur

    diante las secumas. (2)Se realeadunida aunR (dNTPs,Polimizansimultneacacin clonald

    an las beadsecuenciacinslopuedeelocualenlacapilar, o 1

    leicos.oGreif

    10

    e PCRunenado deon unbteneros loses dera10).

    uenciasizaunannicomerasa,amentede cada

    s que. Estaentrarplaca16000

  • Figuradelos

    ReaccEstetermdndvez,incornaciepirofomediemitibasedetecpirofo(FigucadaEn elhomolacanEjemEnelobserluzemobserlaba

    a11.PicoTitrepocillosyejem

    cindesecumtodo

    inadores.Eneseofrece

    secuenciaporacin deente de ADosfato liberante dos pdaencadapofrecida,

    ccin luminoosfato durara).Unacmbase,encadl caso de hoopolimeroesntidaddebaplo:primerciclorvalaemisimitida).LuegrvanlospocseG,y luego

    plate.Arriba:emplodecargade

    enciacin:no utili

    nestecaso,encadapocalmente.e una baseDN se liberarado se coprocesos enzpocillo,dndes monit

    omtrica dente la reacmaraCCDcodacicloyenomopolimerosdeterminasesincorpor

    oseofrecendeluz(degodeobtenillosqueincoo laCparat

    squemadedepeunaplaca.

    za nuclese realizancillounabasDuranteen unamola pirofosfatonvierte enzimticos. Ldeseincorpotoreada pola liberaci

    ccin de snlectalosdatcadaposicios (tractos ddoapartirdrada).

    labaseA,eependiendoidas las imorporanT.Sterminarelp

    Mto

    posicindeesfe

    tidosciclosepor

    laculato, eln luzLa luzorlaor lan delntesistosden.de secuenciade lacantida

    n todos loslacantidaddgenes,sereevuelveaeprimerciclo.

    Figura

    odosdesecu

    erasenlospoci

    a con elmisaddepirofos

    pocillos.EndeAincorpoemueve labaliminarlabaLuegode1

    a12.Esquema

    enciacinde

    illos.Abajo:mic

    smo nucletsfato liberad

    aquellosquorada,serlase,yseofreasenoincorp00ciclosfin

    dereaccinde

    ecidosnuclGonzalo

    crografaelectr

    tido), el largdo(proporcio

    uese incorpoaintensidadece labaseTporadayseoaliza lacorri

    pirosecuenciac

    leicos.oGreif

    11

    rnica

    go delonala

    oraseddelaTyseofreceida.El

    cin

  • Mtodosdesecuenciacindecidosnucleicos.GonzaloGreif

    12tamaopromediode cada lecturaesde400basesyenuna corrida seobtienen cercade1millndesecuencias(esdecir400millonesdebases/10horasdecorrida).

    b. Illumina:Lasegundatecnologadesecuenciacinmasivaquesalialmercado (2006) fue ladeSolexa(luego adquirida por Illumina). En esta tecnologa, se utilizan nucletidos terminadoresmarcadosconmolculasfluorescentesaligualqueenlaSecuenciacindeSanger.Ademsdela paralelizacinmasiva (es decir la capacidad de realizarmillones de secuencias en cadacorrida),ladiferenciaconelmtodoconvencionaleslaposibilidaddeeliminarlafluorescenciaunavezobtenidalaimagen,ydesbloquearcarbono3demodoquepuedaaceptarunanuevabase para continuar la reaccin de secuenciacin, haciendo que la incorporacin de unnucletidoterminadorseareversible.Enestecaso,laslongitudesobtenidassonmenoresquelossecuenciadores454(enlaactualidadhasta150bases),sinembargolacapacidadderealizarsecuenciasenparaleloesmuchomayorqueen454(hasta250millonesdesecuencias).Comoresultadoesposibleobtenerhasta6x1012enunasolacorrida.Paradimensionarestenmero,elgenomahumanotieneaproximadamente3x109basesdelargo.Al igual que el mtodo de secuenciacin de Roche, los primeros pasos consisten en lafragmentacindelADNyligacindeadaptadores.Luegohayunpasodeamplificacin(enestecaso, laamplificacinesenunasuperficieslida:flowcell,dndetambinsedar luego lareaccindesecuenciacin).AmplificacinyReaccindesecuenciacin:En el primer paso, la librera se deposita en la flow cell por complementariedad con losadaptadores (1). Luego se produce la amplificacin en puente (2 y 3) en sucesivos ciclos(4,5,6,7,8)hastaobtenerunclusterconlaamplificacinclonaldelfragmentoinicial(8)(Figura13).Figura13.Amplificacinenpuente.Verdescripcineneltexto.

    En la reaccin de secuenciacin, se bloquea uno de los adaptadores (1), y se comienza lareaccindesecuenciacindesdeelotroextremo (2)medianteuncebadorespecfico (Figura14).

    1 2 43 5 6 7 8

    1 2

    Figura14.ReaccindesecuenciacindeIllumina.Verdescripcineneltexto.

  • Mtodosdesecuenciacindecidosnucleicos.GonzaloGreif

    13

    1 2 43

    Durante la reaccin, adiferenciade lapirosecuenciacin, seofrecen los cuatronucletidosterminadoresmarcadoscadaunoconunfluorocromodiferente(1),aligualqueelmtododeSanger.Luegodeunlavado(2),seobtienenlasimgenesyseobtienelaprimerabasedecadacluster(3).Luego,seeliminaelfluorocromoysedesbloqueaelCarbono3,permitiendoqueunnuevo nucletido pueda extender la cadena de ADN naciente (4). Otra vez los cuatronucletidosterminadoresmarcadossonofrecidosa losclusters,comenzandounnuevociclo(Figura15).

    Figura 15. Reaccin de secuenciacin de Illumina. Primer ciclo de secuenciacin (1), incorporacin dedideoxinucletidosmarcados(2),adquisicindeimagen(3),ylavado,desbloqueo,yeliminacindemarcado(4).

    Losltimosmodelosde Illuminapermiten secuenciar enparalelomsde 3000millonesdeclustersconlargosdesde35a150bases(www.illumina.com).

    c. Otrosmtodos:Desde2005hastalafecha,otrastecnologasdesecuenciacinmasivahansidodesarrolladasyotras se encuentran en desarrollo y constituyen una nueva generacin de secuenciadores(Tabla1).Esimposibleenestecaptuloeldesarrolloenprofundidaddecadaunadeellas,porlotantoenlasiguientetablasemuestranotrastecnologasylasfuentesdndeobtenermayorinformacindecadaunadeellas.Algunasdeestastecnologas(SMRT,Helicos)proponenlasecuenciacinapartirdeunanicamolculadeADNentiemporeal.Unadeellas(PacificBiosciences)enteoranotienelmiteencuntoal largode lassecuenciasgeneradasyeventualmentepodrasecuenciarcromosomasenterosenunanicalectura(www.pacificbiosciences.com).Otras, como Oxford nanopore e Ion Torrent (recientemente lanzada al mercado) ofrecennovedosas soluciones y no requieren marcacin fluorescente ni cmaras registradoras deimgenes.Enparticular, IonTorrent (ver recuadro J.Rothberg),sebasaenel registrode loscambiosdepHproducidosdurante la incorporacindebasesdurante lasntesisdeADN.Setrata de micropHmetros que reducen notablemente los costos de secuenciacin(www.iontorrent.com)yprometenserherramientastilesenelreadediagnstico.

  • SG(HS

    IoO

    Tabla

    PlataOLiD(ApplieGenetic AnaHelicos)MRT(Pacific

    onTorrentOxfordNanop

    RothbergnaIngenieraBUniversidadElDr.Rothbpginawebsuhijo fuersalud. SubsDirigilasedelDr.WatGenomeProLacontribubacterial(eEn 2007,RTorrentydeAdemsesfRothbergInFuente:http

    1.Informacin

    formaedBiosystemalysis Syste

    cBiosciences

    pore

    acien1963BiomedicaenddeYale.bergeselpi(www.iontora internadosecuentemenecuenciacintson).Ademoject,encolcindeRothmPCR).othberg comesarrollaelcfundadordenstituteforC://www.ionto

    sobreotrastec

    Tem) Ligacinem true Si

    Sequens) Single

    timeMicropLabelfr

    JonathanMFundadory

    3enNewHanCarnegieM

    ioneroenelorrent.com),oencuidadonte, funda 4delprimergsinicielpaboracincohbergalsec

    menzunnuconceptodeeotrasempreChildhoodDisorrent.com/te

    cnologasdese

    ecnologaningle MoleccingMolecule R

    pHmetrosee,electrica

    M.RothbergCEOdeIonT

    aven,ConnecMellonUnive

    desarrollodlaprimeraid

    os intensivos454 Life SciegenomahumprimerproyeonelDr.Paauenciadoma

    uevonegocisecuenciaci

    esas,vinculasease.eam/jonathan

    Mto

    ecuenciacinma

    Long50bas

    cule 25a5

    Real >1000(enteo>200b

    l ND

    g,Ph.D.(19Torrent.

    cticut.Segrarsity,yrealiz

    detecnologdeasobreelsysecuestioences, lanzanmanodeunictodesecuebo).asivo incluye

    o, a razdenconpHmadasalatecn

    rothberg/

    odosdesecu

    asivaenelmer

    gituddereadses5bases

    basesorasinlmitbases

    963)

    adueningezluegosum

    asdesecuesecuenciadoonara la impndo almercndividuo(seenciadomas

    eeldesarrol

    un comentmetros.nologayme

    enciacinde

    rcadoocercade

    ds Ao200200

    e)ND

    201ND

    enieraqumimaestraydo

    nciacinmaomasivoenportanciadeado el primcuenciandosivodeunAD

    lodelprime

    ario de su h

    edicina.Esta

    ecidosnuclGonzalo

    esalir.

    o7 www.ap8 www

    D www.pa

    1 wwwD www.

    caconopcioctoradoen

    siva.Segnparalelosurelgenomaher secuenciaexitosamentDNantiguo(

    ersistemade

    hijo.Rothbe

    mbinfunda

    leicos.oGreif

    14

    Webppliedbiosystems.co

    w.helicosbio.com

    acificbiosciences.co

    w.iontorrent.com

    nanoporetech.com

    nenla

    cuentaen lageluegoqueumanoen laadormasivoteelgenoma(Neandertha

    eclonadono

    rg funda Ion

    adordeThe

    om

    m

    aeao.aal

    o

    n

  • Mtodosdesecuenciacindecidosnucleicos.GonzaloGreif

    15

    GenomaHumanoySecuenciacinmasiva:Comoyavimosantes, lasecuenciadelgenomahumanasepublicen2004.Lasecuenciacindeestegenoma tuvo un costo aproximado de 3000millones de dlares y cerca de 20 aos de trabajo. Enoctubrede2007,sepublicaelprimergenomadeunnico individuo(J.CraigVenter),realizadoporelmtododeshotgunysecuenciacinSanger.Elcostodeestegenomafueaproximadamente70millonesdedlaresyunaduracinde4aos.Elprimergenomahumanosecuenciadocon latecnologa454fueeldelDr.JamesWatson,auncostode1millndedlaresyendosmeses(2008). Elcostohacontinuadobajandoysehanreportado lasecuenciacindeungenomahumanopormenosde100.000dlares.Variosproyectostienencomoobjetivo lasecuenciacindems individuos,entreelellosTheCancerGenomeAtlasy1000Genomeproject.Hacetansolo10aos,2dedoseransuficientesparacontarel nmerodegenomassecuenciados.En2009, alcanzaban los dedos de ambas manos. Hoy, es difcil de saberlo exactamente, pero unrelevamiento realizadopor la revistaNature, indicaque cercade30.000 genomashumanosestarnsecuenciadosparafinalesde2011.

    d. Aplicaciones

    La produccin de un gran nmero de lecturas a bajo costo permite la aplicacin de lasplataformas de secuenciadomasivo enmuchas aplicaciones, y es imposible describir todasellasaqu.Laprimeraaplicacinobviaeslasecuenciacindegenomas(verrecuadroGenomaHumano y Secuenciacin masiva) y la precisa anotacin de genes (sitios de splicing,poliadenliacin,secuencias5y3UTR,etc).Dentrodelasprimerasaplicacionesencontramosla secuenciacin de ARN (ej. descubrimiento de ARN pequeos, nuevas variantes gnicas,nuevos genes, etc.) y amplicones de PCR (secuenciado de ARNr16S y su aplicacin enmetagenmica como veremos en el siguiente prrafo). Asimismo, la posibilidad decuantificacindetranscriptosqueofreceestatecnologa(RNAseq),lavuelveunaalternativaalosexperimentosdemicroarreglos.Lasecuenciacinparaidentificarmarcadoresepigenticos,identificar interaccinADNprotena, determinarestructuradecromatina(ChIPSeq,Methylseq,DNaseseq)sonaplicacionescadavezmsutilizadas.LametagenmicaeselestudiogenmicodemicroorganismosporlaextraccindirectadeADNde una comunidadmicrobiana. La aparicin de la secuenciacinmasiva ha facilitado a losinvestigadores la tareade identificacinycaracterizacindediferentesmicroogranismos,endiferentesambientes.En la seccinde lecturas recomendadas seofrecen revisionesbibliogrficasde cadaunadeestasaplicacionesparaqueellectorprofundiceenellas.

  • Mtodosdesecuenciacindecidosnucleicos.GonzaloGreif

    16Lecturasrecomendadas:1. Sanger F. Coulson R. A rapid method for determining sequences in DNA by primed

    synthesiswithDNApolymerase. J.Mol.Biol.,94,441448 (1975).MtodomsmenosdeSanger.

    2. MaxamA.andGilbert.AnewmethodforsequencingDNA.PNAS,74(2),560564,(1977).Articulodndesedescribemtodoqumicodesecuenciacindecidosnucleicos.

    3. Sanger,F.,Nicklen,S.andCoulson,A.R.DNAsequencingwithchainterminatinginhibitors4. PNAS, 74 (12), 54635467 (1977). Artculo de Sanger dnde describe el mtodo de

    secuenciacinutilizandodideoxinucletidos.5. Sanger, F. Determination of nucleotide sequences inDNA.Nobel lecture, 8December

    1980.6. Venter,C.etal.TheDiploidGenomeSequenceofan IndividualHuman.PLOSBiology,5

    (10),(2007).PublicacindegenomadeCraigVenter.7. International Human Genome Consortium. Finishing the euchromatic sequence of the

    humangenome.Nature431,931945(2004).8. Margulies,M.etal.Genomesequencinginmicrofabricatedhighdensitypicolitrereactors.

    Nature437,376380(2005).Losautoresdescribeneldesarrollodelaprimertecnologade secuenciadomasivo,y realizanelensamblajedenovodelgenomadeMycoplasmagenitualiumutilizandopirosecuenciacin.

    9. Bentley,D.R.etal.Accuratewholehumangenomesequencingusingreversibleterminatorchemistry. Nature 456, 5359 (2008). Artculo de los desarrolladores de Illumina,reportandoelusodeestatecnologaparalasecuenciacindeuncromosomahumano.

    10. Wang, Z.,Gerstein,M.& Snyder,M. RNASeq: a revolutionary tool for transcriptomics.NatureRev.Genet.10,5763 (2009).Review sobreusode tecnologasde secuenciadomasivoparaanlisisdetranscriptomas(RNAseq).

    11. Park, P. J. ChIPseq: advantages and challenges of amaturing technology.Nature Rev.Genet.10,669680(2009).RevisinsobreChIPseq.

    12. Morozova, O.,Hirst, M., Marra, M. Applications of New Sequencing Technologies forTranscriptome Analysis. Annu. Rev. Genomics Hum. Genet. 10,13551 (2009). RevisinNGS.

    13. Petrosino, J. F., Highlander, S., Luna, R. A., Gibbs, R. A. & Versalovic, J.Metagenomicpyrosequencingandmicrobial identification.Clin.Chem.55,856866 (2009).Setratadeunreviewsobremetagenmica.

    14. Zhou,X.,Ren,L.,Meng,Q.,Li,Y.,Yu,Y.,Yu,J.Thenextgenerationsequencingtechnologyandapplication.ProteinCell,1(6),520536(2010).RevisinNGS.

    15. Metzker,M.L.Sequencing technologies thenextgeneration.NatureReviewsGenetics11,3146(2010).RevisinNGS.

    16. Human genome: Genomes by the thousand. Nature 467, 10261027 (2010). Revisinsecuenciadoresinstaladosygenomassecuenciados.

    17. Zhanga,J.,Chiodinic,R.,Badra,A.,ZhangG.Theimpactofnextgenerationsequencingongenomics.Genet.Genomics.38(3),95109(2011).RevisinNGS.

    Otrosrecursosinteresantes:1000GenomesProject:http://www.1000genomes.orgTheCancerGenomeAtlas:http://cancergenome.nih.govTheExomeProject:http://www.nhlbi.nih.gov/resources/exome.htmHumanMicrobiomeProject:http://nihroadmap.nih.gov/hmpPersonalGenomeProject:http://www.personalgenomes.orgCraigVenterInstitute:www.jcvi.org