Download - Gen Candidato

Transcript
  • LA BIOINFORMTICA COMO PUENTE ENTRE LAGENTICA Y SUS APLICACIONES INDUSTRIALES

    Y BIOMDICAS

    Estudios de Asociacin Gen Candidato

    Manuel Calaza

  • Diseo del experimento Seleccin de SNPs Antes de evaluar la asociacin Cmo decidir y medir la asociacin Despus de los primeros anlisis

  • Diseo del experimento

  • Diseo del experimento

    Consideraciones sobre las colecciones de muestras

    Consideraciones sobre los marcadores aseleccionar y la potencia estadstica del estudio

  • Es fundamental disponer de colecciones de muestrasclnicamente uniformes y correctamente caracterizadas.

    Es importante que la coleccin de controles no difiera dela coleccin de casos en cuestiones como edad, sexo,origen geogrfico, factores ambientales, caractersticastnicas, etc.

    Sobre las colecciones de muestras

  • Sobre los marcadores a seleccionar y la potenciaestadstica del estudio

    Los SNPs pueden seleccionarse siguiendodistintas estrategias: Utilizando informacin poblacional previa para

    seleccionar el menor conjunto de SNPs quecontengan la mayor variabilidad gentica posibleen la regin de inters.

    Utilizando informacin y predicciones defuncionalidad de los SNPs de la regin de inters.

    O las dos cosas simultneamente.

  • Sobre los marcadores a seleccionar y la potenciaestadstica del estudio

    En todo caso, es recomendable sercautelosos en la seleccin de los SNPs y noconsiderar, por ejemplo, SNPs con MAF < 5%(variantes poco frecuentes que pueden recuperarse con unanlisis de haplotipos definidos por SNPs de mayor frecuencia)

    Una vez seleccionados los SNPs, siconocemos la MAF en una poblacin dereferencia, hemos establecido un nivel designificacin y un tamao para el efecto quepretendemos obtener, podemos estudiar lapotencia estadstica del experimento.

  • Sobre los marcadores a seleccionar y la potenciaestadstica del estudio

    OR=1.5 MAF controles=0.2 P

  • Seleccin de SNPs

  • Seleccin de snps con caractersticasfuncionales

    Son varias las posibilidades de que un SNP puedaalterar el normal funcionamiento de un gen:

    nsSNPsSplicing alternativoCreacin o destruccin de sitios de unin defactores de transcripcinAlteracin de secuencias conservadas

  • NCBI dbSNP

  • Seattle SNPs

  • PupaSuitePodemos emplear herramientas bioinformticas paraevaluar las caractersticas funcionales de un gen ouna regin cromosmica.

  • HapMap

  • HapMap Phase II

    270 muestras de 4 poblaciones:CEU: 30 tros de residentes en Utah conascendencia en norte y oeste de Europa(Centre d'Etude du Polymorphisme Humain,1980)CHB: 45 chinos Han de PeknJPT: 45 japoneses del entorno TokioYRI: 30 tros de Yoruba de Ibadan (Nigeria)

  • HapMap Phase III

    label population sample # samples QC+ Draft 1

    ASW* African ancestry in Southwest USA 90 71

    CEU*Utah residents with Northern and Western

    European ancestry from the CEPH collection180 162

    CHB Han Chinese in Beijing, China 90 82

    CHD Chinese in Metropolitan Denver, Colorado 100 70

    GIH Gujarati Indians in Houston, Texas 100 83

    JPT Japanese in Tokyo, Japan 91 82

    LWK Luhya in Webuye, Kenya 100 83

    MEX* Mexican ancestry in Los Angeles, California 90 71

    MKK* Maasai in Kinyawa, Kenya 180 171

    TSI Toscans in Italy 100 77

    YRI* Yoruba in Ibadan, Nigeria 180 163

    1.301 1.115

    * Population is made of family trios

  • HapMap Phase II

  • HapMap Phase III

  • Hapmap es unabase de datosorientada a ladiversidadpoblacional, aldesequilibrio deligamientoentre SNPs y ala estructurahaplotpica delgenoma.

  • Medidas de desequilibrio de ligamiento: D y r2

    Son medidas entre pares de SNPs que nos dan dosinformaciones muy importantes:

    La D mide el nivel de heredabilidad conjunta de los dospolimorfismos.La r2 mide el nivel de redundancia estadstica que suponeanalizar los dos SNPs.

    D la usaremos para determinar la regin entorno al gen que setransmite haplotpicamente junto con l.r2 la usaremos para seleccionar en esa regin un subconjunto deSNPs suficiente para englobar toda la variabilidad haplotpica.

  • Medidas de desequilibrio de ligamiento: D y r2

  • Haploview

  • Antes de evaluar la asociacin

  • Control de calidad sobre el genotipado: A nivel del genotipador (persona o servicio)

    A nivel del analizador:

    Descartar SNPs o muestras responsables de que la distribucinde los fallos de genotipado no sea claramente uniforme oaleatoria

    Reconsiderar SNPs con frecuencias allicas muy diferentes delas que tienen en la poblacin de referencia.

    Descartar SNPs sin HWE

    Evaluar la heterogeneidad de los subgrupos de controlesrespecto a lo genotipos obtenidos

    Antes de evaluar la asociacin

  • Antes de evaluar la asociacin

    HWE

    AA p2

    aaq2

    Aa pq

    Aapq

    Una desviacin significativa de la tabla observada respecto de laesperada en el grupo de controles, habitualmente puede serindicativo de errores de genotipado

    A (p) a (q)

    A (p)

    a (q)

  • Antes de evaluar la asociacin

    Diagrama de Finetti

  • Antes de evaluar la asociacin

    Heterogeneidad entre los subgrupos decontroles: Las diferencias en frecuencias entre los grupos de

    controles son tan significativas como las quepretendemos ver entre casos y controles. (WTCCC)

    Las distribuciones haplotpicas en los distintossubgrupos de controles presentan diferenciassignificativas (test exacto de diferenciacin depoblaciones Arlequin)

  • Antes de evaluar la asociacin

  • Antes de evaluar la asociacin

  • Antes de evaluar la asociacin

  • Antes de evaluar la asociacin

  • Cmo decidir y medir la asociacin

  • Cmo decidir y medir la asociacin

    Asumiendo un modelo allico, todo se reduceal anlisis de tablas de contingencia 2x2

    dcAlelo Comn

    baAlelo raro

    controlescasos

  • Cmo decidir y medir la asociacin

    Dos herramientas clsicas:

    Pearsons Chi cuadrado test para evaluar lasignificacin estadstica de la diferencia entre lasdistribuciones en casos y en controles

    Odds ratio e Intervalo de Confianza para medirla magnitud de la diferencia detectada

  • Pearsons Chi cuadrado test

    Test de hiptesis sobre la hiptesis de independencia de lasvariables afectacin y alelo del SNP

    n=a+b+c+db+da+c

    c+ddcAlelocomn

    a+bbaAleloraro

    controlescasos Tablaobservada

  • Pearsons Chi cuadrado test

    Tabla esperada asumiendo independencia entre las variables

    n=a+b+c+db+da+c

    c+dd

    (c+d)*(b+d)/n

    c

    (c+d)*(a+c)/nAlelocomn

    a+bb

    (a+b)*(b+d)/n

    a

    (a+b)*(a+c)/nAleloraro

    controlescasosTabla observada y tabla esperada

  • Pearsons Chi cuadrado test

  • Odds ratio e Intervalo de Confianza

    Un intervalo de confianza del 95% es el quecontiene el valor de la OR que se obtendra el95% de las veces que se repita el mismoexperimento sobre muestras del mismo tamaotomadas de la misma poblacin.

    Ln(OR)

  • Cmo decidir y medir la asociacin

    En ocasiones, el anlisis de alelos (equivalente almodelo aditivo) no es el mejor modelo genticopara explicar la asociacin.

    Se pueden considerar modelos recesivos ydominantes como alternativas ms usuales.

    112aa101Aa000AA

    dominanterecesivoAditivo

  • Cmo decidir y medir la asociacin

    Si las colecciones de muestras con las que trabajamospresenta un origen heterogneo (no desde el punto de vistade los SNPs a analizar, que tambin, si no desde el punto devista geogrfico, clnico, etc.) debemos considerar el empleode estrategias de tipo meta-anlisis.

    Cuando estn disponibles los recuentos de alelos en casos ycontroles en cada uno de los subgrupos de muestras, elanlisis de Maentel-Haenszel es el ms utilizado (acompaadodel test de heterogeneidad de efectos de Breslow-Day)frente a la alternativa de unirlo todo sin ms.

  • Cmo decidir y medir la asociacin

    Todas estas consideraciones se han hecho asumiendo cadaSNP como variables estadsticamente independientes, cuandoen realidad es muy improbable que lo sean.Es necesario considerar estrategias de anlisis multivariantey asumir un cierto grado de dependencia entre los SNPs (queviene dado por la r2 que hay entre ellos):

    Regresin Logstica

    Anlisis de Haplotipos

  • Despus de los primeros anlisis

    Anlisis de haplotipos:

  • Despus de los primeros anlisis

    Anlisis de haplotipos:

    Permite descubrir alelos no genotipados que presentandiferencias entre casos y controlesPermite separar efectos protectores y de susceptibilidadindependientesPermite explicar la asociacin de unos SNPs porcompartir haplotipo con el SNP genuinamente explicativo(asociacin por desequilibrio de ligamiento).

  • Supongamos un conjunto de 8 SNPs seleccionados en un bloquede LD que contiene la secuencia de un gen Refseq. El anlisisde alelos aporta los siguientes resultados:

  • En la distribucin de haplotipos, los alelos se codifican como0=comn y 2=raro

  • Despus de los primeros anlisis

    Regresin Logstica:Permite evaluar de forma sistemtica multitud de modelosPermite evaluar interacciones epistticas entre SNPs deacuerdo con un modelo preestablecidoPermite evaluar la contribucin individual de cada SNP aun modelo concretoPresenta limitaciones a la hora de diferenciar variosefectos