Gen Candidato
-
Author
geovani-gregorio-rincon-navas -
Category
Documents
-
view
13 -
download
2
Embed Size (px)
Transcript of Gen Candidato
-
LA BIOINFORMTICA COMO PUENTE ENTRE LAGENTICA Y SUS APLICACIONES INDUSTRIALES
Y BIOMDICAS
Estudios de Asociacin Gen Candidato
Manuel Calaza
-
Diseo del experimento Seleccin de SNPs Antes de evaluar la asociacin Cmo decidir y medir la asociacin Despus de los primeros anlisis
-
Diseo del experimento
-
Diseo del experimento
Consideraciones sobre las colecciones de muestras
Consideraciones sobre los marcadores aseleccionar y la potencia estadstica del estudio
-
Es fundamental disponer de colecciones de muestrasclnicamente uniformes y correctamente caracterizadas.
Es importante que la coleccin de controles no difiera dela coleccin de casos en cuestiones como edad, sexo,origen geogrfico, factores ambientales, caractersticastnicas, etc.
Sobre las colecciones de muestras
-
Sobre los marcadores a seleccionar y la potenciaestadstica del estudio
Los SNPs pueden seleccionarse siguiendodistintas estrategias: Utilizando informacin poblacional previa para
seleccionar el menor conjunto de SNPs quecontengan la mayor variabilidad gentica posibleen la regin de inters.
Utilizando informacin y predicciones defuncionalidad de los SNPs de la regin de inters.
O las dos cosas simultneamente.
-
Sobre los marcadores a seleccionar y la potenciaestadstica del estudio
En todo caso, es recomendable sercautelosos en la seleccin de los SNPs y noconsiderar, por ejemplo, SNPs con MAF < 5%(variantes poco frecuentes que pueden recuperarse con unanlisis de haplotipos definidos por SNPs de mayor frecuencia)
Una vez seleccionados los SNPs, siconocemos la MAF en una poblacin dereferencia, hemos establecido un nivel designificacin y un tamao para el efecto quepretendemos obtener, podemos estudiar lapotencia estadstica del experimento.
-
Sobre los marcadores a seleccionar y la potenciaestadstica del estudio
OR=1.5 MAF controles=0.2 P
-
Seleccin de SNPs
-
Seleccin de snps con caractersticasfuncionales
Son varias las posibilidades de que un SNP puedaalterar el normal funcionamiento de un gen:
nsSNPsSplicing alternativoCreacin o destruccin de sitios de unin defactores de transcripcinAlteracin de secuencias conservadas
-
NCBI dbSNP
-
Seattle SNPs
-
PupaSuitePodemos emplear herramientas bioinformticas paraevaluar las caractersticas funcionales de un gen ouna regin cromosmica.
-
HapMap
-
HapMap Phase II
270 muestras de 4 poblaciones:CEU: 30 tros de residentes en Utah conascendencia en norte y oeste de Europa(Centre d'Etude du Polymorphisme Humain,1980)CHB: 45 chinos Han de PeknJPT: 45 japoneses del entorno TokioYRI: 30 tros de Yoruba de Ibadan (Nigeria)
-
HapMap Phase III
label population sample # samples QC+ Draft 1
ASW* African ancestry in Southwest USA 90 71
CEU*Utah residents with Northern and Western
European ancestry from the CEPH collection180 162
CHB Han Chinese in Beijing, China 90 82
CHD Chinese in Metropolitan Denver, Colorado 100 70
GIH Gujarati Indians in Houston, Texas 100 83
JPT Japanese in Tokyo, Japan 91 82
LWK Luhya in Webuye, Kenya 100 83
MEX* Mexican ancestry in Los Angeles, California 90 71
MKK* Maasai in Kinyawa, Kenya 180 171
TSI Toscans in Italy 100 77
YRI* Yoruba in Ibadan, Nigeria 180 163
1.301 1.115
* Population is made of family trios
-
HapMap Phase II
-
HapMap Phase III
-
Hapmap es unabase de datosorientada a ladiversidadpoblacional, aldesequilibrio deligamientoentre SNPs y ala estructurahaplotpica delgenoma.
-
Medidas de desequilibrio de ligamiento: D y r2
Son medidas entre pares de SNPs que nos dan dosinformaciones muy importantes:
La D mide el nivel de heredabilidad conjunta de los dospolimorfismos.La r2 mide el nivel de redundancia estadstica que suponeanalizar los dos SNPs.
D la usaremos para determinar la regin entorno al gen que setransmite haplotpicamente junto con l.r2 la usaremos para seleccionar en esa regin un subconjunto deSNPs suficiente para englobar toda la variabilidad haplotpica.
-
Medidas de desequilibrio de ligamiento: D y r2
-
Haploview
-
Antes de evaluar la asociacin
-
Control de calidad sobre el genotipado: A nivel del genotipador (persona o servicio)
A nivel del analizador:
Descartar SNPs o muestras responsables de que la distribucinde los fallos de genotipado no sea claramente uniforme oaleatoria
Reconsiderar SNPs con frecuencias allicas muy diferentes delas que tienen en la poblacin de referencia.
Descartar SNPs sin HWE
Evaluar la heterogeneidad de los subgrupos de controlesrespecto a lo genotipos obtenidos
Antes de evaluar la asociacin
-
Antes de evaluar la asociacin
HWE
AA p2
aaq2
Aa pq
Aapq
Una desviacin significativa de la tabla observada respecto de laesperada en el grupo de controles, habitualmente puede serindicativo de errores de genotipado
A (p) a (q)
A (p)
a (q)
-
Antes de evaluar la asociacin
Diagrama de Finetti
-
Antes de evaluar la asociacin
Heterogeneidad entre los subgrupos decontroles: Las diferencias en frecuencias entre los grupos de
controles son tan significativas como las quepretendemos ver entre casos y controles. (WTCCC)
Las distribuciones haplotpicas en los distintossubgrupos de controles presentan diferenciassignificativas (test exacto de diferenciacin depoblaciones Arlequin)
-
Antes de evaluar la asociacin
-
Antes de evaluar la asociacin
-
Antes de evaluar la asociacin
-
Antes de evaluar la asociacin
-
Cmo decidir y medir la asociacin
-
Cmo decidir y medir la asociacin
Asumiendo un modelo allico, todo se reduceal anlisis de tablas de contingencia 2x2
dcAlelo Comn
baAlelo raro
controlescasos
-
Cmo decidir y medir la asociacin
Dos herramientas clsicas:
Pearsons Chi cuadrado test para evaluar lasignificacin estadstica de la diferencia entre lasdistribuciones en casos y en controles
Odds ratio e Intervalo de Confianza para medirla magnitud de la diferencia detectada
-
Pearsons Chi cuadrado test
Test de hiptesis sobre la hiptesis de independencia de lasvariables afectacin y alelo del SNP
n=a+b+c+db+da+c
c+ddcAlelocomn
a+bbaAleloraro
controlescasos Tablaobservada
-
Pearsons Chi cuadrado test
Tabla esperada asumiendo independencia entre las variables
n=a+b+c+db+da+c
c+dd
(c+d)*(b+d)/n
c
(c+d)*(a+c)/nAlelocomn
a+bb
(a+b)*(b+d)/n
a
(a+b)*(a+c)/nAleloraro
controlescasosTabla observada y tabla esperada
-
Pearsons Chi cuadrado test
-
Odds ratio e Intervalo de Confianza
Un intervalo de confianza del 95% es el quecontiene el valor de la OR que se obtendra el95% de las veces que se repita el mismoexperimento sobre muestras del mismo tamaotomadas de la misma poblacin.
Ln(OR)
-
Cmo decidir y medir la asociacin
En ocasiones, el anlisis de alelos (equivalente almodelo aditivo) no es el mejor modelo genticopara explicar la asociacin.
Se pueden considerar modelos recesivos ydominantes como alternativas ms usuales.
112aa101Aa000AA
dominanterecesivoAditivo
-
Cmo decidir y medir la asociacin
Si las colecciones de muestras con las que trabajamospresenta un origen heterogneo (no desde el punto de vistade los SNPs a analizar, que tambin, si no desde el punto devista geogrfico, clnico, etc.) debemos considerar el empleode estrategias de tipo meta-anlisis.
Cuando estn disponibles los recuentos de alelos en casos ycontroles en cada uno de los subgrupos de muestras, elanlisis de Maentel-Haenszel es el ms utilizado (acompaadodel test de heterogeneidad de efectos de Breslow-Day)frente a la alternativa de unirlo todo sin ms.
-
Cmo decidir y medir la asociacin
Todas estas consideraciones se han hecho asumiendo cadaSNP como variables estadsticamente independientes, cuandoen realidad es muy improbable que lo sean.Es necesario considerar estrategias de anlisis multivariantey asumir un cierto grado de dependencia entre los SNPs (queviene dado por la r2 que hay entre ellos):
Regresin Logstica
Anlisis de Haplotipos
-
Despus de los primeros anlisis
Anlisis de haplotipos:
-
Despus de los primeros anlisis
Anlisis de haplotipos:
Permite descubrir alelos no genotipados que presentandiferencias entre casos y controlesPermite separar efectos protectores y de susceptibilidadindependientesPermite explicar la asociacin de unos SNPs porcompartir haplotipo con el SNP genuinamente explicativo(asociacin por desequilibrio de ligamiento).
-
Supongamos un conjunto de 8 SNPs seleccionados en un bloquede LD que contiene la secuencia de un gen Refseq. El anlisisde alelos aporta los siguientes resultados:
-
En la distribucin de haplotipos, los alelos se codifican como0=comn y 2=raro
-
Despus de los primeros anlisis
Regresin Logstica:Permite evaluar de forma sistemtica multitud de modelosPermite evaluar interacciones epistticas entre SNPs deacuerdo con un modelo preestablecidoPermite evaluar la contribucin individual de cada SNP aun modelo concretoPresenta limitaciones a la hora de diferenciar variosefectos