Desvelando la historia de la vida registrada en los...

20
1 Variación genética en el genoma A G A G T T C T G C T C G A G G G T T A T G C G C G A G A G T T C T G C T C G A G G G T T A T G C G C G A G A G T T C T G C T C G A G G G T T A T G C G C G A G A G T T C T G C T C G A G G G T T A T G C G C G Genoma humano vs Genomas humanos ¿A quién representa el genoma humano?

Transcript of Desvelando la historia de la vida registrada en los...

Page 1: Desvelando la historia de la vida registrada en los genomasbioinformatica.uab.cat/base/documents/masterGP...1. /2n = 10 / 16 = 0,625 q 1 ^ = n ... Desequilibrio de ligamiento Estructura

1

Variación genética en el genoma

A G A G T T C T G C T C G

A G G G T T A T G C G C G

A G A G T T C T G C T C G

A G G G T T A T G C G C G

A G A G T T C T G C T C G

A G G G T T A T G C G C G

A G A G T T C T G C T C G

A G G G T T A T G C G C G

Genoma

humano

vs

Genomas

humanos

¿A quién representa el genoma humano?

Page 2: Desvelando la historia de la vida registrada en los genomasbioinformatica.uab.cat/base/documents/masterGP...1. /2n = 10 / 16 = 0,625 q 1 ^ = n ... Desequilibrio de ligamiento Estructura

2

G

C

Variación genética humana

Polimorfismo

vs

mutación

Variación genética

Page 3: Desvelando la historia de la vida registrada en los genomasbioinformatica.uab.cat/base/documents/masterGP...1. /2n = 10 / 16 = 0,625 q 1 ^ = n ... Desequilibrio de ligamiento Estructura

3

Especiación

Aislamiento

reproductor

Árbol de la vida

Page 4: Desvelando la historia de la vida registrada en los genomasbioinformatica.uab.cat/base/documents/masterGP...1. /2n = 10 / 16 = 0,625 q 1 ^ = n ... Desequilibrio de ligamiento Estructura

4

Frecuencia

Alélica

Tiempo

1

0

gen.4Nt 1

1/

Naturaleza de los SNPs:

Teoría neutralista de la evolución molecular

El polimorfismo es un estado transitorio

en el proceso de fijación de alelos

neutros

Motoo Kimura

Teoría neutralista de la evolución molecular

Page 5: Desvelando la historia de la vida registrada en los genomasbioinformatica.uab.cat/base/documents/masterGP...1. /2n = 10 / 16 = 0,625 q 1 ^ = n ... Desequilibrio de ligamiento Estructura

5

SNPs

Naturaleza y Clasificación

Single Nucleotide Polymorphism (SNP)

•Cambio de un nucleótido

•Transversión-Transición | Indel

•Cambio dos o pocos nucleótidos o indels – >

Simple Nucleotide Polymorhism

•SNP codificante

•Sinónimo

•No sinónimo o remplazamiento

•SNP no codificante

Variación heredable del genoma humano

SNPs

A G A G T T C T G C T C G

A G G G T T A T G C G C G

A G A G T T C T G C T C G

A G G G T T A T G C G C G

A G A G T T C T G C T C G

A G G G T T A T G C G C G

Single Nucleotide

Polymorphism

SNPs

Page 6: Desvelando la historia de la vida registrada en los genomasbioinformatica.uab.cat/base/documents/masterGP...1. /2n = 10 / 16 = 0,625 q 1 ^ = n ... Desequilibrio de ligamiento Estructura

6

Variación heredable

del genoma humano

A G A G T T C T G C T C G

A G G G T T A T G C G C G

A G A G T T C T G C T C G

A G G G T T A T G C G C G

SNPs

Variación fenotípica

Variación genética humana

Fenotipo = Genética + Ambiente

Page 7: Desvelando la historia de la vida registrada en los genomasbioinformatica.uab.cat/base/documents/masterGP...1. /2n = 10 / 16 = 0,625 q 1 ^ = n ... Desequilibrio de ligamiento Estructura

7

Base genética de la

individualidad humanaA G A G T T C T G C T C G

A G G G T T A T G C G C G

Representatividad

Información disponible

Se han posicionado en el GH más de 11

millones de SNP

~50% de las diferencias en DNA son

debidas a uno o pocos nucleótidos

En promedio dos personas difieren en 3

millones de nucleótidos

Interés

Contribución de los genes a enfermedades comunes como el cáncer, la

diabetis o la enfermedad mental

Significado de la variabilidad genética humana

SNPsSingle Nucleotide Polymorphism

Variación genética humana

Niveles de descripción de la variación genética en el genoma

SNPs BRCA2

Individual 1 acgtagcatcgtatgcgttagacgggggggtagcaccagtacag

Individual 2 acgtagcatcgtatgcgttagacgggggggtagcaccagtacag

Individual 3 acgtagcatcgtatgcgttagacgggggggtagcaccagtacag

Individual 4 acgtagcatcgtttgcgttagacgggggggtagcaccagtacag

Individual 5 acgtagcatcgtttgcgttagacgggggggtagcaccagtacag

Individual 6 acgtagcatcgtttgcgttagacggcatggcaccggcagtacag

Individual 7 acgtagcatcgtttgcgttagacggcatggcaccggcagtacag

Individual 8 acgtagcatcgtttgcgttagacggcatggcaccggcagtacag

Individual 9 acgtagcatcgtttgcgttagacggcatggcaccggcagtacag

one-dimensional: SNP

multi-dimensional: Haplotype

Page 8: Desvelando la historia de la vida registrada en los genomasbioinformatica.uab.cat/base/documents/masterGP...1. /2n = 10 / 16 = 0,625 q 1 ^ = n ... Desequilibrio de ligamiento Estructura

8

SNPs

HLA

Distribución heterocigosidad Cromosoma 6

(2001 Nature 409: 928-941)

Estructura multidimensional de la variabilidad genética en el

genoma humano

A G A G T T C T G C T C G

A G G G T T C T G C G C GA G G G T T A T G C G C G

A G A G T T C T G C T C GA G A G T T C T G C T C G

A G A G T T C T G C T C G

A G A G T T C T G C T C GA G A G T T C T G C T C G

A G G G T T A T G C G C GA G G G T T A T G C G C GA G G G T T A T G C G C G

A G G G T T A T G C G C G

A G G G T T A T G C G C G

SNPs

Page 9: Desvelando la historia de la vida registrada en los genomasbioinformatica.uab.cat/base/documents/masterGP...1. /2n = 10 / 16 = 0,625 q 1 ^ = n ... Desequilibrio de ligamiento Estructura

9

Desequilibrio de ligamiento (D’ Lewontin)

B1 B2 Total

A1 p11 = p1q1 + D p12 = p1q2 - D p1

A2 p21 = p2q1 - D p22 = p2q2 + D p2

Total q1 q2 1

D’ = D / Dmax

SNPs

DAB = pAB - pApB

rAB = D2/ (pA(1-pA) pB(1-pB))

SNPs

Desequilibrio de ligamiento

B1 B2 Total

A1 9 1 10

A2 2 4 6

Total 11 5 16

D = 0,5625 – 0,625 x 0,6875 = 0,1328

p1^ = n1. /2n = 10 / 16 = 0,625

q1= n.1 /2n = 11 / 16 = 0,6875^

Page 10: Desvelando la historia de la vida registrada en los genomasbioinformatica.uab.cat/base/documents/masterGP...1. /2n = 10 / 16 = 0,625 q 1 ^ = n ... Desequilibrio de ligamiento Estructura

10

Recombinación y

Desequilibrio de

ligamiento

Estructura multidimensional de la variabilidad genética en el

genoma humano

SNPs

DAB (t + 1) = (1 – c) DAB (t )

Desequilibrio de ligamiento

Distribución del DL a lo largo del gen de la lipasa lipotroteína humana

(LPL). 66 SNPs en apr. 10 kb de 142 cromosomas

Bloques de

ligamiento o

Tag SNPs

SNPs

Page 11: Desvelando la historia de la vida registrada en los genomasbioinformatica.uab.cat/base/documents/masterGP...1. /2n = 10 / 16 = 0,625 q 1 ^ = n ... Desequilibrio de ligamiento Estructura

11

Estructura multidimensional de los Haplotipos

The empirical

space:

Data

desideratum

SNPs

Human genetic diversity database

SNP1 SNP2 SNP3

Secuence

individual 1

Secuence

individual 2

...

...

A/A

A/C

G/C

C/C

G/T

T/T

Disequilibrium

among SNPs

Estimation of frequencies

Page 12: Desvelando la historia de la vida registrada en los genomasbioinformatica.uab.cat/base/documents/masterGP...1. /2n = 10 / 16 = 0,625 q 1 ^ = n ... Desequilibrio de ligamiento Estructura

12

5q31 Región asociada a enfermedad de Crohn

Análisis estructura haplotípica 500 kb

de 103 SNPs comunes (>5%)

Bloque 1

76% GGACAACC

18% AATTCGGG

Bloque 1

76% GGACAACTC

15% AATTCGGTG

3% AATTCGGCG

Tag SNP

5q31

•65-85 % del genoma humano puede

estar organizado en bloques

•Unos pocos SNPs en un organismo

marcan un haplotipo.

•Con sólo estudiar 300000-600000 tag

SNPs de los 10 millones de SNPs

basta para identificar eficientemente los

haplotipos del genoma humano.

Análisis estructura haplotípica 500 kb

de 103 SNPs comunes (>5%)

Page 13: Desvelando la historia de la vida registrada en los genomasbioinformatica.uab.cat/base/documents/masterGP...1. /2n = 10 / 16 = 0,625 q 1 ^ = n ... Desequilibrio de ligamiento Estructura

13

Estructura de la variación genética

5q31

Tamaño medio de

los bloques

•Africanos: 11 kb

•Caucásico: 22 kb

•Asiáticos: 22 kb

•51% bloques 3 continentes

•72% bloques 2 continentes

•28% bloque 1 continente (90% África)

Estudio de 929 bloques

haplotípicos de África, Asia y

Europa

Page 14: Desvelando la historia de la vida registrada en los genomasbioinformatica.uab.cat/base/documents/masterGP...1. /2n = 10 / 16 = 0,625 q 1 ^ = n ... Desequilibrio de ligamiento Estructura

14

•Dos partes de genoma

humano

•Recombinación

•No recombinación

•Cada genoma individual es

un mosaico de bloques

haplotípicos, que explica un

30% de la variabilidad total

•El individuo, más que las

poblaciones, deber ser el

foco de los estudios de

variación genética

Linkage Disequilibrium

Linkage blocks

Recombination

Hotspot

Associated Sites

TagSNPs

Page 15: Desvelando la historia de la vida registrada en los genomasbioinformatica.uab.cat/base/documents/masterGP...1. /2n = 10 / 16 = 0,625 q 1 ^ = n ... Desequilibrio de ligamiento Estructura

15

International HapMap Project (http://www.hapmap.org)

International HapMap Project (http://www.hapmap.org)

Page 16: Desvelando la historia de la vida registrada en los genomasbioinformatica.uab.cat/base/documents/masterGP...1. /2n = 10 / 16 = 0,625 q 1 ^ = n ... Desequilibrio de ligamiento Estructura

16

International HapMap Project (http://www.hapmap.org)

1. 270 muestras de DNA diferentes

grupos étnicosAfricano (YRI)

Asiático (CHO y JPT)

Europeo (CEU)

2. >1.000.000 SNPs espaciados 5 kb y

comunes (Minor Freq Allele, MFA >

0,05)

3. Estructura haplotípica

El catálogo haplotipos para cada bloque constituye

-> el mapa haplotípico del genoma humano

SNPs

Fase I

1. 270 muestras de DNA diferentes

grupos étnicosAfricano (YRI)

Asiático (CHO y JPT)

Europeo (CEU)

2. >3.100.000 SNPs

3. Estructura haplotípica

El catálogo haplotipos para cada bloque constituye

-> el mapa haplotípico del genoma humano

El proyecto HapMap: catálogo de la

variación haplotípica humana

Fase II

Page 17: Desvelando la historia de la vida registrada en los genomasbioinformatica.uab.cat/base/documents/masterGP...1. /2n = 10 / 16 = 0,625 q 1 ^ = n ... Desequilibrio de ligamiento Estructura

17

International HapMap Project (http://www.hapmap.org)

1. Disponer datos genotípicos diferentes grupos

étnicos

2. Selección TagSNPs estudio asociación ->

Potencial para Whole Genome Association

studies

3. Evaluación significación estadística e

interpretación resultados

4. Estudio de los alelos menos comunes

5. Estudio variación estructural

6. Farmacogenómica

Aplicaciones biomédicas

International HapMap Project (http://www.hapmap.org)

Page 18: Desvelando la historia de la vida registrada en los genomasbioinformatica.uab.cat/base/documents/masterGP...1. /2n = 10 / 16 = 0,625 q 1 ^ = n ... Desequilibrio de ligamiento Estructura

18

International HapMap Project (http://www.hapmap.org)

Bases de datos de variación genética

Online Mendelian

Inheritance in Man

http://www.ncbi.nlm.nih.gov/entrez/que

ry.fcgi?db=OMIMCatalog of human genetic

and genomic disorders

International HapMap

Project

http://www.hapmap.org

Personalized

Genomes: J. Watson’s

genome

http://jimwatsonsequence.cshl.edu/cgi-

perl/gbrowse/jwsequence/

Entrez dbSNP http://www.ncbi.nlm.nih.gov/projects/S

NP/

Database of Genotype

and Phenotype

http://view.ncbi.nlm.nih.gov/dbgap

MamPol

DPDB

http://mampol.uab.cat

http://dpdb.uab.cat

Human Genome

Variation Database

http://hgvbase.cgb.ki.se/

Page 19: Desvelando la historia de la vida registrada en los genomasbioinformatica.uab.cat/base/documents/masterGP...1. /2n = 10 / 16 = 0,625 q 1 ^ = n ... Desequilibrio de ligamiento Estructura

19

La edad de

oro del estudio de la variacióngenética

Human genetic & phenotypic diversity database

SNP1 SNP2 SNP3

Secuence

individual 1

Secuence

individual 2

...

...

A/A

A/C

G/C

C/C

G/T

T/T

...

Disease

1

Healthy

Phenotype

Estimation phenotypic effect

Association studies:

Phenotpyic effect of SNPs

Genotype

...

Trait i

x2

x1

Cervical

Cancer

Page 20: Desvelando la historia de la vida registrada en los genomasbioinformatica.uab.cat/base/documents/masterGP...1. /2n = 10 / 16 = 0,625 q 1 ^ = n ... Desequilibrio de ligamiento Estructura

20

BioBanks: Studies of cohorts at a great scale

•deCODE (Islandia)

•Estonia

•Germany

•Canada

•Japan

•China

USA

Variabilitat genètica, CNV

Grandes regiones del genoma presentan diferentes nº de copias y éstas son polimórficas entre individuos. Dos individuos pueden diferir en 6Mb o más debido a CNVs

CNVsCopy Number Variations