Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1,...

25
Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1 , Valeria Tekiel 1 , Karim Ben Abdellah 2 , Antonio González 2 y Daniel O. Sánchez 1 1 Instituto de Investigaciones Biotecnológicas, Universidad Nacional de General San Martín, San Martín, Argentina 2 Instituto de Parasitología y Biomedicina, Granada, España {fernan,valet,dsanchez}@iib.unsam.edu.ar aga@ipb.csic.es

Transcript of Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1,...

Page 1: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2.

Identificación y análisis de genes estadío específicos en Trypanosoma cruzi

Fernán Agüero1, Valeria Tekiel1, Karim Ben Abdellah2, Antonio González2 y Daniel O. Sánchez1

1 Instituto de Investigaciones Biotecnológicas, Universidad Nacional de General San Martín, San Martín, Argentina2 Instituto de Parasitología y Biomedicina, Granada, España

{fernan,valet,dsanchez}@iib.unsam.edu.ar [email protected]

Page 2: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2.

Genomics :: historia

● En 1994 la OMS decidió impulsar la secuenciación de genomas de parásitos importantes desde el punto de vista sanitario.

● Uno de los primeros objetivos, aun antes de comenzar a secuenciar el genoma, fue el descubrimiento de genes. Distintos proyectos fueron comenzados a ese fin y varias redes de laboratorios se organizaron para llevar a cabo el proyecto.

● En Trypanosomas:

● secuenciación de ESTs

● secuenciación de GSSs

● mapeo

Page 3: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2.

Expressed sequence tags (ESTs)

● Qué es un EST?● Es una secuencia proveniente de un transcripto (mRNA) obtenida al azar.

● Es una secuencia corta, no editada ni corregida, obtenida mediante una única reacción de secuenciación.

● Cómo se produce un EST?● A partir de una biblioteca de cDNA, por secuenciación de extremos de clones seleccionados al azar.

Page 4: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2.

Biblioteca de cDNA

● Biblioteca de cDNA.

● Distintos clones obtenidos a partir del mismo transcripto pueden diferir en el extremo 5'

● Si la biblioteca está orientada, se puede elegir el extremo del clon a secuenciar.

● Se pueden producir ESTs 5' o 3'

AAAAAAAACopias de parciales del mRNA

cDNA clonado

5' EST 3' EST

Fwd sequencing primer

Rev sequencing primer

Page 5: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2.

ESTs :: calidad de secuencia

Vector Repeat

Un EST contiene información de secuencia decalidad variable, con contaminantes

Page 6: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2.

Información presente en un EST

Qué información provee un EST?● En primer lugar:

● Secuencia de un producto de expresión (gen)

● En forma adicional:● información de expresión:

● sitio de expresión (estadio del ciclo de vida / órgano / tejido)● condiciones de expresión (condiciones experimentales)

Page 7: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2.

Redundancia

La secuenciación de ESTs genera redundancia● Una única library de cDNA:

●La redundancia proviene de la selección al azar de los clones a secuenciar (estadística, se puede estimar)

● Distintas libraries de cDNA de distintos estadios/tejidos:

● Redundancia adicional (varios ESTs correspondientes a un mismo transcripto que se expresa en distintos estadios/tejidos)

Dos tipos de redundancia:

●secuencia●información de expresión

Page 8: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2.

Manejo de la redundancia

in vitro

● construcción de libraries normalizadas o sustractivas

in silico

● agrupar ESTs en 'clusters' (por similitud)

● generar un set de datos no-redundante en el cual cada 'cluster' es representado por una única secuencia

Page 9: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2.

ESTs en T. cruzi

cDNA libraries

● epimastigotes, no normalizada, 252 ESTs

● epimastigotes, normalizada, 9630 ESTs

● trypomastigotes metacíclicos (differential display), 175 ESTs

● trypomastigotes, no normalizada, 1507 ESTs [*]

● trypomastigotes, sustractiva (-epimastigotes), 403 ESTs [*]

● amastigotes, no normalizada, 1328 ESTs [*]

Laboratorios

● Instituto Fiocruz, Rio de Janeiro, Brasil.

● Department of Genetics and Pathology, Uppsala Universitet, Sweden.

● Instituto de Biologia Molecular do Parana, Parana, Brasil

● Instituto de Investigaciones Biotecnológicas, UNSAM, Argentina.

● Instituto de Parasitología y Biomedicina, CSIC, España.

Page 10: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2.

T. cruzi ESTs :: gene discovery

● Comparación de las secuencias (ESTs) contra bases de datos de proteínas e identificación de similitud/homología para intentar predecir función

● Uppsala Universitet: Genome Research 10 (2000): 1103-1107

● IIB-UNSAM: Infection & Immunity 66 (1998): 5393-5390

● Inst. Fiocruz, Brasil & Inst Parsitología, España: Mem Inst Oswaldo Cruz 92 (1998): 863-866

● Estudio de un proceso (metaciclogenésis) mediante differential display:

● Inst Biologia Molecular, Parana, Brasil: Mem Inst Oswaldo Cruz. 94 (1999) Suppl 1:165-8

Page 11: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2.

ESTs de trypomastigotes y amastigotes

Proyecto TRAM http://genoma.unsam.edu.ar/projects/tram

Dos bibliotecas de cDNA TcTR (trypomastigotes) TcAM (amastigotes)

Proyecto TcT-E Una biblioteca sustractiva de cDNA

Trypomastigotes - Epimastigotes

Library Número PorcentajeTcTR 1502 47.03TcAM 1289 40.36TcT-E 403 12.62Total 3194 100

Page 12: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2.

TRAM: Construcción de las bibliotecas

Síntesis de la primera hebra de cDNA a partir de oligo-dT

Síntesis de la segunda hebra de cDNA a partir del miniexón

Análisis de las primeras 23-25 bases de todos los ESTs:•Usando fuzznuc (European Molecular Biology Open Software Suite, EMBOSS)•Permitiendo 2 errores de secuencia

1551 clones (55.4%) tienen extremos 5' completos

Page 13: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2.

Reconstrucción de transcriptos

Raw ESTs

Clusters

Alignments

Consensi

Joined Consensi

predict CDS

Protein Fragments

NNN

● 2771 ESTs totales fueron agrupados en un set no-redundante de 1619 secuencias

437 consensos 1182 singletons

Page 14: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2.

Analisis de similitud de secuencia contra bases de datos públicas

BLASTX: GenBank, Swissprot, KOG (genomas eucarióticos completos)

BLASTN: dbEST, Borrador del genoma de T. cruzi

Protein Dbs Nucleotide DbsGrupo GenBank KOG Tc ESTs Tc WGS Number

1 + + + + 1842 + - + + 1133 + + - + 644 - + - + 2535 + - - + 606 - - - + 5497 - - - - 372

Description Number PercentTotal ESTs generated 2771 100TcTR library 1502 54.2TcAM library 1269 45.8Non-redundant dataset 1619 100

1490 92505 31.1

Matches vs protein databases 439 27.1Detail of matches vs protein databases 439 100Ribosomal proteins 107 24.5Hypothetical proteins /Unknown function 100 22.7

ESTs aligned to T. cruzi shotgun readsESTs similar to other T. cruzi ESTs

Page 15: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2.

TRAM: comparación con otros sets de ESTs

Usando BLASTN Alineamientos significativos son aquellos con un E

≤ 1-40

505 ESTs (31.1%) fueron significativamente similares a otros ESTs ya disponibles en bases de datos públicas

1116 ESTs (68.8%) representan nuevos ESTs

Page 16: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2.

Información accesible en sitio web

Una página web mostrando un grupo de ESTs que comparten un patrón de aciertos (matches) contra distintas bases de datos.

http://genoma.unsam.edu.ar/projects/tram

Page 17: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2.

Información accesible en sitio web

Testcode evaluation Presencia de miniexon

Page 18: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2.

Composición de los clusters

Hay clusters enriquecidos en ESTs de una de las dos biblitecas en particular?

Análisis estadístico: Stekel DJ, Git Y, Falciani F. The comparison of gene expression from multiple cDNA libraries. Genome Res (2000) 10:2055.

Calcula un valor R (log likelihood) que está relacionado con la verosimilitud de la hipótesis de que la diferencia en la composición se debe a una diferencia de expresión y no a un desvío en el muestreo

R No. ESTs Mean No. from randomized data Confidencia0 136 350.26 --1 214 69.41 67.572 52 13.35 74.323 29 5.31 81.684 3 0.53 82.55 2 0.11 94.76 1 0.04 96.47 0 0 --8 0 0 --9 0 0 --

10 0 0 --11 0 0 --12 0 0 --13 1 0 10014 0 0 --

Page 19: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2.

Composición de los clusters

Ribosomal proteins with extraribosomal functions (Wool IG, TiBS 1996 21: 164)

S12 is a RNA chaperone. Enhances phage T4 intron splicing in vitro.

SA is also located at the cell surface. Functions as a high-affinity laminin receptor

Cluster TcAM ESTs TcTR ESTs Annotation R FactorCl136 17 0 Ribosomal protein S12 13.15Cl34 8 0 Clathrin assembly protein AP19 6.19Cl237 7 0 - 5.42Cl244 7 0 - 5.42Cl89 6 0 TcSMUG mucin (L) 4.65Cl70 9 1 Ribosomal protein L5 4.34Cl425 0 7 Ribosomal protein SA (P40) 4.33

Page 20: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2.

Construcción de la biblioteca substractivacDNA trip cDNA tripcDNA episTripos

RNATotal

mRNA

1era hebra cDNA

cDNA doble cadena

DigestiónRsaI

Epis

Page 21: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2.

Control final construcción library TcT-E

18 23 28 33 18 23 28 33 -

H2A

Subs T-E Sin subst

Análisis de eficiencia de substracción

Page 22: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2.

47(11.6%)

14(3.4%)

102(25.3%)

31

4

17

ESTs T. cruzitrypomastigotes

ESTs T. cruzi epimastigotes

Protein Databases

TcT-E: Distribución de los ESTs

Page 23: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2.

Reverse Northern

Trypomastigote cDNA Epimastigote cDNA

Northern reverso86 clones testeados en 2 ensayos similares independientes

Page 24: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2.

TcT-E: confirmación de expresión diferencial de clones seleccionados

Northern blots

Control: gp63(T.cruzi)

E T

E T 02g6

E+K+TcTr

02j12

E T

Pre-RNA proc(L. major)

01i24

Todo neg

01b11

Bop(SP/NR)

E T01a18

Rib

E T

E+K, no codif

01p24

E T

Todo neg

Page 25: Identificación y análisis de genes estadío específicos en Trypanosoma cruzi Fernán Agüero 1, Valeria Tekiel 1, Karim Ben Abdellah 2, Antonio González 2.

Reconocimientos

Laboratorio de Genómica y Bioinformática, IIB-UNSAM

Daniel O. Sánchez

●Secuenciación de ESTs

Valeria Tekiel

Ramiro Verdún

Nelson Di Paolo

Fernanda Peri

Rodrigo Pavón

Diego Rey Serantes

●Bioinformática

Fernán Agüero

Colaboradores

● Antonio Gonzalez, Instituto de Parasitologia y Biomedicina, CSIC, Espa?a

● Carlos Frasch, Instituto de Investigaciones Biotecnologicas, UNSAM, Argentina.