Identificar genes en secuencias de ADN
Problema Biolgico
Gramtica? y Gentica?
El estudio de la gramtica y la preparacin de normas gramaticales han sido, desde los primeros estatutos acadmicos, un complemento imprescindible a la elaboracin de diccionarios: en el diccionario se de-finen las palabras; en la gramtica se explica la forma en que los elementos de la lengua se enlazan para formar textos y se analizan los significados de estas combinaciones.
http://www.rae.es/obras-academicas/gramatica#sthash.msVo2Ow3.dpuf
Elementos de la Gramtica
Nueva Gramtica de la Lengua Espaola (2009-2011).
a. morfologa, analiza la estructura de las palabras, su constitucin interna y variaciones.
b. sintaxis, forma en que se ordenan y combinan.
c. fontica y fonologa, sonidos del habla y su organizacin lingstica.
Sigo sin entender . . .
Estoy en la clase de Bioinformtica o en la clase de Lengua Espaola
No se supone que era un electivo.
SECUENCIAS PALNDROMAS
AACGAACGACTAGCATAGATAGAGATAGACATAGACATAGCATCAGCATCAGCATAGCAGCAGCATAGCATCAGCAGCAGTCTACACAGACATAGATAGATAGCATAGATAGATGATACGATAGACTAGAGATCAGATCAGCACTAGCACTACGACTAGACTAGAGAAGAAACGACTACGAGGACTACGACAGCATCACAC
Buscar patrones Interpretarlos biolgicamente
Proyecto Genoma Humano
Se tuvo acceso al as letras del libro de la vida.
Pero desconocamos las reglas gramaticales para poder descifrar la informacin.
La piedra rosseta de la biologa molecular.
http://www.geneprediction.org/book/Comparative.ppt
Tcnicas para la Bsqueda de Genes
ATAGGACTAGACTAGCATAGATGACG
AACGTGGGAGAGAGAGGAGAGTAGCA
Podemos identificar
Genes Limites de exones Sitios de splicing Inicio y fin de la traduccin
Splicing alternativo Elementos regulatorios
Objetivos primarios
Objetivos secundarios
Mtodos experimentales
Mtodos computacionales
ESTRUCTURA DE UN GEN PROCARIOTICO
Imagen superior from Purves et al., Life: The Science of Biology, 4th Edition, by Sinauer Associates (www.sinauer.com) and WH Freeman (www.whfreeman.com)
Promotor CDS Terminador
transcripcin
ADN genmico
ARNm
Seal Shine-Delgarno5'-TATAAT-3
Secuencia codificante
Seal del trmino de la secuencia codificante
La morfologa
La morfologa
SEAL CONTENIDO
RBS (secuencia Shine-Delgarno) secuencia rica en pU, complementaria a 16S rRNA
Codn de Inicio ATG, (GTG, TTG)
Uso de Codn dependiente de la especie
Tercera Posicin del Codn preferencia por un nucletido especfico (G,C)
Frecuencia k-mers dependiente de la especie
Codn Termino TGA, TAA, TAG
Arch. argent. pediatr. v.108 n.4 Buenos Aires jul./ago. 2010
ESTRUCTURA DE UN GEN EUCARIOTICOLa morfologa
La secuencia Kozac, facilita el reconocimiento de la secuencia de iniciacin AUG, en el proceso de traduccin de los eucariontes.
La morfologa
SEAL CONTENIDOS
Inicio Transcripcional regiones circundantes a
Codn Start (CpG islands)
Codn de Inicio ATG, regiones circundantes
(Seq Kozak: CCGCCATGG)
Uso de Codn dependiente de la especie
Tercera Posicin del Codn preferencia por un
nucletido especfico (G,C)
Frecuencia k-mers dependiente de la especie
5' Splice Junction GT(AAGT)
3' Splice Junction (Py)12NCAG
Codn de Termino TGA, TAA, TAG
Seal Poly-A CAATAA(T/C)
Genoma Procaritico
0.5 10 Mpb
Alta densidad gnica : >90% regiones codificantes
Baja frecuencia de secuencias repetitivas
ORF nico y continuo
Facilidad en el anlisis deORF.
No todos los ORF corresponden a genes verdaderos.
Genes con ORF cortos y ARN no codificantes (ARN funcionales que no son traducidos) se ven subrepresentados.
Genoma Eucaritico
10Mpb 670 Gpb
Baja densidad gnica :
http://ghr.nlm.nih.gov/glossary=openreadingframe
ORF
http://www.kazusa.or.jp/codon/
Data source
NCBI-GenBank Flat File Release 160.0 [June 15 2007].Data amount
35,799 organisms3,027,973 complete protein coding genes (CDS's)
Seales Intrones / Exones
Deteccin del Sitio de Splicing
human: AAGGGAAGACAGGTGAGGGTCAAGCCCCAGCAAGTGCACCCAG------------ACACC
chimp: AAGGGAAGACAGGTGAGGGTCAAGCCCCAGCAAGTGCACCCAG------------ACACC
cow: AAGGGAAGACATTTACGAGTCAAGCCACAGAAAGAGCCCCTGAG-----------GTGCC
dog: AAAGGAGGACATGTGAGGGCCAAACTACTGAAGGTTCAACCAGG-----------ATGCT
galago: AAGGGGAGACAGGGGAGGGTCACACCATGGCAGAGG--CCAAG------------ACAGC
rat: AAAGGAAACAATGGGAAGGTTA-TCAACTCCAAGTATGCCCAAGATCAAGGGAACCCCTT
mouse: AAAGGAAACCACTGGGAGGTTA-GAAATCACAGGTGCACCCAAGATCAAGGAA--CCCCT
humanchimpanzee
cowdog
mouserat
chicken galago
Usar mltiplesgenomas
incrementa la
efectividad
Conservacin de Secuencias en la Evolucin
Prediccin de Genes
aatgcatgcggctatgctaatgcatgcggctatgctaagctgggatccgatgacaatgcatgcggctatgctaatgcatgcggctatgcaagctgggatccgatgactatgctaagctgggatccgatgacaatgcatgcggctatgctaatgaatggtcttgggatttaccttggaatgctaagctgggatccgatgacaatgcatgcggctatgctaatgaatggtcttgggatttaccttggaatatgctaatgcatgcggctatgctaagctgggatccgatgacaatgcatgcggctatgctaatgcatgcggctatgcaagctgggatccgatgactatgctaagctgcggctatgctaatgcatgcggctatgctaagctgggatccgatgacaatgcatgcggctatgctaatgcatgcggctatgcaagctgggatcctgcggctatgctaatgaatggtcttgggatttaccttggaatgctaagctgggatccgatgacaatgcatgcggctatgctaatgaatggtcttgggatttaccttggaatatgctaatgcatgcggctatgctaagctgggaatgcatgcggctatgctaagctgggatccgatgacaatgcatgcggctatgctaatgcatgcggctatgcaagctgggatccgatgactatgctaagctgcggctatgctaatgcatgcggctatgctaagctcatgcggctatgctaagctgggaatgcatgcggctatgctaagctgggatccgatgacaatgcatgcggctatgctaatgcatgcggctatgcaagctgggatccgatgactatgctaagctgcggctatgctaatgcatgcggctatgctaagctcggctatgctaatgaatggtcttgggatttaccttggaatgctaagctgggatccgatgacaatgcatgcggctatgctaatgaatggtcttgggatttaccttggaatatgctaatgcatgcggctatgctaagctgggaatgcatgcggctatgctaagctgggatccgatgacaatgcatgcggctatgctaatgcatgcggctatgcaagctgggatccgatgactatgctaagctgcggctatgctaatgcatgcggctatgctaagctcatgcgg
Gen!
Top Related