Introduccion3 bc

42
Bioinformatica: recopilación y almacenamiento de información biológica (AND/ARN) proteina Biología computacional: El desarrollo de algoritmos y métodos estadísticos para el análisis de datos biológicos. Aunque en concepto son diferentes, los términos Bioinformática y Biología computacional se usan indistintamente. ¿Que es Bioinformática/ ¿Que es Bioinformática/ Biología Computacional? Biología Computacional?

Transcript of Introduccion3 bc

Page 1: Introduccion3 bc

• Bioinformatica: recopilación y almacenamiento de información biológica(AND/ARN) proteina

• Biología computacional: El desarrollo de algoritmos y métodos estadísticos para el análisis de datos biológicos.

• Aunque en concepto son diferentes, los términos Bioinformática y Biología computacional se usan indistintamente.

¿Que es Bioinformática/ ¿Que es Bioinformática/ Biología Computacional? Biología Computacional?

Page 2: Introduccion3 bc

Source: http://ccb.wustl.edu/

¿Que es Bioinformática/ ¿Que es Bioinformática/ Biología Computacional? Biología Computacional?

Page 3: Introduccion3 bc

• No se busca la solución “exacta” sino la biológicamente relevante

– No interesan los mínimos globales porque la función de costo es heurísitca y puede tener mínimos irrelevantes.

– Se introduce la noción designificado biológico de una solución óptima o quasi-óptima desde elpunto de vista matemático

• La definición del problema es imprecisa (entre otras cosas por falta de conocimiento)

¿Que es diferente en BC? ¿Que es diferente en BC?

Page 4: Introduccion3 bc

• Es prioritario analizar conjuntos de soluciones quasi-óptimas, en lugar de únicamente la óptima.

• La validación experimental de los algoritmos tiene precedencia sobre el análisis matemático.

• La definición del modelo es la parte mas relevante de la resolución del problema.

• Bioinformática =/= Biología + Computación

¿Que es diferente en BC? ¿Que es diferente en BC?

Page 5: Introduccion3 bc

• Oferta/Demanda: Hay muy poca gente con una formación adecuada en biología e informática

• Los proyectos de secuenciación genómica, análisis en microchips (microarrays), proteómica, metabolómica, etc.… estan produciendo enormes cantidades de datos que tienen que ser analizados.

• Ahorra gran cantidad de tiempo y dinero

¿Porqué está de actualidad la BC? ¿Porqué está de actualidad la BC?

Page 6: Introduccion3 bc

Classificationin biology

Carl von Linne (1707-1778)

Evolution

Genetics Gregor Mendel (1822-1884)

Charles Darwin (1807-1882)

Discovery of nuclein Friedrich Miescher (1844-1895)

DNA is the genetic material Hershey-Chase

Molecular structure of DNA Chargaff, 1962 Nobel Prize James Watson, Francis Crick

Recombinant DNA, DNA sequencing 1980 Nobel Prize Walter Gilbert, Frederick Sanger, Paul Berg

Amplification of DNA (PCR) Kary Mullis & others, 1993 Nobel Prize

186919521953

1970

1983

Un poco de HistoriaUn poco de Historia

Page 7: Introduccion3 bc

H. influenzae 1.8 Mbp (1995)S. cerevisiae 12 Mbp (1997)C. elegans 100 Mbp (1998)Drosophila 180 Mbp (2000)H. sapiens 3200 Mbp (2001)

Overview: TIGR (The institute of genomic research)

http://www.tigr.org/tdb/mdb/mdbcomplete.htmlhttp://www.tigr.org/tdb/mdb/mdbinprogress.html

Un poco de HistoriaUn poco de Historia

Page 8: Introduccion3 bc

1984

1986

1988

1990

1992

1994

1996

1998

2000

2002

Entries

Bases x 1000

20.000.000

10.000.000

Number of Entries in EMBL DatabaseJune 2002: 23.860.228.282 Bases; 17.807.526 Entries

Un poco de HistoriaUn poco de Historia

Source HUSAR

Page 9: Introduccion3 bc

15 February 2001

Un poco de HistoriaUn poco de Historia

Secuenciacion completa del genoma humano

• It is smallIt is small• It is emptyIt is empty• It is unoriginalIt is unoriginal• It is repetitiveIt is repetitive

El genoma humano es:El genoma humano es:

Page 10: Introduccion3 bc

ORGANISM CHROMOSOMES GENOME SIZE GENES

Homo sapiens (Humans)

23 3,200,000,000 ~ 30,000

Mus musculus(Mouse)

20 2,600,000,000 ~30,000

Drosophila melanogaster

(Fruit Fly)

4 180,000,000 ~18,000

Saccharomyces cerevisiae

(Yeast)

16 14,000,000 ~6,000

Zea mays (Corn)

10 2,400,000,000 ???

Comparación de genomasComparación de genomas

Page 11: Introduccion3 bc

46250

Lysandra atlanticaOphioglossum

reticulatum

1260

La complejidad del genomaLa complejidad del genomaNO se correlaciona con el númeroNO se correlaciona con el número

cromosomascromosomas

Homo sapiens

46

Page 12: Introduccion3 bc

La complejidad del genomaLa complejidad del genomaNO se correlaciona con su tamañoNO se correlaciona con su tamaño

Homo sapiens3,4 x 10 9 bp

Amoeba dubia6,7 x 10 11 bp

Page 13: Introduccion3 bc

~31,000 genes~31,000 genes~26,000 genes~26,000 genes

~50,000 genes~50,000 genes

La complejidad del genomaLa complejidad del genomaNO se correlaciona con el número NO se correlaciona con el número

de genesde genes

Page 14: Introduccion3 bc

CHIMP GENOME Chimpanzees are similar to humans in so many ways: they are socially complex, sensitive and communicative, and yet indisputably on the animal side of the man/beast divide. Scientists have now sequenced the genetic code of our closest living relative, showing the striking concordances and divergences between the two species, and perhaps holding up a mirror to our own humanity.

Comparación con genomas mas Comparación con genomas mas cercanoscercanos

Page 15: Introduccion3 bc

From Olson and Varki(2002) Nat Rev Gen 4: 20-28Humanos Humanos

vs vs PrimatesPrimates

La comparación del genoma humanocon el de los Primates dio como resultado

diferencias de solo el 1%

Homo sapiens y Pan troglodytes (Orangutan) 99.0% identical

Homo sapiens y Chimpance 99.9 % identical !!!!!

Humans are not at all original in comparison with other vertebrates.

Page 16: Introduccion3 bc

Dogma Central de Dogma Central de la Biología Molecularla Biología Molecular

The central dogma states that once “information” has passed into protein, it cannot get out again. The transfer of information from nucleic acid to nucleic acid, or from nucleic acid to protein may be possible, but transfer from protein to protein, or from protein to nucleic acid, is impossible. Information means here the precise determination of sequence, either of bases in the nucleic acid or of amino acid residues in the protein.

Francis Crick, 1958

RNA

cDNA

PhenotypeDNA

protein

Page 17: Introduccion3 bc

• El dogma:

No se puede aplicar a todas las funciones biológicas.

• Los procesos celulares implican una gran cantidad de productos genicos asi como interacciones entre ellos.

Los procesos celulares son complejos y multidimensionales.

Condiciones que llaman la atención sobre la necesidad de hacer otro tipo de investigación…. ahi es donde entra en juego la bioinformatica.

Gen Proteina Función

Los límitesLos límites

Page 18: Introduccion3 bc

• Células• ADN (DNA)• ARN (RNA)• Amino Acidos (AA)• Proteinas

Biología Molecular: un resumenBiología Molecular: un resumen

Page 19: Introduccion3 bc

• Sistema complejo envuelto en una membrana

• Los organismos pueden ser unicelulares (bacteria, levadura) o multicelulares

• Humanos:– 60 trillion células – 320 tipos de células

Célula Animalwww.ebi.ac.uk/microarray/ biology_intro.htm

Biología Molecular: CélulasBiología Molecular: Células

Page 20: Introduccion3 bc

• Eucariotas: tienen una membrana nuclear y orgánulos (plantas, animales, hongos,…)

Biología Molecular: ProcariotasBiología Molecular: ProcariotasVs EucariotasVs Eucariotas

•Procariotas: no tienen una membrana

Que separe núcleo y orgánulos (bacteria)

•NO todos los organismos unicelulares son procariotas (levadura)BIOS Scientific Publishers Ltd, 1999

Page 21: Introduccion3 bc

GCCACATGTAGATAATTGAAACTGGATCCTCATCCCTCGCCTTGTACAAAAATCAACTCCAGATGGATCTAAGATTTAAATCTAACACCTGAAACCATAAAAATTCTAGGAGATAACACTGGCAAAGCTATTCTAGACATTGGCTTAGGCAAAGAGTTCGTGACCAAGAACCCAAAAGCAAATGCAACAAAAACAAAAATAAATAGGTGGGACCTGATTAAACTGAAAAGCCTCTGCACAGCAAAAGAAATAATCAGCAGAGTAAACAGACAACCCACAGAATGAGAGAAAATATTTGCAAACCATGCATCTGATGACAAAGGACTAATATCCAGAATCTACAAGGAACTCAAACAAATCAGCAAGAAAAAAATAACCCCATCAAAAAGTGGGCAAAGGAATGAATAGACAATTCTCAAAATATACAAATGGCCAATAAACATACGAAAAACTGTTCAACATCACTAATTATCAGGGAAATGCAAATTAAAACCACAATGAGATGCCACCTTACTCCTGCAAGAATGGCCATAATAAAAAAAAATCAAAAAAGAATAAATGTTGGTGTGAATGTGGTGAAAAGAGAACACTTTGACACTGCTGGTGGGAATGGAAACTAGTACAACCACTGTGGAAAACAGTACCGAGATTTCTTAAAGAACTACAAGTAGAACTACCATTTGATCCAGCAATCCCACTACTGGGTATCTACCCAGAGGAAAAGAAGTCATTATTTGAAAAAGACACTTGTACATACATGTTTATAGCAGCACAATTTGCAATTGCAAAGATATGGAACCAGTCTAAATGCCCATCAACCAACAAATGGATAAAGAAAATATGGTATATATACACCATGGAACACTACTCAGCCATAAAAAGGAACAAAATAATGGCAACTCACAGATGGAGTTGGAGACCACTATTCTAAGTGAAATAACTCAGGAATGGAAAACCAAATATTGTATGTTCTCACTTATAAGTGGGAGCTAAGCTATGAGGACAAAAGGCATAAGAATTATACTATGGACTTTGGGGACTCGGGGGAAAGGGTGGGAGGGGGATGAGGGACAAAAGACTACACATTGGGTGCAGTGTACACTGCTGAGGTGATGGGTGCACCAAAATCTCAGAAATTACCACTAAAGAACTTATCCATGTAACTAAAAACCACCTCTACCCAAATAATTTTGAAATAAAAAATAAAAATATTTTAAAAAGAACTCTTTAAAATAAATAATGAAAAGCACCAACAGACTTATGAACAGGCAATAGAAAAAATGAGAAATAGAAAGGAATACAAATAAAAGTACAGAAAAAAAATATGGCAAGTTATTCAACCAAACTGGTAATTTGAAATCCAGATTGAAATAATGCAAAAAAAAGGCAATTTCTGGCACCATGGCAGACCAGGTACCTGGATGATCTGTTGCTGAAAACAACTGAAAATGCTGGTTAAAATATATTAACACATTCTTGAATACAGTCATGGCCAAAGGAAGTCACATGACTAAGCCCACAGTCAAGGAGTGAGAAAGTATTCTCTACCTACCATGAGGCCAGGGCAAGGGTGTGCACTTTTTTTTTTCTTCTGTTCATTGAATACAGTCACTGTGTATTTTACATACTTTCATTTAGTCTTATGACAATCCTATGAAACAAGTACTTTTAAAAAAATTGAGATAACAGTTGCATACCGTGAAATTCATCCATTTAAAGTGAGCAATTCACAGGTGCAGCTAGCTCAGTCAGCAGAGCATAAGACTCTTAAAGTGAACAATTCAGTGCTTTTTAGTATATTCACAGAGTTGTGCAACCATCACCACTATCTAATTGGTCTTAGTCTGTTTGGGCTGCCATAACAAAATACCACAAACTGGATAGCTCATAAACAACAGGCATTTATTGCTCACAGTTCTAGAGGCTGGAAGTGCAAGATTAAGATGCCAGCAGATTCTGTGTCTGCTGAGG

¿Que es el ADN?¿Que es el ADN?

Es un alfabeto de 4 caracteres

Este alfabeto de 4 caracteres contiene suficiente información paracrear organismos complejos, mediante el uso de largas palabras

Similitud con el codigo binario

Page 22: Introduccion3 bc

Image source: www.biotec.or.th/Genome/whatGenome.html

¿Que es el ADN?¿Que es el ADN?

• DNA: Deoxyribonucleic Acid (ácido dexosiribonucleíco)

• 4 nucleotidos:– Adenosina (A)– Citosina (C)– Guanina (G)– Timina (T)

Page 23: Introduccion3 bc

Bases nitrogenadas• Purinas (A and G)• Pirimidinas (C and T)Un azúcar (deoxiribosa)Un fosfato

Image Source: www.ebi.ac.uk/microarray/ biology_intro.htm

Acidos nucleicosAcidos nucleicosEl bloque básico necesario es:

Page 24: Introduccion3 bc

• Los cuatro nucleótidos pueden unirse mediante fosfatos para formar cadenas de nucleótidos

• Los finales de la hebra son distintos

• Hay direccionalidad en la hebra de ADN

• Por convencion se marca la hebra codificante como 5’ to 3’

http://www.emc.maricopa.edu/faculty/farabee/BIOBK/BioBookDNAMOLGEN.html

Polinucleótidos de ADNPolinucleótidos de ADN

Page 25: Introduccion3 bc

El ADN en realidad está formado por dos cadenas

Doble hebra de ADNDoble hebra de ADN

Las cadenas avanzan en sentido opuesto

y que están ligadas por enlaces

complementarios de bases nitrogenadas : A, T, G y C

Eso significa que la segunda cadena esreversa y complementaria

La doble hélice tiene siempre una anchuraconstante porque las purinas se enfrentansiempre a las pirimidinas.

Page 26: Introduccion3 bc

• La doble hélice es la estructura más estable del ADN.

Image source; www.ebi.ac.uk/microarray/ biology_intro.htm

5’ G→T→A→A→A→G→T→C→C→C→G→T→T→A→G→C 3’ | | | | | | | | | | | | | | | |3’ C←A←T←T←T←C←A←G←G←G←C←A←A←T←C←G 5’

Doble héliceDoble hélice

Page 27: Introduccion3 bc

•RNA can be:–Hebra simple–Hebra doble–Hebra hibrida AND-AR

Acido Ribonucléico ARNAcido Ribonucléico ARN

base(uracil)

phosphate group

sugar (ribose)

•Similar al ADN, el bloque consta de:• Bases nitrogenadas: A, C, G. La Timina (T) se reemplaza por un Uracilo (U)• Un azúcar, en este caso una Ribosa• Un fosfato

El RNA puede formar estructuras terciarias

Page 28: Introduccion3 bc

• ARN mensajero (mRNA)

– Contiene la información para construir una proteina.

• ARN ribosomal (rRNA)

– Componente mayoritario de los ribosomas

• ARN transferente (tRNA)

– Encargado de llevar los amino acidos a los ribosomas para la síntesis de proteinas

Tipos de ARNTipos de ARN

Page 29: Introduccion3 bc

• Molécula linear que contiene información genética copiada del AND. Tiene regiones codificadoras y regiones no codificadoras como la cabeza o líder y la cola.

• Los mensajeros de eucariotas tienen un cap o gorra en el extremo 5’ y una cola polyA en el extremo 3’.

• Transcription: es el proceso por el cual una molécula de AND es copiada a una de ARN.

ARN mensajeroARN mensajero

Dirección de la transcipción

Page 30: Introduccion3 bc

ARN transferenteARN transferente

Tienen una estructura tridimensional muy bien definida

codon in mRNA

anticodon in tRNA

amino acid

Juega un papel crítico en la sintesis de proteinas llevando aa al ribosoma

Doble papel:• adaptador que reconoce al amino ácido en el extremo 3’• El anticodón se empareja con el codón en el ARNm

Amino ácido

5’ GTAAAGTCCCTTTAGC 3’

Anti codonARNm

Page 31: Introduccion3 bc

ARN ribosomalARN ribosomal

Componente mayoritario de los ribosomas

Los ribosomas llevan a cabo la síntesis de proteínas asociándose conlos diferentes ARNm que proporcionan la secuencia de codificaciónreal y los ARNt que les proporcionan los aa

Page 32: Introduccion3 bc

• 4 nucleótidos posibles (A, C, G, U)• Un codón tiene 3 bases• 4 * 4 * 4 = 64 codones posibles• Codón de inicio: AUG• Codón de parada o Stop: UAA, UAG, UGA• 61 codones codifican amino ácidos (AUG también Metionina)• Solo existen 20 amino acidos – redundancia del código genetico

code

Código genéticoCódigo genético

Page 33: Introduccion3 bc

• Todos los organismos usan el mismo código genético

• Un amino ácido esta codificado por 3 nucleótidos = Código genético

Código genético es UniversalCódigo genético es Universal

• 4 nucleótidos posibles (A, C, G, U)• Un codón tiene 3 bases• 4 * 4 * 4 = 64 codones posibles• Codón de inicio: AUG

• Codón de parada o Stop: UAA, UAG, UGA

• 61 codones codifican amino ácidos (AUG también Metionina)

Page 34: Introduccion3 bc

DNA

mRNA

mRNAcodons

threonine proline glutamate glutamate lysine

amino acids

•Solo existen 20 amino acidos – pero 64 codones posibles

Redundancia del Código genéticoRedundancia del Código genético

Page 35: Introduccion3 bc

• Elementos constitutivos de las proteinas (20 different)• Tienen un grupo radical variable que los caracteriza

Amino ácidosAmino ácidos

• Los amino ácidos tienen diferentes características bioquímicas y físicas, las cuales determinan su capacidad de ser reemplazados enla evolución.

CP

GGAVIL

MF

YW H

KR

E Q

DNS

TCSH

S+S

positivos

cargadospolares

alifáticos

aromaticos

pequeños

muy pequeños

hidrofóbicos

Page 36: Introduccion3 bc

Los ARNm se pueden leer en tres diferentes marcos de lectura, pero solouno de ellos codifica la proteína correcta

Código genéticoCódigo genético

Page 37: Introduccion3 bc

ProteínasProteínas

Los aa se unen mediante enlaces peptídicos entre el grupo carboxilo terminal de un aa y el grupo amino de otro.

Péptido: Cadena corta de aa (< 30) Polipéptido: cadena larga de aa (hasta 4000 residuos).

La secuencia de aa, su tipo y orden constituyen la Estructura primaria dela proteína

Residuo aminoterminal

Residuo carboxiloterminal

Tyr Gly GlyPhe Leu Val Ser

Page 38: Introduccion3 bc

ProteínasProteínas

Estructura secundaria: producto del establecimiento de puentes de hidrógeno entre distintos átomos de los aa

Helices alfa: enrrollamiento espiral p.ejem proteinas fibrosas como piel y uñas

Cada hélice tiene 3,6 aa por vuelta

Page 39: Introduccion3 bc

ProteínasProteínas

Estructura secundaria: producto del establecimiento de puentes de hidrógeno entre distintos átomos de los aa

Beta plegada: estructura en zig-zag resistente y flexiblep.ejem fibroína (proteína de la seda)

Dos o mas polipéptidos se situan de forma paralela entre ellos y se unen mediante puentes de hidrógeno. Estos puentes de hidrógeno se establecen entre diferentes segmentos del polipétido a diferencia con las alfa hélices

Page 40: Introduccion3 bc

ProteínasProteínas

Estructura terciaria: Es la forma global de cada proteína. Depende de las interacciones entre los grupos radicales de la misma cadena polipetídica ocasionada por: puentes de hidrógeno, atración iónica, condición hidrofóbica o hidrofílica y puentes disulfuro.

Figure shows the tertiary structure of Chain B of Protein Kinase C Interacting Protein

Péptido individual doblado

Page 41: Introduccion3 bc

ProteínasProteínas

Estructura cuaternaria: Es propia de las proteínas globulares y es la conformación tridimensional de la unión de dos o más cademas polipeptídicas, generadas por las mismas interacciones anteriormente citadas.

Agregado de dos o más péptidos

Figure shows the tertiary structure of Chain B of Protein Kinase C Interacting Protein

Page 42: Introduccion3 bc

Volvemos al principio…Volvemos al principio…““El dogma central”El dogma central”

ADN

ARN

Proteína

Trascripción

Translación

Traducción