Introduccion3 bc

Post on 12-Jul-2015

776 views 0 download

Transcript of Introduccion3 bc

• Bioinformatica: recopilación y almacenamiento de información biológica(AND/ARN) proteina

• Biología computacional: El desarrollo de algoritmos y métodos estadísticos para el análisis de datos biológicos.

• Aunque en concepto son diferentes, los términos Bioinformática y Biología computacional se usan indistintamente.

¿Que es Bioinformática/ ¿Que es Bioinformática/ Biología Computacional? Biología Computacional?

Source: http://ccb.wustl.edu/

¿Que es Bioinformática/ ¿Que es Bioinformática/ Biología Computacional? Biología Computacional?

• No se busca la solución “exacta” sino la biológicamente relevante

– No interesan los mínimos globales porque la función de costo es heurísitca y puede tener mínimos irrelevantes.

– Se introduce la noción designificado biológico de una solución óptima o quasi-óptima desde elpunto de vista matemático

• La definición del problema es imprecisa (entre otras cosas por falta de conocimiento)

¿Que es diferente en BC? ¿Que es diferente en BC?

• Es prioritario analizar conjuntos de soluciones quasi-óptimas, en lugar de únicamente la óptima.

• La validación experimental de los algoritmos tiene precedencia sobre el análisis matemático.

• La definición del modelo es la parte mas relevante de la resolución del problema.

• Bioinformática =/= Biología + Computación

¿Que es diferente en BC? ¿Que es diferente en BC?

• Oferta/Demanda: Hay muy poca gente con una formación adecuada en biología e informática

• Los proyectos de secuenciación genómica, análisis en microchips (microarrays), proteómica, metabolómica, etc.… estan produciendo enormes cantidades de datos que tienen que ser analizados.

• Ahorra gran cantidad de tiempo y dinero

¿Porqué está de actualidad la BC? ¿Porqué está de actualidad la BC?

Classificationin biology

Carl von Linne (1707-1778)

Evolution

Genetics Gregor Mendel (1822-1884)

Charles Darwin (1807-1882)

Discovery of nuclein Friedrich Miescher (1844-1895)

DNA is the genetic material Hershey-Chase

Molecular structure of DNA Chargaff, 1962 Nobel Prize James Watson, Francis Crick

Recombinant DNA, DNA sequencing 1980 Nobel Prize Walter Gilbert, Frederick Sanger, Paul Berg

Amplification of DNA (PCR) Kary Mullis & others, 1993 Nobel Prize

186919521953

1970

1983

Un poco de HistoriaUn poco de Historia

H. influenzae 1.8 Mbp (1995)S. cerevisiae 12 Mbp (1997)C. elegans 100 Mbp (1998)Drosophila 180 Mbp (2000)H. sapiens 3200 Mbp (2001)

Overview: TIGR (The institute of genomic research)

http://www.tigr.org/tdb/mdb/mdbcomplete.htmlhttp://www.tigr.org/tdb/mdb/mdbinprogress.html

Un poco de HistoriaUn poco de Historia

1984

1986

1988

1990

1992

1994

1996

1998

2000

2002

Entries

Bases x 1000

20.000.000

10.000.000

Number of Entries in EMBL DatabaseJune 2002: 23.860.228.282 Bases; 17.807.526 Entries

Un poco de HistoriaUn poco de Historia

Source HUSAR

15 February 2001

Un poco de HistoriaUn poco de Historia

Secuenciacion completa del genoma humano

• It is smallIt is small• It is emptyIt is empty• It is unoriginalIt is unoriginal• It is repetitiveIt is repetitive

El genoma humano es:El genoma humano es:

ORGANISM CHROMOSOMES GENOME SIZE GENES

Homo sapiens (Humans)

23 3,200,000,000 ~ 30,000

Mus musculus(Mouse)

20 2,600,000,000 ~30,000

Drosophila melanogaster

(Fruit Fly)

4 180,000,000 ~18,000

Saccharomyces cerevisiae

(Yeast)

16 14,000,000 ~6,000

Zea mays (Corn)

10 2,400,000,000 ???

Comparación de genomasComparación de genomas

46250

Lysandra atlanticaOphioglossum

reticulatum

1260

La complejidad del genomaLa complejidad del genomaNO se correlaciona con el númeroNO se correlaciona con el número

cromosomascromosomas

Homo sapiens

46

La complejidad del genomaLa complejidad del genomaNO se correlaciona con su tamañoNO se correlaciona con su tamaño

Homo sapiens3,4 x 10 9 bp

Amoeba dubia6,7 x 10 11 bp

~31,000 genes~31,000 genes~26,000 genes~26,000 genes

~50,000 genes~50,000 genes

La complejidad del genomaLa complejidad del genomaNO se correlaciona con el número NO se correlaciona con el número

de genesde genes

CHIMP GENOME Chimpanzees are similar to humans in so many ways: they are socially complex, sensitive and communicative, and yet indisputably on the animal side of the man/beast divide. Scientists have now sequenced the genetic code of our closest living relative, showing the striking concordances and divergences between the two species, and perhaps holding up a mirror to our own humanity.

Comparación con genomas mas Comparación con genomas mas cercanoscercanos

From Olson and Varki(2002) Nat Rev Gen 4: 20-28Humanos Humanos

vs vs PrimatesPrimates

La comparación del genoma humanocon el de los Primates dio como resultado

diferencias de solo el 1%

Homo sapiens y Pan troglodytes (Orangutan) 99.0% identical

Homo sapiens y Chimpance 99.9 % identical !!!!!

Humans are not at all original in comparison with other vertebrates.

Dogma Central de Dogma Central de la Biología Molecularla Biología Molecular

The central dogma states that once “information” has passed into protein, it cannot get out again. The transfer of information from nucleic acid to nucleic acid, or from nucleic acid to protein may be possible, but transfer from protein to protein, or from protein to nucleic acid, is impossible. Information means here the precise determination of sequence, either of bases in the nucleic acid or of amino acid residues in the protein.

Francis Crick, 1958

RNA

cDNA

PhenotypeDNA

protein

• El dogma:

No se puede aplicar a todas las funciones biológicas.

• Los procesos celulares implican una gran cantidad de productos genicos asi como interacciones entre ellos.

Los procesos celulares son complejos y multidimensionales.

Condiciones que llaman la atención sobre la necesidad de hacer otro tipo de investigación…. ahi es donde entra en juego la bioinformatica.

Gen Proteina Función

Los límitesLos límites

• Células• ADN (DNA)• ARN (RNA)• Amino Acidos (AA)• Proteinas

Biología Molecular: un resumenBiología Molecular: un resumen

• Sistema complejo envuelto en una membrana

• Los organismos pueden ser unicelulares (bacteria, levadura) o multicelulares

• Humanos:– 60 trillion células – 320 tipos de células

Célula Animalwww.ebi.ac.uk/microarray/ biology_intro.htm

Biología Molecular: CélulasBiología Molecular: Células

• Eucariotas: tienen una membrana nuclear y orgánulos (plantas, animales, hongos,…)

Biología Molecular: ProcariotasBiología Molecular: ProcariotasVs EucariotasVs Eucariotas

•Procariotas: no tienen una membrana

Que separe núcleo y orgánulos (bacteria)

•NO todos los organismos unicelulares son procariotas (levadura)BIOS Scientific Publishers Ltd, 1999

GCCACATGTAGATAATTGAAACTGGATCCTCATCCCTCGCCTTGTACAAAAATCAACTCCAGATGGATCTAAGATTTAAATCTAACACCTGAAACCATAAAAATTCTAGGAGATAACACTGGCAAAGCTATTCTAGACATTGGCTTAGGCAAAGAGTTCGTGACCAAGAACCCAAAAGCAAATGCAACAAAAACAAAAATAAATAGGTGGGACCTGATTAAACTGAAAAGCCTCTGCACAGCAAAAGAAATAATCAGCAGAGTAAACAGACAACCCACAGAATGAGAGAAAATATTTGCAAACCATGCATCTGATGACAAAGGACTAATATCCAGAATCTACAAGGAACTCAAACAAATCAGCAAGAAAAAAATAACCCCATCAAAAAGTGGGCAAAGGAATGAATAGACAATTCTCAAAATATACAAATGGCCAATAAACATACGAAAAACTGTTCAACATCACTAATTATCAGGGAAATGCAAATTAAAACCACAATGAGATGCCACCTTACTCCTGCAAGAATGGCCATAATAAAAAAAAATCAAAAAAGAATAAATGTTGGTGTGAATGTGGTGAAAAGAGAACACTTTGACACTGCTGGTGGGAATGGAAACTAGTACAACCACTGTGGAAAACAGTACCGAGATTTCTTAAAGAACTACAAGTAGAACTACCATTTGATCCAGCAATCCCACTACTGGGTATCTACCCAGAGGAAAAGAAGTCATTATTTGAAAAAGACACTTGTACATACATGTTTATAGCAGCACAATTTGCAATTGCAAAGATATGGAACCAGTCTAAATGCCCATCAACCAACAAATGGATAAAGAAAATATGGTATATATACACCATGGAACACTACTCAGCCATAAAAAGGAACAAAATAATGGCAACTCACAGATGGAGTTGGAGACCACTATTCTAAGTGAAATAACTCAGGAATGGAAAACCAAATATTGTATGTTCTCACTTATAAGTGGGAGCTAAGCTATGAGGACAAAAGGCATAAGAATTATACTATGGACTTTGGGGACTCGGGGGAAAGGGTGGGAGGGGGATGAGGGACAAAAGACTACACATTGGGTGCAGTGTACACTGCTGAGGTGATGGGTGCACCAAAATCTCAGAAATTACCACTAAAGAACTTATCCATGTAACTAAAAACCACCTCTACCCAAATAATTTTGAAATAAAAAATAAAAATATTTTAAAAAGAACTCTTTAAAATAAATAATGAAAAGCACCAACAGACTTATGAACAGGCAATAGAAAAAATGAGAAATAGAAAGGAATACAAATAAAAGTACAGAAAAAAAATATGGCAAGTTATTCAACCAAACTGGTAATTTGAAATCCAGATTGAAATAATGCAAAAAAAAGGCAATTTCTGGCACCATGGCAGACCAGGTACCTGGATGATCTGTTGCTGAAAACAACTGAAAATGCTGGTTAAAATATATTAACACATTCTTGAATACAGTCATGGCCAAAGGAAGTCACATGACTAAGCCCACAGTCAAGGAGTGAGAAAGTATTCTCTACCTACCATGAGGCCAGGGCAAGGGTGTGCACTTTTTTTTTTCTTCTGTTCATTGAATACAGTCACTGTGTATTTTACATACTTTCATTTAGTCTTATGACAATCCTATGAAACAAGTACTTTTAAAAAAATTGAGATAACAGTTGCATACCGTGAAATTCATCCATTTAAAGTGAGCAATTCACAGGTGCAGCTAGCTCAGTCAGCAGAGCATAAGACTCTTAAAGTGAACAATTCAGTGCTTTTTAGTATATTCACAGAGTTGTGCAACCATCACCACTATCTAATTGGTCTTAGTCTGTTTGGGCTGCCATAACAAAATACCACAAACTGGATAGCTCATAAACAACAGGCATTTATTGCTCACAGTTCTAGAGGCTGGAAGTGCAAGATTAAGATGCCAGCAGATTCTGTGTCTGCTGAGG

¿Que es el ADN?¿Que es el ADN?

Es un alfabeto de 4 caracteres

Este alfabeto de 4 caracteres contiene suficiente información paracrear organismos complejos, mediante el uso de largas palabras

Similitud con el codigo binario

Image source: www.biotec.or.th/Genome/whatGenome.html

¿Que es el ADN?¿Que es el ADN?

• DNA: Deoxyribonucleic Acid (ácido dexosiribonucleíco)

• 4 nucleotidos:– Adenosina (A)– Citosina (C)– Guanina (G)– Timina (T)

Bases nitrogenadas• Purinas (A and G)• Pirimidinas (C and T)Un azúcar (deoxiribosa)Un fosfato

Image Source: www.ebi.ac.uk/microarray/ biology_intro.htm

Acidos nucleicosAcidos nucleicosEl bloque básico necesario es:

• Los cuatro nucleótidos pueden unirse mediante fosfatos para formar cadenas de nucleótidos

• Los finales de la hebra son distintos

• Hay direccionalidad en la hebra de ADN

• Por convencion se marca la hebra codificante como 5’ to 3’

http://www.emc.maricopa.edu/faculty/farabee/BIOBK/BioBookDNAMOLGEN.html

Polinucleótidos de ADNPolinucleótidos de ADN

El ADN en realidad está formado por dos cadenas

Doble hebra de ADNDoble hebra de ADN

Las cadenas avanzan en sentido opuesto

y que están ligadas por enlaces

complementarios de bases nitrogenadas : A, T, G y C

Eso significa que la segunda cadena esreversa y complementaria

La doble hélice tiene siempre una anchuraconstante porque las purinas se enfrentansiempre a las pirimidinas.

• La doble hélice es la estructura más estable del ADN.

Image source; www.ebi.ac.uk/microarray/ biology_intro.htm

5’ G→T→A→A→A→G→T→C→C→C→G→T→T→A→G→C 3’ | | | | | | | | | | | | | | | |3’ C←A←T←T←T←C←A←G←G←G←C←A←A←T←C←G 5’

Doble héliceDoble hélice

•RNA can be:–Hebra simple–Hebra doble–Hebra hibrida AND-AR

Acido Ribonucléico ARNAcido Ribonucléico ARN

base(uracil)

phosphate group

sugar (ribose)

•Similar al ADN, el bloque consta de:• Bases nitrogenadas: A, C, G. La Timina (T) se reemplaza por un Uracilo (U)• Un azúcar, en este caso una Ribosa• Un fosfato

El RNA puede formar estructuras terciarias

• ARN mensajero (mRNA)

– Contiene la información para construir una proteina.

• ARN ribosomal (rRNA)

– Componente mayoritario de los ribosomas

• ARN transferente (tRNA)

– Encargado de llevar los amino acidos a los ribosomas para la síntesis de proteinas

Tipos de ARNTipos de ARN

• Molécula linear que contiene información genética copiada del AND. Tiene regiones codificadoras y regiones no codificadoras como la cabeza o líder y la cola.

• Los mensajeros de eucariotas tienen un cap o gorra en el extremo 5’ y una cola polyA en el extremo 3’.

• Transcription: es el proceso por el cual una molécula de AND es copiada a una de ARN.

ARN mensajeroARN mensajero

Dirección de la transcipción

ARN transferenteARN transferente

Tienen una estructura tridimensional muy bien definida

codon in mRNA

anticodon in tRNA

amino acid

Juega un papel crítico en la sintesis de proteinas llevando aa al ribosoma

Doble papel:• adaptador que reconoce al amino ácido en el extremo 3’• El anticodón se empareja con el codón en el ARNm

Amino ácido

5’ GTAAAGTCCCTTTAGC 3’

Anti codonARNm

ARN ribosomalARN ribosomal

Componente mayoritario de los ribosomas

Los ribosomas llevan a cabo la síntesis de proteínas asociándose conlos diferentes ARNm que proporcionan la secuencia de codificaciónreal y los ARNt que les proporcionan los aa

• 4 nucleótidos posibles (A, C, G, U)• Un codón tiene 3 bases• 4 * 4 * 4 = 64 codones posibles• Codón de inicio: AUG• Codón de parada o Stop: UAA, UAG, UGA• 61 codones codifican amino ácidos (AUG también Metionina)• Solo existen 20 amino acidos – redundancia del código genetico

code

Código genéticoCódigo genético

• Todos los organismos usan el mismo código genético

• Un amino ácido esta codificado por 3 nucleótidos = Código genético

Código genético es UniversalCódigo genético es Universal

• 4 nucleótidos posibles (A, C, G, U)• Un codón tiene 3 bases• 4 * 4 * 4 = 64 codones posibles• Codón de inicio: AUG

• Codón de parada o Stop: UAA, UAG, UGA

• 61 codones codifican amino ácidos (AUG también Metionina)

DNA

mRNA

mRNAcodons

threonine proline glutamate glutamate lysine

amino acids

•Solo existen 20 amino acidos – pero 64 codones posibles

Redundancia del Código genéticoRedundancia del Código genético

• Elementos constitutivos de las proteinas (20 different)• Tienen un grupo radical variable que los caracteriza

Amino ácidosAmino ácidos

• Los amino ácidos tienen diferentes características bioquímicas y físicas, las cuales determinan su capacidad de ser reemplazados enla evolución.

CP

GGAVIL

MF

YW H

KR

E Q

DNS

TCSH

S+S

positivos

cargadospolares

alifáticos

aromaticos

pequeños

muy pequeños

hidrofóbicos

Los ARNm se pueden leer en tres diferentes marcos de lectura, pero solouno de ellos codifica la proteína correcta

Código genéticoCódigo genético

ProteínasProteínas

Los aa se unen mediante enlaces peptídicos entre el grupo carboxilo terminal de un aa y el grupo amino de otro.

Péptido: Cadena corta de aa (< 30) Polipéptido: cadena larga de aa (hasta 4000 residuos).

La secuencia de aa, su tipo y orden constituyen la Estructura primaria dela proteína

Residuo aminoterminal

Residuo carboxiloterminal

Tyr Gly GlyPhe Leu Val Ser

ProteínasProteínas

Estructura secundaria: producto del establecimiento de puentes de hidrógeno entre distintos átomos de los aa

Helices alfa: enrrollamiento espiral p.ejem proteinas fibrosas como piel y uñas

Cada hélice tiene 3,6 aa por vuelta

ProteínasProteínas

Estructura secundaria: producto del establecimiento de puentes de hidrógeno entre distintos átomos de los aa

Beta plegada: estructura en zig-zag resistente y flexiblep.ejem fibroína (proteína de la seda)

Dos o mas polipéptidos se situan de forma paralela entre ellos y se unen mediante puentes de hidrógeno. Estos puentes de hidrógeno se establecen entre diferentes segmentos del polipétido a diferencia con las alfa hélices

ProteínasProteínas

Estructura terciaria: Es la forma global de cada proteína. Depende de las interacciones entre los grupos radicales de la misma cadena polipetídica ocasionada por: puentes de hidrógeno, atración iónica, condición hidrofóbica o hidrofílica y puentes disulfuro.

Figure shows the tertiary structure of Chain B of Protein Kinase C Interacting Protein

Péptido individual doblado

ProteínasProteínas

Estructura cuaternaria: Es propia de las proteínas globulares y es la conformación tridimensional de la unión de dos o más cademas polipeptídicas, generadas por las mismas interacciones anteriormente citadas.

Agregado de dos o más péptidos

Figure shows the tertiary structure of Chain B of Protein Kinase C Interacting Protein

Volvemos al principio…Volvemos al principio…““El dogma central”El dogma central”

ADN

ARN

Proteína

Trascripción

Translación

Traducción