BIOINFORMATICA.pdf

7
BIOINFORMÁTICA Página 1 1 .¿Qué es la bioinformática? 2. ¿A qué se dedica la bioinformática? 3. Medición de la biodiversidad. 4. Genómica comparativa. 5. Análisis de imagen de alto rendimiento. 6. Acoplamiento proteína-proteína. 7. Herramientas de software de la bioinformática. 8. Biología evolutiva computancional. 9. Análisis de secuencias.

Transcript of BIOINFORMATICA.pdf

  • BIOINFORMTICA

    Pgina 1

    1 .Qu es la bioinformtica?

    2. A qu se dedica la bioinformtica?

    3. Medicin de la biodiversidad.

    4. Genmica comparativa.

    5. Anlisis de imagen de alto rendimiento.

    6. Acoplamiento protena-protena.

    7. Herramientas de software de la bioinformtica.

    8. Biologa evolutiva computancional.

    9. Anlisis de secuencias.

  • BIOINFORMTICA

    Pgina 2

    1 .Qu es la bioinformtica?

    La bioinformtica, segn una de sus definiciones ms sencillas, es la

    aplicacin de tecnologa de computadores a la gestin y anlisis

    de datos biolgicos. Los trminos bioinformtica, biologa computacional y, en

    ocasiones, biocomputacin, utilizados en muchas situaciones como sinnimos,

    hacen referencia a campos de estudios interdisciplinares muy vinculados que

    requieren el uso o el desarrollo de diferentes tcnicas estudiadas

    universitariamente en la Ingeniera Informtica como ciencia aplicada de la

    disciplina informtica. Entre estas pueden destacarse las

    siguientes: matemtica aplicada, estadstica, ciencias de la computacin,

    inteligencia artificial, qumica y bioqumica con las que el Ingeniero

    Informtico soluciona problemas al analizar datos, o simular sistemas o

    mecanismos, todos ellos de ndole biolgica, y usualmente (pero no de forma

    exclusiva) en el nivel molecular. El ncleo principal de estas tcnicas se

    encuentra en la utilizacin de recursos computacionales para solucionar o

    investigar problemas sobre escalas de tal magnitud que sobrepasan el

    discernimiento humano. La investigacin en biologa computacional se solapa

    a menudo con la biologa de sistemas.

    2. A qu se dedica la bioinformtica?

    Los principales esfuerzos de investigacin en estos campos incluyen

    el alineamiento de secuencias, la prediccin de

    genes, montaje del genoma, alineamiento estructural de protenas, prediccin

    de estructura de protenas, prediccin de la expresin gnica, interacciones

    protena-protena, y modelado de la evolucin.

    Una constante en proyectos de bioinformtica y biologa

    computacional es el uso de herramientas matemticas para

    extraer informacin til de datos producidos por tcnicas biolgicas de alta

    productividad, como la secuenciacin del genoma. En particular, el montaje o

    ensamblado de secuencias genmicas de alta calidad desde fragmentos

    obtenidos tras la secuenciacin del ADN a gran escala es un rea de alto

    inters. Otros objetivos incluyen el estudio de la regulacin gentica para

    interpretar perfiles de expresin gnica utilizando datos de chips de

    ADN o espectrometra de masas.

  • BIOINFORMTICA

    Pgina 3

    3. Medicin de la biodiversidad.

    La biodiversidad de un ecosistema puede definirse como el conjunto

    genmico completo de todas las especies presentes en un medio ambiente

    particular, sea este una biopelcula en una mina abandonada, una gota de

    agua de mar, un puado de tierra, o la biosfera completa del planeta Tierra.

    Se utilizan bases de datos para recoger los nombres de las especies, as como

    de sus descripciones, distribuciones, informacin gentica, estado y tamaos

    de las poblaciones, necesidades de su hbitat, y cmo cada organismo

    interacta con otras especies. Se usa software especializado para encontrar,

    visualizar y analizar la informacin; y, lo que es ms importante, para

    compartirla con otros interesados. La simulacin computacional puede

    modelar cosas tales como dinmica poblacional, o calcular la mejora del

    acervo gentico de una variedad (enagricultura), o la poblacin amenazada

    (en biologa de la conservacin). Un potencial muy excitante en este campo

    es la posibilidad de preservar las secuencias completas del ADN, o genomas,

    de especies amenazadas de extincin, permitiendo registrar los resultados de

    la experimentacin gentica de la Naturaleza in silico para su posible

    reutilizacin futura, an si tales especies fueran finalmente perdidas.

    4. Genmica comparativa.

    El ncleo del anlisis comparativo del genoma es el establecimiento de

    la correspondencia entre genes (anlisis ortlogo) o entre otras caractersticas

    genmicas de diferentes organismos. Estos mapas intergenmicos son los que

    hacen posible rastrear los procesos evolutivos responsables de la divergencia

    entre dos genomas. Una multitud de eventos evolutivos actuando a diferentes

    niveles organizativos conforman la evolucin del genoma. Al nivel ms bajo,

    las mutaciones puntuales afectan a nucletidos individuales. Al mayor nivel,

    amplios segmentos cromosmicos experimentan duplicacin, transferencia

    horizontal, inversin, transposicin, borrado e insercin. Finalmente, los

    genomas enteros estn involucrados en procesos

    de hibridacin, poliploida y endosimbiosis, conduciendo a menudo a una

    sbita especiacin.

  • BIOINFORMTICA

    Pgina 4

    La complejidad de la evolucin del genoma plantea muchos desafos

    excitantes a desarrolladores de modelos matemticos y algoritmos, quienes

    deben recurrir a un espectro de tcnicas algortmicas, estadsticas y

    matemticas que se extienden desde exactas, heursticas, con parmetros

    fijados, y mediante algoritmos de aproximacin para problemas basados en

    modelos de parsimonia, hasta algoritmos "Mrkov Chain Monte Carlo"

    para anlisis Bayesiano de problemas basados en modelos probabilsticos.

    Muchos de estos estudios estn basados en la deteccin

    de homologa y la computacin de familias de protenas.

    5. Anlisis de imagen de alto rendimiento.

    Se estn usando tecnologas de computacin para acelerar o

    automatizar completamente el procesamiento, cuantificacin y anlisis de

    grandes cantidades de imgenes biomdicas con alto contenido

    en informacin. Los modernos sistemas de anlisis de imagen incrementan la

    habilidad del observador para realizar anlisis sobre un amplio o complejo

    conjunto de imgenes, mejorando la precisin, la objetividad (independencia

    de los resultados segn el observador), o la rapidez. Un sistema de anlisis

    totalmente desarrollado podra reemplazar completamente al observador.

    Aunque estos sistemas no son exclusivos del campo de las imgenes

    biomdicas, cada vez son ms importantes tanto para el diagnstico como

    para la investigacin. Algunos ejemplos:

    Cuantificacin y localizacin subcelular con alta productividad y

    precisin (high-content screening, citohistopatologa).

    Morfometra.

    Anlisis y visualizacin de imgenes clnicas.

    Determinacin de patrones en el flujo del aire en tiempo real de la

    respiracin pulmonar de animales vivos.

    Cuantificacin del tamao de la oclusin a travs de imgenes en

    tiempo real, tanto por desarrollo como por recuperacin, de lesiones arteriales.

    Realizacin de observaciones conductuales basadas en prolongadas

    grabaciones en vdeo de animales de laboratorio.

    Observaciones en infrarrojo (espectroscopia infrarroja) para la

    determinacin de la actividad metablica.

  • BIOINFORMTICA

    Pgina 5

    6. Acoplamiento protena-protena.

    En las ltimas dos dcadas, decenas de miles de estructuras

    tridimensionales de protenas han sido determinadas por cristalografa de rayos

    X y espectroscopia mediante resonancia magntica nuclear de

    protenas (RMN de protenas). Una cuestin central para los cientficos es si

    resulta viable la prediccin de posibles interacciones protena-

    protena solamente basados en esas formas 3D, sin realizar experimentos

    identificativos de estas interacciones. Se han desarrollado una variedad de

    mtodos para enfrentarse al problema del acoplamiento protena-protena,

    aunque parece que queda todava mucho trabajo en este campo.

    7. Herramientas de software de la bioinformtica.

    Las herramientas de software para bioinformtica van desde simples

    herramientas de lnea de comandos hasta mucho ms complejos

    programas grficos y servicios webautnomos situados en compaas de

    bioinformtica o instituciones pblicas. La ms conocida herramienta de

    biologa computacional entre los los bilogos es, probablemente,BLAST, un

    algoritmo para determinar la similitud de secuencias arbitrarias con otras

    secuencias, probablemente residentes en bases de datos de protenas o de

    secuencias de ADN. El NCBI (National Center for Biotechnology Information,

    EE.UU.), por ejemplo, proporciona una implementacin muy utilizada, basada

    en web, y que trabaja sobre susbases de datos.

    Para alineamientos mltiples de secuencias, el

    clsico ClustalW, actualmente en su versin 2, es el software de referencia.

    Puede trabajarse con una implementacin del mismo en el EBI (Instituto

    Europeo de Bioinformtica).

    BLAST y ClustalW son slo dos ejemplos de los muchos programas

    de alineamiento de secuencias disponibles. Existe, por otra parte, multitud de

    software bioinformtico con otros objetivos: alineamiento estructural de

    protenas, prediccin de genes y otros motivos, prediccin de estructura de

    protenas, prediccin de acoplamiento protena-protena, o modelado de

    sistemas biolgicos, entre otros. En Anexo:Software para alineamiento de

    secuencias y Anexo:Software para alineamiento estructural pueden

    encontrarse sendas relaciones de programas o servicios web adecuados para

    cada uno de estos dos objetivos en particular.

  • BIOINFORMTICA

    Pgina 6

    8. Biologa evolutiva computancional.

    La Biologa evolutiva es el estudio del origen ancestral de las especies,

    as como de su cambio a travs del tiempo. La informtica ha apoyado a los

    bilogos evolutivos en diferentes campos clave. Ha permitido a los

    investigadores:

    Seguir la evolucin de un alto nmero de organismos midiendo cambios

    en su ADN, en lugar de hacerlo exclusivamente mediante su taxonoma fsica u

    observaciones fisiolgicas.

    Ms recientemente, comparar genomas completos, lo que permite el

    estudio de eventos evolutivos ms complejos, tales como la duplicacin de

    genes, la transferencia horizontal de genes, o la prediccin de factores

    significativos en la especiacin bacteriana.

    Construir modelos computacionales complejos de poblaciones para

    predecir el resultado del sistema a travs del tiempo.

    Seguir y compartir informacin sobre un amplio y creciente nmero de

    especies y organismos.

    Los esfuerzos futuros se centrarn en reconstruir el cada vez ms

    complejo rbol filogentico de la vida. El rea de investigacin de las ciencias

    de la computacin denominada computacin evolutiva se confunde

    ocasionalmente con la Biologa evolutiva computacional, pero ambas reas

    no guardan relacin. Dicho campo se centra en el desarrollo de algoritmos

    genticos y otras estrategias de resolucin de problemas con una marcada

    inspiracin evolutiva y gentica.

    9. Anlisis de secuencias.

    Desde que el fago -X174 fue secuenciado en 1977 (secuencia

    provisional: un ao ms tarde se publicara la secuencia completa

    definitiva),33 las secuencias de ADN de cientos de organismos han sido

    decodificadas y guardadas en bases de datos. Esos datos son analizados para

    determinar los genes que codifican para ciertas protenas, as como

    tambin secuencias reguladoras. Una comparacin de genes en

    una especie o entre especies puede mostrar similitudes entre funciones de

    protenas, o relaciones entre especies (uso de filogentica molecular para

    construir rboles filogenticos).96

  • BIOINFORMTICA

    Pgina 7

    Con la creciente cantidad de datos, desde hace mucho se ha vuelto

    poco prctico analizar secuencias de ADN manualmente. Hoy se usan

    programas de computadora para estudiar el genoma de miles de organismos,

    conteniendo miles de millones de nucletidos. Estos programas pueden

    compensar mutaciones (con bases intercambiadas, borradas o insertadas) en

    la secuencia de ADN, para identificar secuencias que estn relacionadas,

    pero que no son idnticas.39 Una variante de este alineamiento de

    secuencias se usa en el proceso de secuenciacin.

    La secuenciacin conocida como "shotgun" (o por perdigonada: fue

    usada, por ejemplo, por el Instituto de Investigacin Genmica -The Institute for

    Genomic Research, TIGR, hoy J. Craig Venter Institute- para secuenciar el

    primer genoma de bacteria, el Haemophilus influenzae)62 no da una lista

    secuencial de nucletidos, pero en cambio nos ofrece las secuencias de miles

    de pequeos fragmentos de ADN (cada uno de aproximadamente 600 a 800

    nucletidos de largo). Las terminaciones de estos fragmentos se superponen y,

    cuando son alineados de la manera correcta, constituyen el genoma

    completo del organismo en cuestin.97

    El secuenciamiento shotgun proporciona datos de secuencia

    rpidamente, pero la tarea de ensamblar los fragmentos puede ser bastante

    complicada para genomas muy grandes. En el caso del Proyecto Genoma

    Humano, llev varios meses de tiempo de procesador (en una estacin DEC

    Alpha de alrededor del 2000) para ensamblar los fragmentos. El shotgun

    sequencing es el mtodo de eleccin para todos los genomas secuenciados

    hoy en da y los algoritmos de ensamblado genmico son un rea crtica de la

    investigacin en bioinformtica.

    Otro aspecto de la bioinformtica en anlisis de secuencias es

    la bsqueda automtica de genes y secuencias reguladoras dentro de un

    genoma.98 No todos los nucletidos dentro de un genoma son genes. Dentro

    del genoma de organismos ms avanzados, grandes partes del ADN no sirven

    a ningn propsito obvio. Este ADN, conocido como "ADN basura", puede, sin

    embargo, contener elementos funcionales todava no reconocidos.99 La

    bioinformtica sirve para estrechar la brecha entre los proyectos de genoma y

    proteoma (por ejemplo, en el uso de secuencias de ADN para identificacin

    de protenas).