Post on 09-Nov-2015
BIOINFORMTICA
Pgina 1
1 .Qu es la bioinformtica?
2. A qu se dedica la bioinformtica?
3. Medicin de la biodiversidad.
4. Genmica comparativa.
5. Anlisis de imagen de alto rendimiento.
6. Acoplamiento protena-protena.
7. Herramientas de software de la bioinformtica.
8. Biologa evolutiva computancional.
9. Anlisis de secuencias.
BIOINFORMTICA
Pgina 2
1 .Qu es la bioinformtica?
La bioinformtica, segn una de sus definiciones ms sencillas, es la
aplicacin de tecnologa de computadores a la gestin y anlisis
de datos biolgicos. Los trminos bioinformtica, biologa computacional y, en
ocasiones, biocomputacin, utilizados en muchas situaciones como sinnimos,
hacen referencia a campos de estudios interdisciplinares muy vinculados que
requieren el uso o el desarrollo de diferentes tcnicas estudiadas
universitariamente en la Ingeniera Informtica como ciencia aplicada de la
disciplina informtica. Entre estas pueden destacarse las
siguientes: matemtica aplicada, estadstica, ciencias de la computacin,
inteligencia artificial, qumica y bioqumica con las que el Ingeniero
Informtico soluciona problemas al analizar datos, o simular sistemas o
mecanismos, todos ellos de ndole biolgica, y usualmente (pero no de forma
exclusiva) en el nivel molecular. El ncleo principal de estas tcnicas se
encuentra en la utilizacin de recursos computacionales para solucionar o
investigar problemas sobre escalas de tal magnitud que sobrepasan el
discernimiento humano. La investigacin en biologa computacional se solapa
a menudo con la biologa de sistemas.
2. A qu se dedica la bioinformtica?
Los principales esfuerzos de investigacin en estos campos incluyen
el alineamiento de secuencias, la prediccin de
genes, montaje del genoma, alineamiento estructural de protenas, prediccin
de estructura de protenas, prediccin de la expresin gnica, interacciones
protena-protena, y modelado de la evolucin.
Una constante en proyectos de bioinformtica y biologa
computacional es el uso de herramientas matemticas para
extraer informacin til de datos producidos por tcnicas biolgicas de alta
productividad, como la secuenciacin del genoma. En particular, el montaje o
ensamblado de secuencias genmicas de alta calidad desde fragmentos
obtenidos tras la secuenciacin del ADN a gran escala es un rea de alto
inters. Otros objetivos incluyen el estudio de la regulacin gentica para
interpretar perfiles de expresin gnica utilizando datos de chips de
ADN o espectrometra de masas.
BIOINFORMTICA
Pgina 3
3. Medicin de la biodiversidad.
La biodiversidad de un ecosistema puede definirse como el conjunto
genmico completo de todas las especies presentes en un medio ambiente
particular, sea este una biopelcula en una mina abandonada, una gota de
agua de mar, un puado de tierra, o la biosfera completa del planeta Tierra.
Se utilizan bases de datos para recoger los nombres de las especies, as como
de sus descripciones, distribuciones, informacin gentica, estado y tamaos
de las poblaciones, necesidades de su hbitat, y cmo cada organismo
interacta con otras especies. Se usa software especializado para encontrar,
visualizar y analizar la informacin; y, lo que es ms importante, para
compartirla con otros interesados. La simulacin computacional puede
modelar cosas tales como dinmica poblacional, o calcular la mejora del
acervo gentico de una variedad (enagricultura), o la poblacin amenazada
(en biologa de la conservacin). Un potencial muy excitante en este campo
es la posibilidad de preservar las secuencias completas del ADN, o genomas,
de especies amenazadas de extincin, permitiendo registrar los resultados de
la experimentacin gentica de la Naturaleza in silico para su posible
reutilizacin futura, an si tales especies fueran finalmente perdidas.
4. Genmica comparativa.
El ncleo del anlisis comparativo del genoma es el establecimiento de
la correspondencia entre genes (anlisis ortlogo) o entre otras caractersticas
genmicas de diferentes organismos. Estos mapas intergenmicos son los que
hacen posible rastrear los procesos evolutivos responsables de la divergencia
entre dos genomas. Una multitud de eventos evolutivos actuando a diferentes
niveles organizativos conforman la evolucin del genoma. Al nivel ms bajo,
las mutaciones puntuales afectan a nucletidos individuales. Al mayor nivel,
amplios segmentos cromosmicos experimentan duplicacin, transferencia
horizontal, inversin, transposicin, borrado e insercin. Finalmente, los
genomas enteros estn involucrados en procesos
de hibridacin, poliploida y endosimbiosis, conduciendo a menudo a una
sbita especiacin.
BIOINFORMTICA
Pgina 4
La complejidad de la evolucin del genoma plantea muchos desafos
excitantes a desarrolladores de modelos matemticos y algoritmos, quienes
deben recurrir a un espectro de tcnicas algortmicas, estadsticas y
matemticas que se extienden desde exactas, heursticas, con parmetros
fijados, y mediante algoritmos de aproximacin para problemas basados en
modelos de parsimonia, hasta algoritmos "Mrkov Chain Monte Carlo"
para anlisis Bayesiano de problemas basados en modelos probabilsticos.
Muchos de estos estudios estn basados en la deteccin
de homologa y la computacin de familias de protenas.
5. Anlisis de imagen de alto rendimiento.
Se estn usando tecnologas de computacin para acelerar o
automatizar completamente el procesamiento, cuantificacin y anlisis de
grandes cantidades de imgenes biomdicas con alto contenido
en informacin. Los modernos sistemas de anlisis de imagen incrementan la
habilidad del observador para realizar anlisis sobre un amplio o complejo
conjunto de imgenes, mejorando la precisin, la objetividad (independencia
de los resultados segn el observador), o la rapidez. Un sistema de anlisis
totalmente desarrollado podra reemplazar completamente al observador.
Aunque estos sistemas no son exclusivos del campo de las imgenes
biomdicas, cada vez son ms importantes tanto para el diagnstico como
para la investigacin. Algunos ejemplos:
Cuantificacin y localizacin subcelular con alta productividad y
precisin (high-content screening, citohistopatologa).
Morfometra.
Anlisis y visualizacin de imgenes clnicas.
Determinacin de patrones en el flujo del aire en tiempo real de la
respiracin pulmonar de animales vivos.
Cuantificacin del tamao de la oclusin a travs de imgenes en
tiempo real, tanto por desarrollo como por recuperacin, de lesiones arteriales.
Realizacin de observaciones conductuales basadas en prolongadas
grabaciones en vdeo de animales de laboratorio.
Observaciones en infrarrojo (espectroscopia infrarroja) para la
determinacin de la actividad metablica.
BIOINFORMTICA
Pgina 5
6. Acoplamiento protena-protena.
En las ltimas dos dcadas, decenas de miles de estructuras
tridimensionales de protenas han sido determinadas por cristalografa de rayos
X y espectroscopia mediante resonancia magntica nuclear de
protenas (RMN de protenas). Una cuestin central para los cientficos es si
resulta viable la prediccin de posibles interacciones protena-
protena solamente basados en esas formas 3D, sin realizar experimentos
identificativos de estas interacciones. Se han desarrollado una variedad de
mtodos para enfrentarse al problema del acoplamiento protena-protena,
aunque parece que queda todava mucho trabajo en este campo.
7. Herramientas de software de la bioinformtica.
Las herramientas de software para bioinformtica van desde simples
herramientas de lnea de comandos hasta mucho ms complejos
programas grficos y servicios webautnomos situados en compaas de
bioinformtica o instituciones pblicas. La ms conocida herramienta de
biologa computacional entre los los bilogos es, probablemente,BLAST, un
algoritmo para determinar la similitud de secuencias arbitrarias con otras
secuencias, probablemente residentes en bases de datos de protenas o de
secuencias de ADN. El NCBI (National Center for Biotechnology Information,
EE.UU.), por ejemplo, proporciona una implementacin muy utilizada, basada
en web, y que trabaja sobre susbases de datos.
Para alineamientos mltiples de secuencias, el
clsico ClustalW, actualmente en su versin 2, es el software de referencia.
Puede trabajarse con una implementacin del mismo en el EBI (Instituto
Europeo de Bioinformtica).
BLAST y ClustalW son slo dos ejemplos de los muchos programas
de alineamiento de secuencias disponibles. Existe, por otra parte, multitud de
software bioinformtico con otros objetivos: alineamiento estructural de
protenas, prediccin de genes y otros motivos, prediccin de estructura de
protenas, prediccin de acoplamiento protena-protena, o modelado de
sistemas biolgicos, entre otros. En Anexo:Software para alineamiento de
secuencias y Anexo:Software para alineamiento estructural pueden
encontrarse sendas relaciones de programas o servicios web adecuados para
cada uno de estos dos objetivos en particular.
BIOINFORMTICA
Pgina 6
8. Biologa evolutiva computancional.
La Biologa evolutiva es el estudio del origen ancestral de las especies,
as como de su cambio a travs del tiempo. La informtica ha apoyado a los
bilogos evolutivos en diferentes campos clave. Ha permitido a los
investigadores:
Seguir la evolucin de un alto nmero de organismos midiendo cambios
en su ADN, en lugar de hacerlo exclusivamente mediante su taxonoma fsica u
observaciones fisiolgicas.
Ms recientemente, comparar genomas completos, lo que permite el
estudio de eventos evolutivos ms complejos, tales como la duplicacin de
genes, la transferencia horizontal de genes, o la prediccin de factores
significativos en la especiacin bacteriana.
Construir modelos computacionales complejos de poblaciones para
predecir el resultado del sistema a travs del tiempo.
Seguir y compartir informacin sobre un amplio y creciente nmero de
especies y organismos.
Los esfuerzos futuros se centrarn en reconstruir el cada vez ms
complejo rbol filogentico de la vida. El rea de investigacin de las ciencias
de la computacin denominada computacin evolutiva se confunde
ocasionalmente con la Biologa evolutiva computacional, pero ambas reas
no guardan relacin. Dicho campo se centra en el desarrollo de algoritmos
genticos y otras estrategias de resolucin de problemas con una marcada
inspiracin evolutiva y gentica.
9. Anlisis de secuencias.
Desde que el fago -X174 fue secuenciado en 1977 (secuencia
provisional: un ao ms tarde se publicara la secuencia completa
definitiva),33 las secuencias de ADN de cientos de organismos han sido
decodificadas y guardadas en bases de datos. Esos datos son analizados para
determinar los genes que codifican para ciertas protenas, as como
tambin secuencias reguladoras. Una comparacin de genes en
una especie o entre especies puede mostrar similitudes entre funciones de
protenas, o relaciones entre especies (uso de filogentica molecular para
construir rboles filogenticos).96
BIOINFORMTICA
Pgina 7
Con la creciente cantidad de datos, desde hace mucho se ha vuelto
poco prctico analizar secuencias de ADN manualmente. Hoy se usan
programas de computadora para estudiar el genoma de miles de organismos,
conteniendo miles de millones de nucletidos. Estos programas pueden
compensar mutaciones (con bases intercambiadas, borradas o insertadas) en
la secuencia de ADN, para identificar secuencias que estn relacionadas,
pero que no son idnticas.39 Una variante de este alineamiento de
secuencias se usa en el proceso de secuenciacin.
La secuenciacin conocida como "shotgun" (o por perdigonada: fue
usada, por ejemplo, por el Instituto de Investigacin Genmica -The Institute for
Genomic Research, TIGR, hoy J. Craig Venter Institute- para secuenciar el
primer genoma de bacteria, el Haemophilus influenzae)62 no da una lista
secuencial de nucletidos, pero en cambio nos ofrece las secuencias de miles
de pequeos fragmentos de ADN (cada uno de aproximadamente 600 a 800
nucletidos de largo). Las terminaciones de estos fragmentos se superponen y,
cuando son alineados de la manera correcta, constituyen el genoma
completo del organismo en cuestin.97
El secuenciamiento shotgun proporciona datos de secuencia
rpidamente, pero la tarea de ensamblar los fragmentos puede ser bastante
complicada para genomas muy grandes. En el caso del Proyecto Genoma
Humano, llev varios meses de tiempo de procesador (en una estacin DEC
Alpha de alrededor del 2000) para ensamblar los fragmentos. El shotgun
sequencing es el mtodo de eleccin para todos los genomas secuenciados
hoy en da y los algoritmos de ensamblado genmico son un rea crtica de la
investigacin en bioinformtica.
Otro aspecto de la bioinformtica en anlisis de secuencias es
la bsqueda automtica de genes y secuencias reguladoras dentro de un
genoma.98 No todos los nucletidos dentro de un genoma son genes. Dentro
del genoma de organismos ms avanzados, grandes partes del ADN no sirven
a ningn propsito obvio. Este ADN, conocido como "ADN basura", puede, sin
embargo, contener elementos funcionales todava no reconocidos.99 La
bioinformtica sirve para estrechar la brecha entre los proyectos de genoma y
proteoma (por ejemplo, en el uso de secuencias de ADN para identificacin
de protenas).