Desarrollo de una interfaz Web de consulta y análisis de datos en Bioinformatica basada en Web...
-
Upload
javier-condori-flores -
Category
Technology
-
view
686 -
download
0
description
Transcript of Desarrollo de una interfaz Web de consulta y análisis de datos en Bioinformatica basada en Web...
![Page 1: Desarrollo de una interfaz Web de consulta y análisis de datos en Bioinformatica basada en Web Services del EMBL - EBI](https://reader036.fdocuments.ec/reader036/viewer/2022082420/55841874d8b42aa15a8b46f7/html5/thumbnails/1.jpg)
Desarrollo de una interfaz Web de consultay análisis de datos en Bioinformaticay análisis de datos en Bioinformatica
basada en Web Services del EMBL - EBI
Por:
JAVIER CONDORI FLORES
Dirigido por:Dirigido por:
Ph.D. JULIO ORTEGA LOPERA
Septiembre, 2011
![Page 2: Desarrollo de una interfaz Web de consulta y análisis de datos en Bioinformatica basada en Web Services del EMBL - EBI](https://reader036.fdocuments.ec/reader036/viewer/2022082420/55841874d8b42aa15a8b46f7/html5/thumbnails/2.jpg)
Indice
1. Introducción2. Objetivos3. Conceptos teóricos4. Desarrollo del proyecto5. Pruebas y resultados6. Conclusiones
![Page 3: Desarrollo de una interfaz Web de consulta y análisis de datos en Bioinformatica basada en Web Services del EMBL - EBI](https://reader036.fdocuments.ec/reader036/viewer/2022082420/55841874d8b42aa15a8b46f7/html5/thumbnails/3.jpg)
1. Introduccion
El presente trabajo se trata de realizar una aplicación informáticacon herramientas para la consulta y el tratamiento de informacióngenómica.genómica.
Con el fin poder simplificar de forma sistemática la consulta y elanálisis de datos por parte del investigador.
Estará soportado por el Instituto Europeo de Bioinformatica, el cualproporciona acceso a más de 200 bases de datos y alrededor de150 aplicaciones para Bioinformatica.
![Page 4: Desarrollo de una interfaz Web de consulta y análisis de datos en Bioinformatica basada en Web Services del EMBL - EBI](https://reader036.fdocuments.ec/reader036/viewer/2022082420/55841874d8b42aa15a8b46f7/html5/thumbnails/4.jpg)
1. Introduccion
El acceso a datos, herramientas y métodos, será mediante latecnología de los Web Services.
Para la integración de varias fuentes de trabajo, esta tecnología sebasa en:basa en:
1. Estándares abiertos como el Simple Object Access Protocol(SOAP).
2. Un protocolo de mensajería para el transporte de información(WSDL).
3. Un método estándar para describir Servicios Web y suscapacidades, y Universal Description Discovery and Integration(UDDI).
4. Una plataforma independiente basado en XML para el registrode los servicios.
5. En el proyecto se trabaja con el enlace WSDL que describecomo el servicio está vinculado con el protocolo de mensajería,en particular la mensajería del protocolo SOAP.
![Page 5: Desarrollo de una interfaz Web de consulta y análisis de datos en Bioinformatica basada en Web Services del EMBL - EBI](https://reader036.fdocuments.ec/reader036/viewer/2022082420/55841874d8b42aa15a8b46f7/html5/thumbnails/5.jpg)
El objetivo principal del proyecto es desarrollar una interfaz webque nos permita acceder y analizar los datos de informacióngenómica.
2. Objetivos
Objetivos específicos:
a) Estudio y representación bibliográfica de temas específicosque intervienen en el proyecto.
b) Diseño e implementación de una interfaz web conherramientas que nos permita acceder, analizar los datos deinformación biológica.
c) Realizar las pruebas correspondientes, a través de lasc) Realizar las pruebas correspondientes, a través de lasherramientas proporcionadas en la interfaz.
![Page 6: Desarrollo de una interfaz Web de consulta y análisis de datos en Bioinformatica basada en Web Services del EMBL - EBI](https://reader036.fdocuments.ec/reader036/viewer/2022082420/55841874d8b42aa15a8b46f7/html5/thumbnails/6.jpg)
Bioinformatica , es una disciplina donde intervienen, la biología, lainformática y las tecnologías de información, para el tratamiento yel análisis de la información biológica.
3. Conceptos Teoricos
el análisis de la información biológica.etapas de las aplicaciones bioinformáticas
1. Se obtienen secuencias similares a la secuencia inicial. Ejemplo: FASTA o BLAST.2. Se obtienen propiedades de similitud de la secuencia inicial. Ejemplo: SRS.3. Se buscan motivos funcionales o estructurales en la secuencia inicial4. Se obtienen secuencias similares a la 4. Se obtienen secuencias similares a la inicial
5. Se alinean las secuencias. Ejemplo: CLUSTAL.6. Se obtiene el árbol filogenético Ejemplo: PHYLIP.7. Se obtiene un motivo característico al hacer el alineamiento.8. Se usa el motivo para buscar nuevas secuencias. Ejemplo: HMME
![Page 7: Desarrollo de una interfaz Web de consulta y análisis de datos en Bioinformatica basada en Web Services del EMBL - EBI](https://reader036.fdocuments.ec/reader036/viewer/2022082420/55841874d8b42aa15a8b46f7/html5/thumbnails/7.jpg)
Cloud Computing, consiste en que los recursos de computación sonproporcionados como servicio (“as a service”), permitiendo a los usuariosacceder a servicios tecnológicos desde internet (“en la nube”) bajo
3. Conceptos Teoricos
acceder a servicios tecnológicos desde internet (“en la nube”) bajodemanda.
Clasificación
•Software como servicio (SaaS) -> Aplicaciones Cloud•Plataforma como servicio (PaaS) -> Plataforma de de sarrollo Cloud•Infraestructura como servicio (IaaS) -> Infraestructura Cloud
![Page 8: Desarrollo de una interfaz Web de consulta y análisis de datos en Bioinformatica basada en Web Services del EMBL - EBI](https://reader036.fdocuments.ec/reader036/viewer/2022082420/55841874d8b42aa15a8b46f7/html5/thumbnails/8.jpg)
Web Services , es un sistema que permite a dos aplicaciones remotasconectarse y enviarse datos a través de una red.
3. Conceptos Teoricos
![Page 9: Desarrollo de una interfaz Web de consulta y análisis de datos en Bioinformatica basada en Web Services del EMBL - EBI](https://reader036.fdocuments.ec/reader036/viewer/2022082420/55841874d8b42aa15a8b46f7/html5/thumbnails/9.jpg)
4. Desarrollo del ProyectoInstituto Europeo de Bioinformatica EBI•Se utilizo las herramientas soportados por EBI.
•Su acceso es mediante la tecnología de los Web Services a través del protocolo SOAP.través del protocolo SOAP.
•Para el acceso a los métodos de los clientes nos centramos en el lenguaje de descripción WSDL.
•WSDL esta escrito en formato XML , estos contienen mensajes que contienen información orientada a documentos o a procedimientos.procedimientos.
•El WSDL esta vinculado con el protocolo de mensajería del protocolo SOAP.
•Estos datos y las herramientas de análisis acceden utilizando las interfaces basadas en el navegador.
![Page 10: Desarrollo de una interfaz Web de consulta y análisis de datos en Bioinformatica basada en Web Services del EMBL - EBI](https://reader036.fdocuments.ec/reader036/viewer/2022082420/55841874d8b42aa15a8b46f7/html5/thumbnails/10.jpg)
4. Desarrollo del Proyecto
Instituto Europeo de Bioinformatica EBI
•El cliente lee el WSDL para determinar que funciones están disponibles en el servidor.disponibles en el servidor.
•Existen herramientas SOAP que proporcionan métodos para la generación automática de clientes a través del código de descripción WSDL.
Ejemplo
•WSDL2PHP -> construcción de cliente PHP•WSDL2JAVA -> construcción de cliente JAVA•…………….
![Page 11: Desarrollo de una interfaz Web de consulta y análisis de datos en Bioinformatica basada en Web Services del EMBL - EBI](https://reader036.fdocuments.ec/reader036/viewer/2022082420/55841874d8b42aa15a8b46f7/html5/thumbnails/11.jpg)
4.1. Descripcion de los Servicios
En la actualidad, EBI soporta los servicios SOAP, tanto para la base de datos de recuperación de información y análisis de la secuencia.
Recuperación de Datos:Recuperación de Datos:
•WSDbFetch, realiza búsquedas de secuencia en mas de 20 bases de datos biológicas, con resultados en varios formatos.
Herramientas de búsquedas de similitudes:
InterProScan, herramienta con algoritmos de búsqueda y métodos de reconocimiento, integra las siguientes bases de datos de de reconocimiento, integra las siguientes bases de datos de proteínas: PROSITE, PRINTS, ProDom, Pfam, SMART, TIGRFAMs, PIRSF, SUPERFAMILY, Gene3D y PANTHER .
NCBI BLAST, herramienta de búsqueda de alineación local, encuentra secuencias por similitud.
![Page 12: Desarrollo de una interfaz Web de consulta y análisis de datos en Bioinformatica basada en Web Services del EMBL - EBI](https://reader036.fdocuments.ec/reader036/viewer/2022082420/55841874d8b42aa15a8b46f7/html5/thumbnails/12.jpg)
4.2. Desarrollo de la aplicacion
WSDbFetchRealiza búsqueda de secuencias. Clientes: ofrece soporte para varios lenguajes de programación, en el proyecto se ofrece soporte para varios lenguajes de programación, en el proyecto se utilizara el lenguaje de scripting PHP, y para acceder al Web Service, será mediante el protocolo SOAP y el lenguaje de descripción WSDL proporcionado por el EBI.
Flujo de trabajo:
![Page 13: Desarrollo de una interfaz Web de consulta y análisis de datos en Bioinformatica basada en Web Services del EMBL - EBI](https://reader036.fdocuments.ec/reader036/viewer/2022082420/55841874d8b42aa15a8b46f7/html5/thumbnails/13.jpg)
4.2. Desarrollo de la aplicacion
WSDbFetch
WSDL PARA EL MÉTODO FETCHBATCH
<wsdl:operation name="fetchBatch" parameterOrder="db ids format style">
<wsdl:documentation>
<wsdl:operation name="fetchBatch" parameterOrder="db ids format style">
<wsdl:documentation>
Get a set of database entries (see http://www.ebi.ac.uk/Tools/webservices/services/dbfetch#fetchbatch_db_ids_format_style).
</wsdl:documentation>
<wsdl:input message="impl:fetchBatchRequest" name="fetchBatchRequest"/>
<wsdl:output message="impl:fetchBatchResponse" name="fetchBatchResponse"/>
<wsdl:fault message="impl:InputException" name="InputException"/>
<wsdl:fault message="impl:DbfParamsException" name="DbfParamsException"/>
<wsdl:fault message="impl:DbfException" name="DbfException"/>
<wsdl:fault message="impl:DbfNoEntryFoundException" name="DbfNoEntryFoundException"/>
<wsdl:fault message="impl:DbfConnException" name="DbfConnException"/>
</wsdl:operation>
<wsdl:fault message="impl:DbfConnException" name="DbfConnException"/>
</wsdl:operation>
![Page 14: Desarrollo de una interfaz Web de consulta y análisis de datos en Bioinformatica basada en Web Services del EMBL - EBI](https://reader036.fdocuments.ec/reader036/viewer/2022082420/55841874d8b42aa15a8b46f7/html5/thumbnails/14.jpg)
4.2. Desarrollo de la aplicacion
WSDbFetch
IMPLEMENTACIÓN DEL CLIENTE FETCHBATCH
# URL for the service WSDL
$wsdlUrl = 'http://www.ebi.ac.uk/ws/services/WSDbfetch?wsdl';
# URL for the service WSDL
$wsdlUrl = 'http://www.ebi.ac.uk/ws/services/WSDbfetch?wsdl';
try {
// Get a service proxy from the WSDL
$proxy = new SoapClient($wsdlUrl);
// Call a method on the service via the proxy
$result = $proxy->fetchBatch ('UNIPROT', 'ADH1A_HUMAN', 'fasta', 'raw');
echo $result;
}
catch(SoapFault $ex) {
echo 'Error: ';
if($ex->getMessage() != '') echo $ex->getMessage();
else echo $ex;
echo 'Error: ';
if($ex->getMessage() != '') echo $ex->getMessage();
else echo $ex;
echo "\n";
![Page 15: Desarrollo de una interfaz Web de consulta y análisis de datos en Bioinformatica basada en Web Services del EMBL - EBI](https://reader036.fdocuments.ec/reader036/viewer/2022082420/55841874d8b42aa15a8b46f7/html5/thumbnails/15.jpg)
INTERPROSCANPredicción de familias de la proteína.Flujo de trabajo:
4.2. Desarrollo de la aplicacion
![Page 16: Desarrollo de una interfaz Web de consulta y análisis de datos en Bioinformatica basada en Web Services del EMBL - EBI](https://reader036.fdocuments.ec/reader036/viewer/2022082420/55841874d8b42aa15a8b46f7/html5/thumbnails/16.jpg)
NCBI BLASTAlineamiento local por similitud de secuencias.Flujo de trabajo:
4.2. Desarrollo de la aplicacion
![Page 17: Desarrollo de una interfaz Web de consulta y análisis de datos en Bioinformatica basada en Web Services del EMBL - EBI](https://reader036.fdocuments.ec/reader036/viewer/2022082420/55841874d8b42aa15a8b46f7/html5/thumbnails/17.jpg)
5. Pruebas y Resultados
Demostración del Sistema
![Page 18: Desarrollo de una interfaz Web de consulta y análisis de datos en Bioinformatica basada en Web Services del EMBL - EBI](https://reader036.fdocuments.ec/reader036/viewer/2022082420/55841874d8b42aa15a8b46f7/html5/thumbnails/18.jpg)
5. Conclusiones
En el presente proyecto se desarrollo una interfaz web que nos da la posibilidad de interactuar con grandes volúmenes de datos de información genómica.información genómica.
La aplicación nos permite utilizar todos los algoritmos que existen en el servidor de una forma distribuida.
Se accede a través de una aplicación cliente web, simplemente con conocer el funcionamiento del archivo WSDL.
La interfaz desarrollada consta de herramientas que ofrecen La interfaz desarrollada consta de herramientas que ofrecen información relevante para objetos de estudios del investigador
![Page 19: Desarrollo de una interfaz Web de consulta y análisis de datos en Bioinformatica basada en Web Services del EMBL - EBI](https://reader036.fdocuments.ec/reader036/viewer/2022082420/55841874d8b42aa15a8b46f7/html5/thumbnails/19.jpg)
5.1. Trabajo futuro
Implementación de tecnologías, herramientas y métodos para mejorar las prestaciones en el análisis y tratamiento de los datos en bioinformatica, para tal objetivo se propone realizar una en bioinformatica, para tal objetivo se propone realizar una plataforma que incluya las siguientes características.
•Implementación de un Cluster HPC.•Implementación de algoritmos de cálculo paralelo con MPI BLAST y CLUSTALW MPI.•Implementar gSOAP para que el acceso a los algoritmos, bases de datos y resultados sea mediante Web Services.de datos y resultados sea mediante Web Services.
![Page 20: Desarrollo de una interfaz Web de consulta y análisis de datos en Bioinformatica basada en Web Services del EMBL - EBI](https://reader036.fdocuments.ec/reader036/viewer/2022082420/55841874d8b42aa15a8b46f7/html5/thumbnails/20.jpg)
"La próxima frontera de la humanidadno es el espacio, sino nosotros mismos"
Gregory Stock - Biofísico
Muchas Gracias ….
Gregory Stock - Biofísico