Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote...

17
Tarea 2: Prote´ ınas transmembranales Dpto. Ciencias de la Computaci´ on e Inteligencia Artificial Universidad de Sevilla

Transcript of Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote...

Page 1: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad

Tarea 2: Proteınas transmembranales

Dpto. Ciencias de la Computacion e Inteligencia ArtificialUniversidad de Sevilla

Page 2: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad

Base de datos UniProt

Incluimos el codigo asignado

Page 3: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad

Secuenciacion de la proteına

En la pagina con la informacion sobre la proteına asignada

• Localizamos la seccion ’Sequences’

Page 4: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad

Secuenciacion de la proteına

Descargamos la secuenciacion de la proteına en formato FASTA

Page 5: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad

Topologıa de la proteına

Volvemos a la pagina con la informacion sobre la proteına asignada

• Localizamos la seccion ’Topology’ (a traves de ’Feature table’)

Page 6: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad

Anotacion de la proteına

Descargamos la descripcion de la topologıa de la proteına enformato GFF

Page 7: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad

Se trata de una ’Hoja de calculo’

Si utilizamos ’LibreOffice Calc’ para procesar el fichero

Page 8: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad

Separadores de los datos

Elegimos como separadores de los datos: ’Tabulador’, ’Punto ycoma’ e ’=’.

Page 9: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad

Edicion previa del fichero GFF

Si elegimos otra herramienta que no nos permita seleccionar losseparadores de los datos, tipo ’Excel’

• Sera necesario editar el fichero reemplazando cada ’;’ y cada’=’ por un tabulador (copia primero algun tabulador).

Page 10: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad

Edicion previa del fichero GFF (II)

No olvides incluir el tabulador en ’Reemplazar por:’

Page 11: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad

Procesado del fichero GFF

Con la ’Hoja de calculo’, eliminamos solo las filas innecesarias...

Page 12: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad

Procesado del fichero GFF (II)

y eliminamos solo las columnas innecesarias.

Page 13: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad

Fichero CSV

Guardamos los datos (posicion de inicio y finalizacion de cada tipode region, y el tipo de region) en formato CSV

Page 14: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad

RStudio

En R, obtenemos la tabla a partir del fichero CSV

Page 15: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad

Regiones en la proteına

Generamos el etiquetado de la secuenciacion de la proteına con losdistintos tipos de region asociados a cada aminoacido.

Page 16: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad

Proteınas similares

Volvemos a la pagina con la informacion sobre la proteına asignada

• Localizamos la seccion ’Similar proteins’ (y expandimos latabla de resultados)

Page 17: Universidad de Sevilla - Dpto. Ciencias de la Computaci on e … · 2020-04-23 · Tarea 2: Prote nas transmembranales Dpto. Ciencias de la Computaci on e Inteligencia Arti cial Universidad

Revisadas

Descargamos tambien la informacion de aquellas que estenrevisadas.