Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM...

36
Alberto Jorge García Alberto Jorge García Laboratorio de Qu Laboratorio de Qu í í mica de Prote mica de Prote í í nas y Prote nas y Prote ó ó mica mica CBM-SO. CSIC-UAM CBM-SO. CSIC-UAM Curso de doctorado Curso de doctorado Estructura y Función de Macromoléculas” Estructura y Función de Macromoléculas” [email protected] [email protected] TÉCNICAS DE SECUENCIACIÓN DE PROTEÍNAS Motores de búsqueda con datos de fragmentación de péptidos. Interpretación de resultados.

Transcript of Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM...

Page 1: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”

Alberto Jorge GarcíaAlberto Jorge García

Laboratorio de QuLaboratorio de Quíímica de Protemica de Proteíínas y Protenas y Proteóómica mica CBM-SO. CSIC-UAMCBM-SO. CSIC-UAM

Curso de doctoradoCurso de doctorado““Estructura y Función de Macromoléculas”Estructura y Función de Macromoléculas”

[email protected]@cbm.uam.es

TÉCNICAS DE SECUENCIACIÓN DE PROTEÍNAS

Motores de búsqueda con datos de fragmentación de péptidos.

Interpretación de resultados.

Page 2: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”

Motores de búsqueda con datos de fragmentación de péptidos.

Interpretación de resultados.

Alberto Jorge GarcíaLaboratorio de ProteómicaCentro de Biología Molecular Severo OchoaCSIC-Universidad Autónoma de Madrid

Curso Práctico De Identificación de Proteínas con Datos de Espectrometría de masas:

Herramientas Bioinformáticas

Page 3: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”

Motores con los que vamos a trabajar:

• Sequest: Se necesita licencia; desarrollado por Yates y col., comercializado por Thermo en el paquete “Bioworks”.

• Mascot: Disponible en red; desarrollado por Pappin y col., se puede comprar la licencia.

Emplean distintos algoritmos de búsqueda

Page 4: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”

Abrir BioWorks Browser

Dobleclick

SEQUEST

Fichero de datos como ejemplo : trypmyo01.raw

Page 5: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”

File Open D:/…/Siena trypmyo01.raw

Modo de trabajo más común, TRIPLE PLAY: Full ms-Zom scan-ms/ms

“Cromatograma”Análisis LC-MS

Page 6: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”

Display Configuration Settings D:\Siena\Myo1

Previamente hemos creado la carpeta donde se van a guardar los resultados

Page 7: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”

Qué información tenemos acerca de nuestra muestra?

Complejidad de la mustra

Organismo

Método de digestión

Preparación de la muestra

•Digerido de una única proteína

•Caballo

•tripsina

•No alquilación

Caso más simple: PROTEÍNA ÚNICA

Page 8: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”

Scan nº 449

Seleccionamos un espectro ms/ms con una “buena calidad”

Actions TurboSEQUEST Search

Page 9: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”

Selección de parámetros de búsqueda SEQUEST: básicos

Configuration settings

Generamos ficheros.dta a partir del/ los

ficheros .raw

Parámetros de búsqueda

Siena/myo1

449

Page 10: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”

Resultados SEQUEST

Doubleclick

Page 11: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”

Cobertura de Secuencia

Nuestro péptido

Page 12: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”

Calidad de la identificación

Dobleclick

Page 13: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”

El programa asigna los iones de las series principales en el espectro

El fragmento más intenso no se asigna!?

Page 14: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”

Conclusión: Muy buena asignación

Hay que tener en cuenta la presencia de iones doblemente cargados

Page 15: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”

• Identificación de proteínas en la muestra ‘trypmyo01’

• Búsqueda SEQUEST :- Rápida- Máxima cobertura de proteínas

Aumentamos la complejidad: IDENTIFICACIÓN DE PROTEíNAS EN NUESTRA

MUESTRA

Page 16: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”

Selección de parámetros de búsqueda SEQUEST: básicos

Seleccionamosun rango ampliodel análisis que incluye un alto nºde scans ms/ms

Tenemos la posibilidadde trabajar con DB inde

xadas.

Page 17: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”

Que supone indexar una base de datos?

Seleccionamos la base de datos (disponibles en red y en Bioworks) Conviene ir actualizando las DB Seleccionamos la proteasa (comúnmente tripsina) Seleccionamos las modificaciones: fijas y/o variables. Depende del tratamiento de la muestra Herramienta disponible en Bioworks: Tools

Trabajar con bases de datos cuyas proteínas están digeridas “insilico”

Aumenta notablemente la rapidez de la búsqueda

Page 18: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”

Selección de parámetros de búsqueda SEQUEST: advanced

dta generationPrecursor mass 1.4Group scan 1Min group count 1Min ion count 35

Tolerance for dta searchPeptide 1.5Fragment 0.35

Ion seriesa,b,y

OutputReport duplicate ref.

Page 19: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”
Page 20: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”
Page 21: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”

Resultados de la búsqueda SEQUEST

Dtas generados

Proteína conmayor puntuación

Mayor nºde péptidosasignados

Page 22: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”

Sort Resultados SEQUEST Display Options Sort

Ordenamos lospéptidos por puntuación

Page 23: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”

Filter Resultados SEQUESTDisplay Options Filter

Seleccionamos sololos péptidos con XC>2

de la proteína con mayorpuntuación

Page 24: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”

Revisión de la proteina con mayor puntuaciónCobertura de secuencia

Doubleclick

Page 25: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”

Cobertura de secuencia 89%

Page 26: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”

Cómo comprobar si un “match” es bueno o malo?Scan 341-356: no es el péptido de la proteína con mayor puntuación pero es el nº1 de los 10 mejores de su lista de SEQUEST

Dobleclick

Page 27: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”

Listado de los 10 mejores “hits” SEQUEST para #341

Note: XC values‘Ions’

Page 28: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”

1st mejor “match” por SEQUEST LFTGHPETLEK

Veredicto: asignación correctaTodos los iones mayoritarios se

asignan correctamente a las series principales b- e y”-ion

Page 29: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”

2nd mejor “match” por SEQUEST LIKEAAGKSNLK

Quedan muchos ionesmayoritarios sin asignar a

las series principales

Page 30: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”

ConclusionesEspectro

La intensidad del espectro es el primer “filtro”

La mayoría de los espectros de péptidos tienen una distribución

‘bell-shaped’

Ambas series (b- and y-ion) están presentes en el espectro

Buen “match”

Series b- e y-ion contigüas

Todos los picos intensos se corresponden con la secuencia identificada

XC “the bigger the better”

DeltaCN muestra la capacidad de Sequest de discernir entre secuencias

Sp es una puntuación preliminar, “the bigger the better”

RSp value debe ser 1

péptidos +3 en general no son tan ‘bonitos’ como +2

péptidos +1 generalmente son de secuencia corta–el valor diagnóstico es

menor

Page 31: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”

MASCOT

Trabajamos en red

Page 32: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”

Formulario a completar: Parámetros de búsqueda

Importante si la red no va bien,Podemos recibir los resultados por

correo

NCBInr: mayor nº de entradasMayor significatividad estadística

Mucho cuidado con las modificaciones:anotar solamente las que conozcamos

su presencia con seguridad

Acepta datos en distintos formatos,ya tenemos creados los ficheros .dta

No es necesario rellenar el resto de lascasillas

Importante para obtener buena tabla de resultados

Page 33: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”

Resultados de la búsqueda MASCOT

Mejor puntuación

Proteínas con puntuación fuerade la zona de incertidumbre

Page 34: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”

“Peptide Summary Report” MASCOT

Mejor puntuación a mayornº de péptidos asignados

para la misma proteína

Todas las proteínas conbuena puntuación son

proteínas muy relacionadas

Dobleclick

Page 35: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”

“Peptide View” MASCOT

Page 36: Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM Curso de doctorado “Estructura y Función de Macromoléculas”