ntoduccin al análisis estuctual de protenas...

271
Facultad de Ciencias Sede Bogotá Introducción al análisis estructural de proteínas y glicoproteínas Nohora Angélica Vega Castro Edgar Antonio Reyes Montaño

Transcript of ntoduccin al análisis estuctual de protenas...

Page 1: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Facultad de Ciencias Sede Bogotá

Introducción al análisis

estructural de proteínas y

glicoproteínasNohora Angélica Vega Castro

Edgar Antonio Reyes Montaño

Page 2: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural
Page 3: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Introducción al análisis estructural

de proteínas y glicoproteínas

Page 4: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural
Page 5: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Bogotá, D. C., Colombia, mayo de 2020

Introducción al análisis estructural

de proteínas y glicoproteínas

Nohora Angélica Vega CastroEdgar Antonio Reyes Montaño

Page 6: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

© Universidad Nacional de Colombia Facultad de Ciencias© Nohora Angélica Vega Castro Edgar Antonio Reyes Montaño

Primera edición, 2020

EdiciónCoordinación de publicaciones - Facultad de Ciencias [email protected]

Corrección de estiloNombre Apellido

Diseño de la colecciónLeonardo Fernández Suárez

Maqueta LaTexCamilo Cubides

Prohibida la reproducción total o parcial por cualquier medio sin la autorización escrita del titular de los derechos patrimoniales

Impreso y hecho en Bogotá, D. C., Colombia

Page 7: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Contenido

Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

Capítulo uno Estructura primaria de proteínas 21Requisitos para establecer la secuencia de una proteína . . . . . . . . . . . . . 24Procesos de fragmentación de proteínas . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

Métodos enzimáticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49Mapeo peptídico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

Métodos químicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55Fragmentación de la proteína . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

Secuenciación de los péptidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65Superposición de fragmentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

Fuentes de error en la determinación de la estructura primaria . . . . . . . 73Limitaciones de la determinación de la estructura primaria a partir de la secuencia de adn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

Capítulo dosCaracterización de proteínas por espectrometría de masas (ms) 81Ionización en modo electrospray (esi) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85Ionización/desorción láser asistida por matriz (Maldi) . . . . . . . . . . . . . . . 92Analizador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93Otros analizadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

Analizador de trampa iónica (it) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95Ciclotrón de resonancia de iones con transformada de Fourier (ft-icr) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96Orbitrap . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

Determinación de la secuencia de proteínas por espectrometría de masas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

Fragmentación de la molécula . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99Determinación de la secuencia N-terminal . . . . . . . . . . . . . . . . . . . . . . . . . 106Cuantificación de proteínas en estudios de proteómica . . . . . . . . . . . . . . 108

Page 8: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

8

Utilidad de la espectrometría de masas como herramienta en el análisis de problemas relacionados con proteínas . . . . . . . . . . . . . 112

Identificación de nuevas variantes proteínas . . . . . . . . . . . . . . . . . . . . 112Evaluación del plegamiento de las proteínas . . . . . . . . . . . . . . . . . . . . . 113

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118

Capítulo tres Consecuencias de la determinación de la estructura primaria de proteínas 121Proteínas que tienen la misma función y están en diferentes especies . 123Proteínas que surgieron por la duplicación de un gen . . . . . . . . . . . . . . . . 125Proteínas con diferente función y localización relacionadas evolutivamente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129

Capítulo cuatro Estructura secundaria 131Aspectos relevantes para la formación de estructuras secundarias . . . . 133

El enlace peptídico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133Ángulos de torsión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135

Estructuras secundarias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136Hélice α . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137Estructura β . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141

Propensiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143Giros β . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144

Estructuras supersecundarias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144Conformación de α-hélice, estructuras β y cadenas laterales . . . . . . . 145

Estabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147Determinación experimental de la estructura secundaria . . . . . . . . . . . . 155

Dispersión óptica rotatoria (dor) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158Dicroísmo circular (dc) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161Comportamiento de macromoléculas . . . . . . . . . . . . . . . . . . . . . . . . . . . 163Aplicaciones del dicroísmo circular (dc) . . . . . . . . . . . . . . . . . . . . . . . . . 167

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168

Capítulo cinco Estructura terciaria 171Determinación experimental de la estructura terciaria . . . . . . . . . . . . . . . 175

Determinación de la estructura de proteínas por difracción de rayos X . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175

Page 9: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

9

Resonancia magnética nuclear . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186Microscopía crioelectrónica o criomicroscopía electrónica (Cryo-em) 192

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198

Capítulo seisGlicoproteínas y carbohidratos 201Diversidad estructural de los oligosacáridos . . . . . . . . . . . . . . . . . . . . . . . . 204Biosíntesis de oligosacáridos en las glicoproteínas . . . . . . . . . . . . . . . . . . 205Análisis estructural y funcional de glicanos . . . . . . . . . . . . . . . . . . . . . . . . . 212Análisis de la glicosilación en glicoproteínas . . . . . . . . . . . . . . . . . . . . . . . 213

1. ¿La proteína es glicosilada? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2142. Caracterización de la glicosilación en la proteína intacta . . . . . . . . . 2143. Caracterización de los oligosacáridos . . . . . . . . . . . . . . . . . . . . . . . . . 218

Análisis de la estructura del oligosacárido . . . . . . . . . . . . . . . . . . . . . . . . . 221Métodos químicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221Métodos enzimáticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222Métodos enzimáticos para elucidar estructura primaria de oligosacáridos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228

Estudios de glicosilación, funciones biológicas y posibles aplicaciones 232Patologías asociadas a glicoproteínas . . . . . . . . . . . . . . . . . . . . . . . . . . . 234

Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238

Capítulo sieteBioinformática estructural: aplicaciones del modelamiento estructural de proteínas 245Predicción de estructura secundaria y terciaria de proteínas . . . . . . . . . 248

Métodos para predecir estructura secundaria de proteínas . . . . . . . . 249Predicción de estructura terciaria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254

Metodología sugerida para generar modelos estructurales . . . . . . . . 256Aplicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263

Page 10: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

10

Lista de tablas

Capítulo uno Tabla 1. Análisis de aminóacidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .40Tabla 2. Características de las carboxipeptidasas para determinación

del C-terminal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .46Tabla 3. Datos de determinación de la secuencia con carboxipeptidasas

y espectrometría de masas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .47Tabla 4. Endoenzimas para proteólisis de proteínas . . . . . . . . . . . . . . . . . . . . . . . . .50Tabla 5. Endoenzimas recombinantes para proteólisis de proteínas . . . . . . . . . . . .52Tabla 6. Electroforesis diagonal para determinación de diferentes

aminoácidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .71

Capítulo dosTabla 1. Mecanismos de ionización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .83Tabla 2. Comparación de las masas moleculares determinadas para citocromos

C por espectrometría de masas, ionización electrospray (ms-esi) . . . . . . . . . . .89Tabla 3. Comparación de las dos técnicas de ionización para proteínas . . . . . . . . .95Tabla 4. Comparación de los métodos de fragmentación para péptidos . . . . . . . .106

Capítulo cuatro Tabla 1. Longitud de los puentes de hidrógeno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .146Tabla 2. Valores de b0 y a0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .161Tabla 3. Características de las conformaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .167

Capítulo cincoTabla 1. Desplazamiento químico en estructura al azar de los 20 aminoácidos

proteicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .188Tabla 2. Características principales de los métodos de preparación comunes

de las grillas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .195

Capítulo seisTabla 1. Bases de datos para glicómica y glicoproteómica . . . . . . . . . . . . . . . . . . . . .204Tabla 2. Métodos colorimétricos para cuantificación de carbohidratos . . . . . . . . .220Tabla 3. Métodos analíticos para elucidar estructura de oligosacáridos . . . . . . . . .230

Capítulo sieteTabla 1. Parámetros de Chou-Fasman para establecer propensiones de cada

uno de los aminoácidos a formar estructuras alfa (Pa), beta (Pb) o al azar (Pt). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .251

Tabla 2. Lista de programas disponibles para predicción de estructura terciaria de proteínas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .261

Page 11: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

11

Lista de figuras

Capítulo uno Figura 1. Métodos para establecer la presencia de subunidades de

una proteína. A: cualitativos B: preparativos . . . . . . . . . . . . . . . . . . . . . . . . . . . .27Figura 2. Reducción de los puentes disulfuro (cistina) y alquilación

en proteínas. A: reducción. B: alquilación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .27Figura 3. Estudio de puentes disulfuro en proteínas. A: reacción de sulfitólisis.

B: alquilación con β-haloamina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .28Figura 4. Detección de la glicosilación en glicoproteínas . . . . . . . . . . . . . . . . . . . . .29Figura 5. Determinación del porcentaje de glicosilación en glicoproteínas

por sds-Page . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .30Figura 6. Detección de glicoformas por ms-esi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .31Figura 7. Deglicosilación enzimática de glicoproteínas . . . . . . . . . . . . . . . . . . . . . . . .32Figura 8. Oxidación perfórmica de cisteína y metionina . . . . . . . . . . . . . . . . . . . . . . .33Figura 9. Curvas hipotéticas de la cinética de hidrólisis de los aminoácidos

para una proteína en condiciones ácidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .34Figura 10. Determinación de cisteína libre con el reactivo de Ellman . . . . . . . . . . .35Figura 11. Determinación de triptófano por formación del complejo

de Ruhemann . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .35Figura 12. Diagrama de purificación de aminoácidos . . . . . . . . . . . . . . . . . . . . . . . . .36Figura 13. Reacciones de derivatización de los aminoácidos. A: reacción

con O-Ftalaldehído. B: reacción con fluroescamina. C: reacción con ninhidrina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .36

Figura 14. Perfil de elución de los aminoácidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .37Figura 15. Resultados del análisis de aminoácidos para la lectina de Salvia

bogotensis (lsbo) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .38Figura 16. Reporte del análisis de aminoácidos para la lectina de Salvia

bogotensis (LSBo) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .39Figura 17. Determinación del aminoácido N-terminal . . . . . . . . . . . . . . . . . . . . . . . . .41Figura 18. Determinación de la secuencia N-terminal por la degradación

de Edman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .42Figura 19. Determinación de la secuencia N-terminal con dabitc . . . . . . . . . . . . . . .44Figura 20. Reacción de hidrazinólisis para la determinación del C-terminal . . . . . .48Figura 21. Sitios de clivaje de una proteína . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .49Figura 22. Ilustración esquemática de la fragmentación de un péptido con

tripsina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .51Figura 23. Reacción de los grupos ε de la lisina con anhídridos carboxílicos . . . . .52Figura 24. Mapa peptídico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .54Figura 25. β-eliminación: modificación a nivel de Ser, Thr y Cys . . . . . . . . . . . . . . . .55Figura 26. β-eliminación: modificación a nivel de cisteína . . . . . . . . . . . . . . . . . . . . .56Figura 27. Modificación a nivel de cisteína con cianuro de potasio (KCN) . . . . . . . .57Figura 28. Modificación a nivel de cisteína con cianuro de potasio y el reactivo

de Ellman (dntb) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .58

Page 12: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

12

Figura 29. Modificación a nivel de cisteína con el reactivo de Degani (2-Nitro-5-tiociano ácido benzoico) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .59

Figura 30. Modificación a nivel de triptófano, método Patchkornich . . . . . . . . . . . .59Figura 31. Modificación a nivel de metionina con BrCN . . . . . . . . . . . . . . . . . . . . . . .60Figura 32. Modificación a nivel de serina con N, N’ carbonato disuccinimidilo

(dsc) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .61Figura 33. Ejemplo de superposición de los péptidos de una proteína

hipotética . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .63Figura 34. Purificación de péptidos obtenidos en la hidrólisis de la lectina de

Dioclea lehmanni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .64Figura 35. Superposición de fragmentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .67Figura 36. Secuencia de la lectina Canavalia marítima . . . . . . . . . . . . . . . . . . . . . . .68Figura 37. Comparación de secuencias de tres lectinas relacionadas. . . . . . . . . . . .69Figura 38. Electroforesis diagonal para determinación de la posición de los

puentes disulfuro en proteínas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .70Figura 39. Representación de la electroforesis diagonal para la determinación

de proteínas con puentes disulfuro intra e intercatenarios en proteómica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .72

Capítulo dosFigura 1. Componentes de un espectrómetro de masas . . . . . . . . . . . . . . . . . . . . . . .84Figura 2. Ionización en modo electrospray (esi) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .86Figura 3. Configuración de un espectrómetro de masas básico para determinar

peso molecular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .87Figura 4. Espectro de masas para la apomioglobulina (músculo de caballo) . . . . .88Figura 5. Espectro de masas (esi-cuadrupolo) para la lectina de Salvia

bogotensis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .89Figura 6. Determinación del peso molecular y de las glicoformas de la

ribonucleasa A y B por espectrometría de masas en modo de ionización electrospray (esi) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .90

Figura 7. Configuración de un espectrómetro de masas en tándem (ms/ms)-esi para determinar la secuencia de un péptido . . . . . . . . . . . . . . . . . . . . . . . . . . . .91

Figura 8. Ionización/desorción láser asistida por matriz (Maldi) . . . . . . . . . . . . . . . .93Figura 9. Esquema de un Analizador tof. A: geometría lineal. B: con reflectrón . .94Figura 10. Fragmentación de un péptido-formación de iones . . . . . . . . . . . . . . . . . .99Figura 11. Vía de fragmentación β de la molécula de proteína . . . . . . . . . . . . . . . . . .100Figura 12. Diagrama para establecer secuencia de un tetrapéptido

fragmentado en modo cid . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .101Figura 13. Espectro de masas en modo cid del ion (M+H)+ (m/z = 1882.1) del

péptido A. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .102Figura 14. Espectro de masas para el péptido B y fragmentación vía C-terminal . .102Figura 15. Espectro de masas para el péptido C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .104Figura 16. Interacción de electrones (e-) con moléculas multiprotonadas . . . . . . . .104Figura 17. Marcación del extremo N-terminal con dimetilo para análisis por

espectrometría de masas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .107Figura 18. Estudio de proteómica cuantitativa usando espectrometría de masas 108Figura 19. Marcación de cisteínas en una mezcla de proteínas con isótopos

(método icat) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .109Figura 20. Etiquetado por digestión enzimática con tripsina en H2

180 . . . . . . . . . . .110Figura 21. Marcación isobárica (etiquetado itraq) . . . . . . . . . . . . . . . . . . . . . . . . . . .111

Page 13: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

13

Figura 22. ms-esi para proteína plasmática transtiretina . . . . . . . . . . . . . . . . . . . . . .113Figura 23. ms-esi para el complejo avidina-biotina . . . . . . . . . . . . . . . . . . . . . . . . . . .116Figura 24. ms-nano esi para el complejo homotetramérico Transtiretina . . . . . . . .117

Capítulo tres Figura 1. Árbol filogenético para el citocromo C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .124Figura 2. Alineamiento de las secuencias de la proteína citocromo c . . . . . . . . . . .125Figura 3. Árbol filogenético de la evolución por duplicación genética de la

hemoglobina y la mioglobina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .127Figura 4. Crecimiento de la base de datos Uniprot KB/Swiss-prot desde

1990 hasta 2019 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .128

Capítulo cuatro Figura 1. Geometría del enlace peptídico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .134Figura 2. Ángulos diédricos y dipolo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .134Figura 3. Ángulos de torsión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .135Figura 4. Estructura en α hélices de proteínas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .138Figura 5. Representación de rueda helicoidal en una α hélice. . . . . . . . . . . . . . . . . .139Figura 6. Red Helicoidal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .140Figura 7. Comparación de las tres clases de hélices . . . . . . . . . . . . . . . . . . . . . . . . . . .140Figura 8. Hojas β antiparalelas en proteínas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .141Figura 9. Representación de giros β en proteínas . . . . . . . . . . . . . . . . . . . . . . . . . . . .144Figura 10. Interacción de las estructuras secundarias . . . . . . . . . . . . . . . . . . . . . . . .146Figura 11. Interacción entre α hélices formación del core hidrofóbico . . . . . . . . . . .149Figura 12. Miohemeritrina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .149Figura 13. Motivo jelly-roll Lectina de concanavalina A (Con A) . . . . . . . . . . . . . . . . .150Figura 14. Estructuras de lectinas. A: estructura tridimensional de bryohealin

resuelta con i-Tasser, flechas azules (hebras β). B: fucolectina proveniente de Anguilla anguilla O . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .151

Figura 15. Inmunoglobulina M. A: pdb 2RCJ Estructura de Inmunoglobulina M humana (IgM). B: estructura β sándwich que incluye topología de llave griega . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .152

Figura 16. Unidades β-α-b . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .152Figura 17. Plegamiento Rossmann (α/β estructuras -hoja β abierta) . . . . . . . . . . . .153Figura 18. Plegamiento barril tim. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .154Figura 19. Plegamiento Rossmann en enzimas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154Figura 20. pdb vgk Estructura cristalina del complejo mayor

de histocompatiblidad de Tipo I, H-2Kd a 2.0 A resolución . . . . . . . . . . . . . . . . .155Figura 21. Radiación electromagnética y luz polarizada . . . . . . . . . . . . . . . . . . . . . . .156Figura 22. Componente eléctrico de luz polarizada y no polarizada . . . . . . . . . . . . .157Figura 23. Dispersión óptica rotatoria (dor) y Dicroismo circular (dc). . . . . . . . . . .158Figura 24. Curvas hipotéticas de dispersión óptica rotatoria dor . . . . . . . . . . . . . .158Figura 25. Gráfica hipotética para la determinación de b0 y a0 para α hélice y

estructuras desordenadas o random coil (rc) . . . . . . . . . . . . . . . . . . . . . . . . . . . .160Figura 26. Determinación del espectro por dicroísmo circular (dc) . . . . . . . . . . . . .164Figura 27. Espectro dc en la región uv-lejano. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .166

Capítulo cincoFigura 1. Representación de un cristal y su celda unitaria . . . . . . . . . . . . . . . . . . . . .176

Page 14: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

14

Figura 2. Sistemas cristalinos posibles en las proteínas . . . . . . . . . . . . . . . . . . . . . . .177Figura 3. Grupos espaciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .177Figura 4. Incidencia de un haz sobre un plano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .178Figura 5. Determinación de a, b y c . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .178Figura 6. Determinación de la ecuación de Bragg . . . . . . . . . . . . . . . . . . . . . . . . . . . .179Figura 7. Representaciones de vectores de dispersión . . . . . . . . . . . . . . . . . . . . . . . .182Figura 8. Método geométrico para calcular la probabilidad de fase . . . . . . . . . . . . .183Figura 9. Reemplazo isomorfo. Se han superpuesto dos fotografías de cristales

triclínicos de lisozima. El punto izquierdo de cada pareja de puntos proviene del cristal de la lisozima nativa y el punto derecho corresponde al cristal después de la difusión de HgBr2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .184

Figura 10. Espectro Tocsy patrón para algunos aminoácidos . . . . . . . . . . . . . . . . . . .190Figura 11. Conectividad Noesy y Tocsy en un dipéptido . . . . . . . . . . . . . . . . . . . . . . .191Figura 12. Ejemplo de diagrama de flujo para determinación de estructura

por el método de partícula individual con microscopía electrónica (em) . . . .194

Capítulo seisFigura 1. Glicosilación en glicoproteínas de tipo N en mamíferos . . . . . . . . . . . . . .206Figura 2. Glicosilación en glicoproteínas de tipo N en plantas e invertebrados . . .207Figura 3. Glicosilación de tipo O en mucinas epiteliales. . . . . . . . . . . . . . . . . . . . . . .208Figura 4. O-Glicosilación en glicoproteínas de mamíferos . . . . . . . . . . . . . . . . . . . . .209Figura 5. O-Glicosilación en en plantas e invertebrados . . . . . . . . . . . . . . . . . . . . . . .210Figura 6. Estrategia para realizar estudios de glicosilación en glicoproteínas . . . .215Figura 7. Determinación del perfil de glicoproteínas citoplasmáticas en líneas

celulares con microarreglos de lectinas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .215Figura 8. Deglicosilación enzimática para glicoproteínas . . . . . . . . . . . . . . . . . . . . . .216Figura 9. Hidrólisis enzimática de glicanos en glicoproteínas . . . . . . . . . . . . . . . . . .218Figura 10. Análisis cualitativo y cuantitativo de carbohidratos por electroforesis

en geles de poliacrilamida y marcación con fluorescencia . . . . . . . . . . . . . . . . .219Figura 11. Patrones de fragmentación de monosacáridos por ionización

de impacto electrónico (ei) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .221Figura 12. Reacción de hidrazonólisis para liberar oligosacáridos . . . . . . . . . . . . . .222Figura 13. Reacción de marcación de los oligosacáridos con 2-AB

(2-aminobenzamida) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .223Figura 14. Cromatografía para purificación de oligosacáridos. A: Filtración

en gel para separar por masa molecular. B: Intercambio aniónico de alta resolución (hplc) y marcación para detección por fluorescencia. . . . .224

Figura 15. Patrones de Fragmentación generados por espectrometría de masas en tándem (ms/ms) modo etd. A: patrones generados en péptidos. B: patrones generados en glicanos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .226

Figura 16. Patrones de fragmentación generados por espectrometría de masas en tándem (ms/ms) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .227

Figura 17. Patrones de Fragmentación generados por espectrometría de masas en tándem (ms/ms) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .228

Figura 18. Determinación de la estructura de un glicano por digestión enzimática secuencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .229

Figura 19. Determinación de la estructura de un glicano por digestión enzimática secuencial, utilizando un arreglo de enzimas con diferente especificidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .230

Page 15: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

15

Figura 20. Diagrama general para estudios de glicómica, análisis estructural de los glicanos, y glicoproteómica, análisis de los glicopéptidos . . . . . . . . . . .231

Figura 21. Interacciones de los glicanos conjugados a proteínas y lípidos. Glicosilación de tipo N y O implicados en procesos celulares . . . . . . . . . . . . . .232

Capítulo sieteFigura 1. Representación de estructuras secundarias de proteínas . . . . . . . . . . . . .249Figura 2. Representación de la estructura de la red neuronal . . . . . . . . . . . . . . . . .254Figura 3. Metodología propuesta para la generación de modelos estructurales

a partir de secuencia blanco . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .257Figura 4. Correspondencia aproximada entrer calidad del modelamiento,

precisón, metodología usada y posibles aplicaciones de los modelos . . . . . .262

Page 16: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural
Page 17: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

IntroducciónLas proteínas son polímeros lineales de α-aminoácidos que se organizan aleatoriamente para formar asociaciones estructuralmente diferentes, con diversas funciones biológicas. Los aminoácidos son compuestos orgánicos que se caracterizan por tener una estructura básica de un grupo carboxilo, unido a un grupo amino por medio de un carbono tetramérico (C α) que, además de unirse al grupo carboxilo y al grupo amino, se une a un hidróge-no a través de su tercer enlace y, a través de su cuarto enlace, a una cadena variable que da origen a la diversidad de α-aminoácidos que constituyen las proteínas. A pesar de que se conocen más de quinientos aminoácidos, solo son veinte los que se encuentran, mayoritariamente, en las proteínas y los que dan origen a la diversidad funcional y estructural de las mismas. Para que los aminoácidos se unan entre sí y puedan formar estructuras estables, se realiza un enlace covalente entre el grupo amino de un aminoácido y el grupo carboxilo del siguiente, estableciéndose un enlace tipo amida que posee características especiales y se denomina enlace peptídico.

Las proteínas se sintetizan constantemente y, para que eso ocurra, la información de su estructura se encuentra almacenada en una molécula completamente diferente, el adn. Para que se forme una proteína nueva, se requiere que se activen una serie de procesos que involucran varias es-tructuras celulares, y otros, más complejos: de copiado de información a partir de un gen (adn), la generación de una molécula mensajera que lleve la información desde el adn hasta el ribosoma (arn) y la lectura y traduc-ción de dicha información para que el mensaje que viene codificado en un lenguaje de cuatro componentes en el arn sea traducido en un lenguaje de veinte componentes en la proteína. Durante el proceso de transcrip-ción (copiado de la información del adn para formar arnm), se envía un mensaje que contiene toda la información almacenada en uno de los genes que conforman el genoma de un organismo. Este arnm llega al ribosoma de la célula y allí ocurre el proceso de lectura por tripletas de ese mensaje (codones), para formar la proteína con una alta fidelidad de acuerdo a lo contenido en el genoma del organismo.

Los seres vivos están conformados por una gran variedad de proteínas que se pueden agrupar de acuerdo con sus características físicas, químicas, estructurales o funcionales. Teniendo en cuenta su función, las proteínas se pueden clasificar según el fenómeno biológico en el cual están involucradas. Hay proteínas que se encuentran catalizando la mayoría de las reacciones

Page 18: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

18

metabólicas que ocurren en las células. Estas son conocidas como enzimas y presentan características como su especificidad, que las convierte en re-guladoras de los procesos en los que participan. Si se revisan los procesos de comunicación celular, se encontrará que en todos ellos hay proteínas involucradas. Ejemplos de estas proteínas son los receptores de hormonas y los receptores de neurotransmisores, los cuales interactúan con sus ligandos por complementariedad entre sus estructuras y desencadenan respuestas celulares. Muchos de estos ligandos (hormonas y neurotransmisores) son, a su vez, de naturaleza proteica.

Las moléculas biológicas para transportar son, generalmente, proteínas, que se relacionan con cualquier tipo de transporte de moléculas. Entre los que se destacan el transporte de moléculas hidrofóbicas a través de medios acuosos como las lipoproteínas en la sangre y el transporte de sustancias a través del citoplasma por medio de una red de microtúbulos, como lo hace la kinesina. Así mismo, las proteínas pueden servir de transportadores a tra-vés de la membrana biológica ya sea participando en procesos redox, como en la membrana de la mitocondria, o como transportadoras de moléculas polares a través de la membrana, como ocurre en los canales iónicos. Al-gunas proteínas pueden cumplir también funciones de almacenamiento de sustancias nutritivas, como sucede en las etapas del desarrollo embrionario o con algunos iones vitales para el organismo.

Otros procesos biológicos también son soportados por este tipo de molé-culas. La estructura y soporte de las células son dadas por una compleja red de naturaleza proteica que se denomina citoesqueleto, el cual constituye un armazón alrededor del que se organizan todos los componentes celulares, sirviendo como soporte para la realización de fenómenos indispensables para la viabilidad celular como el transporte intracelular o la división celular. En los tejidos de sostén (conjuntivo, óseo y cartilaginoso) de los vertebrados, las fibras de colágeno presentes en la matriz extracelular son las encargadas de conferir resistencia mecánica tanto a la tracción como a la compresión. La queratina (presente en cabello, plumas, uñas y cuernos), la fibroína de la seda de araña y la fibrina que segregan las plaquetas para formar los coágulos sanguíneos también son proteínas con función estructural.

La defensa en los diferentes organismos también es un proceso realizado por proteínas. En las bacterias, las llamadas endonucleasas de restricción se encargan de identificar y destruir moléculas de adn que no se identifi-can como propias y, en los vertebrados superiores, las inmunoglobulinas reconocen moléculas extrañas y se unen a ellas para facilitar su destrucción, proceso del que se encargan las células del sistema inmunitario. El control de diferentes funciones vitales de las células se puede realizar a nivel gé-nico y, en este proceso, las proteínas regulan la expresión génica, es decir, se encargan de decidir en todo momento qué genes deben ser transcritos a arn y, por lo tanto, traducidos a proteína.

Page 19: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

19

Independientemente del tipo de proteína que se esté considerando, para que esta sea funcional, debe tener una estructura tridimensional estable. Para llegar a esta estabilidad, las proteínas presentan tres (algunas cuatro) niveles estructurales que contribuyen para alcanzar esa estabilidad. La estructura primaria está determinada por la secuencia de aminoácidos en la cadena proteica, es decir, el número de aminoácidos presentes y el orden en que están enlazados. La estructura secundaria corresponde al plegamiento que adoptan determinadas regiones de la cadena polipeptídica por el estable-cimiento de puentes de hidrógeno entre los átomos que forman el enlace peptídico. Finalmente, la molécula proteica adopta un plegamiento tridi-mensional que constituye su estructura terciaria, concepto equiparable al de conformación absoluta en otras moléculas. La estructura terciaria está determinada por la estructura primaria y es la responsable directa de sus propiedades biológicas. Las interacciones que estabilizan la estructura ter-ciaria pueden ser tanto de tipo covalente (puentes disulfuro) como de tipo no covalente (puentes de hidrógeno, fuerzas de polaridad, electrostáticas, hidrofóbicas, etc.). Algunas proteínas pueden tener un nivel estructural adicional cuando se asocian varias cadenas polipeptídicas (iguales o distin-tas) para formar una unidad funcional, y en ese caso se habla de estructura cuaternaria. Las interacciones que estabilizan la estructura cuaternaria son de tipo no covalente.

Las proteínas se asocian entre sí o con otra clase de biomoléculas para formar asociaciones supramacromoleculares (microtúbulos, ribosomas, nu-cleosomas, virus, membranas, etc.). Las interacciones que estabilizan este nivel de estructura también son de tipo no covalente. Esta organización se diferencia de la cuaternaria debido a que la estequiometría de las estructuras formadas puede variar considerablemente.

La pérdida de la estructura terciaria se denomina desnaturalización y va acompañada de la pérdida de funcionalidad. Sin embargo, con la des-naturalización no desaparece la estructura primaria, ya que se mantienen los enlaces peptídicos. En algunos casos la desnaturalización es reversible. Las proteínas se pueden estudiar en todos sus niveles estructurales por medio de diferentes técnicas experimentales. De acuerdo con lo anterior y teniendo en cuenta la importancia de estudiar las proteínas, en este docu-mento hablaremos sobre estructura de proteínas y algunos métodos básicos experimentales que se pueden emplear para su estudio.

Page 20: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural
Page 21: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Capítulo uno

Estructura primaria de proteínas

Page 22: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural
Page 23: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura primaria de proteínas • 23

La función de una proteína solo se puede entender si se conoce su estruc-tura tridimensional y para determinarla se debe conocer su secuencia de aminoácidos. Sanger [1] estableció la primera secuencia para la insulina bovina y a partir de este estudio se corroboró que las proteínas poseían una única estructura covalente. Desde entonces, se han establecido una gran cantidad de secuencias, las cuales han sido importantes para la formulación de los conceptos modernos de la bioquímica por varias razones, entre las que se destacan:

1. La estructura primaria de una proteína es esencial para entender su mecanismo molecular de acción y es importante para establecer su estructura terciaria por difracción de rayos X o cryo-micros-copía electrónica. También se pueden obtener más fácilmente proteínas recombinantes, si se conoce con certeza la secuencia N-terminal y C-terminal.

2. Las comparaciones de las secuencias entre proteínas análogas del mismo individuo, de la misma especie y de especies relacionadas han dado información acerca de la función de una proteína y de las relaciones evolutivas entre las proteínas y los organismos que las producen. Estos análisis complementan los estudios taxonó-micos basados en comparaciones anatómicas. También, es posible hacer predicciones respecto a la estructura y función de la proteína.

3. La secuencia de una proteína tiene implicaciones clínicas impor-tantes, ya que algunas enfermedades se producen por mutacio-nes puntuales o por el cambio de un aminoácido por otro en la molécula. Muchos de estos estudios han llevado al desarrollo de métodos diagnósticos y, en algunos casos, el desarrollo de terapias.

4. Se puede hacer la predicción de la localización celular de la pro-teína en función de su secuencia N-terminal.

5. Permite hacer la determinación de la estructura y función de una proteína a través de diversos métodos computacionales y experimentales.

La elucidación de la estructura primaria de la insulina bovina, la cual tiene cincuenta residuos de aminoácidos, fue el resultado del trabajo desa-rrollado por Sanger y colaboradores a lo largo de una década, en el que se emplearon grandes cantidades de proteína, del orden de gramos. Hoy en día los métodos y las técnicas para determinar la estructura primaria de las proteínas se han perfeccionado y automatizado, a tal punto que proteínas de un tamaño semejante se pueden secuenciar en unos pocos días, utilizando cantidades del orden de microgramos (mg) de proteína. Posteriormente, se hizo la secuenciación de la enzima β-galactosidasa, la cual tiene 1021 residuos de aminoácidos. Esto demostró que, de ahí en adelante, se podía determinar la secuencia de cualquier proteína.

Page 24: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

24 • Introducción al análisis estructural de proteínas y glicoproteínas

Para determinar la estructura primaria se debe realizar un proceso de frag-mentación de la proteína, la caracterización de sus fragmentos (péptidos) y la reconstrucción de su estructura original (por superposición de pépti-dos). Por lo tanto, la secuencia de aminoácidos de una proteína se puede obtener por medio de:

1. Rupturas específicas, empleando métodos químicos y enzimáticos. Hoy en día, se han caracterizado nuevas proteasas bacteriales y de plantas. Además, se han obtenido enzimas recombinantes con una alta especificidad.

2. Métodos de detección a partir de pequeñas cantidades de proteína.3. La secuenciación automática que, al compararla con la secuen-

ciación manual, garantiza la reducción de los tiempos de análisis. 4. La secuenciación de péptidos por espectrometría de masas, que

ha reducido, de manera considerable, la obtención de la secuen-cia de los péptidos derivados de una proteína y ha aumentado, considerablemente, el número de secuencias reportadas.

Requisitos para establecer la secuencia primaria de una proteína

Cuando se van a realizar estudios enfocados en la determinación de la estructura primaria, la proteína debe cumplir con unos requisitos para de-terminar la secuencia. Aunque las técnicas para alcanzar estos resultados han tenido grandes avances, se debe establecer una estrategia que permita, al final del proceso, obtener secuencias que sean lo más exactas posibles, de esta forma se pueden iniciar estudios enfocados en estructura terciaria y función de proteínas.

La selección de la proteína de interés depende del objetivo de la in-vestigación, de la fuente biológica de la cual será aislada (virus, bacterias, órganos o semillas, entre otros) y, por supuesto, de la cantidad de proteína disponible. Sin embargo, si la secuencia tiene como objetivo desarrollar una nueva metodología para secuenciación, se emplean proteínas con se-cuencias establecidas.

Los principales requisitos para establecer la secuencia de una proteína son:

1. Pureza de la proteína: debe ser mayor al 97 %, de tal forma que las impu-rezas no afecten la cantidad de los péptidos de interés. Si el estudio ha sido diseñado para obtener una secuencia completa, la pureza debe ser mayor al 98 %. Por otra parte, la preparación de proteína debe ser homogénea y se debe garantizar que solo hay una entidad molecular. Se hacen controles

Page 25: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura primaria de proteínas • 25

previos que incluyan una evaluación por electroforesis y la determinación del punto isoeléctrico y de la secuencia N-terminal. Sin embargo, con estas técnicas algunas heterogeneidades no son detectadas y aparecen durante el análisis, por ejemplo, la sustitución de aminoácidos con carga eléctrica idéntica, isoleucina y valina, y algunas modificaciones postraduccionales como acetilaciones, metilaciones, etc.

2. Cantidad de proteína: depende de la cantidad de datos que se desean ob-tener y del método de secuenciación (para un análisis completo se necesitan cantidades del orden de miligramos). Las pérdidas de proteína durante los procedimientos analíticos se dan por la absorción de péptidos a los sopor-tes cromatográficos. Los procesos de fragmentación que no son del cien por ciento (100 %) y las malas estrategias de secuenciación incrementan su cantidad durante el análisis.

3. Evaluación de la exactitud de la estructura primaria: se debe hacer la identificación de secuencias idénticas de péptidos en más de un digerido (fragmentos obtenidos por métodos enzimáticos y químicos) y, si es posible, un análisis de aminoácidos. Si existen datos de secuencias de proteínas cer-canas o similares, solo se requieren experimentos con un solo digerido, por ejemplo, con tripsina. En cambio, si la proteína no ha sido estudiada ni se conoce nada acerca de las proteínas cercanas, se requiere una producción continua de proteína pura y una minuciosa caracterización de los péptidos.

4. Tratamientos previos: son necesarios para realizar una digestión más completa de la proteína, ya que el microambiente en el que están los resi-duos puede impedir el ataque proteolítico. Al final del tratamiento, se debe obtener un material altamente soluble. Para tal fin, se emplean agentes desnaturalizantes químicos y físicos. En presencia de agentes desnaturali-zantes físicos, como la temperatura, se hace un calentamiento previo de la proteína a pH ácidos o alcalinos, de esta forma se pueden emplear agentes proteolíticos como la tripsina o el bromuro de cianógeno (BrCN). Con agentes desnaturalizantes químicos, por lo general, se emplea docecil sul-fato de sodio (sds) al 1 %, con o sin calentamiento, y se diluye al 0.1 % para realizar una posterior fragmentación de la proteína con proteasas.

Otros tratamientos incluyen modificaciones químicas, entre las que se encuentra la reducción de los puentes disulfuro y la adición de urea junto con dodecil sulfato de sodio (sds) al 0.1 %. Es importante tener en cuenta, que no todos los agentes desnaturalizantes son removidos para llevar a cabo la diges-tión enzimática y, por lo tanto, no deben afectar la actividad de las proteasas. La reducción de los puentes disulfuro puede llevar a la formación de agregados de alto peso molecular, los cuales no se pueden solubilizar, ni siquiera empleando condiciones drásticas de reducción, aunque, cuando

Page 26: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

26 • Introducción al análisis estructural de proteínas y glicoproteínas

el producto es soluble en medio ácido, se puede fragmentar con bromuro de cianógeno (BrCN) y pepsina.

En términos generales, las modificaciones previas a la fragmentación pueden alterar la selectividad del agente proteolítico. Algunas de ellas son las acetilaciones, la producción de sulfoderivados y la carbamilación del grupo ε-amino de la lisina, en este último caso se ve afectada la actividad de la tripsina. También el uso de la urea puede producir cianato y modi-ficar algunos grupos en un amplio rango de pH. Otras modificaciones se evidencian al usar los anhídridos carboxílicos (succínico, maleico, etc.), que pueden ser empleados en estudios de disociación de multímeros y funcio-nalidad. La oxidación de los aminoácidos aromáticos y la acilación de los grupos ε-amino restringen, en el último caso, la hidrólisis de la proteína por proteasas como la tripsina.

5. Caracterización parcial de la proteína: es muy importante ya que nos permite proponer una buena estrategia de secuenciación. El proceso previo de purificación debe arrojar un producto de óptima calidad y, por lo tanto, permitir la evaluación de parámetros moleculares como:

5.1. El peso molecular de la proteína nativa, el cual se debe determinar mínimo por tres métodos analíticos o, de una forma más exacta, por es-pectrometría de masas con ionización electrospray (ms-esi). Este parámetro permite hacer un estimado del número de los aminoácidos que se van a secuenciar. La presencia de proteínas conjugadas da como resultado un peso molecular menor de la parte proteica y, por lo tanto, del número de aminoácidos que se van a determinar.

5.2. Si las proteínas son multiméricas, se deben caracterizar los monóme-ros constituyentes. Cuando se emplean diferentes métodos, la sensibilidad de las proteínas difiere y, por lo tanto, se deben establecer las condiciones de disociación para el análisis individual de cada subunidad. Por medio de métodos analíticos, se puede evaluar el número de subunidades que tiene la proteína, cómo son químicamente entre sí (idénticas o no idénticas) y cómo interactúan las cadenas polipeptídicas (covalentemente o no covalen-temente). La suma del peso molecular de las subunidades debe ser igual al peso molecular de la proteína nativa. En la figura 1, se observa un resumen de las técnicas para determinar si las proteínas son multiméricas.

La reducción de los puentes disulfuro varía en susceptibilidad hacia los agentes reductores. Para el proceso de reducción se deben establecer las condiciones para cada proteína, como concentración del reductor, tiempo, pH y temperatura. Comúnmente se emplean agentes reductores como β-mercaptoetanol y ditiotreitol (reactivo de cleland). La alquilación se rea-liza para evitar la recombinación de los puentes disulfuro y evitar que se

Page 27: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura primaria de proteínas • 27

formen agregados. Para ello, se emplean agentes alquilantes como el ácido iodoacético y la iodoacetamida (figura 2). Otros agentes alquilantes incluyen el uso de la vinilpiridina, β-haloamina o la etilenimina, en este último caso se obtiene un derivado catiónico S-(2-aminoetil-cisteina) (figura 3B) con propiedades similares a la lisina, una ventaja, ya que se hace la introducción de sitios específicos de clivaje enzimático, para la tripsina [2].

ACUALITATIVOS

ELECTROFORESIS

EN CONDICIONES DESNATURALIZANTES

Y REDUCTORAS.

PUNTO ISOELÉCTRICO EN CONDICIONES

DESNATURALIZANTES.

B PREPARATIVOS

FILTRACIÓN EN GEL

ELECTROFORESIS PREPARATIVA

La resolución del método entre dos proteínas es de 23 kDa.Se puede realizar en condiciones desnaturalizantes

La resolución del método entre dos proteínas es de Se puede realizar en condiciones desnaturalizantes

1 kDa.

CROMATOGRAFÍA LIQUIDA (hplc)

Figura 1. Métodos para establecer la presencia de subunidades de una proteína. A: cualitativos B: preparativos

OH CH2 CH2 CH2 CH2S S OHCH2

CH2

SH

SH

C

HSCH 2

CH 2OH

AC C N

CH2O

S

S

CH2

C C

O

OHOH

SH

CHCH

SH

CH2

CH2

11

OH

HCS OH

S

CH2

CH2

HC

2

2

+

B

CH2

S

C

C O

NH2

CH2

S

C

C O

O

HI

I CH 2COO

I CH2 CONH 2

CH2

CH2

SH

SH

C

1

2

Figura 2. Reducción de los puentes disulfuro (cistina) y alquilación en proteínas. A: reducción. B: alquilación

Page 28: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

28 • Introducción al análisis estructural de proteínas y glicoproteínas

S-aminoetilcisteina

B

A

Cismercaptido

R1 S S SO2R 32 R1(2) S 1 R2(1) S SO3

1

SO32 R1(2)S 1 SO3

22Cu 2 2Cu 1S

S

HNH

CH CH2 CH2 CH2BrSH NH3

haloaminaC O

NH

CH CH2 CH2 NH3

C O

CH2

Br

Figura 3. Estudio de puentes disulfuro en proteínas. A: reacción de sulfitólisis. B: alquilación con β-haloamina

Fuente: [3, p. 38].

La sulfitólisis introduce un grupo sulfo para mejorar la solubilidad de la proteína o del péptido. Con esta reacción no hay oxidación del triptó-fano ni de la metionina, como ocurre cuando se hace la iodoacetilación. En condiciones muy básicas y desnaturalizantes los puentes disulfuro son heterolíticamente clevados y la formación del producto es favorecida por exceso de reactivo (figura 3A). Para la secuenciación de una proteína mul-timérica, la separación de subunidades iguales no es necesaria, pero sí la disociación del polipéptido en las condiciones establecidas (unión covalente o no covalente), con el fin de que los puntos de corte de los agentes pro-teolíticos sean más accesibles.

La separación de subunidades diferentes es necesaria, al igual que su análisis individual, para realizar estudios de secuenciación.

5.3. Determinación de la secuencia N-terminal que, para la proteína nativa y para las subunidades, solo se va debe encontrar una secuencia en cada caso. Esto garantiza que en el material de partida hay solo una entidad molecular y que este es homogéneo. Algunas veces, esta secuencia puede

Page 29: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura primaria de proteínas • 29

estar bloqueada por modificaciones postraduccionales o manipulación de la proteína; sin embargo, se debe hacer una revisión minuciosa de los re-sultados antes de llegar a estas conclusiones.

5.4. En el caso de proteínas conjugadas, se deben hacer ensayos para evaluar cómo es la interacción de la proteína con grupos de diferente naturaleza, como carbohidratos, lípidos, grupos heme, etc., y removerlos sin afectar la proteína, por ejemplo, la remoción de carbohidratos en glicoproteínas.

La detección de glicoproteínas se puede hacer por métodos cualitativos que van a variar en la sensibilidad. Los métodos se basan en la oxidación de los carbohidratos y la formación de un complejo coloreado. Un método que se emplea es la oxidación de los carbohidratos con metaperiodato de sodio para formar aldehídos vecinales y, posteriormente, formar un deri-vado, por ejemplo, con hidrazina biotinilada. Al final, la detección se hace con el sistema de estreptavidina peroxidasa [4]. Existen otros métodos que tienen diferente sensibilidad como la tinción shiff o el uso de anticuerpos antiperoxidasa dirigidos contra glicoproteínas de origen vegetal (figura 4).

AOxidación

BiotinilaciónAldehídos vecinales

Aldehídos-Biotina

Detección de carbohidratos

SDS-Page Tinción Reacción enzimática

Figura 4. Detección de la glicosilación en glicoproteínas

Page 30: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

30 • Introducción al análisis estructural de proteínas y glicoproteínas

Una vez se ha hecho la detección de la glicosilación, se debe hacer la cuantificación de los carbohidratos en la proteína. Usualmente se hace em-pleando el método de Dubois et al. [5], el cual se basa en la deshidratación del carbohidrato con ácido sulfúrico concentrado y posterior formación de un complejo amarillo con fenol al 5 % que absorbe la luz a 450 nm. Con ayuda de una curva de calibración, empleando glucosa como patrón y la proteína pura cuantificada, se puede hacer la determinación con base en la diferencia del peso:

% = (mg carbohidrato en la muestra/mg proteína total) × 100

Sin embargo, si el porcentaje de carbohidratos es inferior al 5 % no es necesario removerlo para realizar los estudios de secuencia.

Empleando técnicas como sds-Page, se puede determinar el porcentaje (%) de uniones N-glicosídicas y O-glicosídicas. A partir de la diferencia en la movilidad electroforética ((∆kDa), figura 5) y el uso de enzimas especi-ficas para la hidrólisis de cada unión glicosídica (figura 7), es posible esta-blecer el porcentaje de glicosilación y, a su vez, realizar comparaciones con estructuras de oligosacáridos ya establecidas, teniendo en cuenta que esta modificación postraduccional es conservada. Tambíen se puede determinar el porcentaje total de glicosilación, haciendo una hidrólisis química total para remover todas las cadenas de oligosacáridos (figura 5).

a b

c d

kDa

a. SDS - Page proteína glicosilada.

c. Tinción especifica glicoproteína.b. SDS - Page proteína deglicosilada.

d. Tinción especifica proteína deglicosilada.

Figura 5. Determinación del porcentaje de glicosilación en glicoproteínas por sds-Page

Page 31: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura primaria de proteínas • 31

Una determinación cuantitativa exacta se puede realizar usando es-pectrometría de masas con ionización electrospray (ms-es), que consiste en determinar el peso molecular de la glicoproteína antes y después de la remoción del oligosacárido. Con este método, también es posible hacer la detección de glicoformas porque la diferencia de peso molecular entre ellas es muy pequeña, pero las propiedades físicas y químicas de la proteína son iguales (figura 6).

La remoción de carbohidratos se puede realizar de manera no selectiva, con una hidrólisis química suave, con ácido clorhídrico (HCl) 0.01 M a 100 °C durante 3 horas (un ácido más concentrado puede romper los enlaces peptídicos). Una vez terminada la hidrólisis se puede hacer la eliminación de los monosacáridos por medio de filtración en gel, ultrafiltración o diáli-sis. Una hidrólisis química selectiva para eliminar O-glicosídicos se puede realizar con ácido sulfónico trifluorometano (tmsf) [6].

Los métodos de deglicosilación selectivos incluyen la hidrólisis enzimá-tica con enzimas para remover la N y O glicolisación (figura 7). Antes del tratamiento enzimático, es importante realizar una desnaturalización previa de la glicoproteína para asegurar la accesibilidad de la proteasa y evitar la modificación del oligosacárido.

En el caso de proteínas conjugadas a lípidos, los cuales no están asociados covalentemente a las proteínas, se pueden realizar procesos de extracción diferencial con solventes (Etanol: éter); un ejemplo del proceso es la deli-pidación de proteínas de alta densidad del suero.

Para proteínas que tienen cofactores, si ellos están unidos covalente-mente, su remoción no debe alterar el enlace peptídico, por ejemplo, el

13500 14000 14500 15000 15500 160000

100

Proteína A

Proteína B14896.9 (14895.5)

15058.8

Diferentes glicoformas

(GlcNAc) 2 Man 5

X X X X

15384.3

15223.815545.4

Man 6

Man 9

Man 7Man 8

Abso

rban

cia

rela

tiva

Figura 6. Detección de glicoformas por ms-esi

Page 32: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

32 • Introducción al análisis estructural de proteínas y glicoproteínas

grupo heme del citocromo c se puede eliminar con una solución de áci-do perfórmico (95 %). Si no están unidos covalentemente su remoción se hace en condiciones desnaturalizantes, a pH ácido y con el uso de agentes acomplejantes como edta y egta. Finalmente, se eliminan por medio de filtración en gel, ultrafiltración o diálisis, entre otros.

5.5. El análisis de aminoácidos permite planear una mejor estrategia de secuenciación y hacer un balance de masa entre la proteína intacta y los fragmentos derivados de la digestión enzimática o química. Si la masa to-tal es mayor que la de los péptidos aislados, hay pérdidas de los péptidos durante el proceso de purificación. Si la masa total es menor que la de los péptidos aislados, probablemente, se hizo un reconteo de péptidos con la misma secuencia. Para hacer un buen análisis de aminoácidos, se deben realizar diferentes hidrólisis que no alteren las cadenas laterales de estos. Algunos aminoácidos no estándar pueden ser pasados por alto durante el análisis por hidrólisis, por ejemplo, la fosfoserina y el γ-carboxiglutámico, en los que el grupo fosfato y carboxilo pueden ser perdidos, lo que da como resultado serina y glutámico, respectivamente. Otros, como ε-metil lisina y 3-metil histidina, no son detectados por los métodos cromatográficos convencionales y se pueden presentar electroforesis anormales de péptidos y proteínas que indican su presencia.

El método de hidrólisis general de las proteínas se hace con HCl 6M, a 100 0C, durante 24 horas, en ausencia de oxígeno y de metales. Con este tratamiento la metionina y cisteína no se pueden cuantificar y, por lo tanto, antes de la hidrólisis, se deben obtener como derivados metioninsulfona y ácido cisteico, respectivamente (figura 8). Se debe tener en cuenta que, con el tratamiento, la tirosina se puede clorar, por lo que, algunas veces, se introduce fenol para inhibir el daño. La serina y treonina son lábiles al

1. PNGase F ( de Flavobacterium meningosepticum): hidroliza los enlaces N- glicosídicos

R-Asp GlcNAc........

de manosa y glicanos de tipo N-híbridos.

3. Endo GalNAc-Ser/Thra ( de Streptococcus pneumoniae )

2.Endoglicosidasa H (endo H) ( de Streptomices plicatus): hidroliza los enlaces N- glicosídicos

R-Asp-GlcNAc

-1-3GalNAc ser/Thr

Figura 7. Deglicosilación enzimática de glicoproteínas

Fuente: [7, p. 344].

Page 33: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura primaria de proteínas • 33

tratamiento; por esto, se debe hacer un análisis cinético de la liberación y velocidad de destrucción de estos aminoácidos. Aminoácidos como alanina, valina e isoleucina forman enlaces peptídicos que son muy resistentes a la hidrólisis, en estos casos se deben extender los tiempos de hidrólisis hasta las 72 horas (figura 9). Los demás aminoácidos se determinan a las 24 ho-ras de hidrólisis, excepto el triptófano, el cual se destruye completamente.

Aminoácidos como la glutamina y la asparagina se convierten en los ácidos glutámico y aspártico, respectivamente. De modo que, después de la hidrólisis ácida, solo puede cuantificarse la mezcla de la amida y el ácido como Asx (Asp +Asn) y Glx (Glu+Gln). Para la determinación de triptófa-no se han hecho varias modificaciones del método de hidrólisis para evitar su cloración y destrucción, algunas de ellas incluyen tratamiento con ácido P-toluen sulfónico 3N o hidrólisis básica con Ba (OH)2 (saturado) 4N.

Se debe hacer una hidrólisis de la proteína luego de su tratamiento con ácido perfórmico del 90-95 % (H2O2 + ácido fórmico) en medio desnatura-lizante, para cuantificar la cisteína como ácido cisteico y la metionina como metioninsulfona. Estos derivados son estables en condiciones de hidrólisis ácida y básica pero, en el último caso, el BrCN (bromuro de cianógeno) no hidroliza el enlace en el que hay metionina, si se fuera a fragmentar la proteína con este reactivo. Se resalta que, con este tratamiento, también hay destrucción del triptófano y los aminoácidos polares se oxidan.

NH-CHCH CH SCH2 2 3 + HCOOH NH-CHCH CH SCH

O

2 2 3

O

metioninsulfona

NH-CHC

O

CH 2

S

S

CH 2

-NH-CH-C-

O

+HCOOH

NH-CHC

O

CH 2

CH 2

-NH-CH-C-

O

SO3

SO 3

ácido cisteíco

Figura 8. Oxidación perfórmica de cisteína y metionina

Page 34: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

34 • Introducción al análisis estructural de proteínas y glicoproteínas

Para complementar el análisis de aminoácidos se puede realizar una determinación de cisteína y cistina. De esta forma, se puede deducir si los residuos de ácido cisteico que fueron determinados en el análisis de ami-noácidos están en forma libre o formando puentes disulfuro. Con el reac-tivo de Ellman [2,8], se mide la cantidad de nitobenzoato (ntb) liberado durante la reacción del ditiobis -2 ácidonitrobenzoico (dntb) con un grupo tiol (figura 10). La hidrólisis de la proteína empleando otros ácidos como sulfúrico (H2SO4) o nítrico (HnO3) traen como consecuencia una fuerte deshidratación, destrucción y nitración de la tirosina, por lo tanto, no son recomendables. Por otra parte, la hidrólisis básica provoca la descomposi-ción de cisteína, serina, treonina y arginina. Además, desamina y racemiza, parcialmente, los demás aminoácidos.

Para determinar la cantidad de triptófano se realiza una digestión enzi-mática con pronasa o proteinasa K y se hace una condensación con P-di-metilbenzaldehído (paba) en medio ácido y, posteriormente, una oxidación con nitrito de sodio (NaNO2). La absorbancia del complejo se puede leer a 596 nm y se determina la cantidad empleando una curva de calibración (figura 11) [9].

El contenido de aminoácidos en un hidrolizado puede determinarse cuantitativamente con un analizador de aminoácidos automatizado. Este equipo separa los aminoácidos sobre una columna de intercambio iónico, usando como base la técnica que fue desarrollada por Hirs y colaborado-res [10, 11] (figura 12). Para la detección de los aminoácidos, se pueden

mm

ol aa

24 48 72 h

Los demás aminoácidos se pueden cuantificar a las 24 horas de hidrólisis. La cisteína y la metioninase cuantifican como metionisulfona y ácido cisteíco respectivamente.

Extrapolación a tiempo cero para

cuantificar serina y treonina.

Extrapolación a las 72 h para

cuantificar leucina, valina, isoleucina.

mm

ol a

a

24 48 72 h

Figura 9. Curvas hipotéticas de la cinética de hidrólisis de los aminoácidos para una proteína en condiciones ácidas

Page 35: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura primaria de proteínas • 35

preparar derivados antes o después del paso por la columna de separación. Los derivados se pueden formar con fluroescamina, ninhidrina, fenilisotio-cianato (pitc), fenil tiocarbamil (ptc), O-Phataldehído (Opa), este último no reacciona con prolina y, por lo tanto, se debe hacer una oxidación previa con cloramina T (figura 13).

RS R S S NO2

2COpH 8.0

2

O N2 S

O CS

CO2

NO2

NTB

S

CO2

NO2

DTNB

Figura 10. Determinación de cisteína libre con el reactivo de Ellman

Fuente: [2, p. 157].

COO

CH C H

H C O

N NH

2

33 2

N(CH )

HON

O

C

C

HOH

3 2N(CH )

gComplejo Ruheman =596 nm

N

O

C

(CH )N3 2

NC

(CH )N3 2

NaNO 2

H 42SO[ [

Figura 11. Determinación de triptófano por formación del complejo de Ruhemann

Page 36: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

36 • Introducción al análisis estructural de proteínas y glicoproteínas

Figura 12. Diagrama de purificación de aminoácidos

Fuente: [11, p. 674].

ACH

O

CH

O

HS3

CH2 CH2 OH NH CH COO

ROH-CH -CH -S2 2

CH COO

R

N

B

OO

OO

H N CH

R

3

COO

COOH

C

RNOH

O

CO

C

C

C

OH

OH

O

2 H N3 CH

COO

R

R C H

O

CO2O

C

O

C

O

C

O

CC N C

2 O3H

Figura 13. Reacciones de derivatización de los aminoácidos. A: reacción con O-Ftalaldehído. B: reacción con fluroescamina. C: reacción con ninhidrina

Los aminoácidos se identifican de acuerdo con su volumen de elución o tiempo de retención y se hace su cuantificación de acuerdo con su inten-sidad fluorescente o por el área bajo la curva (figura 14). Los métodos de detección tienen una alta sensibilidad y se pueden detectar cantidades del orden de un picomol de cada aminoácido. Los datos son reportados, en un aminograma, como porcentaje de cada aminoácido en la proteína (g aa

Page 37: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura primaria de proteínas • 37

/100 g de proteína). Para obtener los datos, es importante una cuantifica-ción exacta de la solución de proteína, por ejemplo, por micro-Kjeldahl o algún método colorimétrico exacto o por el coeficiente de extinción de la proteína si se conoce.

El resultado final del análisis de aminoácidos se describe como residuos de cada aminoácido o molécula. Para alcanzar estos datos, se debe tener en cuenta la masa molecular de cada aminoácido sin una molécula de agua. Para no reportar Glx y Asx como una mezcla, se puede hacer un tratamiento previo a la proteína para determinar las amidas como aminas en el análisis. Por otra parte, es posible hacer una aproximación al punto isoeléctrico de la proteína de acuerdo con el contenido de aminoácidos básicos y ácidos. En el siguiente ejemplo, se presenta el reporte del análisis de aminoácidos para la lectina de Salvia bogotensis (LSBo) (figura 15) con y sin oxidación perfórmica. En los datos se observa lo siguiente:

• Algunos aminoácidos disminuyen su contenido luego del proceso de oxidación perfórmica.

• Luego de la oxidación perfórmica aparece el ácido cisteico, lo que indica la presencia de cisteína en la proteína.

DE

S GHR

TA

PNH3

5 10 15 Minutos

Y

VM F

I L K

Figura 14. Perfil de elución de los aminoácidos, detección a 254 nm-Derivados aminoácidos-ptc (Feniltiocarbamilados). Se observa la elución de los aminoácidos ácidos; luego, de los polares e hidrofóbicos y, al final, de la lisina

Fuente: [12, p. 48].

Page 38: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

38 • Introducción al análisis estructural de proteínas y glicoproteínas

• El cálculo de los residuos de aminoácidos se realiza con los datos que fueron determinados sin oxidación perfórmica, excepto para la cisteína y metionina.

• La metionina es un aminoácido que es escaso en proteínas de plantas. En el ejemplo, la proteína es aislada de semillas y, en este caso, no aparece. Por lo tanto, se confirma su ausencia luego del tratamiento de oxidación.

• No aparece el contenido de triptófano porque, en los dos casos, la hidrólisis lo destruye completamente. Por lo tanto, se debe com-plementar el análisis haciendo su determinación por el método colorimétrico o por técnicas cromatográficas [13].

Aa LSBo LSBo**

ASX 5,79 6,6614,1184,248THR

SERGLUGLYALA1/2 CYsVALMETILE

17,11817,66917,1468,483

03,156

02,373

0

14,58322,63224,1596,8951,2233,437

2,738LEUTYRPHEHISLYSARGPROTRPSUMA

3,72,4561,9391,6558,8461,3824,039

ND100,0 100,0

ND

3,2441,0920,9821,0152,39512963531

LSBo:Lectina de Salvia bogotensis

Masa molecular: 38702 Da

16 % carbohidratos

ND: no determinado

LSBo**: con oxidación perfórmica

Figura 15. Resultados del análisis de aminoácidos para la lectina de Salvia bogotensis (LSBo)

Fuente: [14, p. 352].

Page 39: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura primaria de proteínas • 39

Para calcular los residuos de aminoácidos por molécula se debe realizar el cálculo por cadena polipeptídica, si la proteína es multimérica. Poste-riormente, corregir el porcentaje de aminoácidos dado que el reporte no incluye cisteína y triptófano, según el ejemplo propuesto, entonces:

1 00-(1.22+5.1) = 93.677(%) real = porcentaje de cada aminoácido × 0.93677

Si la proteína es conjugada se debe calcular la masa total, sin el contenido de carbohidratos, en este caso es del 16 %:

38 702 × 0.16 = 6192.32 g38 702 - 6192.32 = 32 510 g

Lectina de Salvia bogotensis (LsBo)

Aa Aa/ 100gproteína

Aa residuos/mol. Integral1

Asx 5,42 15,3 15Thr 3,98 12,8 13SerGlxGlyAlaValMetCyslleLeuTyrPheHisLysArgProTrp3

2

2

16,03 59,8 6016,55 41,7 4216,06 91,5 927,94 36,3 362,95 9,7 100,2 0 0

1,22 3,9 42,22 6,4 63,46 9,9 102,30 4,6 51,811,558,281,293,75,1

3,74,0

21,02,7

12,78,9

44213

139

Cálculos con PM = 38702 con 16% carbohidratos(1) Residuos / cadena polipeptidiza(2) Determinado como met SO y CySO(3) Determinado espectrofotometricamente

2 3

Figura 16. Reporte del análisis de aminoácidos para la lectina de Salvia bogotensis (LSBo)

Fuente: [14, p. 352].

Page 40: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

40 • Introducción al análisis estructural de proteínas y glicoproteínas

El número de residuos de cada aminoácido se debe calcular con el por-centaje obtenido en condiciones de hidrólisis normales, es decir sin oxida-ción perfórmica, para el caso de la mezcla de ácido aspártico y asparagina (Asx) tendremos:

(32.510 × 5.42) /100 = 1762.04/115.089 = 15.31 residuos

y se debe reportar como un número entero, es decir 15 residuos de la mezcla Asx. Se hace el cálculo para los demás aminoácidos y se completa la tabla adjunta para dar el reporte final (figura 16).

Tabla 1. Análisis de aminóacidos

AA AA (g) Residuos AA

N.º Residuos AA Totales AA(g)

Asx 1762.04 15.31 15 1726.3

Ʃ=PM

Para deducir el número de puentes disulfuro debemos tener en cuenta el porcentaje determinado. Así, si tenemos cuatro residuos, habrán, pro-bablemente, dos puentes disulfuro. Finalmente, se deben tabular los datos y sumar los gramos de cada uno de los aminoácidos que nos darán la masa molecular de la proteína. Teniendo en cuenta la caracterización molecular de la proteína de estudio, con el reactivo de Ellman se puede evaluar si las cisteínas están libres. Los resultados arrojados de las electroforesis bajo condiciones reductoras y no reductoras, permiten establecer si los puentes disulfuro son intracatenarios o intercatenarios. Los datos finales se deben reportar como residuos de cada aminoácido por molécula y de esta forma se pueden hacer comparaciones con proteínas que estén relacionadas.

Se han desarrollado otras técnicas para cuantificar aminoácidos como la cromatografía líquida de alta resolución en fase reversa o empleando otros soportes. También se han empleado electroforesis capilar, cromatografía de gases y cromatografía líquida acoplada a un detector de masas. La mayoría de estas técnicas requiere que los aminoácidos sean derivatizados para hacer su detección u obtener derivados volátiles para hacer el análisis por gases. También se ha trabajado en la marcación de aminoácidos usando isóto-pos como 13C o etiquetado con 10-metil-acridona-2-sulfonilo (d0-masc) y d3-masc deuterado, con el objetivo de mejorar la detección de algunos aminoácidos por masas. Sin embargo, con estas técnicas solo se cuantifican unos pocos aminoácidos. Por otra parte, se continúa haciendo el método de hidrólisis convencional acompañado de una digestión adicional asistida con microondas durante treinta minutos. Aminoácidos como el triptófano y la cisteína se pierden durante este proceso [15, 16].

Page 41: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura primaria de proteínas • 41

5.6. La determinación del aminoácido (aa)-N terminal se basa en la re-acción específica de algunos compuestos orgánicos con los grupos α-amino del aminoácido del extremo N-terminal para formar un derivado que se puede identificar fácilmente, ya que la cadena lateral se conserva, a dife-rencia de la reacción convencional con ninhidrina, en la que no es posible identificar el aminoácido. Algunos métodos se resumen a continuación:

5.6.1. Dinitroflurobenceno (dnfb): reacciona con el grupo α-amino del aminoácido del extremo N-terminal, para formar un dinitrofenil-derivado (dnp) del aminoácido (figura 17 A). La hidrólisis se hace en medio ácido y los demás aminoácidos de la cadena polipeptídica quedan como aminoácidos libres. La reacción no se realiza si el N-terminal está bloqueado. La detec-ción del derivado se puede hacer por cromatografía en capa delgada (tlc) o su separación, por cromatografía de intercambio iónico, entre otros métodos.

5.6.2. Cloruro de dansilo (dns-cl) (1-dimetilamino naftaleno 5 sulfonil-cloruro) (figura 17 B): es un método más sensible (1-5 ng) que el derivado obtenido con dnfb, rápido y simple, pero algunos derivados son lábiles como la prolina. Por cromatografía en capa delgada (tlc), algunos derivados son de difícil resolución, por ejemplo, arginina, histidina y ácido cisteico; sin embargo, se pueden emplear métodos cromatográficos para hacer la separación e identificación. También se puede obtener un dipéptido como N-terminal, debido a que los enlaces peptídicos son más resistentes cuando hay residuos hidrofóbicos. El cloruro de dansilo reacciona con las aminas primarias (entre ellos el grupo ε-amino de la lisina), dando como resultado

AO2N F H2 NCHCO

R

NHCHCO

R

HCO

(-HF)

3

NO2

O2N H2NCHCO

R

NHCHCO

R

H O3

NO2

Polipéptido acoplado

Mezcla de aminoácidosO2N HNCHCO

R

N

RNO2

H2 3H CHCO2

B H2

3C CH3

NNH CHCONHCHCO....

R1 R2pH 9.5 - 10

H3C CH3

N

2SO NHCHCONHCHCO....

R1 T 4

J

105°C, 18h

H3C CH3

NMezcla de aminoácidos

2SO NHCHCO H2

R1

Derivado

Figura 17. Determinación del aminoácido N-terminal. A: con 2, 4 dinitrofluorobenceno (dnfb) B: con cloruro de dansilo

Fuente: Capítulo 23. [17, p. 204].

Page 42: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

42 • Introducción al análisis estructural de proteínas y glicoproteínas

polipéptidos dansilados que posteriormente por hidrólisis ácida libera el aminoácido N-terminal dansilado y una mezcla de los demás aminoácidos. El derivado exhibe una intensa fluorescencia amarilla que puede identificarse por cromatografía con cantidades del orden de picomoles [17].

La determinación de la secuencia N-terminal se lleva a cabo con el méto-do más común, denominado la degradación de Edman, el cual es realizado con fenil isotiocianato (pitc) que reacciona con los grupos α-amino del ami-noácido N-terminal de las proteínas. La reacción se realiza en condiciones básicas suaves para formar el fenil tiocarbamilo (ptc) y, posteriormente, se hace una hidrólisis suave con ácido trifluroacético anhidro y se separa el derivado llamado feniltiazolina y el péptido (proteína), el cual tendrá un residuo menos de aminoácido. El derivado de feniltiazolina se extrae en medio orgánico y, por tratamiento con tfa al 20 %, se convierte en un derivado más estable, feniltiohidantoina (ptH) (figura 18 A). Este aminoá-cido-ptH puede identificarse por comparación con estándares conocidos,

R1

N C S NH2 CH C NH CH C

R 2

OpH 9.5

Piridina

PITC

NH C NH CH C NH CH C

R2

O

S

O(1)

R1

C NH CH C

TFA anhidro

C

NH

C S

H

R1

CH C

O

NH S

C

NHNH

CHNH3

R2

C

Polipéptido/Péptido

(2)

Feniltiazolina

(3)

OH

R1

CH C

O

N

CS

NHTFA 20%

3

Feniltiohidantoina - PTH

R1

CHC O

N

NH

SC

Péptido

ProteínaExtracción

FeniltiazolinaObtención conversión

Feniltiazolina Feniltiohidantoina-PTH

4PITC

Hidrólisis Acople

Lavado

5 6 7

3 1

2

A

B

IdentificaciónHPLC

Figura 18. Determinación de la secuencia N-terminal por la degradación de Edman

Fuente: Capítulo 26. [18, p. 245, 246].

Page 43: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura primaria de proteínas • 43

empleando cromatografía en capa delgada (tlc) o cromatografía liquida de alta eficiencia (Hplc), entre otros. Una de las diferencias más claras con respecto a las determinaciones del aminoácido N-terminal antes citadas es que permite determinar la secuencia de, por lo menos, veinte aminoácidos por medio de ciclos repetidos en los que se identifica el ptH liberado (figura 18 B). Hoy en día, esta técnica se ha automatizado y, por lo tanto, se ahorra tiempo y muestra.

Con técnicas automatizadas, la repetición de este método puede utilizarse para determinar la secuencia de hasta cincuenta aminoácidos, comenzan-do desde el extremo N-terminal. Por lo tanto, si se desea secuenciar una proteína, se hace la secuenciación de cada uno de los péptidos aislados de la fragmentación de la proteína.

Algunas de las características de la degradación de Edman se resumen a continuación:

• Presenta una alta eficiencia de la remoción del aminoácido del extremo N-terminal.

• Es un método automático o manual, los dos se diferencian en el número de ciclos/día.

• Se presentan pocas pérdidas del péptido (proteína) por cada ciclo, si es una técnica automatizada.

• Se puede realizar el análisis en forma sólida si la proteína está muy pura.

• Puede detectar aminoácidos naturales, pero no funciona bien con aminoácidos modificados.

• Si el N-terminal está bloqueado, no se da la reacción. • Se pueden secuenciar entre diez y treinta aminoácidos, depen-

diendo de la secuencia y de la cantidad de material.• No permite estudiar modificaciones postraduccionales.• El porcentaje de eficiencia de la reacción es del 15 %.• La serina y la treonina se deshidratan y, algunas veces, se produ-

cen reacciones laterales.• Los ciclos se pueden demorar entre treinta minutos y una hora,

si es un método automatizado.

El método fue optimizado gracias a la propuesta de Matsudaira [19], trabajando con cantidades muy pequeñas de proteína. La transferencia de la proteína se hace sobre una membrana de polivinildifluoruro (pvdf), la cual es inerte y no interfiere en el proceso. También se debe evitar el uso de solventes que bloqueen el N-terminal durante la transferencia, por ejemplo, el ácido acético. Se pueden procesar bandas de 10 picomoles para el aná-lisis y si es posible entre 40-60 pmoles, obtenidos de varias transferencias.

La determinación con dabitc (4-N, N-dimetilazobenceno-4´isotiocianato) es otro método que se emplea para establecer la secuencia N-terminal. En

Page 44: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

44 • Introducción al análisis estructural de proteínas y glicoproteínas

esta, el proceso es evidenciado por los cambios de color de los complejos que se forman durante la reacción, se manejan, básicamente, los mismos principios que la degradación de Edman y la detección de cada uno de los derivados se puede hacer por cromatografía en capa delgada en dos dimensiones o Hplc en fase reversa (figura 19). Por otra parte, las amino-peptidasas son exoenzimas que hidrolizan secuencialmente el aminoácido N-terminal y se han empleado de modo análogo para determinar la se-cuencia N-terminal, pero este método enzimático no es tan común como la degradación de Edman [20].

La falta de identificación de la secuencia N-terminal debe tomarse como un dato provisional ya que no es una evidencia concluyente. Por lo general, se debe desnaturalizar la proteína antes o durante el análisis, para evitar la falta de reacción por impedimento estérico del N-terminal con las proteasas o los reactivos. Una de las modificaciones postraduccionales más comunes que bloquean el N-terminal se presentan cuando hay acetilación, debido al uso de los ácidos carboxílicos. Además, en las proteínas de origen bacte-rial el primer aminoácido se encuentra formilado. También se presentan

3CH

CHCHN N N N C S NH

R R R

CH CHNHC C CNH

O O O3

2

21 3

PH 8-10Piridina 50%DABITC

Color Púrpura

3CH

CHCHN N N NH C NH

R R R

CH CHNHC C CNH

O O O3

21 3

S

TFA anhidroH +

DABITC - péptidoColor Azul

N3CH

CHN N N N C

3

S

+ +CH R1

C

O

CH C NH CH C

R R

O O

NH

2 3

3+

DABITC - aminoácidodiluidoH+ Péptido/proteína

3CH

CHN N N N C

3

CH

R1N

O

C

S

HDABITC - aminoácido

Color rojo

Figura 19. Determinación de la secuencia N-terminal con dabitc

Fuente: Capítulo 25. [21, p. 235].

Page 45: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura primaria de proteínas • 45

procesos de ciclización intramolecular del extremo amino terminal con el grupo γ-carboxilo. Esta última modificación se encuentra naturalmente o se forma durante el aislamiento del péptido o durante la secuenciación de Edman. Este proceso se puede devolver por tratamientos con enzimas como pronasa, piroglutamato aminopeptidasa o por métodos químicos con BrCN. La detección de la formilación y la acetilación se hace con el mismo método. Se hace una hidrólisis ácida y luego una cromatografía de gases para identificar el ácido carboxílico. Otras formas de identificación incluyen el tratamiento con hidrazina y la posterior identificación de los derivados también por cromatografía de gases.

Hoy en día, los métodos para la determinación del extremo N-terminal se han optimizado y se basan en técnicas de marcaje, que permiten ha-cer la purificación del péptido N-terminal por cromatografía de afinidad con soportes o nanopartículas y posterior determinación de la secuencia por espectrometría de masas. Lo anterior significa que es posible hacer la determinación simultánea de la secuencia N-terminal de una mezcla de proteínas [22-24]. Más adelante hablaremos de los conceptos básicos de la espectrometría de masas y su utilidad en la caracterización de proteínas.

5.7. Para la determinación del aminoácido C-terminal, a diferencia de la determinación de la secuencia N-terminal, no se dispone de un proce-dimiento químico similar a la degradación de Edman, sin embargo, este análisis se puede llevar a cabo con el uso de carboxipeptidasas.

Las carboxipeptidasas son exopeptidasas que catalizan la hidrólisis de los aminoácidos C-terminales, a diferentes velocidades. Esto implica que, debido a que se presentan diferencias en susceptibilidad por los enlaces peptídicos, se debe realizar un análisis cinético. Si estas enzimas hidroliza-rán todos los residuos de aminoácidos a la misma velocidad, cualquiera que fuera su identidad, entonces se podría seguir el curso de la aparición de los diversos aminoácidos en la mezcla de reacción, para determinar la secuencia C-terminal. Sin embargo, si el segundo aminoácido fuera liberado a una velocidad mucho mayor que el primero, ambos aminoácidos aparecerían al mismo tiempo. De hecho, el uso de estas enzimas en forma individual o como una mezcla arroja unos pocos residuos del extremo C-terminal.

Las carboxipeptidasas provienen de diversas fuentes biológicas (hongos, levaduras, microbios, animales y plantas superiores) y están disponibles comercialmente. Bajo condiciones desnaturalizantes son activas y se reco-mienda la desnaturalización previa del sustrato (proteínas) para mejorar su función proteolítica. Los enlaces Pro-X no son hidrolizados por las carboxi-peptidasas A y B, esta es la razón por la que se emplean frecuentemente métodos químicos. Algunas características de estas enzimas se resumen en la tabla 2 y, a continuación, se enumeran los problemas en la identificación del C-terminal con estas enzimas:

Page 46: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

46 • Introducción al análisis estructural de proteínas y glicoproteínas

• La velocidad de remoción es diferente, por ejemplo, cuando son cercanas, como en el caso de leucina y fenilalanina (-leu-phe-cOOH), remueven los dos residuos; su actividad depende de la suscep-tibilidad por el enlace, lo que incluye el aminoácido adyacente.

• Si en la secuencia hay dos residuos adyacentes del mismo aminoá-cido, se pierde un aminoácido en la determinación, por ejemplo, leu-Asn-Asn-cOOH.

• Cuando la velocidad de hidrólisis es muy lenta, se deben ajustar las condiciones de reacción y realizar un análisis cinético con una mezcla de carboxipeptidasas para mejorar la determinación [25-27].

Tabla 2. Características de las carboxipeptidasas para determinación del C-terminal

Enzima Actividad Especificidad

Carboxipeptidasa A Las condiciones de pH aumentan o disminuyen la susceptibilidad de

la enzima:pH 5.6: promueve la liberación Asp

y Glu y Sccys.pH alcalino: promueve la liberación

His.pH 7.2: la hidrólisis es más rápida en condiciones desnaturalizantes (0.1 %sds, 6 M urea) es activa.

Rompe el enlace en una variedad de residuos, pero exhibe preferencia

por los aminoácidos aromáticos e hidrofóbicos. Tiene una menor

susceptibilidad por residuos de Gly, aniónicos (Glu, Asp, ScCys), Lys,

Arg y Pro en menor extensión. La presencia de prolina retarda la libe-

ración del residuo adyacente.

Carboxipeptidasa B pH óptimo = 9.0 Hidroliza residuos de Lys, Arg, ornitina y Cys alquilada con

Etilenimina (S-aminoetilcisteina). La presencia de prolina retarda la liberación del residuo adyacente.

Carboxipeptidasa Y Las condiciones de pH aumentan o disminuyen la susceptibilidad de

la enzima: pH 5.5 - 6.5: hidroliza aminoácidos

ácidos.pH 7.0: hidroliza aminoácidos bási-cos más lentamente y aminoácidos

neutros.

Hidroliza todos los residuos de aminoácidos. La presencia de glici-na retarda la liberación del residuo

adyacente

Carboxipeptidasa C pH óptimo = 3.5 Hidroliza la mayoría de los aminoá-cidos, incluyendo prolina.

Fuente: Elaboración propia con información de [27, 28, 29, 30, 31].

Los resultados de la hidrólisis se pueden analizar por cromatografía en capa delgada antes o después de la dansilación de los animoácidos libres.

Las digestiones se realizan con carboxipeptidasa Y, la cual tiene un ampilio espectro de hidrólisis, incluyendo la prolina. Sin embargo, algunas veces las condiciones de hidrólisis no permiten obtener una secuencia que se pueda

Page 47: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura primaria de proteínas • 47

interpretar. Las exopeptidasas se pueden utilizar en conjunto, para obtener fragmentos del C-terminal, que se pueden monitorear por espectrometría de masas. En este caso, se determinan las masas moleculares de los péptidos y, por diferencia de masa, se deducen la identidad del aminoácido y, por lo tanto, la secuencia de los péptidos (tabla 3). Sin embargo, la identificación de cada uno de los aminoácidos liberados, algunas veces se dificulta debido a la cinética de liberación de cada una de las carboxipeptidasas. También existen aminoácidos que tienen la misma masa molecular, por ejemplo, leucina/isoleucina, lisina/glutamina. Técnicas recientes incluyen marcaje para determinar la secuencia C-terminal compatibles con espectrometría de masas (ms) [32].

Tabla 3. Datos de determinación de la secuencia con carboxipeptidasas y espectrometría de masas

Péptido(secuencia)

Masa molecular calculada

(Da)

Masa molecular experimental

(Da)

Diferencia de masa (aminoácido)

(Da)

RPKPQQFFGLM 1347 1349

RPKPQQFFGL 1216 1218 131 (M)

RPKPQQFFG 1103 1105 113 (L)

RPKPQQFF 1046 1049 56 (G)

RPKPQQF 899 901 148 (F)

RPKPQQ 752 754 147 (F)

Fuente: [33, p. 67].

La hidrazinólisis se emplea por las complicaciones que trae el uso de las carboxipeptidasas, es un método clásico y confiable en el cual los gru-pos carbonilo del enlace peptídico reaccionan con hidrazina para formar derivados [34]. Los grupos ácidos que están en las cadenas laterales no son derivatizados ni el aminoácido C-terminal, este último es liberado sin modificación y puede ser separado de los demás residuos modificados. Sin embargo, aminoácidos como arginina y cisteína son inestables bajo con-diciones de hidrazinólisis y se recuperan como ornitina y ácido cisteico, respectivamente. La reacción, algunas veces, es incompleta y se obtienen dipéptidos o tripéptidos terminales, también se obtienen artefactos por descomposición de los derivados de hidracina. Posteriormente, se hace la identificación del aminoácido por técnicas analíticas (figura 20).

Page 48: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

48 • Introducción al análisis estructural de proteínas y glicoproteínas

Aminoácido C-TERMINAL

NH2

R1 CH

OC

HN

CHR2

OC

NH2NH2

HN

R3 CH

COOH

NH2

R1 CH

OC

NHNH2

NH2

R2 CH

OC

NHNH2

NH2

R3 CH

COOH

Mezcla de aminoacilhidracinas

Figura 20. Reacción de hidrazinólisis para la determinación del C-terminal

Procesos de fragmentación de proteínasPara determinar la estructura primaria de una proteína, esta se debe frag-mentar en péptidos que puedan ser secuenciados desde el N-terminal hasta el C-terminal. Por lo tanto, las proteínas deben ser cortadas en sitios específicos y los fragmentos resultantes, secuenciados independientemente. Durante el proceso se emplea más de un agente para romper la molécula, ya sea una enzima o un agente químico, los péptidos (fragmentos) secuen-ciados se superponen para obtener la secuencia completa de la proteína.

Para llevar a cabo los procesos de fragmentación se deben tener en cuenta los siguientes parámetros:

• El número de sitios en los que pueda ocurrir la hidrólisis y las modificaciones selectivas que se puedan presentar. La selectivi-dad depende de los aminoácidos que están en baja cantidad en la proteína. De esta forma, el fraccionamiento de los péptidos y su alineación se simplifica.

• La especificidad del agente y la eficiencia de reacción.• Los sitios donde se hacen cortes en la molécula, para generar un

nuevo N-terminal o C-terminal de las regiones internas de la pro-teína. La molécula se puede fragmentar por el enlace del carbono α, del grupo α-amino (derecha) o del α-carboxilo (izquierda); lo demás es operacional (figura 21).

Page 49: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura primaria de proteínas • 49

Grupoa -COOH

A B C D

Grupoa-amino

Carbonoa

H

1

H

H

C

O

C C

R

N a C

A:B:C:D aminoácidos

O

N

Figura 21. Sitios de clivaje de una proteína

Métodos enzimáticos

Existe un amplio rango de endopeptidasas aisladas de microorganismos que son una excelente fuente de estas enzimas. Estos métodos son selec-tivos y específicos dando como resultado la generación de fragmentos de, aproximadamente, treinta residuos de aminoácidos. Adicionalmente, no se generan reacciones laterales que, sin embargo, son de baja eficiencia. Se han estudiado las condiciones de estabilidad de las proteasas en condiciones desnaturalizantes y el patrón de fragmentación deseado.

Las reacciones se detienen por calentamiento o por la adición de inhi-bidores irreversibles. Durante el proceso de degradación se puede seguir realizando un mapa peptídico, por diferentes técnicas. En la tabla 4, se presentan las características de algunas de las enzimas que se han empleado para realizar hidrólisis de proteínas para estudios de secuenciación.

Las enzimas que más se han empleado como métodos primarios de fragmentación son la tripsina y quimotripsina, las cuales rompen por el α-carboxilo del enlace peptídico. Mediante proteólisis limitada y ajustando las condiciones, como los tiempos de la reacción, las endoproteasas menos específicas pueden proporcionar fragmentos útiles.

Tripsina

Con esta enzima se puede obtener un grupo completo de péptidos, que se denomina la huella peptídica, y es posible identificar una proteína. La tripsina rompe, preferentemente, el extremo carboxilo por arginina, lisina y S-aminoetilcisteína. En incubación prolongada puede ocurrir un clivaje anómalo sobre residuos aromáticos como tirosina, lo cual es atribuido a contaminación con quimotripsina. La presencia en los alrededores de re-siduos aniónicos reduce la eficiencia de hidrólisis y los enlaces peptídicos en los que hay prolina son más resistentes. Se debe alternar la adición de la enzima con tiempos más largos de incubación. Para evitar autolisis, se

Page 50: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

50 • Introducción al análisis estructural de proteínas y glicoproteínas

emplea la enzima grado proteómica la cual tiene metilados los diez resi-duos de lisina que están en su estructura y, por lo tanto, no sufre autolisis.

Tabla 4. Endoenzimas para proteólisis de proteínas

EnzimaActividad

Amplia especificidad: no hay hidrólisis preferencial por ningún aminoácido

Bromelaina Masa molecular 33 kDa, está presente en las romeliáceas en el fruto y el tallo, es estable a 70 0 C durante 1 hora.

Pronasa Es una mezcla de proteasas cuando se requiere extensiva degradación del pépti-do o la proteína.

Pepsina A pH 3.0 tiene una amplia especificidad rompe la mayoría de los enlaces pépti-dicos al interior de la proteína.

Papaina Masa molecular 21 kDa, trabaja a pH ácido y es termostable.

Enzima Hidrólisis por el extremo carboxilo

Subtilisina–bnp

Masa molecular de 30 kDa, los procesos de su purificación se han limitado a la obtención de la proteína básica, estabilizada por metales especialmente Ca+2. No es afectada por agentes como edta, ICH2COO, Hg+2. Es estable entre pH 6-11 y

activa en sds 1 % y urea 8M.Rompe preferencialmente Leu, CySH, Glu, Gln o entre dos aminoácidos

hidrofóbicos.

Proteasa V8 Preferencia por el acido glutámico y en menor extensión ácido aspártico, es activa entre pH 7-8.

Elastasa Tienen preferencia por residuos no polares como alanina, glicina, valina y leuci-na y en menor extensión por serina. Es activa a pH 8-8.5.

Tripsina Rompe preferentemente arginina, lisina y S-aminoetilcysteina. Es activa en bicarbonato de amonio (NH4CO3) pH 8.5 a 37oC y en presencia de urea 4M.

Quimotripsina Presenta una amplia especificidad por residuos aromáticos e hidrofóbicos, feni-lalanina, triptófano, tirosina y leucina en orden de susceptibilidad. Periodos de incubación extensos pueden hidrolizar metionina e histidina; residuos vecinos

pueden influenciar la velocidad de clivaje, en presencia de prolina se debe exten-der el tiempo de hidrólisis para obtener un máximo de péptidos requeridos.

Termolisina Se emplea en la ruptura secundaria de péptidos trípticos o quimotrípticos o de los que provienen de la hidrolisis con BrCN. Buen agente para estudio de puentes disulfuro y cuando hay muchos residuos básicos, ya que no los ataca. Su utilidad reside en que ataca muchas proteínas resistentes a proteasas. Es

termoestable y activa entre 60-80 0C, 8 M urea, 0.05 % sds, activa entre pH 7-8. En orden de susceptibilidad, hidroliza leucina, fenilalanina, alanina, valina,

metionina; otros residuos como histidina, tirosina, alanina, asparagina y las secuencias X-Pro en menor extensión.

Hidrólisis por el extremo amino

Armillaria mellea

Muestra preferencia por lisina (X-Lys) y una menor especificidad por X-Arg.

Fuente: Elaboración propia con información de [38, 39].

Page 51: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura primaria de proteínas • 51

También, durante la hidrólisis, se pueden generar dipéptidos y aminoáci-dos, dependiendo de la secuencia (Lys-Lys; Lys-Arg-; Arg-Lys-; Arg-Arg-). La especificidad puede ser restringida modificando las lisinas o los residuos de arginina de forma reversible o irreversible (figura 22). Por ejemplo, la carga positiva de la lisina se elimina por tratamiento con anhídridos dicar-boxílicos, lo que forma un derivado con carga negativa del grupo ε-amino de la lisina que la tripsina no reconoce. Después de la hidrólisis tríptica del polipéptido, la lisina puede desbloquearse con ácido diluido y realizar de nuevo la digestión de los nuevos péptidos con tripsina (figura 23).

H2N H2N H2N

H2N Arg Lys Lys Arg Arg Lys CO2H

(1)

X HN HN

HN Arg Lys Lys Arg Arg Lys CO2H

HN XX XE

(2) Digestión con tripsina y separación péptidos

X

HN Arg HN HN

Lys Lys Arg

X X Arg

Lys CO2H

HN X

(3) Desbloqueo de grupos

ArgH N2 Arg

Lys Lys Arg

H N2 H N2

Lys CO2H

H N2

(4) Digestión con tripsina y separación de péptidos

ArgH N2 Lys

H N2

Arg CO2 H

Lys

H N2

Arg Lys

H N2

Bloqueo de Lisina y grupos -aminoe

ee

eee

e

Figura 22. Ilustración esquemática de la fragmentación de un péptido con tripsina. Antes y después del desbloqueo de los grupos ε de la lisina

Fuente: [35, p. 63].

Page 52: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

52 • Introducción al análisis estructural de proteínas y glicoproteínas

La arginina también se puede bloquear de forma irreversible con nitro-malondialdehído y, después de la digestión, con tripsina los nuevos péptidos pueden ser reducidos selectivamente con NaBH4, para obtener un nuevo derivado que es susceptible a un nuevo ataque tríptico [35]. Recíprocamente la cisteína puede modificarse por β-haloamina y, de este modo, se obtiene un residuo con una carga positiva que se somete a fragmentación con trip-sina. Las reacciones mencionadas permiten ampliar la especificidad y el uso de la tripsina. La tecnología de producción de las proteínas recombinantes ha mejorado la especificidad de las enzimas y se emplean hoy en día para hacer estudios de proteómica [36]. En la tabla 5, se presenta una lista de enzimas para secuenciación de proteínas.

O

1

O

O

R CC

CC2R

H N2 RpH 8-9

O

1

O

R CC

CC2R

O

NH R

O

1

O

R CC

CC2R

OH

NH R ácido

pH

O

1

O

O

R CC

CC2R

2H RN

O

1 O

O

R CC

CC2R

2H O

O

Figura 23. Reacción de los grupos ε de la lisina con anhídridos carboxílicos

Fuente: [35, p. 65].

Tabla 5. Endoenzimas recombinantes para proteólisis de proteínas

Enzimas (secuenciación)

Especificidad pH pm(kDa)

Tripsina (proteómica) Arg, Lys 8.0 23.3

Asp-N(Flavobacterium menigosepticum)

Asp, Ac Cisteíco

6-8.5 24.5

Glu-c(Staphylococcus aureus Protease V8)

Glu, Asp 4-7.8 29.0

Page 53: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura primaria de proteínas • 53

Enzimas (secuenciación)

Especificidad pH pm(kDa)

Lys-C (Achromobacter lyticus)

Lisina 8.5 28.0

Arg-c (clostripain) Arg, Lys-Lys 7.5-8.5 26.5

Las flechas indican si la ruptura es por el extremo N-terminal o C-terminal Fuente: elaboración propia con información de [7, 38, 39].

Mapeo peptídico

La determinación de la secuencia de una proteína es un proceso que re-quiere exactitud y consume tiempo. Una vez se tiene la estructura primaria se puede hacer con mayor facilidad la determinación de la secuencia de otra proteína relacionada, de una mutación en un aminoácido o de una modificación química. Con una combinación de técnicas cromatográficas y electroforesis de los digeridos parciales de la proteína se puede realizar un mapeo o huella peptídica, en el que los fragmentos peptídicos que incorpo-ran las variaciones de los aminoácidos migran hacia diferentes posiciones, por lo tanto, es posible hacer comparaciones de las huellas.

Los péptidos variantes pueden eluirse y puede ser determinada su se-cuencia para establecer las diferencias entre las estructuras primarias de la proteína original y de las variantes. En 1949, Pauling y colaboradores [40] formularon la hipótesis correcta sobre la anemia de la célula falciforme, que se descubrió como una enfermedad molecular o el resultado de la presencia de una hemoglobina mutante.

La hemoglobina es una proteína cuya función principal es el transporte de oxígeno en la sangre, es un tetrámero a2b2 y está contenida en los eri-trocitos, los cuales son células bicóncavas flexibles que se deslizan a través de los vasos capilares cuyo diámetro es inferior al suyo. En los individuos que padecen anemia falciforme, los eritrocitos adoptan una forma similar a una luna creciente irregular. La forma falciforme aumenta la rigidez de los eritrocitos, lo cual obstaculiza su circulación libre por los capilares y, por lo tanto, evidencia una deficiencia en el transporte de oxígeno. Pauling y colaboradores mostraron mediante electroforesis que la hemoglobina nor-mal (HbA) posee una carga aniónica que es dos unidades más negativas que la de la hemoglobina (HbS) de la célula falciforme. Posteriormente, en 1956, Vernom Ingram desarrolló la técnica del mapeado peptídico con el fin de encontrar la diferencia entre HbA y HbS. Las huellas de los digeri-dos trípticos de las dos proteínas revelaron que las subunidades alfa (α) son

Page 54: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

54 • Introducción al análisis estructural de proteínas y glicoproteínas

idénticas pero que las subunidades beta (β) difieren en un péptido tríptico [41]. Los estudios de secuenciación indicaron que esta diferencia se debe a la sustitución de un ácido glutámico (Glu), el cual está en la sexta posición de cada cadena β de HbA por un residuo de valina en HbS, interpretándo-se de este modo la diferencia de carga observada por Pauling. A partir de este estudio, se demostró por primera vez que una enfermedad hereditaria procedía de un cambio en un aminoácido específico en una proteína. Esta mutación es la causa de que HbS se agregue y forme filamentos del tamaño y rigidez capaces cambiar la forma de los eritrocitos.

Hoy en día, la determinación de la huella peptídica es una técnica de rutina para la identificación de proteínas que sigue la misma metodología, en la cual una proteína desconocida se somete a digestión enzimática con una endoproteasa para producir una mezcla depéptidos. La separación y purificación de los péptidos y secuenciación se puede realizar por croma-tografía líquida acoplada a espectrometría de masas o por Hplc.

La masa exacta de estos péptidos se determina por análisis de espec-trometría de masas y se compara con las masas teóricas de los péptidos, obtenidos a partir de la digestión in silico de las proteínas almacenadas en las bases de datos. La mejor coincidencia es identificada por el software. La principal ventaja de este método es que no depende de la secuenciación para la identificación de proteínas y su limitación es que requiere que las bases de datos tengan la proteína que ya está caracterizada en otro orga-nismo o que el genoma de la especie del cual proviene esté secuenciado. En la figura 24, se presentan dos mapas peptídicos, hipotéticos por croma-tografía líquida (A) y por separación en cromatografía en capa delgada en dos dimensiones (B).

Cro

mat

ogr

afia

asc

end

ente

bu

tan

ol:

pir

idin

a : a

c ac

étic

o :

H O

(6:

5:1:

4)

Absorbancia

T 7

T 1

4T

140

+ T

140

T12

T 1

0

T 3

T 2

0 -

T 2

1T

15

T 1

9T

8T

17

- T

18

- T

19

T 2

+ T

10

- T

19

T 1

T 1

1T

10

o 2

T 4

T 1

0

T 6

- T

16

T 9

300

200

100

0

10 20 30 40 50 60 70 80 90

Tiempo ( min )electroforesis

pH : 3.5 ( ac. formico: ac acético : agua )( 15: : 80 : 5)

A B

Figura 24. Mapa peptídico. A: Proteína X. Columna: C18 150 × 4.6 mm. Fase móvil A: 0.1 % Ácido trifluoro acético (tfa). Fase móvil B: 0.08 % tfa en acetonitrilo. Gradiente 0-60 %. B: Mapa peptídico hipotético, cambio en la movilidad de un péptido (flecha)

Page 55: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura primaria de proteínas • 55

Métodos químicos

Se han evaluado varios métodos de hidrólisis química, pero muy pocos son selectivos y específicos debido a que los enlaces peptídicos son resistentes a los reactivos. Sin embargo, son un complemento de los métodos enzi-máticos y algunos rompen el enlace N-Cα donde no existen enzimas que hagan dicha hidrólisis. Estos métodos se caracterizan porque los aminoáci-dos son modificados para dar un grupo saliente y no se obtienen al final del proceso, se tienen péptidos con el aminoácido siguiente o el anterior. De hecho, algunas veces el aminoácido queda incorporado como un derivado dentro del péptido y se generan péptidos con un nuevo C- o N- terminal. A continuación, se presentan algunos de los métodos químicos, las modi-ficaciones y se describe cómo se realiza la fragmentación de la proteína.

• Las modificaciones a nivel de serina, treonina y cisteína produ-cen un grupo saliente por β eliminación y la ruptura a nivel del Cα en medio básico; al final del proceso se generan dos péptidos con un N-terminal desbloqueado y uno bloqueado en forma de piruvato (figura 25).

Péptido N-terminalAnterior aa

CH2R

O

C C N

HO

C a

Piruvil péptido-piruvato

R´´= OH, H

H

N CCO

H

N

O

CaC

CH2

a

H H

N CCO

CH2

xxGrupo saliente

eliminación

O

C

H

N C

CO

HN 2

+

+

Figura 25. β-eliminación: modificación a nivel de Ser, Thr y Cys

Para la fragmentación de la proteína por el aminoácido cisteína se dan los siguientes pasos (figura 26):

1. La reacción de modificación se realiza en medio ácido (pH = 5.5-6.0) para dar un derivado. Se resalta el Cα, sobre el cual se da la ruptura N-Cα.

2. La β-eliminación se lleva a cabo en medio básico, lo que pro-duce la salida del grupo SX-, en la figura 26 A se observan los sustituyentes para cada aminoácido. La formación del derivado promueve la formación de un doble enlace que debilita la unión N-Ca (figura 26 B).

Page 56: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

56 • Introducción al análisis estructural de proteínas y glicoproteínas

3. En medio ácido, se produce la ruptura a nivel del carbono α, para dar como resultado un péptido N-terminal y un piruvilpéptido.

4. Si en lugar de realizar la hidrólisis en medio ácido, se adiciona Br2 a pH < 7.0, se produce una adición del bromo sobre el doble enlace y, en medio básico, se produce una hidrólisis para obtener un péptido N-terminal y un piruvilpéptido.

5. A partir de piruvilpéptido la reacción continúa en medio oxidante y se obtiene una molécula de piruvato y un nuevo péptido N-terminal.

X

NO2

NO2

O

NO2

NO2

O NO2

(CH )3 2

Ser:X

CH3

O

SO Cl2+ -

(C H ) 256

O

P

O

O

R

2

NC C C

CH

OO

N

H

SH

X

pH 5.5 - 6.0R

2

NC C C

O

CH

O

N

H

S

H

O

X

- eliminación

H

pH=2R C 3NH N

+H 2CH C C

O O O

R

2

NC C C

O

CH

N

HO

H

SX

Br2

pH 7

pH 10

R

2

NC C C

O

CH

N

HO

H OH

OH

pH 10R

2

NC C C

CH

O

N

HO

H Br

Br

PéptidoN-terminal Piruvil - péptido

H

PéptidoN-terminal Piruvil-péptido

R C 2NH OH

O

N2CH C C

O O

O2 2

OHH3

CH C COO

O

2 N R

PiruvatoPéptido N-terminal

OO

OH

Figura 26. β-eliminación: modificación a nivel de cisteína

Por medio de esta reacción, se obtienen dos péptidos N-terminal con los aminoácidos adyacente y posterior al residuo de cisteína (este último desaparece). Las condiciones y el agente alquilante varían dependiendo de la reactividad del aminoácido azufrado y de la presencia de cistina, lo que implica usar un medio menos básico para evitar ruptura del puente disulfuro por β-eliminación. La reacción se puede seguir espectrofotométricamente por la aparición del piruvato.

Algunos ejemplos, de la eficiencia de la hidrólisis se evidencian con estudios sobre la enzima arnasa y quimotripsina dinitrofeniladas, en la que la β-eliminación tiene una eficiencia del 95 % y ocurre en 45 minutos. Este método permite demostrar la presencia de serina en el sitio activo de la quimotripsina por inactivación de la enzima. La ruptura hidrolítica en medio ácido separa, parcialmente, los enlaces aspartil y el medio oxidante oxida triptófano, tirosina o histidina.

Page 57: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura primaria de proteínas • 57

A diferencia de la β-eliminación la modificación a nivel de cistina por el método de Catsimpoolas [42,43], se realiza en condiciones más suaves, entre pH 7-7.5 y es específico (figura 27). Este método utiliza el anión cianuro (CN-) y lo podemos resumir así:

1. Se rompe el puente disulfuro por la interacción del anión cianuro con uno de los átomos de azufre, el cual depende del aminoácido vecino al residuo de cisteína en cada cadena. Posteriormente, se da la formación de un ciclo de iminotiazolidina y el debilitamiento del enlace peptídico e hidrólisis a pH 9.0.

2. Luego de la hidrólisis se obtiene un polipéptido C-terminal y un residuo amino terminal iminotiazolidina 4-carboxilo en el derivado cianocisteína.

3. En medio ácido a 100 0C se rompe el enlace peptídico y se ob-tiene un nuevo péptido N- terminal.

H

N C C N R2

CH2

SH

NH S

H2

O

C

H

C C

CH

OH

N N R 1

H

S

C8

N

C

2

O

H

C N R1CC NO

C CH2O

C

O

OH

H

100°C

H H H

C CN N R1

C CH2O

N S

H H

C COOHN

R1C CH2

N S

H N3

imonitiazolidinaPéptido N-terminal

Péptido C-terminal

C

H

C C

CH

OH

N N R 1

H

S

S

2

H C

NC C C N R 2

OO

CN

pH 7-7.5

Figura 27. Modificación a nivel de cisteína con cianuro de potasio (KCN)

Algunos ejemplos de la efectividad del mecanismo se observaron con el péptido glutatión disulfuro (gssg), oxitocina, la enzima arnsa y la proteína albumina bovina (bsa), entre otros, los cuales dieron los productos espera-dos, demostrando que es un método suave y selectivo. Una modificación del método se puede llevar a cabo realizando inicialmente la reducción del puente disulfuro, con ditiotreitol y luego se adiciona el reactivo de Ellman (dntb) para obtener de nuevo el puente disulfuro y continuar el mecanismo siguiendo el método de Catsimpoolas (figura 28).

Page 58: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

58 • Introducción al análisis estructural de proteínas y glicoproteínas

Figura 28. Modificación a nivel de cisteína con cianuro de potasio y el reactivo de Ellman (dntb)

Con el reactivo de Degani, la ruptura se hace solo a nivel de cisteína sin alterar la cistina para producir un derivado S-cianocisteína pequeño sin carga. Posteriormente, se forma el ciclo de iminotiazolidina y la rección de fragmentación sigue el mecanismo propuesto por Catsimpoolas (figura 29). Este método ha demostrado ser muy útil en estudios de secuencia y función de tioles [35].

Con el método de Patchkornich se lleva a cabo una ruptura específica en triptófano, histidina y tirosina, en este último caso se debe bloquear el grupo OH por dinitrofenilación, acetilación o carboxilación. El mecanismo propuesto aprovecha el sistema de dobles enlaces en el que se genera una diferencia de densidad electrónica o dipolo (figura 30). En medio ácido se genera ion bromonio (Br+) con N-bromo succinimida (nbs), N-bromoa-cetamida (nba) o el reactivo bnps Skatole (2-2nitrofenilsufonil)-3-3 metil 3 bromoindol. Se genera un intermediario inestable con un doble enlace transitorio en el enlace peptídico y, posteriormente, una ruptura hidrolítica en medio ácido; se obtiene un péptido N-terminal. Con nbs continúa la oxidación del péptido en el extremo C-terminal, el cual queda bloqueado.

Como el triptófano es poco abundante en proteínas, es un buen método para hacer rupturas selectivas en las que se generen pocos péptidos o como un método secundario de hidrólisis química. En el caso de la tirosina, se requie-ren condiciones más drásticas y, por lo tanto, se debe proteger el triptófano realizando una acetilación previa con ácido acético al 50 %, durante 6-8 horas.

Page 59: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura primaria de proteínas • 59

Figura 29. Modificación a nivel de cisteína con el reactivo de Degani (2-Nitro-5-tiociano ácido benzoico)

O

C

O

C C

N HH

NC C 1R

O

H+

+Br

NBSNBA

BPNS-SCATOL

CO

C C

N H

H

NC C 1R

OBrN

OC C N C

H

NC C 1RO

BrN

O

H

+

-N

O

C C N C

OCON

HOH

+Br

H O2

Péptido N-terminal

+H N3 C R1

O

O

NBSO

C C N C

OCO

N O

O

NBS : N-BromosuccsinimidaBNPS : (2-2 Nitrofenilsulfonil)-3-3 Metil 3 Bromoindol

Figura 30. Modificación a nivel de triptófano, método Patchkornich

Page 60: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

60 • Introducción al análisis estructural de proteínas y glicoproteínas

La hidrólisis con bromuro de cianógeno es el método químico más empleado, específico por ruptura donde hay residuos de metionina, un aminoácido escaso en proteínas y, por lo tanto, funciona como un método secundario para obtener un grupo de péptidos para superponer. Además, es altamente selectivo y específico. Por otra parte, se forma un derivado cuantificable donde hay un cambio de metionina por homoserina. Ha tenido múltiples aplicaciones en el trabajo de estructura de proteínas. El mecanis-mo de frgamentación se da de la siguiente manera (figura 31):

1. La reacción se lleva a cabo en condiciones ácidas muy suaves (0.1 N HCl) a temperatura ambiente o en ácido fórmico al 70 %. La proteína se desnaturaliza y, por lo tanto, se produce la ruptura en todos los enlaces en los que están los residuos de metionina.

2. Inicialmente, hay un ataque electrófilo del ion cianógeno (CN+) en medio ácido, al par de electrones del átomo de azufre, y se produce la reacción de eliminación del isocianato de metilo. In-mediatamente, se da la formación transitoria de un doble enlace peptídico, y un ciclo que debilitan el enlace peptídico.

3. Se forma un nuevo polipéptido con el N-terminal del aminoácido siguiente a la metionina un péptido con una homoserina en el extremo C-terminal. Los derivados metioninsulfona y metionin-sulfóxido no son clivados por este método.

H

N

H O

C C C N R1

CH2 H

CH2

S

CH3

CN+

BrCN

H+

Homoserina Lactona

Péptido N-terminalN R1H2

H

N

HO

C C C

CH2

H2

R O

O

C

H2O

HO

NCR C COO

H CH2

CH2

C-homoserina

OH

Isocianato de metiloH

N

HO

C C C R1

CH2

H2

R N

O

C

CH3SCNHO2

H

N

HO

C C C N R1

CH2

H2

R

O

C

H

CNS

CH3

Br (+)-

Figura 31. Modificación a nivel de metionina con BrCN

Page 61: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura primaria de proteínas • 61

La hidrólisis ácida parcial no específica es una alternativa para proteínas de limitada solubilidad, cuando no se puede emplear la proteasa V8 (Staphilococcus aureaus); sin embargo, el clivaje es mucho más extenso que con enzimas. La velocidad varía dependiendo de la naturaleza del aminoácido adyacente. La unión Asp-pro es más sensible a las condiciones ácidas o durante el clivaje con reactivos como el BrCN, mientras que la unión Asp-Leu (Valina) es menos sensible y requiere condiciones más drásticas. Esta hidrólisis se hace en ácido acético (CH3cOOH) al 10 %, pH = 2.5 y conteniendo clorhidrato de guanidinio 7 M, durante 24-96 h y a una temperatura de 40 °C.

Otros métodos químicos son selectivos por uniones con ácido glutámico, en los que se hace la activación del carboxilato de la cadena lateral para generar un intermediario activado, que es atacado por los electrones del nitrógeno (ataque nucleofílico) del enlace amido. Lo anterior lleva a la formación de piroglutamil (pGlu) que debilita el enlace peptídico y genera un péptido N-terminal y un fragmento C-terminal bloqueado por el piroglutamil (pGlu). Un enfoque similar para modificar la serina se da por medio de la reacción de su cadena lateral con N, N’ carbonato disuccinimidilo (dsc), para generar un intermediario activado. Un ataque nucleofílico intramolecular se da por los electrones del nitrógeno del enlace amido al grupo carboxilo activado para formar un intermediario cíclico uretano; la formación del ciclo lleva a que el enlace peptídico se rompa para generar un péptido N-terminal y un fragmento C-terminal bloqueado por el uretano cíclico (figura 32).

H

N

O

OH

NH Activación

H

N

O

NH

O

OO

O

O ON

H

Hidrólisis

N

O

O

O

N

O

O

HO H

NHN

O

OO

C C CC

C

C

CC

Figura 32. Modificación a nivel de serina con N, N’ carbonato disuccinimidilo (dsc)

Fuente: [44, p. 2].

Page 62: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

62 • Introducción al análisis estructural de proteínas y glicoproteínas

Fragmentación de la proteína

Como se mencionó previamente, para realizar la hidrólisis de la proteína se debe tener en cuenta la caracterización molecular de la proteína. Ini-cialmente, se puede hacer una revisión del análisis de aminoácidos para ver cuales están en baja proporción, por ejemplo, metionina, triptófano, cisteína. Es apropiado escoger un método enzimático o químico para generar pocos fragmentos, péptidos de 25-30 aminoácidos para realizar la secuenciación (manual/automática). También se puede generar un mapa peptídico para evaluar la complejidad del problema y tratar de reducir los problemas aso-ciados con mezclas complejas de péptidos pequeños. Inicialmente, se debe realizar un balance de materia en el que:

[∑ masa de los péptidos = masa polipéptido]

Se deben realizar mínimo tres digestiones por separado, por ejemplo, con tripsina, quimotripsina y proteasa V8, y generar péptidos solubles. En el siguiente ejemplo se propone determinar la estructura primaria de un péptido que tiene 38 aminoácidos. Los resultados experimentales arrojaron los siguientes resultados (figura 33):

1. Análisis de aminoácidos: en total hay 38 aminoácidos, en los que hay una (1) arginina, dos (2) lisinas y una (1) metionina.

2. Determinación del aminoácido N-terminal: la identidad del derivado obtenido con dinitrofluorobenceno (dnfb); mostró la cadena lateral del ácido glutámico.

3. Hidrólisis con tripsina: si se tienen dos (2) lisinas y una (1) arginina se espera obtener cuatro fragmentos, es decir n+1, n representa el número de residuos de lisina y arginina.

4. Hidrólisis con bromuro de cianógeno: el péptido tiene dos me-tioninas por lo que se espera obtener tres fragmentos.

5. Una vez se obtienen cada uno de los péptidos separados, se hace la secuenciación de cada uno de ellos, por ejemplo, utilizando la degradación de Edman o espectrometría de masas en tándem.

6. Finalmente, se hace la superposición de los péptidos para de-terminar la estructura primaria del péptido de 38 aminoácidos.

Para el fraccionamiento de los péptidos luego del proceso de hidrólisis, se pueden combinar los métodos cromatográficos basados en los diferentes principios de separación. Esto también se realiza con el fin de clasificarlos en péptidos largos, si tienen más de 25 residuos de aminoácidos, y peque-ños, si el número de residuos es menor a 25.

Muchos de los fragmentos peptídicos se agregan, precipitan o absorben fuertemente sobre materiales cromatográficos, lo que ocasiona, con frecuen-cia, que haya una pérdida de péptidos. Antes, el desarrollo de métodos que

Page 63: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura primaria de proteínas • 63

S S

Péptido

Análisis de aminoácidosResiduos/molécula

A

C

D

E

F

G

5

2

4

2

1

3

H 2

I 3

K 2

L

M

2

2

P 3

R 1

S

T

V

Y

2

1

1

2

Superposición de fragmentos y secuencia final

T-2 T-1 T-4 T-3

EGAAYHDFEPIDPRGASMALIKYLIACGPMTKDCVHSD

C-2C-1 C-3

N - C-terminalT-2

GASMALIK

T-3

T-1

T-4

EGAAYHDFEPIDPR

DCVHSD

YLIACGPMTK

Péptidos obtenidos con tripsina Péptidos obtenidos con BrCN

C-1

C-2

C-3

EGAAYHDFEPIDPRGASM

TKDCVHSD

ALIKYLIACGPM

Péptido

NO2

NO2

P

NO2

NO2

NH

2

CH

C O

R

HN

R CH

C O

1

2,4 dinitrofenilpéptido

NO2

NO2

NH

CH

COO

R1H+

2,4 dinitrofenilglutamico

1 2

3 4

Figura 33. Ejemplo de superposición de los péptidos de una proteína hipotética

Fuente: [45, p. 101].

permitieran separar satisfactoriamente una mezcla de péptidos constituía uno de los principales desafíos técnicos en la determinación de la secuencia de una proteína, esta era la etapa en la que se consumía más tiempo. La cromatografía líquida de alta resolución se ha convertido, en gran medida, en la técnica más empleada en la separación de los fragmentos peptídicos, como un procedimiento rutinario. Sin embargo, vale la pena mencionar brevemente algunos de estos métodos que son de ayuda en etapas iniciales de la separación.

Los péptidos mayores de 70 aminoácidos se deben someter a una nueva digestión. Para hacerlo, se puede realizar una precipitación fraccionada con sales, solubilidad a diferentes pH, solubilidad diferencial en detergentes o succinilación de péptidos para volverlos solubles. La filtración en gel es el método de purificación inicial. Para llevarlo a cabo, se puede emplear Bio-gel P4, P6, P10 (es una matriz de poliacrilamida), Sephadex G-50, G-25 (es una matriz de dextrano con entrecruzamiento de epiclorohidrina) o matrices que sean compatibles con solventes orgánicos y acuosos. El perfil cromatográfico nos da una idea de las masas moleculares de los péptidos y algunos parámetros como la absorbancia a 280 nm nos muestran que los péptidos contienen aminoácidos aromáticos. También se pueden hacer reacciones colorimétricas que permitan evaluar la presencia de aminoácidos específicos como histidina.

Las fracciones se someten a una nueva cromatografía, por ejemplo, Hplc en fase reversa, en una segunda etapa de purificación. Otra técnica que se puede emplear es la cromatografía de intercambio iónico. En una etapa final, se realiza la purificación empleando cromatografía liquida (Hplc) con gradientes de acetonitrilo. Al final del proceso se puede hacer un nuevo balance de masa en el que:

Page 64: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

64 • Introducción al análisis estructural de proteínas y glicoproteínas

% aa polipéptido = % aa ∑ péptidos

Los péptidos pequeños (< 25 aa) son solubles en una variedad de medios ácidos, básicos y neutros. Presentan menos problemas de absorción sobre los soportes de purificación y se pueden separar empleando cromatografía de intercambio iónico, filtración en gel y Hplc en fase reversa.

En la figura 34, se representan los perfiles obtenidos luego de realizar una purificación en columna abierta de una mezcla de péptidos obtenidos con tripsina, quimotripsina y proteasa V8. En la figura 34C, se observa que los péptidos están en una baja concentración, la mezcla es muy compleja y no hay buena resolución. En el último caso (figura 34D), se incluye la purificación de una fracción de péptidos trípticos que fueron tratados con proteasa V8, el perfil nos muestra que el método seleccionado de sepa-ración no tuvo de nuevo la suficiente resolución. En el caso de proteínas de medio y alto peso molecular es conveniente, realizar pasos previos de purificación para disminuir la cantidad de péptidos que se puedan analizar por cromatografía líquida para posterior secuenciación.

FracciónFracción

FracciónFracción

A B

C D

Figura 34. Purificación de péptidos obtenidos en la hidrólisis de la lectina de Dioclea lehmanni. Purificación sobre un soporte de Biogel P6. A: digerido tríptico. B: digerido quimotríptico. C: digerido con proteasa V8. D: digestión secundaria de péptidos trípticos con proteasa V8

Page 65: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura primaria de proteínas • 65

Secuenciación de los péptidos

En este paso, se debe tener una metodología bien establecida, manual o automática, ya que la obtención de los péptidos puros representa costos, trabajo y tiempo. El material que se va a secuenciar debe ser homogéneo y la pureza mayor del 95 %. En ese sentido, el mejor criterio es la degra-dación de Edman para obtener la secuencia N-terminal. Si se escoge esta metodología, los péptidos deben ser solubles en solventes orgánicos. Tam-bién es importante aclarar que otra técnica para secuenciar que se emplea, hoy en día, es la espectrometría de masas, la cual se explicará más adelante.

Algunos secuenciadores tienen una copa de vidrio, que gira desde 1000 a 4000 rpm, en la que el péptido se fija en forma de una película delgada. Hay secuenciadores para fase sólida en los que el péptido se acopla en forma covalente a un soporte inerte, como una resina de poliestireno, de modo que solo se precisa filtrar para aislar el producto de cada ciclo de degradación de Edman. En los instrumentos más avanzados, el péptido queda embebido en una película delgada de una sal de amonio cuaternaria, el polibreno, y los reactivos de Edman reaccionan fácilmente ya que son introducidos en forma de vapor en una corriente de argón. Los secuenciadores permiten adicionar los reactivos a la celda de reacción en cantidades exactas a in-tervalos programados. Las tiazolinas de los aminoácidos se separan auto-máticamente, se convierten en los correspondientes ptH-aminoácidos y se identifican cromatográficamente. Estos equipos pueden determinar hasta un aminoácido por hora. Habitualmente, pueden identificarse péptidos de 40-50 aminoácidos antes de que los efectos de las reacciones incom-pletas, laterales y de la pérdida de péptido se acumulen de tal manera que la determinación de un aminoácido ya no sea confiable. Se logra detectar e identificar al menos un picomol de un ptH-aminoácido usando Hplc en fase reversa, equipado con un detector uv. El análisis de la secuencia, de aproximadamente 5 aminoácidos, puede efectuarse empleando una canti-dad de 5-10 pmol de péptido [46].

La técnica tiene más de sesenta años y, desde su aparición, se han veni-do desarrollando otros métodos más rápidos y menos costosos, entre ellos están la espectrometría de masas top-down y la secuenciación de adnc. Sin embargo, la degradación de Edman continúa presentando ventajas para el análisis de proteínas que no han sido superadas por otros métodos analí-ticos, algunas de ellas son:

• La reacción de degradación inicia en el primer aminoácido y, por lo tanto, es identificado con precisión en el primer ciclo. Ami-noácidos con el mismo peso molecular, por ejemplo, leucina e isoleucina, tendrán diferente tiempo de retención. Los derivados son identificados y cuantificados por cromatografía líquida.

Page 66: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

66 • Introducción al análisis estructural de proteínas y glicoproteínas

• Las proteínas pueden ser transferidas a membranas de pvdf a partir de geles 1D y 2D y secuenciadas, lo que indica que se puede hacer la determinación a partir de una mezcla de proteínas.

Hoy en día, se continúa empleando esta técnica para la determinación exacta de la secuencia N-terminal y de proteínas, aunque es muy costosa para investigación básica. Algunos de los ejemplos de sus aplicaciones se resumen a continuación:

• Se puede emplear para verificar la correcta expresión de una pro-teína recombinante, a través de la determinación de su N-terminal. Lo anterior se hace, comúnmente, para controlar las proteínas que se producen en la industria farmacéutica.

• Con ella, se hace la caracterización de líneas celulares por de-tección de la expresión y el procesamiento de metionina y de la secuencia señal en proteínas.

• Se utiliza para realizar estudios de estabilidad por análisis de de-gradación de proteínas e identificación del nuevo N-terminal y del sitio de escisión proteolítica en los fragmentos de la molécula.

• Es empleada en la secuenciación de novo para el análisis de nue-vas proteínas y péptidos, sin datos de secuencia disponibles, pues permite la identificación de proteínas cercanas o de especies que tienen secuenciaciado su genoma.

• Es usada en la secuenciación de novo para péptidos que contienen I / L y Q / K.

Cuando se ha hecho la fragmentación por métodos químicos, que llevan a la formación de homoserina, iminotiazolidina, cianocisteína, ciclación es-pontánea en el caso del ácido aspártico y un residuo de glicina adyacentes, entre otros, bloquean la secuencia N-terminal. En estos casos, los péptidos no son degradados por el método de Edman.

La S-carboximetilcisteína, a pH ácido, forma una cicloamida y, en medio alcalino, se puede formar o-acil serina/treonina. La insolubilidad o agregación puede limitar la accesibilidad dando una baja eficiencia que arroja resultados negativos durante la determinación. Conocer la secuencia N-terminal es de gran ayuda para elucidar la estructura primaria.

Superposición de fragmentos

Una vez se han aislado y secuenciado un grupo completo de péptidos pro-venientes de mínimo tres digestiones, se puede realizar la superposición en la que los péptidos largos solapan los péptidos pequeños. Se debe tener en cuenta que cada proteína es un caso en particular y que el último paso es la

Page 67: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura primaria de proteínas • 67

asignación de los puentes disulfuro y de los residuos de amidas. Para corro-borar la secuencia, se puede llevar a cabo la subfragmentación de péptidos.

El péptido superpuesto (figura 35) contiene una secuencia continua, for-mada por el N-terminal de un péptido (péptido 1) y el C-terminal de un segundo péptido (péptido 2), que dan como resultado una secuencia más larga. El paso final es la reconstrucción total y los fragmentos interiores se pueden asignar a partir de más de dos digeridos, lo que permite una mayor exactitud en la secuencia.

Péptido 1

Péptido 2

Péptido superpuesto

a NH2a COOH

a NH2

a NH2 a COOH

a COOH

Figura 35. Superposición de fragmentos

Como se había mencionado previamente, se considera un grupo completo de péptidos los digeridos trípticos, quimotrípticos y con proteasa V8; también se pueden hacer alineaciones por homología, es decir, búsqueda de secuencias idénticas en composición y posición a partir de proteínas relacionadas, de la misma familia o cercanas taxonómicamente. Las secuencias de proteínas cercanas se pueden utilizar como plantillas para acomodar secuencias de péptidos que tengan una alta identidad. Al final del proceso de alineación y obtención de la secuencia final se debe hacer el último balance de masa:

Número de residuos en el análisis de aminoácidos = Número de residuos en la secuencia

Por lo general, el análisis de aminoácidos no coincide en un 100 % con la secuencia determinada. Sin embargo, proporciona información acerca de la exactitud de la secuencia propuesta. En el siguiente ejemplo (figura 36), se presenta la superposición de péptidos de tres digestiones de la lec-tina de Canavalina marítima, en la que se observa que al final del proceso se obtuvo la secuencia para 170 aminoácidos, realizando superposición con péptidos de tres digestiones primarias y una secundaria, los cuales se deben comparar con el número de residuos reportados en el análisis de aminoá-cidos y la masa molecular. Además, se observa que existe un espacio en las posiciones 115 a 120. A pesar de las digestiones realizadas, la secuencia no

Page 68: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

68 • Introducción al análisis estructural de proteínas y glicoproteínas

fue determinada completamente. La secuenciación fue realizada usando la degradación de Edman, a partir de los péptidos purificados.

20A-D-T-I-V-A-V-E-L-D-S-Y-P-N-T-D-I-G-D-P-S-Y-P-H-I-G-I-D-I-K-D-I-R-S-

0 30

, - , , , . - , - .---TI-------T1V1----- ----T1V2------ -----------T1V3--------- -T2------C1------- ------------C2------------ ---C3--- ------V1------ -----V2----- -------V3-----------

---V2a----

40K-A-T-A-R-W-N-M-Q-T-G-K-V-G-T-A-H-I-S-Y-N-S-V-A-K-R-L-S-A-V-V-S-Y-T-

50 60

-----T3---- ---------T4--------------C4 --- --------C5-------------- ----C6---- ----C7----

----C7a------------C5a------

70 80 90 100G-T-S-S-T-T-V-S-Y-D-V-D-L-N-N-V-L-P-E-W-V-R-V-G-L-S-A-T-T-G-L-Y-K-Q---T5------- --------T6--------- --------T7--------------C8--------- -----------C9------- ----C10----- ---

---------C9a------------------V4--------------

110 120 130T-N-T-V-C-P-R-S-F-T- L-K-T-N-S-I-A-D-A-N-O-L-H-F-S-F-S-Q-F-S-Q-N-----T8------- -T9--------C11-------

-------T10------- --------T11-----C12-- -----C13---- --C14- --C15

140 150 160 170P-K-D-L-I-L-Q-G-O-A-T-I-D-S-D-G-N-L-S-L-T-R-V-S-S-D-G-S-P-Q-G-S-S-V-

--------T11------ ---------T13---------------- ------C16----------- ------------C17------------

--------V5------

180 190 200G-R-A-L-F-Y-A-P-V-H-I-W-E-K-S-A-V-V-S-S-F-D-A-T-F-I-F-L-I-K-S-P-O-R----

-----

--------T14----- ---------------T14V1-------

---C18------ -----C19------ -C20- -----C21-------------C21a-------C21b

210 220

--C18a--

230D-P-A-D-G-I-T-F-F-I-A-N-T-D-T-S-I-P-S-G-S-G-G-R-L-L-G-L-F-P-D-A-N--T15----------

--------------------------

----------T16--------------- ------T17----------------------T16a-------------------------C22--------------- -----C23----

-------------C22a-------------Figura 36. Secuencia de la lectina Canavalia marítima

Fuente: [47, p. 2620].

Page 69: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura primaria de proteínas • 69

En la figura 37, se observa la secuencia para esta misma lectina y la comparación con otras secuencias con un alto porcentaje de identidad. En color, se resaltan las diferencias encontradas en secuencia.

CAM91962 . 1pdb 20W4 Apir A45587

LIVV V IA L F F F P LIL AF L L V PS SSS NS H S H SQN QG T S GN Q T SSSG QGNSR K K KDE D D D D D

----------------------------------------------------------------------------------------------------------------------------------------------------

CAM91962 . 1pdb 20W4 Apir A45587

CAM91962 . 1pdb 20W4 Apir A45587

CAM91962 . 1pdb 20W4 Apir A45587

CAM91962 . 1pdb 20W4 Apir A45587

CAM91962 . 1pdb 20W4 Apir A45587

CAM91962 . 1pdb 20W4 Apir A45587

----------------------------------------------------------------------------------------------------------------------------------------------------

--------------------------------------------------------

----------------------------------------------------

**** *** *** ** *

***** ***** ** **** ********** ******** ************* *

--------------------------------------------------------------------------------

********** ********* ********* ****

V ALF APV IW AVVA F A F FLI P PA I FFIA IP LG Y H S S T T S G T NT TS SGSGGR K K R RE D D E D D

L LFP A IV L F AA A TIVAV P I P P I I I IG N NSTT N YN L SY NT G NY H G S S STD D D E D D D DK K R K

A IVAV L P I P P I I I VD E D D D DT TY NT G SY H G S S TK R KK

A IVAV L P I P P I I I I AD E D D D D DT SY NT G SY H G S TK R K

A W M V V I VA L AW V V L VLP WV V L AR K KR RN QTG GT H SYNS S SYSGSSSTT SY NN G S TTD D E

A W M V A II V L AVV P A V V L VLP WV V L AK K KR RN QNG GT H YNS G S SY NG S T SY N G S STD D D D E

A W M V A I VA L AVV V V L VLP WV V L AR K KR RN QTG GT H SYNS S SYTGTSSTT SY NN G S TTD D E

G Y TNT S S TS TNL IL W F LK K KE

G Y QTNT C S T TNS N H S SQ SQN QG TT S GN TL V P F L IA A L F F F P LIL A L LK R K KXX D D D D D D S

G Y TNT S S TS SNSTH TN H S NQ S Q QG TTGT GN TL IL W F L AL F F F LIL A L LK K K K KE E D D D D E

R R KV P V ALF APV IW AVVA F A F FLI PA IAFFI ISSNGS QGSS G Y H SS S T T SS SH G SNE D D D

R R K K RV P V ALF APV IW AVV F A FIFLI P PA I FFIASS GS QGSS G Y H S SS T S G T NTD E D D D D

-------------------------D DSS SGSTG G NIP LL LFP AR

D DTS SGSGG G NIP LL LFP AR

Figura 37. Comparación de secuencias de tres lectinas relacionadas. CAM9192.1 lectina precursor Dioclea grandiflora. PDB/20W4 Lectina de Canavalia Maritima Seeds . Pir/A45587 Lectina de Dioclea lehmanni. En color azul se muestran los aminoácidos conservados

Fuente: elaboración propia, diagrama obtenido por el servidor Clustal omega.

Finalmente, se deben determinar las posiciones de los puentes disulfuro, por electroforesis diagonal, un método de purificación selectivo para péptidos que tienen una clase de aminoácidos. La base del método consiste en dos sucesivas e idénticas separaciones en dos dimensiones y una modificación química para un aminoácido, el cual altera las propiedades electroforéticas del péptido. Originalmente, se usó para aislar péptidos, conteniendo cisteínas que participaban en la formación de puentes disulfuro. Sin embargo, no es esencial que la modificación química sea selectiva y para un solo tipo de residuo, por ejemplo, en el caso de la metioninsulfona, metioninsulfóxido

Page 70: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

70 • Introducción al análisis estructural de proteínas y glicoproteínas

y ácido cisteico. Después de la separación en la primera dimensión, se saca una franja marcadora y el electroforetograma se expone al vapor de ácido perfórmico, que oxida los puentes disulfuro y deja expuestos los residuos de ácido cisteico.

Posteriormente, la franja oxidada se somete a la separación en una segunda dimensión y se identifican los fragmentos peptídicos que no se han modificado. Estos se sitúan a lo largo de la diagonal debido a que sus velocidades de migración son las mismas en ambas direcciones. Aquellos péptidos que se hallaban unidos, inicialmente, por un enlace disulfuro se dividen en dos péptidos con velocidades de migración diferentes de las iniciales y se ubican por fuera de la diagonal (figura 38).

Digeridoenzimático

Banda

digerido

Péptido concisteína

Tratamientocon ácido

perfórmico

41+ -

Franja marcador Primera dimensión

23 5

Tratamiento conácido perfórmico Segunda dimensión

Obtencióndepéptidos anivelpreparativoparasecuenciar

+

-

+

-

0

0

6 a

5 a

4 a

4 b

6 b

3 a

2 a3 b

1 a

1 b2 b

1a Cys Asp

1b

Cys

Asp

2a

Cys

2b Cys Asp

3a Cys

3b Cys

4a Cys Lys

4b Cys

5a Cys Lys

5b Lys Cys

6a Lys Cys Lys

6 b Cys

Figura 38. Electroforesis diagonal para determinación de la posición de los puentes disulfuro en proteínas

Fuente: [35, p. 107-108].

Los péptidos que forman los puentes disulfuro (figura 38, 3a, 3b, 6a, 6b) se localizan en la electroforesis inicial, se oxidan y purifican a nivel prepara-tivo para determinar su composición de aminoácidos y secuencias. Luego, se comparan con la secuencia de la proteína y de esta forma se establecen las posiciones de los enlaces disulfuro.

Los pasos del método se resumen a continuación: 1. Se realiza la digestión de la proteína con pepsina a pH 2.0 o una

proteasa de amplio espectro.2. Se continúa con la electroforesis del digerido en una dimensión

(horizontal).3. Se elabora una franja marcadora, luego de la separación en la

primera dimensión, y se expone a los vapores del ácido perfór-mico (oxidación).

4. La franja marcadora oxidada se somete de manera perpendicular a una nueva electroforesis (vertical).

Page 71: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura primaria de proteínas • 71

5. La diagonal indica qué bandas están relacionadas pero los péptidos modificados se desplazan fuera de la diagonal.

6. Los péptidos se pueden aislar en forma preparativa para hacer la secuenciación de cada uno de ellos.

Los péptidos con ácido cisteico que tienen carga total negativa son des-plazados al ánodo; sin embargo, el desplazamiento de los péptidos depende de los aminoácidos vecinos. Si hay aminoácidos básicos, el péptido puede desplazarse al polo negativo (se representa en la figura 38, 6a). También se evidencian dos manchas que indican la ruptura de los puentes disulfuro (figura 38, 1a, 1b, 3a, 3b). Cuando los péptidos no son resueltos, se requiere de un procedimiento adicional de purificación (figura 38, 5a, 5b).

Esta técnica fue propuesta inicialmente por Brown y Hartley [48], quienes determinaron la posición de los 5 puentes disulfuro de la enzima quimo-tripsina (tiene 245 aminoácidos). En la tabla 6, se presenta un resumen de las modificaciones químicas que se han descrito para algunos aminoácidos y, por lo tanto, se pueden seguir por esta técnica.

Tabla 6. Electroforesis diagonal para determinación de diferentes aminoácidos

Aminoácido Modificación química Referencia

Cistina Después de la primera separación, se lleva a cabo la oxidación con ácido perfórmico y la producción de dos péptidos contendiendo ácido cisteíco, los cuales migran

hacia el ánodo.

[48]

Cisteína Formación de puentes disulfuro por intercambio con 35S-cisteina, antes del clivaje. Después de la primera separación, oxidación con ácido perfórmico y produc-

ción de un péptido contendiendo ácido cisteico y ácido cisteico libre, los cuales migran hacia el ánodo.

[49, 50]

Metionina Después de la primera electroforesis, alquilación con iodoacetamida y la producción de derivados de metio-ninsulfona, metioninsulfóxido, migran hacia el cátodo.

[51]

Lisina, aminoetilcisteina y aminoácido N-terminal

Después de la primera separación, acilación del grupo amino con anhídrido maleico. Desbloqueo del grupo

amino el cual migra al cátodo.

[52, 53]

Fosfoserina Desfosforilación con fosfatasa alcalina después de la pri-mera separación, producción de un péptido con serina,

el cual migra hacia el cátodo.

[54, 55]

Fuente: [35, p. 109].

Con esta técnica se pueden hacer estudios de proteómicos enfocados en establecer la presencia de puentes disulfuro intracatenarios e intercate-narios en las proteínas de un organismo [58]. El procedimiento es similar

Page 72: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

72 • Introducción al análisis estructural de proteínas y glicoproteínas

al descrito previamente; la mezcla de proteínas se separa en dos dimen-siones, en condiciones no reductoras y reductoras, respectivamente. En este último caso, se alteran las propiedades eléctricas de las proteínas, por reducción de los puentes y alquilación con 5- iodoacetamido fluoresceína (5-iaf). Las proteínas que carecen de puentes disulfuros migran formando una diagonal, ya que sus cualidades eléctricas no cambian, mientras que las proteínas con puentes disulfuro intercatenarios migran como polipéptidos separados por debajo de la diagonal, con una masa molecular menor. Las proteínas con puentes disulfuro intracatenarios migran más lentamente bajo condiciones de reducción y, por lo tanto, se observan por encima de la dia-gonal. El procedimiento involucra una separación secuencial de proteínas en electroforesis en condiciones no reductoras en la primera dimensión y, posteriormente, en condiciones reductoras en la segunda dimensión (figura 39). Las dos corridas electroforéticas son perpendiculares.

Dirección no-reductora

P1

P2

P3 P4 P5

S S

S

SS

S

Dir

ecci

ón

red

uct

ora

P1

P2

P3

P4

P5

Figura 39. Representación de la electroforesis diagonal para la determinación de proteínas con puentes disulfuro intra e intercatenarios en proteómica. P1 y P2: están unidas por puentes disulfuro intercatenarios. P4: tiene puentes disulfuro intracatenarios

Fuente: [59, p. 311].

Page 73: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura primaria de proteínas • 73

Posteriormente, las proteínas que se han separado con esta técnica se extraen del gel y se someten a digestión con tripsina para identificarlas con la huella digital [58]. Esta técnica también se puede usar en combinación con cromatografía de afinidad e inmunoblotting.

Otra técnica que involucra el concepto de corrida en dos dimensiones, para el estudio de modificaciones postraduccionales, es la electroforesis capi-lar diagonal. Esta técnica utiliza dos modos de separación idénticos en cada dimensión y, en el extremo distal del primer capilar, hay un microrreactor que tiene enzimas, las cuales modifican las propiedades de los péptidos o las proteínas de estudio. Los analitos que no son modificados tendrán tiempos de reacción idénticos en los dos capilares y generará manchas que se agru-paran en la diagonal de un electroforetograma bidimensional. Por ejemplo, con fosfatasa alcalina se pueden estudiar modificaciones postraduccionales como la fosforilación y de esta forma se alteran las propiedades eléctricas de los péptidos y proteínas [60].

Fuentes de error en la determinación de la estructura primaria

Las determinaciones de la estructura primaria de proteínas y las técnicas empleadas para elucidarla tienen limitaciones y, por lo tanto, se presentan algunas fuentes de error, las cuales enumeramos de forma breve:

1. Contaminantes provenientes de los soportes de purificación o por manipulación durante la secuenciación Edman o de fuentes naturales. Si hay una baja proporción de péptido contaminante, puede ser una fracción apreciable.

2. Asignación de ácido glutámico y aspártico en vez de glutamina y asparagina por deamidación en medios ácidos durante los procesos de purificación y secuenciación. En el análisis de aminoácidos se debe hacer la determinación como aminas, para poder diferenciar el porcentaje de residuos de ácidos y amidas.

3. Dificultad para identificar algunos derivados de aminoácidos como arginina, histidina, lisina, serina, triptófano y prolina, por extracción incompleta o inestabilidad de los derivados durante la degradación de Edman.

4. Bloqueo de grupos α-amino durante la degradación de Edman y de efectos acumulativos de residuos por clivaje incompleto o por baja detección de cada residuo. Se deben reemplazar los reactivos que puedan acetilar los grupos α-amino.

Page 74: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

74 • Introducción al análisis estructural de proteínas y glicoproteínas

5. Ruptura prematura de derivados ptc o ptH de arginina o histidina, que remueven el aminoácido adyacente y de esta forma en un ciclo se eliminan dos residuos.

6. Hidrólisis incompleta por enlaces resistentes, por ejemplo, con leucina, valina e isoleucina. Por lo tanto, se debe extender el tiempo de hidrólisis. El derivado de un dipéptido puede migrar a la misma posición del derivado de un aminoácido dansilado.

7. Interpretaciones erróneas de los resultados derivados del tra-tamiento con carboxipeptidasas, por contaminación con otras proteasas que van a generar otros grupos terminales. Esto lleva a que el C-terminal quede mal adjudicado.

8. Pérdida de fragmentos por aislamiento incompleto, insolubilidad y absorción a los soportes de purificación. Los balances de materia propuestos ayudan a evitar errores por omisión.

9. Insuficiencia de péptidos obtenidos para superponer, por clivaje incompleto o inespecífico.

Limitaciones de la determinación de la estructura primaria a partir

de la secuencia de adn Las secuencias de las proteínas están codificadas por las secuencias de las bases de los ácidos nucleicos, de manera que, con el código genético, puede deducirse la estructura primaria de una proteína. Las técnicas para aislar y secuenciar los ácidos nucleicos han tenido un gran avance en los últimos años. Hoy en día es más fácil trabajar con un segmento de adn que con la proteína.

Aunque es rutina trabajar con ácidos nucleicos, la secuenciación directa de una proteína es importante por varias razones:

1. Los puentes disulfuro pueden localizarse por secuenciado directo de la proteína.

2. Muchas proteínas son modificadas después de su biosíntesis por eliminación o modificación de residuos de aminoácidos, que son esenciales para su función biológica. Estas modificaciones pueden identificarse a partir de la secuenciación directa de la proteína.

3. Resulta difícil, con frecuencia, aislar e identificar la secuencia del adn que codifica la proteína de interés. Se hace el diseño de pri-mers basados en secuencias de otras proteínas de la misma familia, con funciones similares o en otros parámetros. Lo anterior da

Page 75: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura primaria de proteínas • 75

como resultado una inversión de tiempo y costos que es igual al tiempo que se invierte en la purificación y secuenciación directa de la proteína.

4. Un error común en la secuenciación del adn es la inserción o eliminación de un nucleótido, lo que cambia la pauta de lectura del gen y también las predicciones de todos los restos de ami-noácidos, que se hallan después del punto en el que se cometió el error. Esto se puede comprobar frente a la secuencia directa de los péptidos obtenidos de las hidrólisis de la proteína.

5. El código genético no es universal, los de las mitocondrias y al-gunos protozoos son ligeramente diferentes.

6. Si no se conoce nada acerca de una proteína, para poder hacer un diseño de primers se debe partir, por lo menos, de su secuencia N-terminal o de secuencias parciales de la proteína.

7. La extracción de los ácidos nucleicos es otro punto importante, ya que la metodología no es universal si no que debe estandarizarse para cada caso en particular, dependiendo de material de partida.

El trabajo que se realiza con las proteínas es importante, desde su ca-racterización hasta la elucidación de su estructura, para entender cómo sus interacciones con otras proteínas conducen a las respuestas biológicas. La secuenciación de los ácidos nucleicos, en un momento dado, es un com-plemento en la elucidación de la estructura primaria de las proteínas.

Referencias 1. Sanger F, Thompson eOp. The amino-acid sequence in the glycyl chain of

insulin. 1. The identification of lower peptides from partial hydrolysates. Biochemical Journal. 1953;53(3): 353.

2. Creigthon TE. Disulphide bonds between cysteine residues. Creighton TE. (Ed.) Protein structure. A practical approach. Oxford, UK: irl Press; 1995.

3. Koingsberg aWH y Steiman HM. Strategy and methods of sequence analysis. The Proteins. Vol. iii. New York: Academic Press; 1977.

4. Bio-rad. Glycoprotein and oligosaccharide analysis. P. 149-155, 1997 5. Dubois M, Gilles KA, Hamilton JK, Rebers P, Smith F. Colorimetric method

for determination of sugars and related substances. Analytical chemistry. 1956;28(3):350-356.

6. Edge AS, Faltynek CR, Hof L, Reichert Jle, Weber P. Deglycosylation of glycoproteins by trifluoromethanesulfonic acid. Analytical biochemistry. 1981;118(1):131-137.

Page 76: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

76 • Introducción al análisis estructural de proteínas y glicoproteínas

7. J, Bouquelet S, Debray H, Lemoine J, Michalski JC, Spik G, Strecker G. “Glycoproteins” in Carbohydrate Analysis. A practical approach. Chaplin MF, Kennedy JF. irl Oxford University Press, 1994.

8. Ellman GL. Tissue sulfhydryl groups. Archives of biochemistry and biophysics. 1959; 82(1): 70-77.

9. Spies JR, Chambers D. Determination of Tryptophan. Anal. Chem. 1948;20:30-39.

10. Hirs cHW, Moore S, Stein WH. The sequence of the amino acid residues in performic acid-oxidized ribonuclease. J Biol. Chem. 1960;235:633-647.

11. Hirs cHW, Moore S, Stein WH. Volatile buffers exchange columns; use of chromatography on asolation of amino acids. J. Biol. Chem. 1952;195:669-683.

12. Aitken E, Geisow MJ, Findlay Jbc, Holmes C, Yawoord A. Peptide preparation and characterization. Findlay Jbc, Geisow MM. Protein Sequencing. A Practical Approach. Oxford, UK: irl Press, Oxford University Press; 1989. P.43-68.

13. Ren J, Zhao M, Wang J, Cui C, Yang B. Spectrophotometric method for determination of tryptophan in protein hydrolysates. Food Technology and Biotechnology. 2007;45(4):360-366.

14. Vega N, Pérez G. Isolation and characterization of a lectin from Salvia bogotensis seeds that recognizes Tn Antigen. Phytochemistry. 2006;67:347-355.

15. Khan AS, Faiz F. Amino acids analysis using ion exchange resins. Coden Jnsmac. 2008;48:1-17.

16. Song C, Zhang SH, Ji Z, Li You J. Accurate determination of amino acids in serum samples by liquid chromatography tandem mass spectrometry using a stable isotope labeling strategy. Journal of Chromatographic Science. 2015; 53:1536-1541. dOi:10.1093/chromsci/bmv049.

17. Walker JM. The Dansyl-Edman method for peptide sequencing. Walker JM. (ed.). Proteins. Methods in Molecular Biology. Vol I. Clifton, N. J.: Humana Press; 1984. 203-219.

18. Klemm P. Manual Edman degradation of proteins and peptides. Walker JM (ed.). Methods in Molecular Biology. Proteins. Vol I. Clifton, N. J.: Humana Press, 1984. 243-254.

19. Matsudaira P. Sequence from picomole quantities of proteins electroblotted onto polyvinylidene diflouride membranes. J. Biol. Chem. 1987;262:10035-10038.

20. Taylor A. Aminopeptidases: Structure and Function. Faseb J. 1993;7(2):290-298.

21. Wittmann-Liebold B, Kimura M. Microsequencing of peptides and proteins with 4-N, N, Dimethylazobenzene 4´Isothiocyanate. Walker JM (ed.). Methods in Molecular Biology. Proteins. Vol I. Clifton, N. J.: Humana Press; 1984.

Page 77: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura primaria de proteínas • 77

22. Deng J, Zhang G y Huang NT. Identification of protein N-termini Using tmpp or dimethyl labeling and mass spectrometry. Methods Mol Biol. 2015;1295:249-258. dOi:10.1007/978-1-4939-2550-6_19.

23. Shen PT, Hsu JL, Chen SH. dimethyl isotope-coded affinity selection for the analysis of free and blocked N-termini of proteins using lc-ms/ms. Anal. Chem. 2007;79(24):9520-9530.

24. Hsu JL, Huang SY, Shiea JT, Huang WY, Chen SH. Beyond quantitative proteomics: signal enhancement of the a1 ion as a mass tag for peptide sequencing using dimethyl labeling. J. Proteome Res. 2005;4(1):101-108.

25. Shiveley JE (ed). Methods in microcharacterization. Clifton, N.J.: Human Press; 1986. Chapter 13, 338

26. Avilés F y Vendrell J. Carboxypeptidase B in handbook of proteolytic enzymes (Third Edition). Ciudad: London. Academic Press; 2013.

27. Greenblatt HM, Feinberg H, Tucker PA, Shoham G. Carboxypeptidase A: Native, Zinc-Removed and Mercury-Replaced Forms. Acta Crystallogr D Biol Crystallogr. 1. 1998; 54(Pt 3):289-305.

28. Remington SJ, Breddam K. Carboxypeptidases C and D. Methods in Enzimology. 1994;244:231-248.

29. Klemm P. Carboxy-terminal sequence determination of proteins and peptides with carboxypeptidase Y. Walker JM (ed.). Methods in Molecular Biology. Proteins. Vol I. Clifton, N. J.: Humana Press, 1984. 255-259.

30. Jung G, Ueno H, Hayashi R. Carboxypeptidase Y: Structural Basis for Protein Sorting and Catalytic Triad. J Biochem. 1999;126(1):1-6.

31. Shiveley JE. Methods in Microcharacterization. Clifton, N.J.: Human Press; 1986. Chapter 13, 338-346.

32. Nika H, Nieves E, Hawke D, Angeletti R. C-Terminal protein characterization by mass spectrometry using combined micro scale liquid and solid-phase derivatization. Journal of Biomolecular Techniques. 2013;24:17-31.

33. Thiede B, Wittmann-Liebold B, Bienert M, Krause e. Maldi-ms for C-terminal Sequence determination of peptides and proteins degraded by carboxypeptidase Y and P. febs Letters. 1995;357:65-69.

34. Montreuil J, Bouquelet S, Debray H, Lemoine J, Michalski JC, Spik G, Strecker G. “Glycoproteins” in Carbohydrate Analysis. A practical approach. Oxford University Press; 1994. Chapter 5, 193

35. Koingsberg WH, Steiman HM. Strategy and methods of sequence analysis. The Proteins. Vol. iii. New York: Academic Press; 1977.

36. Hustoft HK, Malerod H, Wilson SR, Reubsaet L, Lundanes E, Greibrokk T. A critical review of trypsin digestion for lc-ms based proteomics. Integrative Proteomics. 2012;(1):73-82.

37. Lewis WG, Basford JM, Walton PL. Specificity and inhibition studies of Armillaria mellea protease. Biochimica et Biophysica Acta (bba) – Enzymology.1978; 522(2): 551–560. dOi:10.1016/0005-2744(78)90087-6

Page 78: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

78 • Introducción al análisis estructural de proteínas y glicoproteínas

38. Drapeau GR. Protease from Staphyloccus aureus. Methods in Enzymology. 1976:469-475. dOi:10.1016/s0076-6879(76)45041-3

39. Olsen JV, Ong SE, Mann M. Trypsin cleaves exclusively C-terminal to arginine and lysine residues. Molecular & Cellular Proteomics. 2004;3(6):608-614.

40. Pauling L, Itano HA, Singer SJ, Wells IC. Sickle Cell Anemia, a Molecular Disease. Science. 1949;110(2865): 543–548. dOi:10.1126/science.110.2865.543

41. Ingram VM. A specific chemical difference between the globins of normal human and sickle-cell anemia hemoglobin. Nature. 1956;178:792. dOi: 10.1038/178792a0

42. Catsimpoolas N, Wood JL. Cleavage of the peptide bond at the cystine amino group by the action of cyanide. J Biol Chem. 1963;238:2887-2888.

43. Catsimpoolas N, Wood JL. Specific Cleavage of Cystine Peptides by Cyanide. J. Biol. Chem. 1966;241:1790-1796.

44. Elashal HE, Raj M. Site-selective chemical cleavage of peptide bonds. Chemical Communications. 2016;52(37):6304-6307.

45. Lehninger AL, Nelson DL, Cox MM. Lehninger principles of biochemistry. New York: Macmillan; 2005.

46. Bandeira N, Victoria P, Pevzner P, Arnott D, y Lill J. Beyond Edman degradation: Automated de novo protein sequencing of monoclonal antibodies. Nature Biotechnology. 2008;26(12): 1336-1338. Disponible en: http://doi.org/10.1038/nbt1208-1336 (19 de febrero de 2020).

47. Perez G, Perez C, Sousa-Cavada B, Moreira R, Richardson M. Comparison of the amino acid sequences of the lectins from seeds of Dioclea lehmanni and Canavalia maritima. Phytochemistry. 1991;30(8):2619-2621.

48. Brown JR, Hartley BS. Location of disulfide bridges by diagonal paper electrophoresis. Biochem J. 1966;101: 241-228.

49. Weeds AG, Hartley BS. Selective purification of the thiol peptides of myosin. Biochemical Journal, 1968; 107(4), 531-548.

50. Weeds AG. Small sub-units of myosin. Biochemical Journal. 1967;105(2):25.51. Tang J, Hartley BS. A diagonal electrophoretic method for selective

purification of methionine peptides. Biochemical Journal. 1967;102(2):593.52. Dixon HB, Perham RN. Reversible blocking of amino groups with citraconic

anhydride. Biochemical Journal. 1968; 109(2): 312.53. Perham RN, Jones gmt. The determination of the order of lysine-

containing: tryptic peptides of proteins by diagonal paper electrophoresis a carboxyl-terminal sequence for pepsin. European journal of biochemistry. 1967;2(1):84-89.

54. Perham RN. A diagonal paper-electrophoretic technique for studying amino acid sequences around the cysteine and cystine residues of proteins. Biochemical Journal. 1967;105(3):1203-1207.

Page 79: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura primaria de proteínas • 79

55. Butler pJg, Hartley BS. Maleylation of amino groups. In Methods in enzymology. Vol. 25. Academic Press. 1972.

56. Milstein C. A simple procedure for the fractionation of the tryptic peptides of the c-terminal half of immunoglobulin lambda-chains. Biochemical Journal. 1968;110(4):652.

57. Milstein C. Linked groups of residues in immunoglobulin κ chains. Nature, 1967;216(5113), 330-332.

58. Winger AM, Taylor NL, Heazlewood JL, Day DA, Millar AH. identification of intra- and intermolecular disulphide bonding in the plant mitochondrial proteome by diagonal gel electrophoresis. Proteomics. 2007;7:4158-4170. dOi:10.1002/pmic.200700209

59. McDonagh B. Diagonal electrophoresis for the detection of protein disulfides. In Protein Electrophoresis Humana Press; Totowa, NJ: 2012.

60. Wojcik R, Vannatta M, Dovichi N. Automated enzyme-based diagonal capillary electrophoresis: application to phosphopeptide characterization. Anal. Chem. 2010;82(4):1564-1567. dOi: 10.1021/ac100029u

Page 80: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural
Page 81: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Capítulo dos

Caracterización de proteínas por

espectrometría de masas (ms)

Page 82: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural
Page 83: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Caracterización de proteínas por espectrometría de masas (ms) • 83

La espectrometría de masas es una rama de la ciencia que trata todos los aspectos relacionados con los espectrómetros de masas y los resultados que de ellos se obtienen. Un espectrómetro de masas es un instrumento que mide la relación masa / carga de los iones y su porcentaje de abundancia relativa. En general, la separación de los componentes de un analito es realizada en forma de iones, de acuerdo con su relación masa (m) / carga (z) para producir un espectro masas. Las características más importantes de esta técnica son:

1. Es una técnica cualitativa y cuantitativa.2. Permite analizar mezclas complejas.3. Tiene una gran sensibilidad del orden 10-12 g (10-15 moles).4. Es una técnica universal y específica.5. Proporciona información estructural por fragmentación de la

molécula. 6. Permite determinar la masa molecular de moléculas medianas,

pequeñas y biomoléculas.7. Suministra información isotópica.8. Es una técnica muy rápida.

Se presentan diversos mecanismos de ionización que incluyen procesos de protonación, cationización o pérdidas de electrones, entre otras (tabla 1).

Tabla 1. Mecanismos de ionización

Protonación M + H+ MH+

Pérdida de protón M - H+ [M - H]-

Cationización M + Y+ MY+

Pérdida de un electrón M – e- M+

Captura de un electrón M + e- M+

Antes, las técnicas de ionización producían una fragmentación abun-dante de las moléculas y una ausencia total del ion molecular. Actualmente, estas técnicas han mejorado con el objetivo de reducir la fragmentación de las moléculas y aumentar la señal del ion molecular. Hoy, son técnicas indispensables para el estudio de biomoléculas gracias al desarrollo de los métodos de ionización “suave”, las cuales, con avances en instrumentación, tecnología computarizada y algoritmos para procesar datos, permiten rea-lizar determinaciones bioquímicas de gran importancia como:

1. Determinar la masa molecular de las biomoléculas como proteínas, oligosacáridos y ácidos nucleicos, entre otros.

2. Secuenciar péptidos y, por lo tanto, proteínas.

Page 84: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

84 • Introducción al análisis estructural de proteínas y glicoproteínas

3. Estudiar modificaciones postraduccionales, como identificación de los sitios de glicosilación, fosforilación, y metilación, entre otras.

4. Estudiar el plegamiento y la dinámica de las proteínas.5. Evaluar las Interacciones intramoleculares e intermoleculares y

la formación de complejos.6. Estudiar complejos moleculares y sus interacciones.

A diferencia de otras técnicas espectroscópicas, no requiere analitos que posean características físicas especiales como carga, momento magnético o eléctrico, radioactividad, etc. Sus tiempos de análisis son cortos y es de gran utilidad en estudios de proteómica, glicómica, transcriptómica y me-tabolómica, entre otros. Para realizar los análisis, el analito (sólido, líquido, neutral o cargado) debe ser convertido en iones en fase gaseosa antes de ser analizados.

Los espectrómetros de masas comerciales manejan un amplio rango de masas (> 300 000 Da), tienen alta sensibilidad del orden de fentomoles, alta precisión (error < 0.01 %) y resolución (1:100 000 (100.001)).

Los componentes claves de un espectrómetro de masas se resumen a continuación (figura 1):

1. Fuente de iones: las moléculas de analito son transformadas en iones positivos o negativos. En fase gaseosa, los iones son mani-pulados por campos eléctricos y magnéticos.

2. Analizador de masas: hace la diferenciación de iones en fase ga-seosa de acuerdo con la proporción masa (m) /carga (z).

3. Detector: registra la abundancia de los iones convirtiendo la co-rriente aportada por los iones en una señal de salida.

4. Dispositivo para recolección y almacenamiento: hace el procesa-miento de los datos experimentales.

Entrada IonizadorAnalizador

de masas

Detector yProcesador

de datos

Figura 1. Componentes de un espectrómetro de masas

La espectrometría de masas ha surgido como una técnica práctica en la secuenciación de péptidos de hasta 25 residuos de aminoácidos. Hasta hace poco, para moléculas orgánicas de alta masa molecular, estaba limitada por la dificultad de vaporizar dichas moléculas sin que sufrieran descomposi-ción térmica. Este obstáculo se superó mediante la técnica de ionización de bombardeo con átomos rápidos (fab), en la que el compuesto de interés es disuelto en un solvente de baja volatilidad, como glicerol, que se irradia con un haz de átomos de Argón (Ar) o Xenón (Xe) en la cámara de ionización

Page 85: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Caracterización de proteínas por espectrometría de masas (ms) • 85

del espectrómetro [1]. El proceso da como resultado la expulsión de iones (M+H) + del compuesto de interés, en este caso del péptido.

Los iones se generan a partir de sus dos extremos, N-terminal y C-ter-minal, de forma predecible, dando lugar a una serie de iones derivados del péptido, cada vez menores y cuyas masas moleculares pueden medirse con una precisión mayor que 0.5 Da. Como veremos más adelante, las masas moleculares y, por tanto, solo la identidad de cada aminoácido puede de-terminarse comparando las masas moleculares de los grupos de fragmentos sucesivamente mayores. De esta forma se puede determinar la secuencia completa de cada péptido y, al final, todas las secuencias de los péptidos generados de la proteína se superponen para llegar a la estructura primaria de la proteína de interés.

Se han desarrollado otros métodos de ionización suave para lograr frag-mentación reducida, entre ellas, electrospray (esi) y Maldi. Nano-esi, es una modificación de la técnica de ionización que permite trabajar con muy bajas cantidades de muestra y unos pocos microlitros de solución para hacer determinaciones de masa molecular y elucidación de estructura primaria (ms-ms) [2]. El nano flujo de solvente afecta el mecanismo de formación de iones y hace posible analizar, más fácilmente, los oligosacáridos, glico-proteínas y análisis de complejos no covalentes.

La informatización de este proceso ha reducido el tiempo necesario para secuenciar completamente un péptido de cerca de una hora, tiempo requerido para un ciclo de degradación por Edman, a unos pocos minu-tos. Además es posible determinar simultáneamente la secuencia de varios péptidos en una mezcla, incluso en presencia de contaminantes, con lo que hay que hacer un esfuerzo menor para separar y purificar los fragmentos derivados de una proteína antes de su secuenciación. También se pueden secuenciar péptidos con el N-terminal bloqueado y caracterizar modifica-ciones postraduccionales como fosforilación y glicosilación, entre otras. La gran desventaja es el costo de los espectrómetros y su menor sensibilidad, si los comparamos con los secuenciadores más avanzados que utilizan la secuenciación de Edman.

Ionización en modo electrospray (esi)Los iones son generados en forma continua a partir de soluciones diluidas del analito a presión atmosférica. Los pasos de este proceso se resumen a continuación (figura 2):

1. La solución de analito fluye a través de un capilar de metal muy fino, el cual está a alto voltaje (~4kV).

Page 86: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

86 • Introducción al análisis estructural de proteínas y glicoproteínas

2. De la punta del capilar emerge una “neblina fina” de gotas car-gadas (analito y solvente).

3. El solvente es evaporado de una gota por una corriente de gas caliente y el tamaño de la gota disminuye.

4. El acercamiento de los iones produce fuerzas de repulsión, ge-nerando que la gota “explote” y libere las moléculas de analito cargado en fase gaseosa. Los iones resultantes contienen un bajo exceso de energía interna y, por lo tanto, no sufren fragmentación. El proceso es realizado a presión atmosférica.

5. Las gotas de analito cargados pasan al analizador de masas para su selección a alto vacío.

CapilarGota grande

Analito cargado

Analito

Altovoltaje

Evaporacióniones Presión

atmosférica

Alto vacío

Analizadorde masas

Figura 2. Ionización en modo electrospray (esi)

Fuente: [3, p. 5].

Cuando la molécula es grande, como una proteína, este procedimiento lleva a iones con múltiples cargas (M+nH) n+1 debido a la protonación de n sitios básicos en el analito. Por ello, es muy conveniente para el análisis de macromoléculas ya que permite hacer determinaciones de masa utilizando el algoritmo de promedios. Esto da como resultado una altísima precisión en la determinación de la masa molecular. Por ejemplo, en la determina-ción de la masa molecular de la angiotensina:

Peso molecular fórmula angiotensina: 1046.54234 umaPeso molecular angiotensina (ms): 1046.54114 - 0.62 ppm

Este tipo de ionización tiene la ventaja de que se puede acoplar en línea a cromatografía líquida (cl), Hplc o electroforesis capilar (ce). También se pueden emplear analizadores de masas como tOf (tiempo de vuelo), cua-drupolo e it (trampa de iones), entre otros, los cuales permiten realizar análisis de masas en tándem (ms-ms). El analizador cuadrupolo actúa como

Page 87: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Caracterización de proteínas por espectrometría de masas (ms) • 87

un filtro que transmite solo un ion (m/z) y hace un scanning para obtener una transmisión secuencial de iones que incrementan m/z, generando un

“espectro de masas típico” de intensidad de la señal vs m/z. Este analizador tolera alta presión, tiene buena resolución y analiza un

rango limitado de masas (m/z < 40 000 Da), que es compensado por la generación de iones de múltiple carga. Está constituido por cuatro rodillos paralelos, a dos de estos rodillos se les aplica una corriente continua (dc), mientras que los restantes están vinculados por un potencial de radiofre-cuencia. Los iones en esta región de campo variable oscilarán dependiendo del campo de radiofrecuencia aplicada, así como de su relación m/z, por lo que el campo creado actúa a modo de filtro, determinando qué iones alcanzarán el detector.

En la figura 3, se presenta un esquema resumido de la configuración de espectrómetro de masas para determinar masa molecular.

Presión atmosférica

Capilar

Vacío

Iones

Detector

Mp

Espectro de masasAnalizador

Cromatografía Liquida

ElectroforesisCapilar

InyecciónManual

Figura 3. Configuración de un espectrómetro de masas básico para determinar peso molecular

Fuente: [4, p. 302].

La inyección de la muestra se puede hacer en forma manual, luego de cromatografía líquida o electroforesis capilar y de pasar el ionizador, en el que se generan los iones que pasan a una zona de alto vacío. En este caso hay un cuadrupolo que es usado como un filtro y transmite solo los iones preseleccionados (ion precursor), que permiten determinar el peso mole-cular de la proteína.

En el caso de la apomioglobina (obtenida de músculo caballo), se obser-van 12 estados de carga (+13 a +24) en la molécula intacta; es decir, hay 12 residuos básicos accesibles, cuyos estados más abundantes son +20 y +21 (figura 4A). Teniendo en cuenta el valor de m/z y la carga, se puede obte-ner la masa molecular para cada uno de estos estados, con la fórmula m/z

= (M+n) / n, en la que n es el estado de protonación. Al final se determina el promedio de la masa molecular de la apomioglobina en forma manual o con el algoritmo de promedios. En los espectros se observa la distribución de estado de cargas, dado por la accesibilidad de las lisinas y argininas en la proteína. También se observan espectros con una sola señal y su masa molecular (figura 4).

Page 88: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

88 • Introducción al análisis estructural de proteínas y glicoproteínas

650 750 850 950 1050 1150 1250 1350 1450 Da/z

24

23

22

2120

19

18

17

16

15

14

13

A

16000 16500 17000 17500 18000

Masa (Da)

B 16953

Figura 4. Espectro de masas para al apomioglobulina (músculo de caballo). A: se observan 12 estados de carga (+13 a +24), los más abundantes son +20 y +21. B: masa molecular 16 953 Da, determinada usando el algoritmo de promedios. Desviación estándar > 0.1 %

Fuente: [4, p. 304]

En la figura 5, para la lectina de Salvia bogotensis (lsbo), se observa un ion mayoritario con un estado de carga +12 y un valor de m/z = 3226.53. La masa molecular promedio de las tres señales más abundantes es 38 702.66 ± 22.26 Da. A diferencia de la apomioglobina, tiene solamente tres estados de carga, lo que muestra que hay muy pocos residuos básicos accesibles para ser protonados.

Page 89: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Caracterización de proteínas por espectrometría de masas (ms) • 89

A: 38 702.66 22.26+-

%

100

0

A12;3226.46

3519.98A11

2977.95A13

5369.93

1000 2000 3000 4000 5000 6000 7000

Figura 5. Espectro de masas (esi-cuadrupolo) para la lectina de Salvia bogotensis . Se observan tres estados de carga (+11 a +13), el más abundante es +12. Masa molecular 38 702 Da determinado usando el algoritmo de promedios

Fuente: [5, p. 80].

En la tabla 2, se observan los datos de masa molecular, para la mioglo-bina del corazón de caballo y tres citocromos C de especies diferentes. En este último caso se observan pequeñas diferencias en las determinaciones de la masa molecular que muy difícilmente se podría alcanzar con otra técnica analítica. Además, todas tienen diferentes estados de carga, lo que muestra diferencias muy sutiles en la exposición de residuos básicos y en su plegamiento.

Tabla 2. Comparación de las masas moleculares determinadas para citocromos

C por espectrometría de masas, ionización electrospray (ms-esi)

Proteína Masa molecular(Da)

Estados de carga

Estado de carga más abundante

Mioglobina de caballo 16 945 +14 a +25 +20

Citocromo C Atún

12 024 +13 a +18 +15,+16,+17

Citocromo CCorazón bovino

12 222 +12 a +19 +15

Citocromo CCorazón caballo

12 353 +13 a +20 +17

En el último ejemplo se muestra la detección de glicoformas de dos pro-teínas, ribonucleasa A y ribonucleasa B. El espectro nos muestra que estas estructuras difieren en el número de residuos de manosa y, en el caso de

Page 90: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

90 • Introducción al análisis estructural de proteínas y glicoproteínas

la ribonucleasa B, se observan cinco glicoformas, las cuales se diferencian entre sí por un residuo de manosa (figura 6).

Ribonucleasa A

100

013500 14000 14500 15000 15500 16000

(GlcNAc)

Ab

sorb

anci

a re

lati

va

Man2 5

6

7

89

Man

ManManMan

Ribonucleasa B14896.9 (14895.5)

X X X X

15058.8

15384.3

15223.815545.4

Figura 6. Determinación del peso molecular y de las glicoformas de la ribonucleasa A y B por espectrometría de masas en modo de ionización electrospray (esi)

El uso de una segunda etapa de análisis de masas en el mismo experi-mento es lo que se denomina en tándem (n). Aquí n es el número de etapas de análisis de masas. Se realiza la selección de ion parental para obtener información estructural por medio del acople dos analizadores separados por una cámara de colisión. La colisión del ion se da, por lo general, con los átomos en la cámara para generar patrones de fragmentación en modo cid (cad).

Un ejemplo de las geometrías que se pueden hacer por espectrometría de masas con ionización electrospray se observa en la figura 7 en la que se presenta un esquema resumido para espectrometría de masas en tándem (ms-ms) (msn) y, en este caso, el sistema esi-triple cuadrupolo.

El primer cuadrupolo (q1) es usado como un filtro de masas y trans-mite solo los iones preseleccionados (ion precursor) m/z, trabaja como un analizador de masas. El segundo cuadrupolo (q2) es una cámara de reac-ción que contiene un gas inerte (argón) en la que los iones seleccionados colisionan con las moléculas de gas. Estas son colisiones de baja energía inducen fragmentación en modo cid (collision induced fragmentation), lo que significa que este cuadrupolo trabaja como una fuente de ionización. En el tercer cuadrupolo (q3) se obtiene la distribución de iones por scanning.

Page 91: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Caracterización de proteínas por espectrometría de masas (ms) • 91

Este cuadrupolo es un segundo analizador de masas en el que se genera un espectro de fragmentación.

Presión atmosférica Vacío

IonesMp

M3

Detector

M2Md

Mp

Espectro de fragmentación

Mp ArM1, M2, M3

Analizador Cámara de colisión Analizador

Figura 7. Configuración de un espectrómetro de masas en tándem (ms/ms)-esi para determinar la secuencia de un péptido

Fuente: [4, p. 304].

De acuerdo con la geometría, se pueden desarrollar diferentes experi-mentos como:

1. Modo estándar de análisis, en el que se transmiten todos los iones para que el segundo analizador realice el análisis de masas.

2. Barrido de iones producidos, la selección de un ion (m/z) y su fragmentación para tener la masa de iones producidos.

3. Fragmentación de los iones producidos y selección un ion pre-cursor de acuerdo con (m/z).

4. Barrido de pérdida neutral, en el que el análisis de masas de dos analizadores se relaciona con una pérdida de una especie neutral específica, a partir de la fragmentación de iones precursores.

Algunas de las determinaciones que se puede hacer con ionización en modo electrospray son:

1. Determinación de la masa molecular de péptidos, proteínas, com-plejos multiproteicos o megaiones 106, entre otras.

2. Identificación de proteínas por establecimiento de la secuencia que la implica digestión enzimática (preferencialmente, con tripsina o lisil endopeptidasa).

3. Caracterización de los péptidos obtenidos por fragmentación y análisis de secuencia por ms /ms, para la proteína desconocida.

4. Comparación de los resultados con las con bases de datos para:• Hacer análisis de novo mass spectral interpretation. • Determinar la masa de péptidos o sequence best fit.

Con este tipo de ionización se puede hacer la cuantificación proteínas en proteoma, análisis de interacciones proteína-proteína, estudio de modi-ficaciones postransduccionales y estudio de cambios conformacionales, de los que hablaremos más adelante.

Page 92: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

92 • Introducción al análisis estructural de proteínas y glicoproteínas

Ionización/desorción láser asistida por matriz (Maldi)

En esta técnica de ionización, los iones son desorbidos de una fase sólida. Con este fin, el analito es disuelto en un solvente adecuado, mezclado con una cantidad excesiva de matriz (del orden de 104

veces) y secado bajo una corriente de nitrógeno, permitiendo que los analitos cristalicen con la matriz. Esta muestra, finalmente, se irradia con un láser (usualmente, de nitrógeno a una longitud de onda de 337 nm), lo que produce que la matriz absorba la mayor cantidad de energía y la transfiera a los analitos y, así, se genera la ionización y desorción de la matriz de los iones [M + H]+ del analito hacia la fase gaseosa. La ionización puede ocurrir en fase condensada o gaseosa, por transferencia de un protón entre las moléculas de matriz y del anali-to. La matriz es usualmente un ácido orgánico, como un cromóforo que puede absorber la longitud de onda (uv, ir). La ionización Maldi requiere cientos de disparos del láser para lograr una señal-ruido aceptable para la detección de los iones del analito.

Los iones generados por Maldi son, predominantemente, de carga simple, lo que permite que esta técnica pueda emplearse en un análisis top-down de proteínas de alto peso molecular. Sin embargo, las desventajas que presenta Maldi se deben a la baja reproducibilidad de ionización/desorción entre los disparos del láser y a la fuerte dependencia del método de preparación de la muestra. Las colisiones con moléculas de la matriz causan fragmentación de iones moleculares y la descomposición es rápida; también se generan procesos metaestables, transferencia H+. Usualmente la ionización Maldi es acoplada a un analizador tOf.

Al contrario del modo de ionización electrospray, en Maldi se producen bajos estados de carga, sin embargo, se puede analizar un rango de masas mayor (m/z 75.000 Da), en comparación con la ionización electrospray (figura 8).

Page 93: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Caracterización de proteínas por espectrometría de masas (ms) • 93

Muestra y matriz

Analizador

Láser

+ ++

+ +

Vaporización/ionización

Muestra y matriz

+

+

Figura 8. Ionización/desorción láser asistida por matriz (Maldi)

Fuente: [3, p. 6].

AnalizadorEl analizador tOf se basa en el vuelo libre de las moléculas ionizadas (iones) en un tubo de 1 a 2 m de longitud, antes de llegar al detector. Como los iones poseen la misma energía cinética y diferentes masas, alcanzarán el colector a diferentes tiempos. Los iones son acelerados en el analizador por un potencial eléctrico y todos ellos, excepto aquellos con múltiples cargas (la máxima es +2), adquieren la misma energía cinética. La velocidad de los iones es inversamente proporcional a √m, así que los iones más livianos llegan primero al detector y la señal de intensidad es registrada en función del tiempo, generando el espectro de masas. El analizador tOf combinado con Maldi o con esi permite la detección de macromoléculas que superan los mega Dalton en rango de masa. tOf trabaja en modo pulsado, igual que la ionización Maldi, por lo tanto, no tiene un límite teórico para de-tectar m/z, los iones producidos por Maldi son de alto peso molecular y no pueden ser medidos por otros tipos de analizadores. Este analizador es de baja resolución y, para proteínas pequeñas, la resolución de un tOf lineal es 1:500 (10 000 vs 10 020) (figura 9A).

Page 94: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

94 • Introducción al análisis estructural de proteínas y glicoproteínas

Como los iones producidos por Maldi no tienen energía cinética unifor-me, los iones con el mismo valor de m/z van a llegar al detector a diferen-tes tiempos, lo que produce picos amplios y espectros baja de resolución; sin embargo, con ayuda de un reflectrón los iones con la misma masa y diferente energía son centralizados en un primer detector y luego son en-viados a un segundo detector que está a 180 0, para que todos lleguen al mismo tiempo. De esta forma, se generan picos delgados y espectros de alta resolución (figura 9B).

bv

bv

LM

H

Detector 1

Espectro de bajaresolución

Reflectron1

Detector 2

Espectro de

alta resolución

Láser pulsos

B

Detector

Tiempo de vuelo

MaldiESI

A

Figura 9. Esquema de un Analizador tof. A: geometría lineal. B: con reflectrón

Fuente: [4, p. 306].

Otra forma de mejorar la resolución se basa en la reducción de la energía cinética de los iones, antes de salir de la fuente ionización, por medio de la introducción de pausas (nsg) breves entre la producción de iones en la fuente y el potencial de aceleración del analizador en funcionamiento, de este modo los iones que alcanzan el detector tienen la misma velocidad y hay un Incremento en la resolución, 1:10.000 (10 000 vs 10 001). Maldi tOf ms no tiene la geometría de doble analizador como en esi -3q para ms-ms.

Los iones producidos pueden ser relacionados con el ion precursor metaestable (parental) usando postsource decay (psd). Los iones metaestables que se fragmentan en el tubo tienen la misma velocidad, ya que la han adquirido antes de la fragmentación, y diferente masa y energía cinética. De esta forma, el espectro psd resulta de una serie de experimentos, en la que el potencial del reflectrón decrece para dar un espectro optimizado en etapas y transmitir los iones de baja energía formados a partir del precursor.

Page 95: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Caracterización de proteínas por espectrometría de masas (ms) • 95

La ionización en modo Maldi permite evaluar la pureza de péptidos aislados por Hplc en fase reversa y, aplicando los criterios de relación de alturas de picos presentes en mezclas de péptidos, se puede establecer si son adecuados para análisis por masas. La detección se logra en el rango de 100-300 fmoles que varía según el péptido y mejora al incrementar a carga +2. Se pueden determinar secuencias de péptidos entre 10 y 30 residuos de aminoácidos.

También se puede hacer la detección de modificaciones postransduccio-nales o de las resultantes de las condiciones experimentales. En la tabla 3 se hace una comparación entre las ventajas y desventajas de las dos técnicas de ionización.

Tabla 3. Comparación de las dos técnicas de ionización para proteínas

Ionización Maldi esi

Proceso No es continuo, es un evento pulsado. Es continuo.

Muestras Analitos disueltos y mezclados con la matriz y cocristalizados.

Disueltos e introducidos en la fuente en forma continua.

Analitos purificados en línea Hplc y desalinizados.

Sensibilidad Fentomoles. Fentomoles.

Analizador tOf. tOf, 1Q, 3Q.

Dificultad Depende de la calidad de los datos ob-tenidos a partir de la primera muestra.

Manejo de analitos en el caso de infusión directa.

Sales Tolerante. Baja tolerancia.

Aplicaciones Para determinar masa molecular. Exactitud en la determinación de la masa molecular.

Interfases No es compatible con ce y Hplc. Es compatible con lc y ce.

m/z Masa > 300 kDa, habilidad de análisis de mezclas.

Masas > 200 kDa, inhabilidad para analizar mezclas.

Otros analizadores

Analizador de trampa iónica (it)

Funciona con un principio similar al empleado por el cuadrupolo (q) y está conformado por tres electrodos: uno anular, uno de entrada y uno de salida. Estos forman una cavidad en la cual es posible almacenar y

Page 96: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

96 • Introducción al análisis estructural de proteínas y glicoproteínas

analizar los iones de los analitos. Una de las características del analizador it es su capacidad para aislar un ion y fragmentarlo, generando el espectro de fragmentación, que contiene la información acerca de la secuencia del péptido aislado. Todos los iones generados por esi o Maldi son capturados en el analizador y salen de uno en uno, de acuerdo con la proporción m/z para luego ser detectados. La trampa está llena con gas helio (He) para re-ducir la energía cinética, fragmentar los iones por colisión (cid) y generar un espectro ms-ms. Este analizador no es una invención reciente, pero se ha convertido en una herramienta valiosa para el estudio de biomoléculas gracias al desarrollo de software para control de instrumentos. Tiene altas resolución, precisión (0.3 Da, m/z 1000), y sensibilidad, un bajo costo y analiza masas moleculares entre 65 y 70 kDa.

Ciclotrón de resonancia de iones con transformada de Fourier (ft-icr)

El analizador ft-icr se basa en la acción que ejerce un campo magnético sobre una partícula cargada (ion) girando en un campo de radiofrecuencia. Mediante el campo magnético los iones son dirigidos al interior de una caja donde giran, describiendo una órbita de diámetro reducido y mínima frecuencia. Por aplicación de una señal de radiofrecuencia, los iones son excitados para describir órbitas espirales de amplitud creciente, hasta que la órbita descrita alcanza alguno de los dos electrodos, momento en el cual originan una imagen de corriente, que es función directa de su relación m/z. Esta imagen de corriente es integrada mediante una transformada de Fourier y convertida en una señal proporcional a su intensidad. El espectro completo se obtiene mediante un barrido del campo de radiofrecuencia aplicado que varía entre 8 KHz y 100 MHz. El ft-icr presenta como ven-taja la alta precisión en la medida de masas y el poder de resolución casi ilimitado (> 100 000). Sin embargo, su costo es muy elevado y el nivel de vacío es un parámetro crítico en su funcionamiento.

Orbitrap

El analizador de masas Orbitrap utiliza la trampa orbital de iones en sus campos electrostáticos, en el cual, los iones orbitan alrededor de un electrodo central y oscilan en la dirección axial. Al igual que el icr, orbitrap también usa el algoritmo de la transformada de Fourier para convertir la señal del tiem-po-dominio en un espectro de m/z. El analizador Orbitrap se caracteriza por tener alta resolución, alta precisión y un rango de análisis de m/z de 60 000.

Page 97: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Caracterización de proteínas por espectrometría de masas (ms) • 97

Determinación de la secuencia de proteínas por espectrometría de masas

Como se había mencionado previamente, la etapa inicial de análisis debe incluir una caracterización molecular de la proteína y en lo posible se deben cumplir los requisitos para realizar estudios de determinación de secuencia.

Parámetros moleculares como la composición de aminoácidos, deter-minación de la secuencia N-terminal, masa molecular, determinación de subunidades y evaluación de su conjugación son importantes antes de realizar las digestiones enzimáticas y químicas de la proteína. La determinación de la secuencia de los péptidos se puede realizar por degradación de Edman, como se mencionó; sin embargo, esta técnica tiene algunas limitaciones y su tiempo de análisis es más largo. Con espectrometría de masas, el tiempo de análisis es más corto y hay menos limitaciones.

Algunos de los requisitos necesarios para esta técnica y de las ventajas con respecto al establecimiento de secuencia por Edman se enumeran a continuación:

1. Se requieren menores cantidades de proteína pura. Incluso si es conocido su perfil electroforético se pueden extraer las bandas del gel o realizar estudios a partir de un spot, si es un gel en dos dimensiones. Sin embargo, es importante aclarar que, previamente, se debe hacer una caracterización molecular de la proteína, así se eliminen algunos pasos de purificación.

2. No se requiere una purificación estricta de cada uno de los péptidos que se obtienen de las digestiones de proteína, ya que se pueden separar previamente, por cromatografía líquida. La técnica puede analizar la mezcla de péptidos y dar secuencias parciales.

3. Las secuencias de los péptidos se obtienen rápidamente con ayuda de programas informáticos, al igual que la superposición de pép-tidos. En este punto, se hace una selección de los péptidos que son candidatos a ser parte de la secuencia de la proteína.

4. Es importante tener la secuencia N-terminal, como un requisi-to de su caracterización molecular. Además, esto permite hacer una búsqueda de proteínas cercanas que hayan sido previamente secuenciadas y sirvan como molde para ubicar algunos de los péptidos seleccionados.

Si no se conoce nada acerca de una proteína, se requiere que la información sea redundante; es decir, que las secuencias que se van a superponer sean de tres digestiones diferentes, ya sean químicas o enzimáticas. La digestión con tripsina es muy eficiente y genera péptidos con una longitud de 5 a 20 aminoácidos, los cuales son apropiados para ionización por colisión o análisis por cid.

Page 98: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

98 • Introducción al análisis estructural de proteínas y glicoproteínas

Se deben emplear otras enzimas cuando los péptidos trípticos no puedan ser detectados o se pierdan durante la elución por Hplc-rp. Las enzimas se pueden escoger de acuerdo con la composición de aminoácidos. La redundancia de péptidos da confiabilidad a la elucidación de la estructura primaria. La alquilación de cisteína se puede realizar con 4-vinilpiridina en lugar de usar ácido iodoa-cético o iodoacetamida. El derivado resultante permite hacer la detección de fragmentos por Hplc y es más hidrofóbico, es ideal para ionización por fab (m/z = 106 abundante). Se lleva a cabo en solventes volátiles y se emplea trietilfosfina como agente reductor.

5. Empleando Hplc-rp, se hace, de forma eficiente, la remoción de sales del buffer (que interfieren con esi/ms) y de la enzima re-manente. Además, simplifica la mezcla de péptidos que se van a analizar (ms-ms: 3 péptidos/ fracción de Hplc).

Por ejemplo, la secuenciación de novo para los anticuerpos monoclonales es importante para estudiar su integridad y efectividad. Este es un ejemplo interesante que nos muestra que las dos técnicas son complementarias y, a la vez, presentan limitaciones. Sin embargo, lo más importante es la su-perposición de secuencias obtenidas por los dos métodos.

Los anticuerpos se producen por recombinación somática de segmentos génicos y por esa razón no se puede obtener su secuencia del genoma de los linfocitos B. Por otra parte, las diferencias en secuencias están, princi-palmente, en las regiones variables de las inmunoglobulinas. La búsqueda de secuencias en las bases de datos obtenidas por ms/ms no son aplicables. De acuerdo con lo anterior, la degradación de Edman es la opción más viable para secuenciar anticuerpos, pero es una técnica que toma mucho tiempo. También se han aplicado enfoques híbridos, empleando las dos técnicas (ms/ms + Edman) en la secuenciación de novo de los anticuerpos y de otras proteínas.

Una propuesta para realizar secuenciaciones más rápidas para proteínas de novo es la secuenciación Shotgun Protein Sequencing (sps), basada en el en-samblaje de los espectros de masas de péptidos obtenidos en digestiones enzimáticas redundantes de la proteína. También se han hecho estudios comparativos para ensamblar espectros de proteínas desconocidas usan-do proteínas conocidas como plantillas [6]. Lo anterior se propone por la baja precisión de los algoritmos de secuenciación ms/ms, los cuales tienen un ~ 30 % de precisión. Esta propuesta ha permitido secuenciar de novo anticuerpos monoclonales desconocidos en menos de 72 h e identificar modificaciones postraduccionales [7].

Page 99: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Caracterización de proteínas por espectrometría de masas (ms) • 99

Fragmentación de la molécula

La fragmentación del enlace peptídico va a generar un grupo de iones de carga positiva con incremento de masa.

Los precursores con una sola carga generan un ion positivo y uno neutral, entre los que, de acuerdo con el proceso de fragmentación, tendremos dife-rentes clases de iones que se pueden nombrar de la siguiente forma: a, b, c, x, y, z, w, v, d, entre otros. La fragmentación de la molécula se dirige hacia los sitios protonados; por esta razón, la ionización en modo positivo es el método más adecuado para péptidos. Sin embargo, para grupos fosforila-dos o sulfatados ((M-H)-) se da la ionización en modo negativo (figura 10).

N terminalFragmentación

C terminalFragmentación

+

a1 b1 c1 a2 c2b2 a3 b3 c3

R1

NN

N

OHH O R3

2H N

HR2O O R4

HO

X3 y3 3z y2 z2 X1y1 z1

a 2

(NHH CH CO)

HR

N C H

1 R 2

+

x2

O (NH CH CO)

R

N

3 R 4+C C C

O

HO

H H

b2

(NHH CH CO)

HR

N C C

1 R 2 +

O

H

(NH CH CO)

R3 R 4+

C C

O

HO

H

H3N

y 2

c 2

(NHH CH CO)

HR

N C C

1 R2+

NH

H

3

O

z 2

(NH CH CO)

R3 R 4

+ C C

O

HO

H

X2

Figura 10. Fragmentación de un péptido-formación de iones

La fragmentación en modo cid se produce por colisión de los iones que se han generado en la fuente ionización con un gas de argón inerte. Estas colisiones de baja energía producen la fragmentación de la molécula. Los centros básicos del péptido van a influenciar la fragmentación, ya que se protona el enlace peptídico y, por lo tanto, se puede dar la vía α, que pro-mueve la formación de iones b, y la vía β, de iones Y (figura 11). En este caso, los residuos de lisina y arginina van a influenciar el modo de fragmentación

Page 100: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

100 • Introducción al análisis estructural de proteínas y glicoproteínas

del péptido lo que lleva a que se genere una mayor abundancia de un tipo de iones. La fragmentación en modo cid genera, preferentemente, iones b y y. Todos los centros van a tener la misma basicidad (enlace peptídico) y, por lo tanto, estos iones permiten establecer la secuencia de un péptido [8].

O R2

R1

+NH3

NH

O

NHOH

O

NH3+

O R2

NH2

NH2+

O

NH3+

O

NHOH

OR2

NH

O

OH

O

H N2+

yNH+ 3

O

C+R1

NH2

b

R

Figura 11. Vía de fragmentación β de la molécula de proteína, protonación del enlace amido y la fragmentación de la molécula lleva a la formación de un ion neutro y uno cargado

La presencia de grupos –cOOH, -OH, SH y S- no altera el patrón de protonación de los grupos amida. Como se mencionó, los residuos de lisi-na y arginina afectan el proceso de fragmentación del enlace amida, por lo tanto, la fragmentación procede vía C-terminal, si se presenta la lisina o la arginina en este extremo, y predominarán los iones Y. Estos aminoácidos se protonan más fácilmente, por su carácter más básico que el enlace amido y, posteriormente, influencian la ruptura de la molécula.

La diferencia de masa entre pares consecutivos (señales m/z) revela la identidad del aminoácido, excepto en los casos de la leucina y la isoleucina, en los que se podría hacer digestión con quimotripsina para corroborar la presencia de leucina.

En la figura 12, se observa la determinación de la secuencia del tetrapép-tido realizando fragmentaciones por el C-terminal y el N-terminal donde se forman los iones Y y los b, preferentemente . El ion Y1 en zona de baja m/z nos da la masa del aminoácido AA4 y el ion b1 del aminoácido AA1. La diferencia de m/z del ion y2 menos el ion y1 nos permite establecer la identidad del AA3. La diferencia de m/z del ion b2 menos b1 nos permi-te establecer la identidad el AA2. La determinación de las diferencias de masa de las dos clases de iones permite corroborar la secuencia postulada.

Page 101: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Caracterización de proteínas por espectrometría de masas (ms) • 101

H2N CH C

AR1

O

y3

R2

HN CH

O

C HN CH

O

C HN CH

O

C OH

R3 R4

y2 y1

b1 b2 b3

By1 y2 y3

AA4

b1

AA3 AA2 AA1

precursor

b2 b3

AA2 AA3

m/z

Figura 12. Diagrama para establecer secuencia de un tetrapéptido fragmentado en modo cid

Fuente: [4, p. 311].

Para diferenciar entre los aminoácidos glutamina y lisina, se puede ace-tilar la lisina y, así, determinar glutamina (∆m=128); si la arginina o lisina están en el extremo N-terminal, la fragmentación procede por este extremo y predominan los iones b.

En la figura 13, se observa el espectro para el péptido A. En la secuencia no hay aminoácidos básicos en los extremos y, por lo tanto, se observan las señales para los iones b y y. De la diferencia de masa entre cada una de las señales se puede deducir su secuencia. Para aminoácidos como la glicina, las señales que arrojan las abundancias relativas son bajas. Cuando hay prolina sucede el caso contrario, el porcentaje de abundancia es alto y su cadena lateral puede influenciar la fragmentación.

También se observan señales de muy baja m/z, que permiten detectar aminoácidos en la secuencia, en este caso el triptófano (w).

En la figura 14, se presenta el espectro de masas para el péptido B, en el extremo N-terminal hay un residuo de arginina, que influencia la frag-mentación que procede vía C-terminal; por lo tanto, predominan los iones Y. La diferencia de masa de los pares consecutivos de las señales arroja la identidad de cada uno de los aminoácidos. Se observan los valores de m/z de los iones Y y b, y otras señales que pueden ser debidas a procesos de fragmentación inespecífica o iones que no son consecutivos.

Otros de los grupos de iones que se pueden generar durante el proceso de fragmentación son:

Page 102: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

102 • Introducción al análisis estructural de proteínas y glicoproteínas

HCONH-V-G-A-L-A-V-V-V-W-L-W-L-W-L W-CONH(CH )2 2OH

( M+H )+

1882.1

b15

b13

b14

b12

b11

b10

b9

b8b7

b6b5

b4b3

b2

Y4

Y11

Y10

Y9

Y8

Y6

Y5

Y14

Y13

Y12

G

Bajaabundancia

Abu

nd

anci

a re

lativ

a

GA

AL

V VV

W

L

WW

W

L

W

x 5.0

m/z100 200 300 400 500 600 700 800 900 1000 1100 1200 1300 1400 1500 1600 1700 1800 1900

x 10

Figura 13. Espectro de masas en modo cid del ion (M+H)+ (m/z = 1882.1) del péptido A. Las diferencias de masa de los iones consecutivos b permiten determinar la secuencia. Es un espectro simple en el que no se observan aminoácidos básicos en la secuencia del péptido

Fuente: [8, p. 458].

Abu

nd

anci

a re

lativ

a

130

Glu

1442

187

Gly

1385

286

Val

1286

400

Asn

1172

515

Asp

1057

629

Asn

943

758

Glu

813

887

Glu

684

944

Gly

627

1092

Phe

480

1239

Phe

333

1326

Ser

246

1397

Ala

175

Arg

130 57 99 115 114 130 129114 57 147 147 87 71

100

80

60

40

20

784.8

y

Arg173.7

245.7332.9 479.1

664.2

664.6

627.8

942.7

1054.5

1171.21286.0

m/z

1325.11396.8

200 400 600 800 1000 1200 1400

Figura 14. Espectro de masas para el péptido B y fragmentación vía C-terminal

Page 103: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Caracterización de proteínas por espectrometría de masas (ms) • 103

Iones w: la fragmentación procede vía C-terminal y se presentan por la pérdida de parte de la cadena lateral. El mecanismo de formación de estos iones involucra clivaje β de la cadena lateral Rn, que no ocurre en glicina, aminoácidos aromáticos y alanina.

Iones d: la fragmentación procede vía N-terminal y se presentan por pérdida de parte de la cadena lateral.

Iones v: la fragmentación procede vía C-terminal y se presentan por pérdida de la cadena lateral completa. Otras fragmentaciones complican el espectro y provocan disminución en la señal por competencia en la ruptura. Se encuentran iones internos de secuencia, cuando hay prolina (P), treo-nina (T) y leucina (L) en la secuencia. La señal de m/z puede ser debida a secuencias como PT, ptl, ptll y ptlm.

En la figura 15A, se observa el espectro para el péptido C, que arroja se-ñales debidas a su secuencia y los patrones internos (ptl, ptll, PT). Además, señales de bajo peso molecular que corroboran la presencia en la secuencia para aminoácidos como prolina (P), fenilalanina (F), metionina (M), y lisina (K). La leucina e isoleucina se pueden diferenciar por los iones w, los cuales tienen una señal en m/z = 348 y 362, respectivamente (figura 15 A y 15 B). Se observa alta abundancia del ion m/z cuando hay prolina en la secuen-cia, debido que el grupo imino tiene una mayor afinidad por el protón que otros enlaces peptídicos en la cadena. Por lo tanto, la protonación y corte del enlace amida de la prolina está favorecido para formar un fragmento interno. La fragmentación procede vía C-terminal y se encuentran iones Y y b que permiten establecer la secuencia.

Algunos espectros para péptidos con residuos de lisina, no se pueden interpretar por la ausencia de fragmentación especifica. Sin embargo, se puede eliminar el efecto de los grupos ε por acetilación y se observa un incremento de masa de 210 U (5 átomos de hidrógeno reemplazados por el grupo acetil) y se puede deducir la secuencia a partir de los iones Y y b.

La fragmentación en modo cid, por lo general, no es adecuada para hacer estudios de modificaciones postraduccionales, ya que el proceso debilita los enlaces, por ejemplo, el glicosídico o el de ester de fosfato. Otros procesos de fragmentación, como disociación por captura de electrones (ecd) o de transferencia de electrones (etd), permiten identificar estas modificaciones. El de haz o disociación de colisión de alta energía (Hcd) genera iones y pero, en el caso de los iones b, los fragmenta en especies más pequeñas.

El mecanismo para etd y ecd permite la fragmentación en fase gaseosa de iones multicargados de proteínas o péptidos tras la captura de un elec-trón de baja energía (< 1 eV) o la transferencia de electrones entre iones (figura 16). Las especies impares sufren rearreglos que llevan a fragmenta-ción de la cadena principal en el enlace N-Cα, dando lugar a la formación de iones del tipo c y z sin pérdida de información en la localización de las modificaciones postraduccionales (ptm).

Page 104: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

104 • Introducción al análisis estructural de proteínas y glicoproteínas

Abu

ndan

cia

Rel

ativ

a A G I P T L L L F K9 8 7 6 5 4 3 2 1

1 2 3 4 5 6 7 8 9Fy2

PTLPTPTLL

w4407

Cwn ny

b5

b8

b7

b8w7

y8

y7

P

w8

3y

3W 5W4y5y

L

PX

F

97140K

3

b2

by1

348 4b

100 200 300 400 500 600 700 800 900 1000

bn

m/z

Abu

ndan

cia

Rel

ativ

a

B G I P T L M l F K9 8 7 6 5 4 3 2 1

1 2 3 4 5 6 7 8 9F

y2P T L

P TPTLM

w4

407

pwn ny

b5b8

b7

b8

y8

y7

w83y

3W

5W

4y

5y

M

P XM

140K

3b2 b

y1

3624b

100 200 300 400 500 600 700 800 900 1000

bn

F

104Met

L

Figura 15. Espectro de masas para el péptido C

Fuente: [8, p. 459].

e +- H

O

2NH+

R

3NH+

NH

O

NHOH

O

3NH+

R

3NH+

NH

O

NHOH

OHO

2NH

3NH+

R

3NH+

NH

O

NHOH

OH

O

2NH

3NH+

C

3NH+

3NH+

O

O

NHNHR

O

H

C Z

OH

2NH

HC

+

Figura 16. Interacción de electrones (e-) con moléculas multiprotonadas, se genera la captura de e-(ecd) o la transferencia (etd)

Fuente: [9, p. 164].

Page 105: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Caracterización de proteínas por espectrometría de masas (ms) • 105

Los modos de fragmentación complementarios son adecuados para estudiar las modificaciones postraduccionales (ptm) como la glicosilación y ubiquitinación. El modo cid / Hcd permite hacer la identificación de la estructura de glicanos y, a su vez, determinar la secuencia del péptido. Con etd, se puede hacer la elucidación de los sitios de glicosilación mantenien-do intacta la unión carbohidrato-péptido. Otras modificaciones como la detección directa de la S-nitrosilación de proteínas no son fáciles, debido a la naturaleza lábil del grupo nitroxilo (NO) unido al azufre (S) de la cis-teína. Se ha observado fragmentación de la estructura peptídica debido a la pérdida neutra del grupo NO en el modo de fragmentación cid o etd. La mayoría de las estrategias de identificación para S-nitrosilación se hace por métodos indirectos que modifican el grupo NO, antes del análisis de ms.

La fosforilación de proteínas es un tipo de modificación reversible de gran importancia en todos los procesos celulares. La desregulación de la fosfori-lación está implicada en una variedad de procesos patológicos. La fragmen-tación en modo (cid), produce la pérdida neutra del ácido; sin embargo, este tipo de ion “no secuencia” proporciona información sobre la presencia de fosforilación. Se produce la pérdida de 98 Da (unidad de m/z) del residuo fosforilado (80 Da del grupo fosfato y 18 Da del agua), que es utilizado como una identificación positiva de fosfoserinas y fosfotreoninas. La presencia de 69 Da y 167 Da (98 Da + 69 Da) son indicativos de una fosfoserina en la secuencia peptídica. La β-eliminación da lugar a la formación de ácido de-hídro- 2-aminobutírico (83 Da), el cual sirve de indicador de fosfotreonina. La fosfotirosina no sufre la β-eliminación y, en su lugar, la fragmentación con cid causa que pierda 80 Da del grupo fosfato. También se observa el ion imonio de la tirosina 216 Da (136 Da + 80 Da) en los espectros de péptidos que la contienen, el cual corrobora su presencia en la secuencia.

ecd permite realizar el estudio de péptidos multifosforilados porque puede causar fragmentación eficaz sin alterar la modificación. Además, una evaluación consecutiva de los modos Hcd y cid para el análisis fosfopro-teómico puede proporcionar espectros de iones de fragmentos más ricos para fosfopéptidos. En la tabla 4 se comparan los métodos de ionización en forma muy breve.

Los datos obtenidos por ms / ms son usados para predecir la secuencia de las proteínas de las cuales se originaron los péptidos. Los productos esperados de las digestiones teóricas de las proteínas de cualquier genoma secuenciado pueden ser usados para catalogar los posibles iones paternos. Estos resultados son comparados con los obtenidos y se asignan puntajes que indican la probabilidad de identificar la proteína. Para este tipo de análisis, se encuentran disponibles algoritmos como Mascot o Sequest, los cuales cuentan con una variedad de métodos de procesamiento, que incluye la digestión de varias enzimas o la adición de marcadores (por ejemplo, icat). Cuando no se dispone del genoma secuenciado, la caracterización se hace más difícil.

Page 106: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

106 • Introducción al análisis estructural de proteínas y glicoproteínas

Tabla 4. Comparación de los métodos de fragmentación para péptidos

MétodoFragmentación

cid ecd etd

Proceso Colisión de moléculas con gas

no reactivo

Irradiación con un e- de baja energía

Reacción ion / ion por transferencia e-

Analizador QqQ QqQ ft-icr

Iones b, y c, z c, z

Estabilidad de las ptm No Sí Sí

Número de aminoáci-dos secuencia

< 15 > 15 15 - 40

Para determinar la secuencia de los péptidos se cuenta con un software que tienen algoritmos basados en correlaciones numéricas. Por ejemplo, el programa pltseq se basa en la búsqueda de iones generados por frag-mentación vía N-terminal y C-terminal, de las series an , bn, yn, de iones de bajo m/z = 300 para a1,2, b1,2, y1,2 y la diferencia de 18 u para identificar cada aminoácido. El algoritmo seqpep se basa en el chequeo de todos los iones que pueden ser formados, interpreta la secuencia C-terminal, la cual es identificada por búsqueda de los iones y1, am-1, bm-1. En general, el software del equipo arroja las posibles secuencias del péptido de interés; sin embargo, si no es la secuencia esperada, se debe hacer la interpretación manual del espectro y corroborar los resultados. A diferencia de la secuenciación por Edman, en la que se hace la identificación directa de cada aminoácido, con esta técnica se proponen aminoácidos en la secuencia que cumplen con la diferencia de masa, que se deduce de cada una de las señales consecutivas. Esto quiere decir que se puede proponer más de un aminoácido en una de las posiciones, lo que da como resultado una secuencia que no es tan exac-ta como la que se puede obtener a partir de una degradación por Edman. Por otra parte, la secuencia de una proteína deducida por espectrometría de masas se puede corroborar a partir del adnc o se puede complementar por Edman.

Determinación de la secuencia N-terminal Los nuevos métodos para el aislamiento y la determinación del extremo N-terminal de las proteínas o péptidos, incluyen técnicas de marcaje y purificación del péptido N-terminal marcado por cromatografía de afini-dad. El marcaje con dimetilo se basa en la selección de afinidad de isótopo

Page 107: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Caracterización de proteínas por espectrometría de masas (ms) • 107

dimetilo (Dicas), la posterior separación de los péptidos no marcados y la identificación de las secuencias N-terminal bloqueadas; el análisis de la secuencia se realiza por cromatografía líquida acoplada a masas (cl-ms/ms).

La marcación de la proteína se hace con formaldehído deuterado por aminación reductiva (figura 17) y posterior digestión con tripsina [10, 11, 12]. Las fracciones con los péptidos marcados y bloqueados naturalmente son sometidas a análisis de secuencia por cl-ms/ms. Esta técnica es de gran utilidad para determinar el N-terminal de una mezcla de proteínas de di-ferente origen, por ejemplo, de un lisado celular para estudiar las proteínas.

H O

HNH2 Péptido

NaBH CN3

PéptidoNCH3

CH3

Figura 17. Marcación del extremo N-terminal con dimetilo para análisis por espectrometría de masas

Nuevos métodos de estudio de la secuencia N-terminal incluyen el marcaje con sulfihidrilo y la posterior selección con nanopartículas de oro (STagAu). Inicialmente, se hace un marcaje del aminoácido N-terminal y los grupos ε-amino de la lisina de las proteínas con dimetilo; posteriormente, se hace digestión con tripsina y los nuevos péptidos generados son marcados con sulfihidrilo, con el reactivo de Traut a través de sus grupos α-amino. Los péptidos sulfihidrilo resultantes se purifican mediante su unión a materiales compuestos de nano oro por separación magnética. La interacción Au-S es estable y ampliamente utilizada en la ciencia de los materiales. Esta téc-nica permite la retención de los péptidos sulfihidrilo, que son diferentes al péptido N-terminal marcado con dimetilo. Finalmente, el conjunto de los péptidos marcados es analizado mediante cl-ms/ms [13].

Estos métodos son muy eficientes en la determinación de la secuencia N-terminal, debido al uso de reacciones de derivatización, de nuevos mate-riales de purificación, las cantidades de péptidos con las que se realizan son muy bajas (mg) y, además, en combinación con métodos robustos como la cl-ms/ms, son de gran utilidad en el estudio de proteínas. En comparación con la secuenciación por degradación de Edman, las técnicas de etiquetado son muy sensibles y tienen varias ventajas, como los tiempos de análisis y la determinación de varias secuencias en un solo análisis entre otras.

Page 108: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

108 • Introducción al análisis estructural de proteínas y glicoproteínas

Cuantificación de proteínas en estudios de proteómica

La detección y cuantificación de péptidos obtenidos de la hidrólisis de proteínas de diversas fuentes se puede estudiar con o sin marcaje, deter-minando sus abundancias a partir de los espectros de masas. El estudio sin marcaje se basa en el conteo espectral o la comparación de las intensidades de las señales en un rango estrecho de m/z. El marcaje se puede realizar en diferentes residuos de aminoácidos y, posteriormente, pueden ser ana-lizados por masas. Con estos métodos es posible comparar sistemas que están bajo diferentes condiciones metabólicas. Por ejemplo, las proteínas que se expresan en células normales y en células que se han transformado por diferentes procesos fisiológicos y patológicos (figura 18).

La marcación se hace en proteínas o péptidos con isótopos. Posterior-mente, las muestras se mezclan, fraccionan y analizan por espectrometría de masas. La relación de las dos variantes isotópicas se determina a partir de las intensidades relativas en los espectros de masas y, con ella, se iden-tifican las proteínas que difieren en abundancia.

Figura 18. Estudio de proteómica cuantitativa usando espectrometría de masas

Fuente: [14, p. 79].

Page 109: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Caracterización de proteínas por espectrometría de masas (ms) • 109

Una marcación selectiva para proteínas y péptidos que tienen cisteína es la marcación icat, la cual se basa en el uso isótopos y en un enriquecimiento de los péptidos marcados por cromatografía de afinidad. Los residuos de cisteína son iodoacetilados y marcados con biotina deuterada y no deuterada. Las proteínas marcadas son tratadas con tripsina y los péptidos trípticos son sometidos a cromatografía de afinidad para simplificar la mezcla de péptidos. Una modificación posterior a la cromatografía de afinidad incluye la eliminación de las etiquetas de biotina que, para este caso, emplea un isótopo de carbono 13C (figura 19).

Cisteínasmarcadas

Mezcla 2 (pesada)

Mezcla 1 (ligera)

Separaciónpor afinidad

Análisispor MS

100

Cu

anti

fica

ció

n Ligera Pesada-

550 560 570 580

m/z

100

Iden

tifi

caci

ón

NH

200 400 600 800

m /z

2-EACDPLR-COOH

(MS

/MS

)

Digestión conenzimas

Figura 19. Marcación de cisteínas en una mezcla de proteínas con isótopos (método icat)

Fuente: [14, p. 79].

Las proteínas y los péptidos también pueden marcarse modificando las cadenas laterales de la lisina, para formar derivados con N-hidroxisucinimi-da éster que contienen deuterio. Enfoques similares incluyen el etiquetado específico de los extremos N-terminales, algunos que ya hemos mencionado. Otros tipos de marcaciones incluyen la digestión con tripsina de las proteínas en medio acuoso con el isótopo de 18O en la molécula de H2O (figura 20).

Los métodos de etiquetado selectivo y no selectivo, mencionados pre-viamente, generan dos versiones de cada proteína o péptido, difiriendo en masa en una cantidad específica. Sin embargo, los resultados dependen del analizador de masas. Otro enfoque se basa en la marcación isobárica, con sustancias químicas, en la que diferentes formas de una molécula tienen la misma masa y durante la fragmentación ms/ms se generan iones reporteros con diferentes masas, que permiten determinar la abundancia del pépti-do correspondiente. Los derivados tienen tres regiones, una informadora (reportera), una región de equilibrio de masa (balance) y una región con el grupo reactivo que se va a acoplar a los péptidos. Las masas de la región

Page 110: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

110 • Introducción al análisis estructural de proteínas y glicoproteínas

informante y la de equilibrio son iguales en todas las formas del reactivo, pero las masas individuales difieren cuando se libera el ion informador. Para mantener la misma masa, el número absoluto de isótopos (13C, 15N, 18O) en un grupo de reactivos se mantiene constante; en el primer análisis ms, los péptidos marcados son indistinguibles entre ellos, pero, en el modo de ms/ms, en el que los péptidos son aislados y fragmentados, cada tag genera una señal iónica única (figura 21).

Otro tipo de marcación introduce un marcaje isotópico en las células en cultivo con un medio que contienen isótopos pesados, lo que implica la incorporación del marcaje en células metabólicamente activas. Un ejemplo es el crecimiento de levaduras en medio enriquecido con 15N, y el control con 14N, posterior a la extracción, digestión y análisis de proteínas por ms/ms.

Experimental

Desnaturalizacióny reducción

Proteólisisusando H O2

18Proteólisis

usando H O216

combinar

Mezcla depéptidosmarcados

LC-MS

Control

Figura 20. Etiquetado por digestión enzimática con tripsina en H2180

Fuente: [14, p. 82].

Page 111: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Caracterización de proteínas por espectrometría de masas (ms) • 111

En este caso, se identifican proteínas expresadas como dobletes que difie-ren en una unidad de masa. La ventaja es que la marcación se introduce al principio del experimento y se eliminan las variaciones que se producen durante la preparación de la muestra y las pérdidas por purificación. Una variante ampliamente utilizada de este enfoque es el etiquetado con isótopos estables de aminoácidos en cultivo celular (Silac), que implica la inclusión de aminoácidos marcados isotópicamente, por ejemplo, 15N lisina, en el medio para una población de células que luego se comparan con controles suplementados con lisina normal. El inconveniente de Silac y otras etique-tas metabólicas es que están restringidas al análisis de sistemas biológicos simples que se pueden mantener en un ambiente controlado.

Figura 21. Marcación isobárica (etiquetado itraq)

Fuente: [14, p. 83].

Page 112: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

112 • Introducción al análisis estructural de proteínas y glicoproteínas

Utilidad de la espectrometría de masas como herramienta en el análisis de

problemas relacionados con proteínas

Identificación de nuevas variantes proteínas

Una de las utilidades de esta técnica, por su sensibilidad, resolución y exac-titud, es la detección de variantes de una misma proteína. Por ejemplo, la proteína plasmática transtiretina (ttr) tienen 127 aminoácidos y una masa molecular de 13 761 Da. Las mutaciones puntales causan amiloidosis (attr), una enfermedad hereditaria neurodegenerativa. El diagnóstico es establecido sobre la detección de variantes usando isoelectroenfoque (ief) y técnicas de biología molecular. Sin embargo, estos métodos son efectivos para de-tectar variantes conocidas, mientras que la ms da la posibilidad de detectar mutaciones conocidas y desconocidas. En el estudio, se sospechaba de una nueva mutación en un paciente, pero los métodos convencionales fallaron en la detección; por lo tanto, se empleó ms-esi para la caracterización de la nueva variante. La estrategia empleada en el estudio tiene dos pasos básicos:

• La detección de variantes usando ms-esi con la proteína obtenida por inmunoprecipitación del suero del paciente. Los resultados mostraron que existían dos variantes de la proteína y que la di-ferencia de masa molecular era muy pequeña. Además, hay dos variantes de la proteína, sulfatada y no sulfatada (figura 22).

• La localización del péptido variante a partir de la digestión de la proteína con tripsina, posterior separación de los péptidos con cromatografía líquida y análisis por ms-esi. La determinación de las masas moleculares mostró que el péptido T4 tenía una masa mayor con respecto al péptido obtenido de la variante, una dife-rencia de 24 Da. La determinación de la secuencia del péptido variante por ms-ms (Maldi-psd) mostró un cambio por una serina (ser) en el péptido variante con respecto al normal en el que hay asparagina (Asn). Los resultados se confirmaron realizando secuen-ciación de adn y se encontró la mutación en una base (agt-aat).

Este ejemplo no solo nos muestra que la espectrometría de masas es una herramienta muy poderosa en el análisis de proteínas, también, que la combinación de las técnicas bioquímicas permite dar respuestas más acer-tadas en la resolución de problemas relacionados con las macromoléculas.

Page 113: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Caracterización de proteínas por espectrometría de masas (ms) • 113

Ab

un

dan

cia

rela

tiva

13839.0 DaNormal-Sulfatada

C

D 13864.9 DaVariante-sulfatada

13759.1DaNormal

Variante13786.5

A B

+80 Da: sulfato+26 Da: mutacióncausada por base

13750 14000 Mr

Figura 22. ms-esi para proteína plasmática transtiretina

Fuente: [4, p. 313].

Evaluación del plegamiento de las proteínas

La determinación de la estructura terciaria es importante para entender el mecanismo de muchos procesos biológicos. Por ello, en los últimos veinte años, las técnicas para elucidar dicha estructura han avanzado considerable-mente. La estructura terciaria de una proteína se determina con base en su estructura primaria y su plegamiento mediante técnicas como cristalografía de rayos X, resonancia magnética nuclear bidimensional (rmn) y, hoy en día, por criomicroscopía electrónica.

Cada técnica tiene sus limitaciones, por ejemplo, la cantidad de proteína necesaria para los análisis, pureza, solubilidad, la resolución etc. La rmn, permite el estudio de la dinámica de macromoléculas con resolución ató-mica en varias escalas de tiempos. Otras técnicas, como dicroísmo circular (dc), fluorescencia y algunos cálculos teóricos permiten realizar estudios de plegamiento. Con la ms-esi se pueden realizar estudios de cambios confor-macionales y no solo diferenciar proteínas en estado nativo de proteínas desnaturalizadas, sino que permite realizar el seguimiento de los procesos dinámicos de las proteínas, los cuales no son detectados por cristalografía y, en algunos casos, por rmn. Algunos ejemplos de los alcances de la espec-trometría de masas con ionización electrospray en estudios de plegamiento de las proteínas se mencionan a continuación:

Page 114: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

114 • Introducción al análisis estructural de proteínas y glicoproteínas

Monitoreo de cambios conformacionales por el cambio en la distribución de cargas (csd)

Una proteína puede acumular múltiples cargas por los sitios básicos ((M + nH) n+) presentes en su estructura; puntualmente, por los aminoácidos como lisina y arginina. En estado nativo, muchos de estos sitios no son accesibles ya que están inmersos en el interior hidrofóbico y no están disponibles para ser protonados. Por esto, solo se pueden observar bajos estados de carga. Lo anterior significa que la distribución de cargas cambia cuando los residuos básicos están expuestos debido a cambios conformacionales. Así, como consecuencia de una desnaturalización, se obtienen altos valores de carga. La detección del csd se puede hacer empleando cantidades de proteína < 100 pmol.

La ubiquitina bovina es una proteína de 76 aminoácidos (de los cuales 13 son básicos) en la que se observa cómo cambia la distribución de car-gas. Los datos indican que, en estado nativo, hay cinco sitios que no son accesibles a la protonación mientras que, en estado desnaturalizado, los 13 sitios son protonados. También se puede realizar el estudio de cambios conformacionales por intercambio de átomos de hidrógeno (H) y deuterio (D). Por su gran sensibilidad y resolución, la ms es una técnica adecuada para estudios de intercambio isotópico y se emplea en conjunto con infra-rrojo (ir) y rmn. La accesibilidad de los H+ intercambiables en las cadenas laterales y en el enlace peptídico es la clave para este estudio. En estado nativo el intercambio de H+ se hace a diferentes velocidades, algunos H+ no están expuestos o están formando puentes de hidrógeno o puentes salinos y, por lo tanto, la situación es compleja en una proteína. La velocidad de intercambio varía para los diferentes protones, los cuales pueden diferir en muchos órdenes de magnitud. Las proteínas desnaturalizadas intercambian H+ a una velocidad mayor que en estado nativo. Para los péptidos, las ve-locidades de intercambio varían en función de la temperatura y pH, pero el proceso es más lento con los protones del enlace amido, los cuales son intercambiados en minutos.

La ubiquitina tiene un total de 144 átomos de hidrógeno intercambiables: 72 en el enlace amido y 72 en las cadenas laterales. El espectro obtenido luego de veinte minutos en solventes desnaturalizados arroja dos estados de carga (+8 y +9); luego de noventa minutos, se intercambian 105 proto-nes; en una semana 130 protones y, sobre condiciones desnaturalizantes, se intercambian 131 protones en veintitrés minutos [4].

Los diferentes cambios conformacionales de una proteína se pueden medir en función del tiempo. Una ventaja de la técnica es la detección de diferentes conformeros en solución y no el promedio del estado de los conformeros. Konermnan et al. [15, 16, 17]. estudiaron la cinética del ple-gamiento del citocromo c por ms-esi time resolved. La proteína tiene cinco

Page 115: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Caracterización de proteínas por espectrometría de masas (ms) • 115

estados conformacionales dependientes del pH. Los autores usaron un equipo de flujo continuo en el cual la proteína a pH 2.4 fue mezclada con una solución de cloruro de tetrametilamonio. La mezcla dio como resultado un salto de pH abrupto de 2.5 a 3.0, que marcó el tiempo inicial para el inicio del plegamiento de la proteína.

Controlando la velocidad de flujo y cambiando la distancia entre el punto de mezcla y la fuente de electrospray, midieron un tiempo de resolución de 0.1 segundos. Los estados de carga +8 y +9 son característicos de la proteí-na nativa mientras que de +15 a + 17 son de la estructura desnaturalizada. La esi-ms es una técnica muy útil para realizar estudios de plegamiento en proteínas; sin embargo, no puede dar información acerca del papel de cada uno de los residuos de aminoácidos en el proceso de plegamiento.

Estudios de interacciones intermoleculares e intramoleculares

Las interacciones intermoleculares e intramoleculares determinan la estruc-tura macromolecular, son las responsables de la formación de complejos, agregados y del plegamiento y están mediando procesos biológicos. Estas interacciones son débiles y se dan por interacciones electrostáticas, forma-ción de puentes de hidrógeno, interacciones hidrofóbicas, dipolo-dipolo y dipolos inducidos [18].

Los complejos formados por este tipo de interacciones son frágiles, pro-piedad que es esencial para el desarrollo de algunas funciones biológicas que dependen del equilibrio entre las moléculas asociadas y no asociadas. Una variedad de métodos experimentales en solución y en fase sólida han sido empleados para el estudio de complejos asociados no covalentemente. Cada uno de estos métodos tiene sus ventajas y limitaciones. La resonancia magnética nuclear y la cristalografía de rayos X, ambas empleadas para rea-lizar estudios estructurales, requieren grandes cantidades de muestra y no siempre son técnicas que están disponibles. Los estudios de macromoléculas por rmn están limitados a moléculas < 40 kDa y requieren de altas concen-traciones de proteína que pueden inducir agregación, lo que no ocurren a nivel biológico. La cristalografía de rayos X está limitada a sistemas que producen cristales de buena calidad. Las técnicas espectroscópicas (dicroís-mo circular, fluorimetría), ultracentrifugación, calorimetría, resonancia de superficie de plamon (spr) y métodos de electroforesis presentan también limitaciones y desventajas. La ms-esi permite el análisis de complejos, los cuales pueden sobrevivir luego de los procesos de ionización y son iguales a los complejos en solución. También las constantes de afinidad de los com-plejos en fase gaseosa deben ser iguales a las de los complejos en solución. En el siguiente ejemplo, se evidencia la habilidad de esta herramienta para el análisis de los complejos.

Page 116: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

116 • Introducción al análisis estructural de proteínas y glicoproteínas

El complejo avidina biotina se caracteriza porque su interacción tiene una Kd = 1 × 10-15 M y es un sistema que se emplea con frecuencia en estudios de inmunoquímica, cromatografía de afinidad y bioquímica. La avidina es un tetrámero con 4 subunidades idénticas (64 kDa) que une 4 moléculas de biotina (244 Da). Con este ejemplo, se evalúan las interaccio-nes proteína-proteína y ligando-proteína de tipo no covalente. En la figura 23, se observa el espectro para la avidina y el complejo avidina biotina.

Avidina

+15, +16.+17,+1863915 Da

Q16+

Q17+

Q15+

Q18+ Q24+

Q25+ Q23+

M11+

M9+

100

50

0

500 1500 2500 3500 4500 5500 6500 7500

Avidina-biotina

Q15+

Q16+

Q17+Q14+

M9+

100

50

0

500 1500 2500 3500 4500 5500 6500 7500

Desplazamiento m/z 973 Da=

Figura 23. ms-esi para el complejo avidina-biotina

Fuente: [4, p. 322].

Page 117: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Caracterización de proteínas por espectrometría de masas (ms) • 117

En este último caso, se observa un desplazamiento m/z = 973 Da, que co-rresponde a la unión de cuatro moléculas de biotina. También se observa la disminución de una unidad de carga. Este demostró que el proceso de ionización en modo electrospray (esi) transfiere el complejo en solución a la fase gaseosa [4].

La formación de especies altamente cargadas permite la detección de complejos de masa molecular alta con una baja relación m/z. Como las interacciones no covalentes entre las moléculas se puede conservar, es posible mantener las especies intactas desde dímeros o tetrámeros, por ejemplo, hasta grandes conjuntos, como cápsides virales ordenadas y he-terogéneas, o ribosomas asimétricos (figura 24). Un ejemplo muy sencillo ocurre cuando la lectina de Galactia lindenii es sometida a electroforesis en condiciones desnaturalizantes. Se observa una banda en 25 kDa y una de alto peso molecular, en 100 kDa. Esta última banda solamente desaparece en condiciones drásticas de calentamiento, lo que indica que el detergente

Figura 24. ms-nano esi para el complejo homotetramérico Transtiretina en la que se observan dos especies en equilibrio, el monómero y el tetrámero

Fuente: [20, p. 170].

Page 118: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

118 • Introducción al análisis estructural de proteínas y glicoproteínas

(sds) no es suficiente para la disociación de la proteína [19]. Por ms-esi, se observan dos especies con una masa molecular de 104 256 Da y 26 064 Da, lo que indica que es un tetrámero que está en equilibrio con el monómero.

La combinación de la espectrometría de masas con otros métodos biofí-sicos, como la ultracentrifugación analítica (auc), la dispersión de neutrones de ángulo pequeño (sans), dispersión de rayos X de ángulo pequeño (saxs), microscopía electrónica y difracción de rayos, se ha desarrollado la biología estructural [21]. Las interacciones receptor-ligando, enzima-sustrato, he-moproteína y proteína-proteína, entre otras, se deben preservar y, por eso, se le ha denominado espectrometría de masas nativa (ms nativo). El estudio de la dinámica de complejos proteicos como reorganización estructural, intercambio de subunidades, procesos de ensamblaje o desensamblaje en solución está mediado por interacciones débiles transitorias. Por lo tan-to, esta técnica es muy pertinente para realizar estos estudios. Además, es muy sensible, ya que con muy bajas cantidades de proteína (picomoles) es accesible para estudiar proteínas expresadas a nivel endógeno, con una velocidad de análisis en la escala de tiempo adecuada para capturar la di-námica de proteínas.

Nano-esi es empleada en cambio de esi para mantener los iones macro-moleculares en fase gaseosa; por ejemplo, el proteosoma 26S aislado de S. cerevisiae con una masa molecular de 2587 kDa. Una modificación de estos estudios incluye la técnica de movilidad iónica (im-ms), en la que se separan iones macromoleculares de acuerdo con su capacidad para atravesar una cámara llena de gas en un campo eléctrico. Por comparación con valores teóricos de modelos estructurales se puede determinar la estructura y con-formación de complejos proteicos.

El estudio de los complejos proteicos mediante espectrometría de masas ha llevado a desarrollar los mapas de complejos en organismos, para estu-diar enfermedades que se producen por la interrupción de las funciones de los mismos. Se publicó recientemente un estudio realizado en humanos que contiene más de 4600 complejos proteicos, 7700 proteínas y 56 000 interacciones. Lo anterior va a permitir comprender mejor las funciones celulares y las patologías que se presentan en los organismos [22].

Referencias 1. Mann M, Hendrickson RC, Pandey A. Analysis of Proteins and Proteomes by

Mass Spectrometry. Annu. Rev. Biochem. 2001;70:437-473.2. Griffiths WJ, Jonsson AP, Liu S, Rai DK, Wang Y. Electrospray and Tandem

Mass Spectrometry in Biochemistry. Biochemical Journal. 2001;355(Pt 3):545-561.

Page 119: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Caracterización de proteínas por espectrometría de masas (ms) • 119

3. Mano N, Goto J. Biomedical and Biological Mass Spectrometry. Analytical Sciences. 2003; 19(1): 3–14. dOi:10.2116/analsci.19.3.

4. Gibson D, Costello C. Mass Spectrometry of Biomolecules. Ahuja S (ed). Handbook of bioseparations. San Diego: Academic Press; 2000. 299-327.

5. Vega N. Caracterización bioquímica, funcional y biológica de la lectina de Salvia bogotensis y evaluación de su aplicación para la detección del antígeno Tn [Tesis de Doctorado]. Bogotá: Universidad Nacional de Colombia, 2004.

6. Seattle Proteome Center (spc). Proteomics Tools. Disponible en: http://tools.proteomecenter.org/software.php. [4 de febrero de 2015].

7. Bandeira N, Pham V, Pevzner P, Arnott D, y Lill JR. Automated de novo protein sequencing of monoclonal antibodies. Nature Biotechnology. 2008;26(12):1336-1338. dOi:10.1038/nbt1208-1336

8. Biemann K. Sequencing of Peptides by Tandem Spectrometry and High Energy Collision-Induced Dissociation. Methods in enzimology. 1990;193:455-479. dOi:10.1016/0076-6879(90)93433-l

9. Elviri L. etd and ecd Mass Spectrometry Fragmentation for the Characterization of Protein Post Translational Modifications. Jeevan KP. Tandem Mass Spectrometry-Applications and Principles. Croatia:InTech. 2012;7:161-178. Disponible en www.intechopen.com. dOi: 10.5772/35277. 2012

10. Chang E, Pourmal S, Zhou C, Kumar R, Teplova M, Pavletich NP, et al. N-terminal amino acid sequence determination of proteins by N-terminal dimethyl labeling: pitfalls and advantages when compared with Edman degradation sequence analysis. J Biomol. Tech. 2016;27(2):61-74. dOi: 10.7171/jbt.16-2702-002.

11. Deng J, Zhang G, Huang F, Neubert T. Identification of protein N-termini using tmpp or dimethyl labeling and mass spectrometry. Methods Mol. Biol. 2015;1295:249-258. dOi: 10.1007/978-1-4939-2550-6_19

12. Shen PT, Hsu JL, Chen SH. Dimethyl isotope-coded affinity selection for the analysis of free and blocked N-termini of proteins using lc-ms/ms. Anal. Chem. 2007;79(24):9520-9530.

13. Li L, Wu R, Yan G, Gao M, Deng C, Zhang X. A novel method to isolate protein N-terminal peptides from proteome samples using sulfydryl tagging and gold nanoparticle-based depletion. Anal Bioanal Chem. 2016;408(2):441-448. dOi: 10.1007/s00216-015-9136-x.

14. Twyman RM. Strategies for protein quantitation. In Principles of Proteomics, 2nd ed. New York, NY, usa: Garland Science, Taylor & Francis Group, llc; 2014.

15. Konerman L, Collings BA, Douglas DJ. Cytochrome C folding kinetics studied by time resolved electrospray ionization mass spectrometry. Biochemistry. 1997;36:5554-5559.

Page 120: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

120 • Introducción al análisis estructural de proteínas y glicoproteínas

16. 16. Konermann L, Douglas D. Unfolding of proteins monitored by electrospray ionization mass spectrometry: A comparison of positive and negative ion modes. J. Am. Soc. Mass Spectrom. 1998;9(12):1248-1254.

17. Konermann L, Pan J, Wilson D. Protein folding mechanisms studied by time-resolved electrospray mass spectrometry. BioTechniques. 2006;40(2):135-141.

18. Loo JA. Studying noncovalent protein complexes by electrospray ionization mass spectrometry. Mass Spectrom. Rev. 1997;16:1-23. dOi:10.1016/j.jasms.2005.02.017

19. M, Vega N, Pérez G. Isolating and characterising a lectin from Galactia lindenii seeds that recognise blood group H determinants. Arch.Biochem.Biophys. 2004;492:180-190.

20. Sharon M, Robinson C. The role of mass spectrometry in structure elucidation of dynamic protein complexes. Annu. Rev. Biochem. 2007;76:167-193.

21. Heck AJ. Native Mass Spectrometry: A bridge between interactomics and structural biology. Nature Methods. 2008;5:927-933.

22. Drew K, Lee C, Huizar RL, Tu F, Borgeson B, McWhite CD, et al. Integration of over 9000 mass spectrometry experiments builds a global map of human protein complexes. Molecular Systems Biology. 2017;13(6):932. dOi:10.15252/msb.20167490

Page 121: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Capítulo tres

Consecuencias de la determinación de la estructura primaria

de proteínas

Page 122: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural
Page 123: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Consecuencias de la determinación de la estructura primaria de proteínas • 123

La estructura primaria de una proteína determinada presente en especies relacionadas guardan entre sí una estrecha semejanza. De acuerdo con la teoría evolutiva, las especies relacionadas evolucionaron desde un antece-sor común, entonces se deduce que cada una de sus proteínas deben haber evolucionado, análogamente, desde la proteína correspondiente de aquel antecesor.

La naturaleza al azar de los procesos de mutación cambiará, a lo largo del tiempo, a la proteína de modo que no afecte a su función significativamente. Las comparaciones de las estructuras primarias de las proteínas homólogas o relacionadas evolutivamente indican cuáles aminoácidos son esenciales para su función y cuáles tienen un valor menor. En ellas, se encuentran regiones en las que la secuencia es invariante y está relacionada con la fun-cionalidad de la proteína. El porcentaje de identidad permite establecer relaciones evolutivas a nivel molecular y estimar cuando hubo divergencia de género y especie y la relación con la duplicación de genes, entre otros.

Con los datos de comparación se puede hacer la construcción de tablas y árboles de evolución elaborados por medio de algoritmos computacionales a partir de las secuencias de aminoácidos de muchas especies. Además, se pueden establecer diferentes relaciones, algunas de ellas se mencionan a continuación:

Proteínas que tienen la misma función y están en diferentes especies

Un ejemplo muy interesante es el citocromo c, una proteína transportadora de electrones presente en la membrana interna de las mitocondrias y esta, en todos los organismos aerobios [1]. Tiene 104 residuos de aminoácidos, altos niveles de disponibilidad, es periférica y, además, ha estado inalterada a través de un billón de años de evolución. Hoy en día, ya ha sido secuenciada en, aproximadamente, cien especies. Con esta proteína, es posible elaborar un mapa de historia de evolución de organismos vivos, pues es universal, no tiene variantes y se presenta en un amplio espectro de organismos. En su trabajo original, Dickerson y Geis [1] compararon secuencias de 50 es-pecies, y encontraron que una tercera parte de los residuos son idénticos en vertebrados, levaduras, insectos y trigo, aunque se presentan cambios conservativos. En las posiciones 70 - 80 hay un grupo de 7 residuos que son invariantes y se pueden relacionar con la funcionalidad de la proteína. El grupo heme interactúa con dos residuos de cisteína (cys 14, cys 17) y uno de Histidina (His 18).

Page 124: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

124 • Introducción al análisis estructural de proteínas y glicoproteínas

Para ver las diferencias evolutivas entre dos proteínas homólogas, se pue-den contar las diferencias en aminoácidos, entre ellas. La figura 1 muestra las diferencias de secuencia en el citocromo para 22 especies. El orden de estas diferencias mantiene un gran paralelismo con lo que se espera a partir de la taxonomía clásica. Los citocromos c de los primates se parecen más a los de los otros mamíferos. Con respecto a los insectos, difieren entre 26 y 31 residuos de aminoácidos. Los citocromos c de hongos difieren tanto de los de mamíferos (45 - 51 diferencias) como de los de insectos (41 - 47 dife-rencias) o de las plantas superiores (47 – 54 diferencias). Mediante análisis informáticos de los datos tabulados puede construirse un árbol filogenéti-co, que indica la relación ancestral entre los organismos que producen las proteínas. Incluso, se han deducido árboles semejantes para otras proteínas. Cada punto de ramificación de un árbol indica la existencia probable de un antecesor común para todos los organismos situados por encima de aquel. Las distancias evolutivas relativas entre los puntos de ramificación vecinos se expresan como número de diferencias de aminoácidos por 100 residuos de la proteína. De esta forma, se dispone de una medida cuantitativa del grado de relación de las diversas especies que no puede proporcionar la taxonomía macroscópica.

Figura 1. Árbol filogenético para el citocromo C

Fuente: [1, p. 65].

Page 125: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Consecuencias de la determinación de la estructura primaria de proteínas • 125

En la figura 2, se observan las secuencias de citocromo c para diez es-pecies, en las que hay aminoácidos conservados como la glicina, triptófano, fenilalanina y alanina. También secuencias de aminoácidos invariantes como enpKKYipgtKm, relacionados con la función de la proteína [2].

Figura 2. Alineamiento de las secuencias de la proteína citocromo c

Fuente: elaboración propia, diagrama obtenido con el servidor Clustal [2].

Proteínas que surgieron por la duplicación de un gen

Muchas proteínas presentan semejanza de secuencias con otras proteínas del mismo organismo. Estas proteínas surgieron por duplicación de un gen, consecuencia, según se cree, de un proceso de recombinación genética en el que un solo cromosoma adquiere las dos copias del gen.

La duplicación del gen es un modo particularmente eficaz de evolución debido a que uno de los genes duplicados puede desarrollar una nueva funcionalidad a través de la selección natural, mientras que la otra continúa dirigiendo la síntesis de la proteína ancestral, presumiblemente esencial. La hemoglobina y la mioglobina son un excelente ejemplo de esta clase de evolución. La hemoglobina fue la primera secuencia establecida para

Page 126: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

126 • Introducción al análisis estructural de proteínas y glicoproteínas

proteínas oligoméricas y se puede comparar con la mioglobina, ya que las dos tienen como función el transporte de oxígeno.

La hemoglobina transporta el oxígeno de los pulmones a los tejidos y la mioglobina, que se encuentra en los músculos, facilita la difusión rápida del oxígeno a través de los tejidos, almacena el oxígeno y es monomérica. El árbol filogenético (figura 3) indica que, probablemente, la globulina pri-mitiva almacenaba oxígeno. La duplicación del gen permitió que los dos genes resultantes evolucionaran por separado, de modo que, en gran parte, por una serie de mutaciones puntuales, surgió una hemoglobina monomé-rica que tiene la afinidad de unión por el oxígeno y se halla en la sangre de lamprea, un vertebrado primitivo que, de acuerdo con la descripción de los fósiles, ha mantenido su morfología de serpiente alargada durante 425 millones de años. El efecto cooperativo de la hemoglobina tetramérica au-menta su capacidad de transportar oxígeno. Esto proporcionó una ventaja adaptativa que promovió la evolución de la cadena β a partir de la cadena α duplicada. En los mamíferos fetales, el oxígeno se obtiene de la circulación maternal. La hemoglobina fetal, un tetrámero a2g2, en el que la cadena γ es una variante de la cadena β por duplicación genética, evolucionó con el objetivo de tener una mayor afinidad por el oxígeno que se establece entre la de la hemoglobina del adulto normal y la de la mioglobina. Los embrio-nes humanos en sus primeras ocho semanas de gestación producen una hemoglobina (x2e2 ), en la que las cadenas son variantes de las α y β por duplicación del gen. En los primates, la cadena β ha experimentado una duplicación para formar una cadena δ. La hemoglobina d2a2 se encuentra como un componente minoritario de los adultos normales (1 %) y no tiene función única conocida.

Otro ejemplo bien documentado es la formación de la familia de las endopeptidasas, entre las que se encuentran la tripsina y la quimotripsina. Estas enzimas son secretadas por el páncreas como zimógenos al intestino delgado, semejantes en sus propiedades y diferentes en su especificidad. Hay un 41 % de identidad entre ellas, 4 de los 5 puentes disulfuro de la quimotripsina están en las mismas posiciones de 4 de los 6 puentes de la tripsina. Estas son proteínas que están en la misma especie y tienen fun-ciones relacionadas.

Page 127: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Consecuencias de la determinación de la estructura primaria de proteínas • 127

Figura 3. Árbol filogenético de la evolución por duplicación genética de la hemoglobina y la mioglobina

Fuente: [1, p. 65].

Proteínas con diferente función y localización relacionadas evolutivamente

Podemos tener como ejemplos la lisozima, una enzima que hidroliza en la pared de las bacterias gram, el disacárido (GlcNacβ(1-4) MurA2c) y la α- lactalbumina, que representa el 15 % de la proteína de la leche, es una subunidad reguladora de la lactosa sintetasa que sintetiza lactosa (Galβ(1-4)Glc) a partir de los monosacáridos que la componen. Sus funciones fisio-lógicas difieren ampliamente, sin embargo, de 124 residuos de aminoáci-dos, 54 residuos son idénticos. Se calcula que la divergencia, después de la

Page 128: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

128 • Introducción al análisis estructural de proteínas y glicoproteínas

duplicación del gen, se produjo hace unos 300 millones de años, alrededor de la época en que los mamíferos divergieron de los reptiles. La única in-dicación funcional del origen común de estas dos proteínas es que ambas participan en reacciones en las que intervienen carbohidratos como sustratos.

En la base de datos sWiss-prOt se puede consultar la composición de aminoácidos (%), la clasificación de aminoácidos de acuerdo con su fre-cuencia de aparición, el origen taxonómico, la distribución taxonómica de secuencias y las citaciones en revistas. Hasta el 11 de diciembre de 2019 habían reportadas 561 568 secuencias revisadas y curadas, y 201 997 950 análisis de aminoácidos extraídos de 269 719 referencias [3]. En la figura 4, se observa cómo ha sido el crecimiento de la base de datos hasta la fecha.

1990 1995 2000 2005 2010 2015

Número de registros en UniProtKB/TrEMBL

2020

350,000

300,000

250,000

200,000

150,000

100,000

50,000

0

550,000

500,000

450,000

400,000

Figura 4. Crecimiento de la base de datos Uniprot KB/Swiss-prot desde 1990 hasta 2020

Fuente: [4].

Otros estudios de secuencias que han permitido hacer comparaciones filogenéticas se basan en secuencias de aminoácidos que se repiten en tán-dem o se presentan como módulos. Algunas de las proteínas que contienen estas repeticiones están implicadas en procesos de desarrollo neuronal y sus mutaciones pueden alterar la función de dichas proteínas. Lo anterior indi-ca que estas secuencias participan en funciones celulares muy importantes.

En un gran número de proteínas de origen eucariótico se encuentran repeticiones en tándem de aminoácidos, que muestran una alta variabilidad en tamaño entre diferentes especies y en la misma especie. Existe evidencia experimental, en la que los cambios en el tamaño de la secuencia pueden influir en las interacciones proteína-proteína, la actividad transcripcional o su localización subcelular. Esto indica que lo que se repite podría ser fun-cionalmente relevante y, por lo tanto, ser formado por selección natural.

Page 129: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Consecuencias de la determinación de la estructura primaria de proteínas • 129

Un análisis comparativo de la conservación de repeticiones de aminoácidos en un conjunto de proteínas ortólogas de 12 especies de vertebrados mostró 92 secuencias de repetición de gran importancia en funciones biológicas. La especie con el mayor número de repeticiones, en sus proteínas, es la humana, en la que hay un exceso de aminoácidos polares y cargados, y pocos residuos hidrofóbicos, en comparación con la frecuencia general de diferentes aminoácidos en las proteínas evaluadas de otras especies. Las re-peticiones encontradas y evaluadas en proteínas humanas están asociadas a factores de transcripción y desarrollo, y situadas en receptores y membrana.

Estas proteínas pueden ser perjudiciales para las células y, a menudo, se asocian con enfermedades humanas. Estas secuencias aumentan la versa-tilidad funcional de las proteínas, mediando interacciones y facilitando la organización espacial de una manera dependiente de la repetición. Durante la evolución, las repeticiones se retienen preferentemente en proteínas que mantienen la homeostasis rigurosa, lo que podría minimizar los efectos perjudiciales asociados con la repetición y la agregación de proteínas. Su presencia facilita la rápida divergencia de proteínas a través de la acumu-lación de sustituciones de aminoácidos que, a menudo, afectan motivos lineales y sitios de modificación postraduccional. Por otro lado, estas sus-tituciones pueden dar como resultado la reconfiguración de la interacción de proteínas y de las redes de señalización. En síntesis, podemos definir las repeticiones de secuencias en tándem como módulos distintos que, a menudo, se retienen en proteínas estrictamente reguladas [5, 6].

Referencias 1. Dickerson RE, Geis I. The structure and action of proteins. Londres: Harper

& Row publishers, 1969.2. Multiple Sequence Alignment. Clustal. Disponible en: http:/www.ebi.ac.uk/

clustalw/. [Consultado 4 febrero 2020].3. Expasy. Bioinformatics Resource Portal. Disponible en: https://web.expasy.

org/docs/relnotes/relstat.htm. [Consultado 4 febrero 2020].4. UniProtKB/Swiss-Prot UniProt release 2019. Disponible en: https://www.

uniprot.org/statistics/Swiss-Prot. [Consultado 3 febrero 2020].5. Chavali S, Chavali P, Chalacu G, Sanchez de Groot N, Gemayel R,

Latysheva N, et al. Constraints and Consequences of the Emergence of Amino Acid Repeats. Eukaryotic Proteins Nature Structural & Molecular Biology. 2017;24:765-777. dOi:10.1038/nsmb.3441

6. Mularoni L, Ledda A, Toll Riera M, Alba M., Natural Selection Drives the Accumulation of Amino Acid Tandem Repeats in Human Proteins. Genome Res. 2010;20(6):745-754. dOi: 10.1101/gr.101261.109

Page 130: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural
Page 131: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Capítulo cuatro

Estructura secundaria

Page 132: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural
Page 133: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura secundaria • 133

La estructura secundaria de proteínas incluye unos patrones regulares de plegamiento que son conocidos como α hélices, hojas β y vueltas o giros. Estas organizaciones se logran gracias a la disposición espacial de los áto-mos que se encuentran relacionados y a las propiedades del enlace peptí-dico. A continuación, se realiza una descripción detallada de los aspectos más relevantes para la formación de las estructuras secundarias conocidas.

Aspectos relevantes para la formación de estructuras secundarias

El enlace peptídico

Gracias al aporte realizado por Linus Pauling y Robert Corey [1] respecto a la determinación de la estructura de aminoácidos y dipéptidos por rayos X (1930´s - 1940´s), se inició un esfuerzo grande por elucidar las restric-ciones conformacionales que deberían tener las cadenas polipeptídicas y que determinarían la estructura y función de las proteínas. Estos estudios mostraron que el enlace peptídico poseía una estructura rígida y planar como consecuencia de las interacciones de estructuras resonantes que le conferían al enlace peptídico un 40 % de carácter de doble enlace.

Esta configuración se puede demostrar por el hecho que la longitud de enlace peptídico C-N es cerca de 0.13Å más corto que su enlace sencillo Cα-N y su enlace doble C=O es 0.02 Å más largo que el de aldehídos y cetonas. La conformación planar maximiza el sobrelapamiento de los orbitales π enlazantes, lo cual contribuye a la rigidez del enlace peptídi-co. Los enlaces peptídicos, con pocas excepciones, asumen la configuración trans, con lo cual los Cα sucesivos se ubican en lados opuestos del enlace peptídico que los está uniendo (figura 1). En consecuencia, se observan una serie de planos rígidos separados por los sustituyentes R de cada aminoáci-do y, por lo tanto, hay un número limitado de conformaciones que puede asumir la cadena. La conformación cis, en la que los Cα se ubican sobre el mismo lado del enlace peptídico, es cerca de 8.2 kJ/mol menos estable que la conformación trans debido a la interferencia estérica entre cadenas laterales vecinas. Sin embargo, ese impedimento estérico es reducido en enlaces peptídicos en los cuales hay presente una prolina y cerca del 10 % de los residuos de prolina en proteínas adoptan una configuración cis de enlace peptídico (figura 1B).

Page 134: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

134 • Introducción al análisis estructural de proteínas y glicoproteínas

trans cis

O

C

H

N

180°

CCa

a

O

C

C

N

HCa

a

cis

O

CN

C

C

C C

C

a

g

a

trans

O

CN

C

C

C C

C

a

g

a

A

B

Figura 1. Geometría del enlace peptídico

Fuente: [2].

Debido a ese carácter parcial de doble enlace, la rotación sobre el enlace N-C es restringida fuertemente. El enlace peptídico permite rotación de los enlaces de los Cα de los aminoácidos involucrados, pero no del enlace amida N-C propiamente. Solo los ángulos de torsión φ (phi) y ψ (psi) pueden modificarse de una manera relativamente libre (figura 2). Adicio-nalmente, los seis átomos involucrados en el enlace peptídico, los dos Cα, el C y el O del grupo carboxilo, el N y el H del grupo amino son copla-nares, lo que genera más dificultad para una modificación del ángulo de torsión ω (omega) que se observa en el enlace N-C del enlace peptídico. Finalmente, el enlace peptídico tiene un dipolo, ya que el oxígeno tiene una carga parcial negativa y el Namida tiene una carga parcial positiva. Debido a esta característica, el enlace peptídico puede participar en interacciones electrostáticas y contribuye a la formación de puentes de hidrógeno entre el grupo carbonilo del esqueleto y el protón del N del grupo amido (Namida).

O

C N

H

Caa

aCa

H

H

N

H

C

O

N

C

O

C

R

Figura 2. Dipolo y ángulos dihédricos

Page 135: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura secundaria • 135

Ángulos de torsión

El enlace peptídico contiene tres tipos de ángulos de torsión conocidos también como ángulos dihédricos. El menos variable de esos ángulos es ω (omega), el ángulo dihédrico alrededor del enlace peptídico. Este ángulo es fijo debido al solapamiento de los orbitales del doble enlace del carbono carbonilo y el par libre del orbital del Namida. Debido a los factores esté-ricos, como se mencionó, se favorece fuertemente la configuración trans generando un ángulo ω de 180 °, aproximadamente, por el impedimento estérico entre los carbonos alfa (Cα) de residuos de aminoácidos adyacen-tes. Eso significa que, prácticamente, todos los enlaces peptídicos en una proteína tendrán un ángulo ω de 180 °. Debido a la rigidez del ángulo ω, en estructura de proteínas, es mucho más importante poner atención a los ángulos que varían en una proporción mucho mayor, esos ángulos son el φ (phi, Cα - Namida) y el ψ (psi, Cα - Camida). Por definición, la conformación completamente extendida corresponde a 180 ° (o -180 °) para φ y ψ. Los valores numéricos de los ángulos aumentan en sentido de las manecillas del reloj cuando se observan partiendo desde el Cα. También por definición, phi (φ) = 0 y psi (ψ) = 0 cuando los enlaces de Camida-Namida y Camida-Cα están en el mismo plano. La dirección (+) es en sentido de las manecillas del reloj mirando desde el Cα (figura 3).

R

H

H

C

N amina

C amidaC amida

180°

a

= -80°= 85°+

TetraédricoUnión C-C

O

R

C

C amina

N amidaN amida

180°

a

H

Figura 3. Ángulos de torsión

Page 136: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

136 • Introducción al análisis estructural de proteínas y glicoproteínas

Los ángulos de torsión que pueden asumir los átomos del enlace peptídico son limitados por impedimentos estéricos. Algunas relaciones de ángulos φ/ψ podrían resultar en átomos que están más cerca que lo permitido por sus radios de Van der Waals y son, entonces, estéricamente prohibidas. Por ejemplo, 0°/0°, 180°/0° y 0°/180° no son permitidos porque los átomos del esqueleto chocarían. En el caso de carbonos tetraédricos, los sustituyentes se encuentran típicamente en conformaciones escalonadas, pero los enlaces peptídicos son más complicados porque mientras el Cα es tetraédrico, los otros dos átomos involucrados no lo son. Las conformaciones preferidas para los átomos del enlace peptídico ubican los átomos de los sustituyentes a las máximas distancias posibles unos de los otros.

Un ángulo ψ de 180° genera un alineamiento del Namida con el oxígeno carbonilo del mismo residuo, lo que es permitido, aunque no específica-mente favorecido. Un ángulo y de 0° localiza el Namida de un residuo muy cerca al Namida del residuo previo lo cual resultaría en un choque estérico, así como en una interacción electrostática desfavorable porque ambos Namidas tienen cargas parciales positivas.

Las cadenas laterales de los residuos también imponen impedimentos estéricos. Por ejemplo, la glicina, por su tamaño, tiene un rango mucho más amplio de pares φ/ψ posibles que cualquier otro residuo, mientras que la prolina tiene un rango mucho más limitado de ángulos φ porque su cadena lateral está covalentemente unida a su Namida. Los demás residuos están limitados a pocos pares φ/ψ, aunque tienen más posibilidades que la prolina. Esas pocas posibilidades se observan especialmente en residuos que tengan ramificación en el Cβ, como la treonina, valina e isoleucina, las cuales están más restringidos por la presencia de grupos unidos a ese carbono que incrementan el impedimento estérico.

Estructuras secundarias El arreglo espacial que van adoptando las secuencias de aminoácidos puede generar patrones regulares que dan lugar a la estructura secundaria. Los puentes de hidrógeno que involucran átomos que participan en los enlaces peptídicos, en los que el grupo −CO− actúa como aceptor y el grupo −NH− como donador, permiten que la proteína adopte conformaciones de menor energía libre y, por tanto, más estables. A este tipo de conformaciones se les denomina estructura secundaria y cada uno de sus tipos se puede describir perfectamente mediante los ángulos dihédricos φ y ψ de cada uno de sus residuos. Algunos aminoácidos se acomodan mejor en un tipo de estructu-ra secundaria concreto, aunque aún no está claro qué es lo que determina estas preferencias, salvo en algunos casos, como la prolina, la asparagina y

Page 137: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura secundaria • 137

la glicina. En algunas proteínas, o en ciertas regiones de estas, no existen interacciones de suficiente consideración como para que se pueda distinguir un nivel de organización superior a la estructura primaria, en estos casos se habla de conformación al azar (random coil). Estas regiones se localizan, preferentemente, en la superficie de la proteína, donde pueden establecer interacciones con el agua, principalmente interacciones polares y puentes de hidrógeno. Estas son las regiones de las proteínas que mejor toleran las mutaciones, ya que contienen aminoácidos que no son particularmente importantes para la estructura o la función de la proteína.

Hélice α

Cuando la secuencia de aminoácidos adyacentes de un polipéptido se pliega en el espacio en forma de helicoide dextrógiro se adopta una conformación denominada α hélice (figura 4). Cada vuelta de la hélice implica 3.6 residuos de aminoácidos, de modo que cada residuo presenta una rotación de 100 o en relación con el anterior. Como la translación media por residuo es de 0.15 nm, una vuelta completa de la α hélice representa una distancia de 0.54 nm. Cada enlace peptídico puede establecer dos puentes de hidrógeno. Un puente de hidrógeno se forma entre el grupo -NH- del enlace peptídico del aminoácido en posición n y el grupo -CO- del enlace peptídico del aminoácido situado en posición n-4. El otro puente de hidrógeno se forma entre el grupo -CO- del enlace peptídico del aminoácido en posición n y el grupo -NH- del enlace peptídico del aminoácido situado en posición n+4 (n±4). Existen variantes de la α hélice que adoptan un patrón distinto a la hora de formar los puentes de hidrógeno, se trata de la hélice 310, en la que se forman puentes de hidrógeno entre los residuos n y n+3, y de la hélice π, en la que se forman puentes de hidrógeno entre los residuos n y n+5. Los momentos dipolares de los enlaces peptídicos quedan alinea-dos, de manera que se genera un macrodipolo a lo largo de la hélice, con el polo positivo en el extremo amino de la α hélice. Las cadenas laterales de los aminoácidos se orientan hacia la parte externa del helicoide, lo que evita impedimentos estéricos. Esta estructura puede albergar a cualquier aminoácido, a excepción de la prolina, cuyo Cα no tiene libertad de giro por estar integrado en un heterociclo. Por este motivo, la prolina suele de-terminar una interrupción de la α hélice o una desviación de su trayectoria. Los aminoácidos muy polares (por ejemplo, Lys y Glu) también desesta-bilizan la hélice α porque los puentes de hidrógeno pierden importancia frente a las interacciones electrostáticas de atracción o repulsión. Cuando la hélice contiene un residuo hidrofóbico cada cuatro posiciones, este se acumula en uno de los lados de la hélice. Por lo tanto, la α hélice presenta un lado hidrofóbico y otro hidrofílico que forman hélices anfipáticas. En las

Page 138: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

138 • Introducción al análisis estructural de proteínas y glicoproteínas

proteínas de membrana las regiones de la proteína que atraviesan el interior hidrofóbico de la bicapa son, con mucha frecuencia, α hélices hidrofóbicas que contienen unos 20 aminoácidos hidrofóbicos seguidos. Podemos enu-merar de modo general las propiedades de las α hélices:

• La estructura satisface los puentes de hidrógeno de los átomos del esqueleto, excepto por los primeros 4 Namida y los últimos 4 carbonilos.

• Si se observa desde la parte superior una hélice, en un modelo, no se evidencian espacios vacíos en el interior porque todos son ocupados por los radios de los átomos.

• Las cadenas laterales se ubican hacia afuera y ligeramente incli-nadas (~30°) hacia el N-terminal de la hélice.

• Una α hélice tiene un dipolo con una carga parcial positiva hacia el N-terminal y una carga parcial negativa hacia el C-terminal, que interactúan con aminoácidos ácidos y básicos respectivamente.

• La α hélice tiene 3.6 residuos de aminoácidos y una inclinación de 5.4 Å por vuelta.

• El diámetro del esqueleto de la hélice es de ~6 Å.• Los ángulos de torsión del esqueleto son φ = -57 ° y ψ = -47 °.

Sin embargo, estos ángulos pueden variar en cerca de 10 ° de esos valores ideales.

n=5 n=4 n=3 n=2 n=-3

Hélices derechasIzquierdasHélices a

a

p=0p

pp

n

p

Figura 4. Estructura en α hélices de proteínas

Dibujar una α hélice tridimensional en un papel es complicado y, por esto, se han usado dos tipos de representación en dos dimensiones de las estructuras helicoidales, con el objetivo de simplificar el análisis de los seg-mentos helicoidales en las proteínas.

El primer tipo de representación es un diagrama de rueda helicoidal (Helical Wheel) [3]. En este diagrama, la representación implica que se está mirando de arriba hacia abajo por el eje de la hélice y se ubica el ángulo de

Page 139: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura secundaria • 139

rotación para cada residuo, avanzando 100 ° en el sentido de las manecillas del reloj. Esta representación es fácil de entender, pero oculta la distancia de los átomos en la hélice. Por ejemplo, dos residuos que estén completa-mente alineados en esta representación, en la realidad estarán separados en el espacio por cerca de 30 Å. Se observa que los residuos 1, 3, 4, 7 y 8 se encuentran en la misma cara de la hélice y en la red helicoidal se observa que están distanciados cerca de 10 Å uno respecto al otro (figura 5).

1

8

4

5

9

90°

2

270°

6

3

7

180°AV

L

L

L

LG

H

K

G

A

A KK02E

T

Sn

B

Figura 5. Representación de rueda helicoidal en una α hélice. A: nótese que los residuos 1, 3, 4, 7 y 8 se ubican sobre una misma cara de la rueda. B: representación en colores, en amarillo aminoácidos en la misma cara

Fuente: modificado de [4].

La otra forma de representación de las α hélices es la red helicoidal (figura 6). En esta representación se tiene en cuenta el ángulo presente entre cada uno de los carbonos alfa del esqueleto y la distancia que se presenta entre ellos. Aunque en esta representación no se puede hablar de la ubicación es-pecífica de los residuos respecto a las caras de la hélice, sí se hace énfasis en la distancia y el ángulo de inclinación que tiene la hélice en su estructura [5].

En algunas proteínas, el esqueleto forma una variante de la α hélice; como se mencionó la hélice 310 (3 residuos/vuelta, 10 átomos del esqueleto/vuelta) tiene una inclinación de 6 Å (2 Å/residuo). Los residuos presentes en una hélice 310 tienen ángulos de torsión ligeramente diferentes a los presentes en una α hélice, lo que produce una hélice ligeramente más extendida. En este tipo de estructura, el ángulo φ = -49° y el ángulo ψ = -26°.

La hélice π es un elemento de estructura secundaria muy raro en pro-teínas. Los puentes de hidrógeno, en esta, muestran un patrón regular en el cual el C=O del residuo i del esqueleto interactúa por este tipo de puente con el NH del residuo i+5 del esqueleto. Como la hélice 310, este tipo de hélices se encuentra algunas veces en los extremos de α hélices regulares, en los que se puede formar el puente de hidrógeno entre el residuo i y el i+5.

Page 140: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

140 • Introducción al análisis estructural de proteínas y glicoproteínas

20

15

10

5

0 60 120 180 240 300 360

0 12

34

56

78

9

Dis

tan

cia

a lo

larg

o h

élic

e (A

Figura 6. Red Helicoidal

hélicehélicea hélice310

10A°

Figura 7. Comparación de las tres clases de hélices

Fuente: [6].

Los ángulos φ y ψ de la hélice π son -57.1 ° y -69.7 °, respectivamente. Por ello, es necesario que el ángulo de enlace N-Cα-C sea más grande (114.9 °) que el ángulo tetraédrico estándar (109.5 °). Adicionalmente, el radio de la hélice π es mayor, lo que indica que puede haber espacio entre los radios de Van der Waals de los átomos del esqueleto, lo que genera un

“hueco” pequeño que se llena con el solvente. Además, las cadenas laterales están más escalonadas que en la hélice 310, pero no tanto como la α hélice. En la figura 7, se muestra una comparación de las tres clases de hélices.

Page 141: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura secundaria • 141

Estructura β

Segmentos adyacentes de la cadena polipeptídica que se encuentran aleja-dos en la estructura primaria interactúan para formar un zigzag. La cadena principal adopta una configuración espacial denominada estructura de lámina β (figura 8). Las estructuras β de distintas cadenas polipeptídicas o bien las estructuras β de distintas zonas de una misma cadena polipeptídica pueden interactuar entre sí mediante puentes de hidrógeno, lo que da lugar a estruc-turas laminares denominadas hojas plegadas u hojas β. Cuando las estructuras β tienen el mismo sentido extremo N- extremo C se dice que la hoja plegada es paralela. Si tienen sentidos opuestos, la hoja plegada es antiparalela.

Esta conformación es típica de proteínas fibrosas como la fibroína de la seda o las β-queratinas de las plumas de aves y también aparece en proteínas globulares como las inmunoglobulinas. El patrón de formación de puentes de hidrógeno es distinto según se trate de una hoja β paralela o antiparalela.

R R R

R

R

R

R

R

R

RR

RR

R

R

Figura 8. Hojas β antiparalelas en proteínas

Fuente: [7].

La mayoría de las hojas β son arreglos adyacentes a otras hojas en una red extensa de puentes de hidrógeno entre una lámina β y otra cercana, en la cual los grupos N-H del esqueleto de una lámina se estabilizan por puentes de hidrógeno con los grupos C=O de la lámina cercana. De esta manera, en una hoja beta extendida, las cadenas laterales de los aminoáci-dos involucrados se localizan de manera alternada hacia arriba de la lámina y el siguiente hacia abajo de la misma. La apariencia de hoja “plegada” se origina a partir de la conformación tetraédrica del Cα y la orientación que toman las cadenas laterales alrededor de este. Esta organización genera una

Page 142: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

142 • Introducción al análisis estructural de proteínas y glicoproteínas

distancia entre Cα y C=O de 6 Å, aproximadamente, que son más cortos que los esperados para los átomos presentes cerca de un enlace peptídico tipo trans (7.6 Å). La distancia entre Cα adyacentes en láminas β unidas por puentes de hidrógeno es, aproximadamente, 5 Å. Sin embargo, las hojas β raramente son extendidas de manera perfecta y más bien exhiben una torsión un poco diferente debida a la quiralidad de los aminoácidos que la componen. Los ángulos dihédricos promedio, φ y ψ, son respecti-vamente -135° y 135°, lo que diverge significativamente de la conformación completamente extendida esperada (-180°, 180°). Esta variación se explica por la divergencia en las cadenas laterales presentes en las láminas y las interacciones que se pueden generar gracias a estos grupos.

Las láminas β tienen una direccionalidad que está dada por sus grupos amino y carboxi terminal. Debido a esta dirección, las hojas β pueden ser arreglos paralelos, antiparalelos o mixtos. En un arreglo antiparalelo, las láminas β sucesivas alternan sus direcciones de tal manera que el amino terminal de una cadena es adyacente al carboxi terminal de la siguiente. Este tipo de arreglo produce la mayor estabilidad en la cadena porque per-mite que los puentes de hidrógeno se establezcan de forma planar entre los grupos carbonilo y amina, lo cual es la orientación preferida. En este tipo de orientación los ángulos dihédricos φ y ψ son cerca de -140 ° y 135 °, respectivamente. En un arreglo paralelo, todos los aminos terminales de las láminas sucesivas están orientados en la misma dirección, lo cual gene-ra estructuras menos estables por la falta de planaridad en los puentes de hidrógeno formados. Los ángulos dihédricos φ y ψ son, aproximadamente, 120 ° y 115 °, respectivamente. Finalmente, una lámina individual puede ex-hibir un patrón mixto de asociación con una lámina paralela por un lado y una antiparalela por el otro lado. Este tipo de arreglo es menos común que las asociaciones antiparalelas, lo cual podría sugerir que es menos estable.

Las hojas β, en general, contienen entre 2 y 12 láminas unidas, 6 es el promedio encontrado. Cada lámina puede contener hasta 15 residuos de aminoácidos, aunque el promedio es de 6 residuos. Las hojas beta mues-tran un leve enrollamiento hacia la derecha que, de acuerdo con cálculos de energía conformacional, se debe a las interacciones entre los aminoácidos quirales existentes en la cadena polipeptídica. Como consecuencia de este enrollamiento, la hoja β se debilita y se distorsionan los puentes de hidró-geno intercatenarios. La estructura final de hoja β se debe a la optimización de la energía conformacional del péptido y los puentes de hidrógeno que estabilizan la estructura. La topología, o la conectividad, de las láminas en una hoja β puede ser muy compleja. Si la hoja se forma por dos láminas antiparalelas, la conexión puede ser un loop pequeño. Sin embargo, si la hoja se forma por láminas paralelas, la unión entre estas debe ser algo mu-cho más grande que puede, en algunos casos, ser otra estructura secundaria, como las α hélices.

Page 143: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura secundaria • 143

PropensionesEl análisis de la frecuencia con la cual diferentes aminoácidos se encuen-tran en los diferentes tipos de estructura secundaria parece mostrar ciertas preferencias. Por ejemplo, cadenas laterales grandes como las de leucina, metionina, glutamina y ácido glutámico son, generalmente, encontradas en hélices, presumiblemente porque esas cadenas laterales extendidas se pueden proyectar hacia fuera de la región central de la hélice [8]. En con-traste, residuos cuyas cadenas laterales son ramificadas en el carbono beta, como valina, isoleucina y fenilalanina, son, generalmente, encontradas en hojas β, ya que todas las cadenas laterales en esta estructura están dirigidas hacia una dirección opuesta, dejando suficiente espacio para que los átomos presentes en la ramificación se ubiquen y se empaqueten. Debido a estas características, se han determinado algunas reglas empíricas para poder predecir la estructura secundaria a partir de la secuencia de aminoácidos. Uno de los algoritmos más usados para esto es el de Chou y Fasman, el cual, así como otros métodos estadísticos, asume que es posible determinar si un segmento de estructura va a tener una mayor tendencia a organizarse como una estructura helicoidal, como una lámina beta, cómo una vuelta o como una conformación irregular [9]. Hoy en día, existen portales con varios programas informáticos disponibles para hacer dicha predicción, con base en la estructura primaria.

Desafortunadamente, esas tendencias son solo aproximaciones y hay muchas excepciones. Tal vez es preferible determinar qué cadenas laterales se encuentran desfavorecidas en cada uno de los tipos de estructura secun-daria. Con muy pocas excepciones, por ejemplo, la prolina no favorece la formación de α-hélices ni hojas β debido a que su grupo amino no puede participar en la formación de puentes de hidrógeno. Así mismo, la glicina tampoco se encuentra muy comúnmente en α-hélices alfa u hojas β. Esto se debe, posiblemente, a que no posee cadena lateral como tal y puede adoptar un amplio rango de ángulos de torsión φ y ψ en los péptidos. Sin embargo, estos dos aminoácidos se asocian, fuertemente, con vueltas beta y secuencias Pro-Gly o Gly-Pro y son considerados fundamentales para la formación de vueltas tipo beta.

Aunque estos análisis se han usado para predecir la estructura secundaria y se han asignado valores a cada uno de los aminoácidos de acuerdo con el tipo de estructura a formar, se debe decir que no son totalmente precisos y que la única regla que parece aplicarse realmente a la estructura de las proteínas es que cualquier aminoácido puede estar en cualquier tipo de estructura secundaria. Por ejemplo, la prolina se encuentra en algunas α-hé-lices y, cuando esto sucede, simplemente se interrumpe la red de puentes de hidrógeno que la estabilizan y se produce un pliegue en la hélice [10].

Page 144: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

144 • Introducción al análisis estructural de proteínas y glicoproteínas

Giros β

En una proteína globular, las regiones con estructura α o β están conectadas entre sí por medio de los llamados giros β (figura 9). Son secuencias cortas, típicamente formadas por cuatro aminoácidos, con una conformación ca-racterística que impone un brusco giro de 180 ° a la cadena principal de un polipéptido. Aminoácidos como Asn, Gly y Pro, que se acomodan mal en estructuras de tipo α o β, aparecen con frecuencia en este tipo de estructura. Normalmente, la conformación de los giros β está estabilizada por medio de un puente de hidrógeno entre el grupo carboxilo del residuo 1 y el grupo amido del residuo 4. En una proteína globular los giros β pueden incluir a casi un tercio de los residuos de la proteína. Los giros se localizan, prefe-rentemente, en la superficie de la proteína, de modo que los aminoácidos en posiciones 2 y 3 puedan establecer puentes de hidrógeno con el agua.

Hay varias clases de giros β, los más abundantes son los giros β de tipo i, formados por 4 aminoácidos, con un puente de hidrógeno entre los re-siduos 1 y 4. Los giros β de tipo ii también están formados por 4 aminoá-cidos, con un puente de hidrógeno entre los residuos 1 y 4; sin embargo, se distinguen de los anteriores porque el aminoácido en posición 3 es una glicina. Finalmente, los giros β de tipo γ están formados por 3 aminoácidos, con un puente de hidrógeno entre los residuos 1 y 3.

H

2 3

O

41

ON

R2

N

O

R3

N

H

H

R2 R3

O

41

OH N

NH

2O

N 3

Tipo I: n=3, cualquier Aa excepto Pro Tipo II: n=2 Gly y n=3 Pro

O

H

N

HH

H

O

3

N

2

1

H

H

Tipo : n=1, ProgTipo III: un fragmento de hélice 310

Figura 9. Representación de giros β en proteínas

Estructuras supersecundarias En proteínas con estructura terciaria globular es frecuente encontrar combi-naciones de elementos de estructura secundaria, estructuras al azar, α hélice, hojas β y giros β, con una disposición característica que puede observarse en distintas proteínas, aunque sus secuencias sean muy distintas. Estas combi-naciones de elementos de estructura secundaria que se repiten en distintos tipos de proteínas reciben el nombre de estructuras supersecundarias o

Page 145: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura secundaria • 145

motivos estructurales. Las estructuras supersecundarias se suelen clasificar en función del elemento de la estructura secundaria predominante: motivos α, motivos β y motivos aβ [11].

Las estructuras supersecundarias se estabilizan por los mismos tipos de interacciones que estabilizan la estructura terciaria, interacciones débiles y covalentes, como veremos más adelante. Sin embargo, no todas las proteí-nas presentan estructuras supersecundarias. Los principios que gobiernan la estructura de proteínas globulares tienen relación con seis aspectos o niveles de organización estructural, los cuales se enumeran a continuación:

1. Como se mencionó previamente, los plegamientos locales de la cadena se dan por la formación de los puentes de hidrógeno y la conservación de aquellas estructuras con un mínimo de energía determina las estructuras secundarias.

2. Las estructuras α-hélice y hojas β se empaquetan según un número restringido de orientaciones, hay un número alto de posibilidades y solo se dan unas cuantas.

3. Las conexiones entre estructuras secundarias son generalmente orientadas en sentido a la derecha y no hay formación de nudos.

4. Las cadenas polipeptídicas forman estructuras secundarias dis-puestas en unos pocos patrones (patterns). Se tienen así proteínas con estructura terciaria similares sin que haya parentesco evolu-tivo funcional.

5. La estabilidad de la estructura resulta de una superficie míni-ma expuesta al solvente. Esta superficie mínima aparece por el plegamiento de la cadena y por los puentes de hidrógeno intramoleculares.

6. De las estructuras posibles termodinámicamente y cinéticamente, solo unas pocas poseen las depresiones, rendijas o nichos apro-piados para la formación de sitios activos.

Conformación de α-hélice, estructuras β y cadenas laterales

Los factores dominantes son las restricciones estéricas a los ángulos de torsión y la formación de puentes de hidrógeno con los residuos polares enterrados al interior de la proteína. Todas las estructuras α y β tienen uniones de longitud similar y ángulo (tabla 1).

Los valores son muy parecidos en las diferentes estructuras α hélice, hélice 310 y hélice π. Con estructuras determinadas a 1.2 A ° y 0.98 A °, se estableció que los puentes de hidrógeno situados en el lado accesible al

Page 146: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

146 • Introducción al análisis estructural de proteínas y glicoproteínas

Tabla 1. Longitud de los puentes de hidrógeno

Estructura Longitud de uniones Desviación estándar

Ángulos de torsión en α-hélice

α-hélice N…O 2.9 Α ° NH…O=C 155 ° 6 ° N-Cα : φ=-65Cα -C=O : ϕ=-41

β-estructura NH….O 2.0 Α ° NH…O=C 160 ° 12 °

Fuente: [12, p. 539].

solvente son, aproximadamente, 0.2 A ° más largos que los situados en la parte no accesible. Las hélices se doblan cuando tienen una longitud ma-yor a 15 residuos de aminoácidos, con ángulos del orden 10 - 30 °. Las vueltas en las hélices se presentan en la superficie de la proteína cuando ocurren grupos polares que no forman puentes de hidrógeno intramole-culares. En las estructuras β, los valores de ϕ y φ no están tan restringidos como en las α-hélices, lo cual permite torsiones (generalmente hacia la derecha) y enrollamientos. En ciertos casos hay dobleces que implican cambios de dirección de 90 °. La densidad de empaque (de) y la eficiencia del empaquetamiento de los residuos al interior de la proteína influyen en sus propiedades termodinámicas, estructurales y mecánicas. Los modelos de empaquetamiento de α-hélice y estructuras β están dominados por un empaque denso de residuos y las estructuras secundarias empacadas que tienen conformaciones aproximadas se encuentran relacionadas a confor-maciones con el mínimo de energía libre de las estructuras por separado. Las estructuras tienen diferentes formas de interacción, ángulos y distancia entre cada elemento de estructura secundaria (figura 10).

α-hélices: las crestas, usualmente, son las cadenas laterales de residuos i, i+4, i+8, se encuentran en ángulos Ω y se refieren a la orientación relativa de las dos cadenas con valores preferenciales de -50 °, si las dos hélices tie-nen un n = ±4 (crestas); +20 °, si una hélice tiene n = ±4 y la otra n = ±3, y -105 °, si una hélice tiene n = ±4 y la otra n = ± 1. La distancia entre las dos hélices está entre 6.8 y 12 A °, es decir, los contactos se dan a nivel de cadenas laterales.

1-4

i 4nj 1n

105°

4-4

i 4n j 4n

52°

3-4i 4 j 3n

23° 30°90°

Figura 10. Interacción de las estructuras secundarias Fuente: [12, p. 548, 533].

Page 147: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura secundaria • 147

α-β: en las proteínas estudiadas se ha observado que las dos estructuras se empacan con sus ejes paralelos porque cada una se pliega hacia la dere-cha y las superficies de la fila de residuos i, i+4, i +8 y de la fila i+1, i+5, i+9 son complementarias a la estructura β.

β-β: hay dos clases, alineadas (Ω - 30 °) y ortogonales (Ω - 90 °). En las alineadas, cada una de las estructuras β es independiente y las dos hojas están enfrentadas de manera que los pliegues son complementarios. En las ortogonales, el empaquetamiento se hace con hojas dobladas sobre sí mismas (figura 10).

Los segmentos con estructura secundaria que son adyacentes en la se-cuencia también están en contacto en la estructura terciaria. De todas las posibilidades de combinaciones, 2/3 son aα, bβ y baβ. Cada una de estas asociaciones se llama “unidad de plegado” o estructuras supersecundarias.

Estabilidad La contribución de las fuerzas electroestáticas no es clara, la de los puentes de hidrógeno puede ser substancial si se considera que la proporción de grupos R que puedan formar puentes de hidrógeno es constante y cercana a 0.5 [12]. Se ha calculado que por razones entrópicas la energía libre (G) de las interacciones intramoleculares es mayor que la de las intermolecula-res. La contribución hidrofóbica resulta de un menor número de contactos con el agua de la proteína plegada comparada con la desdoblada o abierta (desnaturalizada). Si se calculan las áreas superficiales de los grupos o áto-mos de la proteína, se pueden calcular los cambios en las áreas de contacto proteína-solución y proteína-proteína que ocurre durante el plegamiento o la asociación. En la determinación de la contribución hidrofóbica, deben considerarse el área superficial accesible, la accesibilidad y el área de contacto.

Se puede determinar también el grado de exposición de los diferentes grupos R y la composición superficial e interna de las proteínas, si se sabe, por ejemplo, que al interior de la proteína se encuentran un 50 % de los residuos no polares, un 25 % de los residuos con un átomo polar y un 10 % de los residuos con dos o más átomos polares o grupos cargados. Respecto a la “superficie enterrada” un 60 % está “enterrada” dentro de las estructu-ras secundarias y un 40 %, entre ellas. El área accesible (As) es función del peso molecular ƒ(PM):

As (Å2): 11.1 M2/3 para proteínas ∼50 aminoácidos (5.500 Da) = 70 As (Å2): 1.45 M para proteínas ∼300 aminoácidos (33 000 Da) =160

Page 148: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

148 • Introducción al análisis estructural de proteínas y glicoproteínas

Lo que indica que a mayor masa molecular se entierra una menor pro-porción de su superficie.

Las proteínas se pueden clasificar por los motivos estructurales (domi-nios) en [13]:

• α-totales: compuestas principalmente por α-hélices dispuestas como haces segmentales 3-4.

• β-totales: con empaquetamientos alineados u ortogonales de las hojas β, principalmente antiparalelas.

• α/β : se alternan a lo largo de la cadena, frecuentemente hay una hoja β central con α- hélices dobladas o segmentos helicoidales de conexión.

• α+β: son segmentos segregados y no se alternan; las proporciones de cada una varían dando lugar a estructuras heterogéneas.

• Coil: estructuras ricas en puentes disulfuro o asociadas con un cofactor grande, generalmente pequeñas y con poca estructura secundaria.

Los motivos α-helicoidales más comunes tienen cuatro hélices y un plegamiento tipo globina, que consiste en ocho α hélices que forman un bolsillo hidrofóbico en el núcleo, en el que los grupos orgánicos hidrofó-bicos y organometálicos pueden unirse. Un ejemplo, es la mioglobina, una proteína de almacenamiento de oxígeno, en la que las ocho hélices están dispuestas alrededor del grupo hemo. Este plegamiento se encuentra en proteínas que son monoméricas, diméricas, tetraméricas o multiméricas.

El motivo α-helicoidal más común tiene cuatro α hélices empaqueta-das y ha sido encontrado en muchos dominios α con un rango de diversas funciones, como el transporte de oxígeno, la unión de ácidos nucleicos y el transporte de electrones. Las interfaces entre las hélices están compuestas por residuos hidrófobos, mientras que las cadenas laterales polares expuestas en las superficies interactúan con el ambiente acuoso (figura 11).

Las cuatro hélices pueden tener diferentes topologías: • Todas las hélices tienen una organización antiparalela (motivo

ascendente y descendente).• Todas las hélices tienen una organización paralela.• Las hélices tienen una organización paralela y antiparalela.

En la figura 12, se observa el motivo de cuatro hélices antiparalelas para miohemeritrina, una proteína de almacenamiento de oxígeno en gusanos marinos, conectadas por elementos de estructura secundaria desordenados o sin plegamiento, que se empaquetan en forma globular. El oxígeno se une a centros de hierro. Los átomos de hierro se unen a la proteína por medio de las cadenas laterales carboxilato de residuos de glutamato y aspartato y por cinco residuos de histidina.

Page 149: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura secundaria • 149

Leu

Val

Leu

Val

Leu

Val

Leu

Leu

Val

Leu

Val

Leu

Val

Leu

add

aa

dd

aa

dd

aa

dd

Interacciones iónicas NúcleoHidrofóbico

Hélice 1 Hélice 2

Interacciones iónicas

f f

c

d

g

d

b e

ac

be

a

g

e g

Ala

Glu

Asp

Lys

Lys

Glu

Arg

Val

Figura 11. Interacción entre α hélices formación del core hidrofóbico

Fuente: [14].

Figura 12. Miohemeritrina

Fuente: [15].

Los dominios β contienen solo hojas β, giros cerrados y estructuras irregulares. Muchas de las β proteínas tienen hebras antiparalelas. Los con-tactos más comunes son hebras adyacentes, horquillas β (β hairpins), que forman motivos con conexiones hacia arriba y hacia abajo, o la llave griega. Las hojas antiparalelas pueden formar estructuras de barril o β sándwich. En esta última, dos hojas separadas se empaquetan una contra la otra. En motivos de barril β, una sola hoja forma una estructura cilíndrica cerrada

Page 150: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

150 • Introducción al análisis estructural de proteínas y glicoproteínas

en la que todas las hebras forman puentes de hidrógeno entre sí, es decir, en la lámina, la última hebra está unida por hidrógeno a la primera hebra.

Otro motivo es el jelly-roll. Está formado por ocho hebras que hacen parte de dos hojas β y se encuentra en diferentes proteínas, entre las cuales están las lectinas de origen vegetal. En la figura13, se presenta un ejemplo de este tipo de estructuras que corresponde a la lectina de concanavalina A (Con A) (pdb 3cna). Tiene la estructura clásica de lectinas de la familia Leguminosae. Se ha encontrado gran homología estructural entre todas las subunidades presentes en la molécula, el plegamiento típico de los mo-nómeros es de tipo jelly-roll y se constituye de tres hojas: una trasera con seis hebras antiparalelas de forma plana, una delantera cóncava, con siete hebras y una más pequeña con cinco hebras que mantiene juntas las otras dos hojas, lo que genera una estructura aplanada en forma de domo con cuatro bucles localizados en la parte superior del monómero, formando el sitio de reconocimiento a carbohidratos. Este plegamiento típico se de-nomina legume lectin fold y también ha sido hallado en algunas proteínas bacterianas, fúngicas y animales.

A B

Figura 13. Motivo jelly-roll Lectina de concanavalina A (Con A). Estructura tomada del Protein Data Bank (pdb 3CNA). Resolución 2.4 angstroms. Cada hebra, bucle y subunidad están representados en un color diferente. Las esferas negras y blancas simbolizan los iones calcio y manganeso necesarios para la actividad de Con A. A: estructura monomérica simbolizada desde el extremo amino terminal, en azul oscuro, hasta el carboxilo terminal, en rojo. B: interacción de las cuatro subunidades idénticas para formar el tetrámero de Concanavalina A

Fuente: [16, p. 20].

Page 151: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura secundaria • 151

Este plegamiento tipo leguminosa es común en muchas lectinas aisladas de semillas de diferentes familias botánicas, incluso, se ha observado en lectinas aisladas de algas marinas. En la figura 14, se observa la estructura de la lectina bryohealin aislada de un alga verde. Consta principalmente de cinco hebras β organizadas de forma antiparalela que se superpone sobre una segunda hoja conformada por tres hebras β, dispuestas una sobre la otra formando un barril-β compacto con topología jelly roll y cuatro bucles flexibles que forman la superficie de unión al ligando (A-E). También se observa la estructura de una lectina L-fucosa descrita para Anguilla angui-lla (código pdb 1K12), un barril β de ocho cadenas, cuyo sitio de unión al ligando es una bolsa de carga positiva superficial en un extremo del barril β, que está enmarcada por cinco bucles, denominados las regiones deter-minantes de complementariedad (cdr1 a cdr5).

BC-terminal

E

6

7

12

3 4 5

A

C

B

DE

AC-terminal

57

6 1

23

4

E

D

CB

A

Figura 14. Estructuras de lectinas. A: estructura tridimensional de bryohealin resuelta con i-Tasser, se muestra sitio de unión al carbohidrato definido entre la región determinante (Bucles A-E). Línea gris (random coil), cilindros rojos (ahélices), flechas azules (hebras β). B: fucolectina proveniente de Anguilla anguilla O

Fuente: [17, p. 70].

Otro motivo es el plegamiento inmunoglobulina, que se encuentra en muchas proteínas que desempeñan papeles en la respuesta inmune. En este plegamiento, encontramos motivos formados por hojas β antiparalelas, una de cuatro hebras y otra de tres hebras, empaquetadas en forma de sándwich, interactuando por hebras que se unen por puentes disulfuro formando un núcleo hidrofóbico. La topología, a menudo, incluye una llave griega, en la que una de las uniones puede cambiar entre las hojas. Las hojas son ali-neadas, en contraste, con estructuras β sándwich ortogonales. En la figura 15, se observa la estructura de una inmunoglobulina de tipo M, que está formada por 70 dominios inmunoglobulina.

Page 152: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

152 • Introducción al análisis estructural de proteínas y glicoproteínas

N

C

1 2 3 4 5 6 7

N

C

A B

Figura 15. Inmunoglobulina M. A: pdb 2RCJ Estructura de Inmunoglobulina M humana (IgM). B: estructura β sándwich que incluye topología de llave griega

Fuente: [18, p. 184].

En proteínas α/β se ha demostrado una relación entre su topología y la posición de los sitios activos, que se encuentran en hendiduras formadas por las conexiones que dos hebras β hacen con α hélices. Están compuestos por unidades β-α-β, en las que las hebras β se orientan en forma paralela e interactúan por puentes de hidrógeno. Las hebras están conectadas por segmentos largos y hélices que se empaquetan contra el núcleo de las he-bras. La orientación de esta estructura es, por lo general, hacia la derecha (figura 16).

Orientación hacia la derecha, la hélice esta sobre el plano de las hebras

Core hidrofóbico entre hélice y hoja

Figura 16. Unidades β-α-b

Fuente: modificado de [19].

Page 153: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura secundaria • 153

Hay dos clases principales de motivos α/β:

1. Plegamiento Rossmann Las unidades β-α-β se combinan para dar estructuras más complejas que dejan en la mitad una hebra β que comparten las unidades β-α. La unión da como resultado la formación de una hoja β paralela abierta rodeada por hélices en los dos lados. La estructura es dividida en dos motivos similares, con una unidad lineal β-α-β-α-β. La hoja β normalmente tiene seis hebras, pero puede tener hebras adicionales.

Las deshidrogenasas dependientes de nad+ han sido las más estudiadas. El plegamiento genera una cavidad que permite la unión de la adenina pre-sente en nad+ u otro nucleótido. Cada plegamiento Rossmann puede unir un nucleótido; por lo tanto, los dominios de unión para los dinucleótidos consisten en dos motivos Rossmann (figura 17).

Figura 17. Plegamiento Rossmann (α/β estructuras -hoja β abierta)

Fuente: [20, p. 50]

2. Plegamiento barril TIM Otro motivo muy común α / β, es el barril tim, en este motivo se alternan 8 unidades β paralelas y 8 unidades α, generando una topología cilíndrica en la cual las hebras β se orientan hacia el interior del cilindro y las hélices hacia el exterior (figuras 18 y 19). Las enzimas que tienen el motivo barril tim catalizan una variedad de diferentes reacciones y su secuencia aminoá-cidos tienen un bajo porcentaje de identidad. En la figura 19 se observan dos proteínas con cada uno de los plegamientos α/β mencionados.

Page 154: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

154 • Introducción al análisis estructural de proteínas y glicoproteínas

Interfase

/

Interfase/ ( barril)

Interfase/ ( motivo)-X-

Eje barril

Lado catalítico

C-terminal hebras

Figura 18. Plegamiento barril tim. Se observa un barril cerrado en el centro de la estructura y un eje de simetría (punto y línea punteada) que atraviesa el cilindro formado por las hebras β (color blanco). Las α hélices rodean el cilindro, en el que se forma el sitio catalítico

Fuente: [21].

Figura 19. Plegamiento Rossmann en enzimas. A.pdb 3QVO estructura con plegamiento Rossmann de una deshidrogenasa de unión a nad(P) de Shigella flexneri. B. pdb 3TDM modelo computacional para el plegamiento barril tim de la proteína HalfFLR de novo de Escherichia coli

Fuente: [22, 23].

Page 155: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura secundaria • 155

Los motivos α+β contienen hojas β y α hélices, pero están separados estructuralmente y, por lo general, se encuentran en proteínas del sistema inmune. Un ejemplo son las moléculas del complejo mayor de histocom-patibilidad (mcH), en las que las unidades forman un surco orientado hacia el exterior, para albergar los péptidos que son presentados a los linfocitos T. Las hojas β son antiparalelas y forman el piso del surco, las α hélices atraviesan el piso de hebras β y allí se encuentran los aminoácidos expuestos que son reconocidos por el receptor de células T o permiten la interacción con los residuos de aminoácidos de los péptidos que se unen a la molécula del complejo mayor de histocompatibilidad. Se observa que no se mezclan los dos elementos de estructura secundaria (figura 20).

Sitio de unión de péptidos

Figura 20. pdb vgk Estructura cristalina del complejo mayor de histocompatiblidad de Tipo I, H-2Kd a 2.0 A resolución

Fuente: [24].

Determinación experimental de la estructura secundaria

La interacción de una molécula quiral con la luz polarizada es un método para la caracterización estructural de moléculas pequeñas y de macromo-léculas. Los tipos de medición comúnmente empleados para determinar

Page 156: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

156 • Introducción al análisis estructural de proteínas y glicoproteínas

el efecto de la luz polarizada en una molécula asimétrica son el dicroísmo circular (dc) y la dispersión óptica rotatoria (dOr). Los efectos producidos por la incidencia de la luz sobre moléculas quirales son relativamente pe-queños, pero pueden ser medidos fácilmente con instrumentos modernos. En el caso particular de las proteínas, el dc es una técnica muy valiosa, ya que permite llevar a cabo estudios estructurales en las condiciones en las que las biomoléculas funcionan normalmente, proporcionando así medidas de cambios estructurales esenciales para su función biológica.

La radiación electromagnética se caracteriza por la amplitud y orientación de sus campos eléctricos y magnéticos (H y E). Los vectores magnético y eléctrico son perpendiculares entre sí y perpendiculares a la dirección de propagación; en la luz no polarizada las ondas electromagnéticas oscilan en todas las direcciones mientras que, cuando el vector eléctrico vibra en un solo plano, se denomina plano de polarización. La luz que se propaga en estas condiciones se denomina luz polarizada plana, o linealmente po-larizada (figura 21).

Campo eléctrico

Campo magnético

Luz no polarizadaLuz polarizada

BA

Figura 21. Radiación electromagnética y luz polarizada A: vectores de los componentes de la radiación electromagnética. B: representación de la luz no polarizada, oscilando en un solo plano y en todas las direcciones.

Fuente: [25, 26].

Para obtener la luz polarizada a partir de una fuente de luz, se selecciona una onda que oscila en un solo plano y puede ser lineal o circular (figura 22). La luz polarizada circularmente es quiral, es decir, se encuentra en dos formas no superponibles, las cuales son imágenes especulares. Para discri-minar entre las dos formas quirales de la luz, una molécula debe ser quiral, lo cual incluye a la gran mayoría de moléculas biológicas.

La luz polarizada en un plano se considera constituida por un compo-nente polarizado circularmente que gira en el sentido de las manecillas del reloj (D) y otro, en contra (L). Ambos componentes están en fase y son de la misma amplitud. Cuando los dos son iguales se tiene luz polarizada en un plano y el vector resultante oscila. Cuando esta luz atraviesa un medio

Page 157: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura secundaria • 157

AZ

y y

Z

B

X X

C

No polarizada Lineal o polarizada enun plano

Circularmente polarizada

Figura 22. Componente eléctrico de luz polarizada y no polarizada. A: luz no polarizada: que se mueve en todas las direcciones 360 °. B: luz polarizada que oscila en un plano o lineal, solamente ocurre en la dirección Z. C: luz circular que ocurre en dirección a las agujas del reloj y en sentido contrario.

Fuente: [27, p. 3].

que tiene un índice de refracción diferente para cada uno de los compo-nentes, uno de ellos se retrasa y el vector resultante se desplaza α grados respecto a su posición original. Es decir, al pasar por un medio ópticamente activo, cada componente interactúa de manera diferente con los centros quirales de las moléculas presentes. La diferencia en la absorción de la luz polarizada circularmente a la izquierda (L) y a la derecha (D) es la base del dicroísmo circular (dc).

Los componentes circularmente polarizados son absorbidos en diferentes grados por una sustancia quiral, la luz que pasa a través de esta estará po-larizada elípticamente y se dice que esta sustancia tiene dicroísmo circular (dc), magnitud expresada en unidades de elipticidad molecular (θ). Como los índices de refracción del medio quiral son distintos para cada compo-nente, se produce un desfasamiento entre ellos que provoca la rotación del plano de polarización en un ángulo α, lo que resulta en un proceso de dispersión que se conoce como dispersión óptica rotatoria (dOr) (figura 23). Tanto dc como dOr varían con la longitud de onda, lo que permite representar la rotación o elipticidad frente a la misma y obtener espectros de los dos procesos.

En síntesis, la medida de la rotación óptica como función de la longitud de onda (λ) se denomina dispersión óptica rotatoria (dOr) y la medida de la absorción desigual polarizada circularmente dextrógira (D) o levógira (L) se denomina dicroísmo circular (dc).

Page 158: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

158 • Introducción al análisis estructural de proteínas y glicoproteínas

A

Dispersión óptica rotatoria (DOR)

Dicroísmo circular (DC)

Dispersión óptica rotatoria (DOR)

C1 2 3

Ab

sorb

anci

a (A

)D

C (

)

D

Figura 23. Dispersión óptica rotatoria (dor) y Dicroismo circular (dc). A: un componente es retrasado con respecto al otro. Hay un cambio en el plano de la luz polarizada, se evidencia por el ángulo α. B: la absorción de los componentes izquierda y derecha de la luz polarizada es diferente εi≠εd (coeficientes de extinción). C: La luz es elípticamente polarizada, se genera un espectro (θ vs λ) espectro generado por dicroísmo circular (dc). D: luz polarizada en un plano-componentes de la misma amplitud.

Fuente: [27, p. 14; 32, p. 162].

Dispersión óptica rotatoria (dor)

La detección consiste en evaluar el cambio de velocidad de los haces a tra-vés del cambio en el índice de refracción: ηd ≠ ηi (D: derecho,I: izquierdo). Las curvas dispersión pueden ser normales si no hay banda de absorción ópticamente activa y anormales si hay una banda ópticamente activa (fi-gura 24) [28].

C.AC.N

S

C.A: Curva AnormalC.N: Curva NormalS: Curva Sencilla

Figura 24. Curvas hipotéticas de dispersión óptica rotatoria dor

Page 159: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura secundaria • 159

En el primer caso, para la curva sencilla, se puede describir por la ecua-ción de Drude:

[a] x= ∑ (ki/l2-l0

2)

En esta,

Ki (constante de rotación): son constantes para el cromóforo absorbente.λ: es la longitud de onda de la medida.

l0: son las posiciones de los máximos de absorción del compuesto en la región ultravioleta (constante de dispersión).

α: rotación específica.

Las curvas de dispersión sencillas se representan por la ecuación de Drude con un solo término, en el cual l0 está en el extremo inferior de la región ultravioleta. Generalmente, se usa la rotación molar (m´) definida por la ecuación:

m´= α (3/η2 +2)M/100

En esta,

(3/η2 +2) es un factor de corrección para efecto de la polarizabilidad del medio.

η: índice de refracción. M: masa molecular

En biopolímeros si M se toma como peso promedio, m´ se llama rota-ción promedio por residuo. La variación m´ con λ en regiones no cercanas a una banda de absorción se puede describir con la ecuación de Drude:

[m´] = (96 π N/hC) (R*l02/l2-l0

2)

En esta,

h: Constante de Planck.C: velocidad de la luz.

R: Fuerza rotacional (diferencia del coeficiente de extinción integrado a lo largo de la banda).

l0: longitud de onda de la banda. N: número de Avogadro.

Page 160: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

160 • Introducción al análisis estructural de proteínas y glicoproteínas

Si hay un cierto número de transiciones de longitud lko y fuerza rota-cional Rk, [m´] será la sumatoria:

[m´] = (96 π N/hC) ∑ (Rko*lk02/l2-lk0

2 ) [m´] = A ∑ (Rk*lk

2/l2-lk2)

En forma general, se puede describir una ecuación empírica, llamada ecuación Moffit-Yang en la que:

[m´]= (a0 l02/l2-l0

2) + (b0 l04/ (l2-l0

2)2) +…

La ecuación se obtiene por consideraciones de mecánica cuántica sobre la actividad óptica producida por un sistema regularmente espaciado, que forma una hélice y que actuaría como un solo sistema que absorbe (exci-tón). b0 y l0

son característicos de una α-hélice; a0 es característico de una α-hélice con la influencia de la temperatura, solvente e interacciones entre residuos y composición.

Si se puede suponer un valor para l0, se pude graficar [m´]*(l2-l02) vs 1/

(l2-l02). La intersección será a0 l0

2 y la pendiente b0l04 (figura 25).

-200

-400

-600

-800hélice pH=4.0

RC pH=7.0

Figura 25. Gráfica hipotética para la determinación de b0 y a0 para α hélice y estructuras desordenadas o random coil (rc)

Experimentalmente, se ha visto que si se asume λ = 212 nm se obtiene una relación lineal y los valores a0 y b0 se pueden relacionar bien entre lo teóricamente predicho y lo experimentalmente observable para proteínas y polipéptidos sintéticos. Por ejemplo:

0 % α-hélice b0 = 0100 % α-hélice b0 = -630

Los valores para 100 % de una estructura obtenidos de gran número de experiencias con polipéptidos sintéticos se observan en la tabla 2.

Page 161: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura secundaria • 161

Tabla 2. Valores de b0 y a

0

Estructura a0 b0

Hélice derecha α +650 -630

Hoja β +400 0

Random coil -650 0

Los estudios con polipéptidos sintéticos permitieron relacionar los tres tipos de estructuras en proteínas a través de constantes y cada una de ellas es la suma de las contribuciones de cada una de las tres estructuras secun-darias así :

b0 = ƒα(bo) +ƒβ(bo) +ƒR(bo) a0 = ƒα(ao) +ƒβ(ao) +ƒR(ao)

ƒα +ƒβ +ƒR=1

En las que R corresponde a random coil; α, α hélice; β, hojas β.

Dicroísmo circular (dc)

El dicroísmo circular se expresa frecuentemente como la propiedad que poseen algunos materiales de absorber la luz a diferentes grados dependien-do de la forma de polarización del haz incidente. Se dice que un material presenta dicroísmo circular cuando la absorción de la luz circularmente polarizada en una dirección (derecha) es diferente de la absorción de la luz circularmente polarizada en la dirección opuesta (izquierda) [29]. Cuan-do la luz se polariza circularmente, surge un componente secundario de absorbancia que se mide como el cambio entre la luz polarizada circular-mente a la derecha (D) e izquierda (I), y la diferencia resultante se expresa como absorbancia. Se tiene así que el dc a una longitud de onda (λ) dada se define por:

∆A = AI-AD

En esta ecuación, I es componente izquierdo; D, componente derecho; A, absorbancia a determinada longitud de onda; ∆A, diferencia de absorbancia.

Las moléculas quirales tienen índices de refracción diferentes para la luz polarizada circularmente dextrógira (D) y levógira (I), es decir, los haces de luz viajan a diferentes velocidades y son absorbidos en diferentes grados dependiendo de la energía; por lo tanto, los coeficientes de extinción molar para la luz circularmente polarizada dextrógira y levógira son diferentes, εI≠εD, la ∆E se grafica contra la λ para producir el espectro dc, por lo tanto:

Page 162: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

162 • Introducción al análisis estructural de proteínas y glicoproteínas

∆E = (εI-εD). c. L

Aquí ε corresponde al coeficiente de absortividad molar (M-1 cm-1); ∆E corresponde a la diferencia de los coeficientes de extinción; c, a la concen-tración en molaridad de la muestra y L, al paso óptico.

Por otra parte, la elipticidad molar [θ] y la diferencia en el coeficiente de extinción molar (∆E) son medidas interconvertibles por un factor:

[θ] = 3.300 ∆E

La elipticidad molar también se define como:

[θ] = 100θ/CL θ: Elipticidad (medida en grados)

[θ] : Elipticidad molar (grados * cm2* dmol-1)

En la que C y L son la concentración molar y la longitud de la trayectoria (cm) de la celda, respectivamente. La elipticidad molar se reporta como deg.cm2.dmol o como deg.M-1.m-1, y estas dos unidades son equivalentes.

La integrada de la intensidad de una banda de dc proporciona una me-dida de la fuerza del dc, llamada la fuerza de rotación. La fuerza rotacional tiene unidades de erg.cm3 y se define experimentalmente como:

R = ((2.303) (3.000) hc) /32 π3N ∫ ∆E dλ/lR = 2.295x10-39∫ ∆E dλ/l

En la que h es la constante de Planck, c es la velocidad de la luz, y N es el número de Avogadro.

La fuerza rotacional se define teóricamente, siguiendo el tratamiento de Rosenfeld, como la parte escalar del producto de los momentos de transición del dipolo eléctrico (μ) y del magnético (m) de una transición electrónica. Una formulación alterna de la fuerza rotacional se conoce como la formula-ción velocidad-dipolo y se utiliza normalmente en el cálculo teórico del dc:

Roa = - (eh/2mνoa) Im {(oIμIm). (aImIo)}

En esta, e y m son, respectivamente, carga y masa de un electrón, y νoa es la frecuencia de la transición oa.El cálculo del espectro del dc a una longitud de onda dada (λ) se hace asumiendo bandas gaussianas para todas las transiciones y empleando la relación entre dc, ∆εκ y la fuerza rotacional (Rκ) para una transición κ dada con 1/2 de ancho de banda (la mitad del ancho de banda de dc a 1/e de su /máximo) de ∆κ.

Page 163: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura secundaria • 163

∆εκ = 2.278Rκλκ/∆κ

Existen algoritmos para deconvolucionar espectros de dc, de modo que pueda derivarse el contenido de estructura secundaria; entre ellos están sse, Contin, Belok, varslc 1, bpnn , sOm-bpn y Prot cd, entre otros [30]. Sin embargo, hay menos datos sobre estructura β que sobre α y la contribución variable de los residuos aromáticos en esta región espectral. Se ha desarro-llado un método de selección de estructura β (BeStSel) para la estimación de la estructura secundaria que toma en cuenta el giro de las estructuras β. Este método puede distinguir hojas β paralelas y antiparalelas y estimar con precisión la estructura secundaria para un amplio número de proteínas [31].

Comportamiento de macromoléculas

Para tener actividad óptica (dc, dOr) se requiere que el medio en que ocu-rre una transición sea asimétrico. En proteínas se presentan los siguientes tipos de asimetría:

• El carbono α es asimétrico para todos los aminoácidos, excepto para la glicina y las transiciones que involucran electrones en la vecindad del Cα.

• La estructura secundaria helicoidal.• Las transiciones que involucran los electrones del anillo de tiro-

sina son, normalmente, muy débiles desde el punto de vista de actividad óptica; sin embargo, en algunas proteínas la tirosina al interior puede estar colocada en un medio que produce campos eléctricos asimétricos y la actividad óptica aumentará para esta tirosina.

Actualmente, dc es una técnica más utilizada que dOr, ya que existe ins-trumentación superior para dc y la forma de las bandas de dc da una mayor facilidad en la asignación y mejor resolución espectral. Por otra parte, por dc, además de estimar el contenido de estructura secundaria, se pueden detectar cambios conformacionales, estudios de desnaturalización química o térmica de proteínas y medir la unión de ligandos.

Los instrumentos dc (espectropolarímetros) miden la diferencia en absorbancia entre los componentes I (izquierdo) y D (derecho) de la luz polarizada circularmente, pero, generalmente, la reportan en términos de elipticidad (θ) en grados. Cabe señalar que θ = tan-1(b/a) en la que b y a son los ejes mayor y menor de la elipse resultante [29]. La ∆ε y la elipticidad (en grados) se pueden relacionar la siguiente ecuación:

θ = 32.98 ∆ε.

Page 164: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

164 • Introducción al análisis estructural de proteínas y glicoproteínas

El espectro de dc se obtiene cuando el dicroísmo se mide como una función de la longitud de onda (figura 26). En estudios biológicos, las se-ñales dc observadas son muy pequeñas, por ejemplo, las mediciones de elipticidad están, por lo general, en un rango 10 mdeg, correspondiente a una diferencia de absorbancia en el orden de 3×10-4.

Figura 26. Determinación del espectro por dicroísmo circular (dc)

Fuente: [29, p. 6].

La pureza de las muestras debe ser alta (95 %), soluble y evitar componen-tes en el buffer que absorban o ácidos nucleicos [30]. Uno de los principales problemas en las medidas de dc es que las señales se distorsionan signifi-cativamente si no llega la suficiente luz al fotomultiplicador y, en términos prácticos, esto quiere decir que no se pueden hacer medidas confiables en muestras con una absorbancia mayor a 1. Siempre se debe verificar el es-pectro de absorción de una muestra para comprobar que no se supere este límite de absorbancia. En el uv-lejano, las mediciones de absorbancia de la muestra por sí mismas son, generalmente, bastante pequeñas y el prin-cipal problema se debe a interferentes del buffer, los cuales interfieren en las medidas del uv-lejano (178 - 260 nm). En esta región absorbe el enlace péptico y, por lo tanto, contribuyen al espectro dc, de ahí que la concen-tración en mg/ml es igual para todas las proteínas: 200 μl de una solución 0.1 - 0.15 mg/ml cuando se emplea una celda con longitud de trayectoria de 1 mm o 30 μl de una solución de 1.0 - 1.5 mg/ml cuando se utiliza una celda de 0.1 mm (desmontable). El espectro de proteínas en el uv-lejano, generalmente, debe analizarse desde 260 nm hasta la longitud de onda más baja posible. Este límite bajo de longitud de onda dependerá en gran medida de la composición del amortiguador utilizado [30].

Los espectros de dc en el uv-cercano de las proteínas requieren soluciones más concentradas de proteína y longitudes de trayectoria más largas. Sin embargo, se debe evaluar el rango de absorbancia. Por otra parte, se debe conocer la concentración precisa de las muestras, para determinar el con-tenido de estructuras secundarias y, si uno desea, hacer una comparación

Page 165: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura secundaria • 165

válida entre diferentes muestras de proteínas. Los espectros en el uv-cercano son analizados en el rango de 225 - 340 nm para proteínas. Normalmente, no tienen intensidad significativa en la región de 315 - 340 nm. Si hubiera señal significativa en esta región, podría deberse a que hay contribución de un puente disulfuro en el espectro. La técnica es muy dispendiosa, ya que hay que ajustar muchos parámetros para obtener señales que permitan hacer un análisis de la proteína.

La señal de dc observada (S) en miligrados (1 miligrado = 32.98 × ∆A) se convierte al coeficiente de extinción molar de dc (∆εM) o la media del coeficiente de extinción molar residual (∆εmrW) mediante las ecuaciones:

∆εM = S/32.98 × CM × L∆εMRW = S × MRW/32.980 × Cmg/ml × L (unidades: M-1cm-1)

En esta ecuación, L es la longitud de trayectoria (en cm), CM es la con-centración molar, C es la concentración en mg/mL y mrW es el peso medio de los residuos (peso molecular dividido entre el número de residuos). Las proteínas globulares, generalmente, tienen un peso medio de residuos de, aproximadamente, 110, el valor real siempre debe calcularse para evitar grandes errores en el cálculo de las intensidades. Las intensidades de dc también se reportan como elipticidad molar ([θ]M) o elipticidad media de residuos ([θ]mrw), que puede calcularse directamente como:

[θ]M = S/ 10 × CM × L [θ]mrw = S × MRW/ 10 × Cmg/ml × L (unidades: grados x cm2dmol-1)

Los valores [θ] y ∆ε se interconvierten usando la relación [θ] = 3298∆ε.Las bandas de dc en el uv-cercano de los residuos individuales en una

proteína pueden ser positivas o negativas, variar en intensidad y presentar residuos que tienen interacciones acopladas a residuos aromáticos vecinos con oscilación, los cuales producen las señales más fuertes. Por lo tanto, existe poca relación entre el número de residuos aromáticos y el espectro de dc en el uv-cercano de una proteína. La intensidad y posición de las bandas de dc son importantes para comprender el espectro de dc observado en el uv-cercano de una proteína, así como las características de los cuatro aminoácidos principales, que presentan absorción:

• Tirosina con un máximo entre 275 - 282 nm • Triptófano presenta dos bandas, 288 - 293 nm y 265 nm • Fenilalanina en 262 y 268 nm • El dc de la cisteína comienza en una longitud de onda larga (>

320 nm) y muestra uno o dos picos anchos arriba de 240 nm. El pico de longitud de onda larga frecuentemente es negativo.

Page 166: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

166 • Introducción al análisis estructural de proteínas y glicoproteínas

El espectro de proteínas en el uv-lejano depende del contenido de la estructura secundaria. Todas las proteínas tienen una banda intensa negativa con dos picos a 208 y 222 nm y una banda muy positiva entre 191 y 193 nm. Las intensidades de estas dos bandas reflejan el contenido de α-hélices. Los valores de ∆εmrw para una proteína completamente helicoidal pueden ser del orden de -11 M-1cm-1 y +21 ±1 M-1cm-1 respectivamente. En cambio, los espectros de proteínas con hojas β regulares son más débiles que los espectros de las proteínas α hélice. Estos espectros tienen una banda nega-tiva a 210-225 nm, ∆εmrw: -1 a -3.5 1 M-1cm-1 y una banda fuertemente positiva a 190-220 nm, ∆εmrw: 2 a -6 M-1cm-1.

Las estructuras desordenadas y las proteínas desnaturalizadas presen-tan una banda fuertemente negativa entre 195 y 200 nm (∆εmrw: -4 a -8 M-1cm-1) y una banda mucho más débil, que puede ser positiva o negativa, entre 215 y 230 nm (∆εmrw: +0.5 a -2.5 M-1cm-1) (figura 27).

190 210 230 250

80

60

40

20

0

-20

-40

aHélice

bHoja

Random coil

Longitud de onda (nm)

Elip

ticid

ad m

olar

por

res

iduo

x 1

03

Figura 27. Espectro dc en la región uv-lejano. Absorciones características: α-hélice: máximo a 190 nm, dos mínimos a 208 y 222nm. Hoja β: máximo a 195 nm, mínimo a 217 nm. Random coil: mínimo a 195 y máximo a 212 nm.

Las proteínas α+β y α/β casi siempre tienen espectros dominados por el componente α-helicoidal y, por lo tanto, con frecuencia, muestran ban-das a 222, 208, y 190-195 nm. En algunos casos, puede haber un solo espectro ancho mínimo entre 210 y 220 nm debido a las contribuciones

Page 167: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura secundaria • 167

superpuestas de α-hélices y hojas β. Las posiciones características para las diferentes conformaciones se resumen en la tabla 3 y se comparan con los parámetros obtenidos por dOr.

Tabla 3. Características de las conformaciones

Estructura dc dor

Random coil λ (nm) [ θ] × 10-3 λ (nm) [m´] ao bo

237 -0.2 205 -15 000 -600 0

217 +5 190 +17 000

197 -42

α-Hélice 222 -36 233 -15 000 +650 -630

208 -33 198 +70 000

191 +77

Hoja bantiparalela

217 -18 230 -6000 400-700 0

195 +32 205 +26 000

El cambio en el espectro de dicroísmo circular permite determinar cam-bios conformacionales, como el proceso de desnaturalización de las proteí-nas, en el que se puede determinar si hay α-hélices, hojas β o giros en las proteínas; sin embargo, se han reportado precisiones de 97 % para hélices, 75 % para hojas β, 50 % para giros y 89 % para otras estructuras secundarias.

Aplicaciones del dicroísmo circular (dc)

Los estudios de dc a diferentes temperaturas proporcionan información de la estabilidad de las proteínas por medio de cambios en el espectro de dc en la región del uv-cercano o lejano. También se usa regularmente para evaluar el grado al cual el pH de una solución y los componentes del buffer alteran la estabilidad térmica. Además, siguiendo los cambios a lo largo del espectro completo de dc en la región del uv-lejano, se puede determinar si, a altas temperaturas, la proteína está perdiendo la totalidad o una parte de su estructura secundaria, o experimenta cambios. De igual forma, los cambios en la estructura terciaria pueden seguirse con los cambios en el espectro de dc en la región del uv-cercano.

Con esta técnica se pueden estudiar proteínas en un rango amplio de concentraciones, lo cual puede proporcionar información valiosa de procesos

Page 168: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

168 • Introducción al análisis estructural de proteínas y glicoproteínas

dependientes de concentración, como la asociación entre proteínas, forma-ción de agregados, plegamiento y desnaturalización de proteínas. Se han adelantado estudios referentes a la estructura de proteínas de membrana, como los efectos del desplazamiento del disolvente, con métodos especia-lizados, que involucran estudios de despliegue térmico y dc orientado de muestras de membrana anisotrópica.

El dc es ampliamente usado actualmente y, en las últimas décadas, se han desarrollado varias técnicas basadas en dc para mejorar la medición molecular de estructuras biológicas. Los más conocidos de ellos son dc elec-trónico convencional (edc), dc magnético (mdc), dc magnético vibracional (mvdc), xmdc), dc fluorescencia (fddc), dc cercano al infrarrojo (nir-dc), dc vibracional (vdc, ftir-vdc), Hplc-dc, dc en espectrofluorómetro de mezclado rápido, y dc de radiación de sincrotrón (srdc) [29].

Referencias1. Eisenberg D. The discovery of the α-helix and β-sheet, the principal

structural features of proteins. Proceedings of the National Academy of Sciences. 2003;100(20):11207–11210. dOi:10.1073/pnas.2034522100

2. Wikimedia Commons. Peptide bond cis trans miguelferig. Disponible en: https://commons.wikimedia.org/wiki/File:Peptide_bond_cis_trans_miguelferig.jpg. [04 de febrero de 2020].

3. Schiffer M, Edmundson AB. Use of helical wheels to represent the structures of proteins and to identify segments with helical potential. Biophysical Journal. 1967;7(2):121–135. dOi:10.1016/s0006-3495(67)86579-2

4. Wikimedia commons. Helical Wheel 2nrl 77-92 KaelFischer Disponible en: https://commons.wikimedia.org/wiki/File:Helical_Wheel_2nrl_77-92_KaelFischer.jpg. [04 de febrero de 2020].

5. Dunnill P. The use of helical net-diagrams to represent protein structures. Biophysical Journal. 1968;8(7): 865–875. dOi:10.1016/s0006-3495(68)86525-7

6. Berndt KD. Types of Secondary Structure. Protein Secondary Structure. Helices. Estocolmo: Karolinska Institute, 1996. Disponible en: http://www.cryst.bbk.ac.uk/pps2/course/section8/ss-960531_5.html [20 de febrero de 2020].

7. Sancho P. Tema 4a. Estructura tridimensional de las proteínas. Segundo curso de farmacia 2012-2013 [Presentación]. Universidad de Alcalá. Disponible en: http://www3.uah.es/bioquimica/Sancho/farmacia/temas/tema-4a_proteinas-estructura.pdf [20 de febrero de 2020].

8. Costantini S, Colonna G, Facchiano AM. Amino acid propensities for secondary structures are influenced by the protein structural class.

Page 169: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura secundaria • 169

Biochemical and Biophysical Research Communications. 2006; 342(2): 441–451. dOi:10.1016/j.bbrc.2006.01.159

9. Ashok KT. cfssp: Chou and Fasman Secondary Structure Prediction server. Wide spectrum: Research Journal. 2013; 1(9):15-19.

10. Koehl P, Levitt M. Structure-based conformational preferences of amino acids. Proceedings of the National Academy of Sciences. 1999; 96(22): 12524–12529. dOi:10.1073/pnas.96.22.12524

11. Branden C, Tooze J. Introduction to Protein Structure. Segunda edición. New York: Garland Pub; 1999.

12. Clothia C. Principles that Determine the Structure of Proteins. Ann. Rev. Biochem. 1984;53:537-572.

13. Efimov AV. Super-secondary Structures and Modeling of Protein Folds. Methods Mol Biol. 2013;932:177-189. Disponible en dOi: 10.1007/978-1-62703-065-6_11.

14. Craig L. Tertiary Structure Chapter 3, 4, & 5 [Presentación]. Slide Player. Disponible en: https://slideplayer.com/slide/6407321/ [20 de febrero de 2020].

15. Sheriff S, Hendrickson WA, Smith JL. Structure of myohemerythrin in the azidomet state at 1.7/1.3 A resolution. J. Mol. Biol. 1987;197:273-296. Disponible en: https://www.ebi.ac.uk/pdbe/entry/pdb/2mhr/ [20 de febrero de 2020].

16. Wilches tma. Aproximación a la estructura primaria de lectinas específicas para el antígeno tn e identificación de nuevas lectinas específicas para glucosa/manosa en semillas de Salvia bogotensis y Lepechinia bullata [Tesis de doctorado]. Universidad Nacional de Colombia; 2017.

17. Hidalgo D.J. Detección, purificación y caracterización parcial de lectinas presentes en algas marinas colombianas [Tesis de Maestría]. Universidad Nacional de Colombia; 2017.

18. Branden CI, Tooze J. Introduction to protein structure. New York: Garland Science; 2012.

19. Walshaw J, Mills A. Alpha/Beta Topologies. Protein Folds. Birkbeck College, Londres; 1995. Disponible en http://www.cryst.bbk.ac.uk/pps95/course/8_folds/alph_bet_wnd.html [20 de febrero de 2020].

20. Branden C, Tooze J. Introduction to Protein Structure. Segunda edición. New York: Garland Pub; 1999.

21. Wikimedia Commons. tim barrel. Disponible en: https://commons.wikimedia.org/wiki/File:tim_barrel.tif [20 de febrero de 2020].

22. Computationally designed tim-barrel protein, Halfflr. dOi: 10.2210/pdb3tdm/pdb. Disponible en: https://www.rcsb.org/structure/3tdm [05 de febrero de 2020].

23. 3qvO. Structure of a Rossmann-fold nad(p)-binding family protein from Shigella flexneri. dOi: 10.2210/pdb3qvO/pdb. Disponible en: https://www.rcsb.org/structure/3qvO [05 de febrero de 2020].

Page 170: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

170 • Introducción al análisis estructural de proteínas y glicoproteínas

24. rcsb pdb.The crystal structure of class I Major histocompatibility complex, H-2Kd at 2.0 A resolution. dOi: 10.2210/pdb1vgK/pdb. Disponible en: https://www.rcsb.org/structure/1vgK [05 de febrero de 2020].

25. Georgia State University.Polarización lineal. Hyperphysics. Disponible en: http://hyperphysics.phy-astr.gsu.edu/hbasees/phyopt/polclas.html. [05 de febrero de 2020].

26. Mancho C. Luz polarizada. El rincon de la Ciencia. 2008;48. Disponible en: http://rincondelaciencia.educa.madrid.org/Curiosid2/rc-114/rc-114.html. [05 de febrero de 2020].

27. Cortazar A, Silva EP. Métodos Físico-Químicos en Biotecnología pcr. México: Universidad Nacional Autónoma de México, Instituto de Biotecnología; 2004. Disponible en: http://www.ibt.unam.mx/computo/pdfs/met/dicroismocircular2013.pdf. [05 de febrero de 2020].

28. Van Holde KE. Circular Dichroism and Optical Rotatory Dispersion. Physical Biochemistry. New York: Prentice Hall; 1971. 202-220.

29. Mata E. Métodos fisco-químicos en biotecnología. Disponible en: http://www.ibt.unam.mx/computo/pdfs/met/dicroismocircular2013.pdf [05 de febrero de 2020].

30. Greenfield NJ. Using circular dichroism spectra to estimate protein secondary structure. Nature Protocols. 2007;1(6):2876-2890. dOi:10.1038/nprot.2006.202 

31. Micsonai A, Wien F, Kernya L, Lee YH, Goto Y, Réfrégiers M, Kardos J. Accurate Secondary Structure Prediction and Fold Recognition for Circular Dichroism Spectroscopy. Proc. Natl. Acad. Sci. 2015;112(24):E3095-E3103. Disponible en: dOi: 10.1073/pnas.1500851112.

32. Kelly M, Price N. The Application of Circular Dichroism to Studies of Protein Folding and Unfolding. Biochimica et Biophysica Acta. 1997;1338:161-185.

Page 171: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Capítulo cinco

Estructura terciaria

Page 172: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural
Page 173: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura terciaria • 173

Con o sin estructura secundaria, la proteína presenta un plegamiento tri-dimensional compacto que constituye su estructura terciaria. Podemos definir la estructura terciaria como la disposición tridimensional de todos los átomos que componen la proteína. Se trata de un concepto análogo al de configuración absoluta en moléculas pequeñas. Para las proteínas que constan de una sola cadena polipeptídica (carecen de estructura cuater-naria), la estructura terciaria es la máxima información estructural que se puede obtener.

La estructura terciaria de una proteína es única y siempre la misma en igualdad de condiciones, ya que está determinada por la secuencia y el análisis de aminoácidos (estructura primaria). La estructura terciaria es la responsable directa de sus propiedades biológicas, debido a que la disposición espacial de los distintos grupos funcionales de la proteína es la que determina su interacción con los diversos ligandos. Por lo tanto, la desnaturalización de una proteína supone la pérdida de su actividad bioló-gica. La estructura y función están íntimamente relacionadas y, en muchas ocasiones, el conocimiento de la estructura de una proteína puede aclarar muchos aspectos sobre su función. Para conocer la estructura terciaria de las proteínas se pueden utilizar algunas técnicas experimentales como las indicadas a continuación:

• Difracción de rayos-X (drx): para utilizar esta técnica es preciso disponer de cristales de la proteína. Su obtención puede llegar a resultar muy complicada debido a su complejidad estructural.

• Resonancia magnética nuclear (rmn): Mediante esta técnica es posible determinar la estructura terciaria de proteínas en disolu-ción. Sin embargo, esta técnica está limitada por el tamaño y la cantidad de la proteína, no se puede utilizar en el caso de proteí-nas grandes (>40 kDa).

• Microscopía electrónica y reconstrucción tridimensional de imá-genes (Cryo-em): Es una de las técnicas que más se utiliza en la actualidad cuando se pretende obtener información estructural de complejos macromoleculares o proteínas de gran tamaño. Es la técnica que permite obtener información más cercana a las condiciones nativas de las proteínas.

Una vez se obtienen datos de estructura terciaria de proteínas, se al-macenan en el Protein Data Bank (pdb), una base de datos de acceso libre (http://www.rcsb.org/pdb/).

Las fuerzas que estabilizan la estructura terciaria de una proteína glo-bular se establecen entre las distintas cadenas laterales de los aminoácidos que la componen. Los enlaces que estabilizan la estructura terciaria pueden ser de dos tipos:

Page 174: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

174 • Introducción al análisis estructural de proteínas y glicoproteínas

• Los enlaces covalentes, que pueden deberse a la formación de un puente disulfuro entre dos cadenas laterales de Cys o a la forma-ción de un enlace amida (-CO-NH-) entre las cadenas laterales de la Lys y un aminoácido dicarboxílico (Glu o Asp).

• Las interacciones no covalentes, que pueden deberse a las fuer-zas de van der Waals, dentro de las cuales están las interacciones electrostáticas entre cadenas laterales con grupos ionizables, es decir, entre cargas de signo opuesto; puentes de hidrógeno; entre las cadenas laterales de aminoácidos polares; interacciones hidro-fóbicas entre cadenas laterales apolares y fuerzas de polaridad debidas a interacciones dipolo-dipolo.

No todas estas interacciones contribuyen por igual al mantenimiento de la estructura terciaria. Obviamente, los enlaces que aportan más estabilidad son los de tipo covalente. Entre las interacciones no covalentes, las más importantes son las de tipo hidrofóbico, ya que exigen una gran proximidad entre los grupos apolares de los aminoácidos.

Hay dos tipos de estructura terciaria, la de tipo fibroso y la de tipo globular. En las proteínas con estructura terciaria de tipo fibroso (como el colágeno, la queratina del cabello o la fibroína de la seda), una de las di-mensiones es mucho mayor que las otras dos. En este caso, los elementos de estructura secundaria (hélices α u hojas β) pueden mantener su orde-namiento sin recurrir a grandes modificaciones, tan solo introduciendo ligeras torsiones longitudinales, como en las hebras de una cuerda. Las de tipo globular son más frecuentes. En ellas, la cadena polipeptídica sufre un nuevo plegamiento, en el que no existe una dimensión que predomine sobre las demás, y su forma es aproximadamente esférica y compacta. En este tipo de estructuras se suceden regiones con estructuras al azar, hélice α, hoja β, giros β y estructuras supersecundarias. Como resultado de estas interacciones, las moléculas con estructura terciaria globular suelen conte-ner un interior compacto de carácter hidrofóbico, con las cadenas laterales más polares orientadas hacia la superficie, interaccionando con el agua y permitiendo que la proteína permanezca en disolución.

Como se mencionó previamente, se han descrito regiones diferenciadas dentro de la estructura terciaria de las proteínas globulares. Estas regiones, que constituyen un nivel estructural intermedio entre las estructuras secun-daria y terciaria, reciben el nombre de dominios. Los dominios son unidades autónomas de plegamiento. Parece ser que a medida que se sintetizan las cadenas polipeptídicas, los distintos dominios se pliegan por separado. En una proteína es muy común que cada dominio esté especializado en realizar una función determinada. Esta función puede consistir en:

• Unir un ligando de tamaño pequeño.• Atravesar la membrana plasmática.

Page 175: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura terciaria • 175

• Contener el centro catalítico.• Interactuar con el adn.• Ofrecer una superficie de contacto para la unión a otras proteínas.

Con frecuencia se observa que el mismo tipo de dominio aparece en proteínas distintas y en todas ellas realiza la misma función. Esta arquitec-tura modular de las proteínas permite hacer estimaciones sobre la función de una nueva proteína si esta contiene dominios cuya función en otras proteínas se conoce. Hoy en día existen bases de datos especializadas que contienen los dominios descritos hasta la fecha en las proteínas. Ejemplos de esas bases de datos son Prosite, Smart y Prodom. La diferencia entre dominios y estructuras supersecundarias radica precisamente en que los dominios están asociados a alguna función, mientras que las estructuras supersecundarias son motivos estructurales que contienen una determinada combinación de elementos de estructura secundaria. Los dominios pueden contener o no estructuras supersecundarias.

Determinación experimental de estructura terciaria

Los pasos necesarios para la determinación de la estructura de una proteína por drx son los siguientes:

1. Purificación de la proteína.2. Obtención de cristales de la proteína con la calidad adecuada.3. Exposición del cristal a rayos X y obtención del espectro de

difracción.4. Interpretación del espectro de difracción para obtener un mapa

de densidad electrónica.5. Diseño de un modelo molecular compatible con el mapa de

densidad electrónica y compatible con la función biológica de la proteína.

Determinación de la estructura de proteínas por difracción de rayos X

El objetivo de la cristalografía monoclonal es deducir la densidad electrónica de un cristal a partir de la intensidad de los rayos X difractados por él. El

Page 176: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

176 • Introducción al análisis estructural de proteínas y glicoproteínas

estudio teórico de la interacción materia-radiación es muy complejo, por lo tanto, solo se habla siempre de las aproximaciones que permiten rela-cionar las dos magnitudes. Cuando un haz de rayos X interactúa con un cristal ocurren varios procesos y se presenta absorción, principalmente, por efecto fotoeléctrico. Algunos fotones son reflejados sin pérdida de energía, lo que constituye una radiación dispersada con la misma longitud de onda que la radiación incidente, esto se conoce como dispersión coherente elás-tica (dispersión de Bragg). Otros fotones son dispersados con pérdida de energía, lo que constituye la radiación Compton, que tiene una longitud de onda un poco mayor que la longitud de onda de la radiación incidente (dispersión incoherente). En la difracción de rayos X por un cristal, el efecto cooperativo de la dispersión coherente es más significativo que la suma de las contribuciones incoherentes y la información estructural está conteni-da, esencialmente, en la intensidad de la difracción coherente elástica. Un cristal es un arreglo tridimensional de elementos repetitivos, colocados cada uno a una cierta distancia bien definida del otro, en el cual se tiene la menor energía potencial. Para obtener difracción, se requiere que esta distancia sea del mismo orden de magnitud que la longitud de onda de los rayos incidentes (figura 1).

Cristal celda unitaria

Figura 1. Representación de un cristal y su celda unitaria

Existen 230 posibles grupos espaciales permitidos en un cristal, sin embargo, en los cristales de proteína solo se permiten 65 debido a que los aminoácidos imponen algunas restricciones de simetría. La celda de unidad se define como la caja imaginaria de volumen mínimo que engloba el conjunto de unidades asimétricas definidas por el grupo espacial (figura 1). Las celdas unitarias tienen seis formas posibles y las longitudes de las aristas para cristales de proteína varían entre 50 y 150 Å. Los siete sistemas cristalinos son: triclínico, monoclínico, ortorrómbico, trigonal, hexagonal, tetragonal y cubico (figura 2). La estructura cristalina puede representarse como la repetición de la celda unidad en intervalos periódicos a lo largo de tres ejes, que son llamados los ejes cristalográficos. Dado que estos cris-tales se comportan como una rejilla tridimensional de difracción de rayos

Page 177: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura terciaria • 177

X, es posible determinar la densidad electrónica del cristal a partir de las intensidades de difracción.

Cubica (p,f,i,)Tetragonal (p, i,)

Ortorrómbica (p, i, f, c)

Trigonal /Hexagonal p

Trigonal

TriclínicaMonoclínica (p, c)

Figura 2. Sistemas cristalinos posibles en las proteínas

El nivel de detalle con el que pueden determinarse las posiciones atómicas está relacionado con el grado de orden cristalino. Cualquier inhomogeneidad del cristal influye en la calidad de los diagramas de difracción. Los cristales macromoleculares son propicios a estas inhomogeneidades debido a que las fuerzas que sostienen la red cristalina son muy débiles. Por otra parte, el alto contenido de solvente de los cristales de proteína hace que estas estructuras moleculares sean muy similares a las existentes en condiciones fisiológicas debido a la hidratación del cristal. También existen limitaciones en la celda unitaria ya que la longitud es lo más corta posible y los ángulos lo más cercanos a 90 °. Al combinar los grupos puntuales con transloca-ción, se generan catorce grupos espaciales, entre los que están centrado, P y ortorrómbico centrado (figura 3).

Borde de celda unidad

Plano especular

Deslizamiento del plano

2, 3, 4 6 ejes

P4

P4gm P4mm P6 P6mm

Pmm2 Pmg2 Pgg2 Cmm2

P1 P2 Pm Pg Cm

Figura 3. Grupos espaciales

Page 178: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

178 • Introducción al análisis estructural de proteínas y glicoproteínas

Determinación de las constantes de cristales unitarios y difracción de rayos X

En la figura 4 se observa la incidencia de un haz sobre un plano determina-do por una serie de elementos cristalinos. Un haz monocromático difracta cuando a es casi similar a la longitud de onda (λ). El Rayo def reforzará abc cuando hay un incremento en la distancia recorrida por def

F

C

n=2

n=1

n=0

n=-1

n=-2

A B

a

D E

o

n = a Cos o

Figura 4. Incidencia de un haz sobre un plano

(1) nλ= a coseno φ

Al rodear el cristal con una película fotográfica se tendrá una serie de líneas (realmente puntos) en la que cada cono corta la película (figura 4). Se determina φ y se reemplaza en (1). Posteriormente, se despeja a ya que n = 1 y se conoce λ (figura 5).

Figura 5. Determinación de a, b y c

Page 179: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura terciaria • 179

La ecuación de Bragg (figura 6) implica que: • Habrá difracción del rayo incidente solo cuando el conjunto de

planos está colocado en un ángulo dado respecto al rayo inciden-te. Por ello, las imágenes de difracción no son líneas sino puntos y cada uno de ellos es el resultado de la difracción de un set de planos dado.

• Hay una relación definida entre las dimensiones de la celda uni-taria y los ángulos en los cuales ocurre la difracción.

Hazincidente

Hazdifractado

00

0

dsen0

Planos atómicos

Figura 6. Determinación de la ecuación de Bragg

Fuente: [1].

8

Figura 6. Determinación de la ecuación de Bragg

Fuente: [1].

𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 − 𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 = 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛

𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 =𝑑𝑑𝑑𝑑ℎ𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑛𝑛𝑛𝑛𝑠𝑠𝑠𝑠

𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 = 𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 cos 2𝑠𝑠𝑠𝑠 =𝑑𝑑𝑑𝑑ℎ𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑛𝑛𝑛𝑛𝑠𝑠𝑠𝑠

cos 2𝑠𝑠𝑠𝑠

𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 − 𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 =𝑑𝑑𝑑𝑑ℎ𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑛𝑛𝑛𝑛𝑠𝑠𝑠𝑠

(1− cos 2𝑠𝑠𝑠𝑠) =𝑑𝑑𝑑𝑑ℎ𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑛𝑛𝑛𝑛𝑠𝑠𝑠𝑠

2𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑛𝑛𝑛𝑛2𝑠𝑠𝑠𝑠 = 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛

2𝑑𝑑𝑑𝑑ℎ𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑘 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑛𝑛𝑛𝑛𝑠𝑠𝑠𝑠 = 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛

La determinación de los ángulos de Bragg permite obtener las dimensiones de la celda y por lo tanto se

puede conocer h,k,l (a,b,c). Por otra parte, para saber de cuál conjunto de planos provienen las

difracciones, hay que asignar los índices (h,k,l) y ello determina el valor de n.

Representación por series de Fourier [T3]

Cualquier función que se repite periódicamente en una dimensión es decir ƒ(X) se puede representar por

una serie Fourier [2].

(2)

𝑓𝑓𝑓𝑓(𝑥𝑥𝑥𝑥) = 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 + �𝑎𝑎𝑎𝑎𝑛𝑛𝑛𝑛𝐴𝐴𝐴𝐴𝑎𝑎𝑎𝑎𝑠𝑠𝑠𝑠2𝛱𝛱𝛱𝛱𝑛𝑛𝑛𝑛𝑥𝑥𝑥𝑥 + �𝑏𝑏𝑏𝑏𝑛𝑛𝑛𝑛𝑏𝑏𝑏𝑏𝑠𝑠𝑠𝑠𝑛𝑛𝑛𝑛2𝛱𝛱𝛱𝛱𝑛𝑛𝑛𝑛𝑥𝑥𝑥𝑥 𝜌𝜌𝜌𝜌

𝑖𝑖𝑖𝑖𝑖𝑖

𝜌𝜌𝜌𝜌

𝑖𝑖𝑖𝑖𝑖𝑖

En esta, n es el número de onda (número de veces que la función seno (coseno) se repite en un intervalo

unitario de X); an y bn son amplitudes de las ondas coseno y seno.

La determinación de los ángulos de Bragg permite obtener las dimensio-nes de la celda y por lo tanto se puede conocer h,k,l (a,b,c). Por otra parte, para saber de cuál conjunto de planos provienen las difracciones, hay que asignar los índices (h,k,l) y ello determina el valor de n.

Page 180: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

180 • Introducción al análisis estructural de proteínas y glicoproteínas

Representación por series de Fourier

Cualquier función que se repite periódicamente en una dimensión es decir ƒ(X) se puede representar por una serie Fourier [2].

(2)

8

Figura 6. Determinación de la ecuación de Bragg

Fuente: [1].

𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 − 𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 = 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛

𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 =𝑑𝑑𝑑𝑑ℎ𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑛𝑛𝑛𝑛𝑠𝑠𝑠𝑠

𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 = 𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 cos 2𝑠𝑠𝑠𝑠 =𝑑𝑑𝑑𝑑ℎ𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑛𝑛𝑛𝑛𝑠𝑠𝑠𝑠

cos 2𝑠𝑠𝑠𝑠

𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 − 𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 =𝑑𝑑𝑑𝑑ℎ𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑛𝑛𝑛𝑛𝑠𝑠𝑠𝑠

(1− cos 2𝑠𝑠𝑠𝑠) =𝑑𝑑𝑑𝑑ℎ𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑛𝑛𝑛𝑛𝑠𝑠𝑠𝑠

2𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑛𝑛𝑛𝑛2𝑠𝑠𝑠𝑠 = 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛

2𝑑𝑑𝑑𝑑ℎ𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑘 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑛𝑛𝑛𝑛𝑠𝑠𝑠𝑠 = 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛

La determinación de los ángulos de Bragg permite obtener las dimensiones de la celda y por lo tanto se

puede conocer h,k,l (a,b,c). Por otra parte, para saber de cuál conjunto de planos provienen las

difracciones, hay que asignar los índices (h,k,l) y ello determina el valor de n.

Representación por series de Fourier [T3]

Cualquier función que se repite periódicamente en una dimensión es decir ƒ(X) se puede representar por

una serie Fourier [2].

(2)

𝑓𝑓𝑓𝑓(𝑥𝑥𝑥𝑥) = 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 + �𝑎𝑎𝑎𝑎𝑛𝑛𝑛𝑛𝐴𝐴𝐴𝐴𝑎𝑎𝑎𝑎𝑠𝑠𝑠𝑠2𝛱𝛱𝛱𝛱𝑛𝑛𝑛𝑛𝑥𝑥𝑥𝑥 + �𝑏𝑏𝑏𝑏𝑛𝑛𝑛𝑛𝑏𝑏𝑏𝑏𝑠𝑠𝑠𝑠𝑛𝑛𝑛𝑛2𝛱𝛱𝛱𝛱𝑛𝑛𝑛𝑛𝑥𝑥𝑥𝑥 𝜌𝜌𝜌𝜌

𝑖𝑖𝑖𝑖𝑖𝑖

𝜌𝜌𝜌𝜌

𝑖𝑖𝑖𝑖𝑖𝑖

En esta, n es el número de onda (número de veces que la función seno (coseno) se repite en un intervalo

unitario de X); an y bn son amplitudes de las ondas coseno y seno.

En esta, n es el número de onda (número de veces que la función seno (coseno) se repite en un intervalo unitario de X); an y bn son amplitudes de las ondas coseno y seno.

Una formulación más general que permite la representación de un nú-mero de complejos es:

(3)

9

Una formulación más general que permite la representación de un número de complejos es:

(3)

𝐹𝐹𝐹𝐹(𝑥𝑥𝑥𝑥) = � 𝐹𝐹𝐹𝐹𝑛𝑛𝑛𝑛𝜌𝜌𝜌𝜌

𝑖𝑖𝑖𝑖𝑖 −𝜌𝜌𝜌𝜌

(exp(2𝛱𝛱𝛱𝛱𝛱𝛱𝛱𝛱𝑛𝑛𝑛𝑛𝑥𝑥𝑥𝑥))

𝐹𝐹𝐹𝐹𝑛𝑛𝑛𝑛 = 𝐴𝐴𝐴𝐴𝑛𝑛𝑛𝑛 + 𝛱𝛱𝛱𝛱𝛱𝛱𝛱𝛱𝑛𝑛𝑛𝑛 = 𝐹𝐹𝐹𝐹𝑛𝑛𝑛𝑛 𝑠𝑠𝑠𝑠𝑥𝑥𝑥𝑥𝑒𝑒𝑒𝑒(𝛱𝛱𝛱𝛱φ𝑛𝑛𝑛𝑛)

En la que Fn es la amplitud; φn, la fase o desplazamiento que se debe dar a la onda n respecto a un punto

de referencia común, antes de sumarlo en la serie. Dado que un cristal es periódico tridimensionalmente

en cuanto a la densidad electrónica, esta densidad (ρ) se puede representar formalmente por una serie

tridimensional.

(4)

𝜌𝜌𝜌𝜌(𝑥𝑥𝑥𝑥, 𝑦𝑦𝑦𝑦, 𝑧𝑧𝑧𝑧) = 1/𝑣𝑣𝑣𝑣 � � � 𝐹𝐹𝐹𝐹𝜌𝜌𝜌𝜌

𝑘𝑘𝑘𝑘𝑖 −𝜌𝜌𝜌𝜌

𝜌𝜌𝜌𝜌

𝑘𝑘𝑘𝑘𝑖 −𝜌𝜌𝜌𝜌

𝜌𝜌𝜌𝜌

ℎ𝑖 −𝜌𝜌𝜌𝜌

(ℎ, 𝑘𝑘𝑘𝑘, 𝑙𝑙𝑙𝑙)(exp�2𝛱𝛱𝛱𝛱𝛱𝛱𝛱𝛱(ℎ𝑥𝑥𝑥𝑥 + 𝑘𝑘𝑘𝑘𝑦𝑦𝑦𝑦 + 𝑙𝑙𝑙𝑙𝑧𝑧𝑧𝑧)�)

En esta, V representa el volumen de celda unitaria y h, k, l son los componentes del número de onda de

una onda sinusoidal dada en los tres ejes cristalinos. Conjuntamente nos dan la frecuencia de la onda y

su orientación en el espacio.

(5) 𝐹𝐹𝐹𝐹(ℎ,𝑘𝑘𝑘𝑘,𝑘𝑘𝑘𝑘) = 𝐹𝐹𝐹𝐹(ℎ𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑘) 𝑠𝑠𝑠𝑠𝑥𝑥𝑥𝑥𝑒𝑒𝑒𝑒 [𝛱𝛱𝛱𝛱Ø(ℎ𝑘𝑘𝑘𝑘𝑙𝑙𝑙𝑙)]

𝐼𝐼𝐼𝐼 𝛼𝛼𝛼𝛼 (𝐹𝐹𝐹𝐹(ℎ,𝑘𝑘𝑘𝑘,𝑘𝑘𝑘𝑘))2

El significado físico de la ecuación 4 es que la densidad electrónica a lo largo del cristal se puede obtener

por adiciones de un gran número ondas sinusoidales, cada una de ellas con una orientación (h,k,l) y

longitud de onda definidas, con su amplitud (F) y desplazamiento respecto al origen. En resumen, la

difracción por un cristal es un análisis de Fourier. Cada punto en el patrón 3D da información sobre un

término o una onda en la síntesis de Fourier; la intensidad es proporcional a [F (hkl)]2 y los componentes

h,k,l son idénticos a los índices de Miller. La información que no está dada por el pattern de difracción

es la fase (ϕh,k,l) de cada onda respecto a las otras.

En la que Fn es la amplitud; φn, la fase o desplazamiento que se debe dar a la onda n respecto a un punto de referencia común, antes de sumar-lo en la serie. Dado que un cristal es periódico tridimensionalmente en cuanto a la densidad electrónica, esta densidad (ρ) se puede representar formalmente por una serie tridimensional.

(4)

9

Una formulación más general que permite la representación de un número de complejos es:

(3)

𝐹𝐹𝐹𝐹(𝑥𝑥𝑥𝑥) = � 𝐹𝐹𝐹𝐹𝑛𝑛𝑛𝑛𝜌𝜌𝜌𝜌

𝑖𝑖𝑖𝑖𝑖 −𝜌𝜌𝜌𝜌

(exp(2𝛱𝛱𝛱𝛱𝛱𝛱𝛱𝛱𝑛𝑛𝑛𝑛𝑥𝑥𝑥𝑥))

𝐹𝐹𝐹𝐹𝑛𝑛𝑛𝑛 = 𝐴𝐴𝐴𝐴𝑛𝑛𝑛𝑛 + 𝛱𝛱𝛱𝛱𝛱𝛱𝛱𝛱𝑛𝑛𝑛𝑛 = 𝐹𝐹𝐹𝐹𝑛𝑛𝑛𝑛 𝑠𝑠𝑠𝑠𝑥𝑥𝑥𝑥𝑒𝑒𝑒𝑒(𝛱𝛱𝛱𝛱φ𝑛𝑛𝑛𝑛)

En la que Fn es la amplitud; φn, la fase o desplazamiento que se debe dar a la onda n respecto a un punto

de referencia común, antes de sumarlo en la serie. Dado que un cristal es periódico tridimensionalmente

en cuanto a la densidad electrónica, esta densidad (ρ) se puede representar formalmente por una serie

tridimensional.

(4)

𝜌𝜌𝜌𝜌(𝑥𝑥𝑥𝑥, 𝑦𝑦𝑦𝑦, 𝑧𝑧𝑧𝑧) = 1/𝑣𝑣𝑣𝑣 � � � 𝐹𝐹𝐹𝐹𝜌𝜌𝜌𝜌

𝑘𝑘𝑘𝑘𝑖 −𝜌𝜌𝜌𝜌

𝜌𝜌𝜌𝜌

𝑘𝑘𝑘𝑘𝑖 −𝜌𝜌𝜌𝜌

𝜌𝜌𝜌𝜌

ℎ𝑖 −𝜌𝜌𝜌𝜌

(ℎ, 𝑘𝑘𝑘𝑘, 𝑙𝑙𝑙𝑙)(exp�2𝛱𝛱𝛱𝛱𝛱𝛱𝛱𝛱(ℎ𝑥𝑥𝑥𝑥 + 𝑘𝑘𝑘𝑘𝑦𝑦𝑦𝑦 + 𝑙𝑙𝑙𝑙𝑧𝑧𝑧𝑧)�)

En esta, V representa el volumen de celda unitaria y h, k, l son los componentes del número de onda de

una onda sinusoidal dada en los tres ejes cristalinos. Conjuntamente nos dan la frecuencia de la onda y

su orientación en el espacio.

(5) 𝐹𝐹𝐹𝐹(ℎ,𝑘𝑘𝑘𝑘,𝑘𝑘𝑘𝑘) = 𝐹𝐹𝐹𝐹(ℎ𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑘) 𝑠𝑠𝑠𝑠𝑥𝑥𝑥𝑥𝑒𝑒𝑒𝑒 [𝛱𝛱𝛱𝛱Ø(ℎ𝑘𝑘𝑘𝑘𝑙𝑙𝑙𝑙)]

𝐼𝐼𝐼𝐼 𝛼𝛼𝛼𝛼 (𝐹𝐹𝐹𝐹(ℎ,𝑘𝑘𝑘𝑘,𝑘𝑘𝑘𝑘))2

El significado físico de la ecuación 4 es que la densidad electrónica a lo largo del cristal se puede obtener

por adiciones de un gran número ondas sinusoidales, cada una de ellas con una orientación (h,k,l) y

longitud de onda definidas, con su amplitud (F) y desplazamiento respecto al origen. En resumen, la

difracción por un cristal es un análisis de Fourier. Cada punto en el patrón 3D da información sobre un

término o una onda en la síntesis de Fourier; la intensidad es proporcional a [F (hkl)]2 y los componentes

h,k,l son idénticos a los índices de Miller. La información que no está dada por el pattern de difracción

es la fase (ϕh,k,l) de cada onda respecto a las otras.

En esta, V representa el volumen de celda unitaria y h, k, l son los com-ponentes del número de onda de una onda sinusoidal dada en los tres ejes cristalinos. Conjuntamente nos dan la frecuencia de la onda y su orienta-ción en el espacio.

(5)

9

Una formulación más general que permite la representación de un número de complejos es:

(3)

𝐹𝐹𝐹𝐹(𝑥𝑥𝑥𝑥) = � 𝐹𝐹𝐹𝐹𝑛𝑛𝑛𝑛𝜌𝜌𝜌𝜌

𝑖𝑖𝑖𝑖𝑖 −𝜌𝜌𝜌𝜌

(exp(2𝛱𝛱𝛱𝛱𝛱𝛱𝛱𝛱𝑛𝑛𝑛𝑛𝑥𝑥𝑥𝑥))

𝐹𝐹𝐹𝐹𝑛𝑛𝑛𝑛 = 𝐴𝐴𝐴𝐴𝑛𝑛𝑛𝑛 + 𝛱𝛱𝛱𝛱𝛱𝛱𝛱𝛱𝑛𝑛𝑛𝑛 = 𝐹𝐹𝐹𝐹𝑛𝑛𝑛𝑛 𝑠𝑠𝑠𝑠𝑥𝑥𝑥𝑥𝑒𝑒𝑒𝑒(𝛱𝛱𝛱𝛱φ𝑛𝑛𝑛𝑛)

En la que Fn es la amplitud; φn, la fase o desplazamiento que se debe dar a la onda n respecto a un punto

de referencia común, antes de sumarlo en la serie. Dado que un cristal es periódico tridimensionalmente

en cuanto a la densidad electrónica, esta densidad (ρ) se puede representar formalmente por una serie

tridimensional.

(4)

𝜌𝜌𝜌𝜌(𝑥𝑥𝑥𝑥, 𝑦𝑦𝑦𝑦, 𝑧𝑧𝑧𝑧) = 1/𝑣𝑣𝑣𝑣 � � � 𝐹𝐹𝐹𝐹𝜌𝜌𝜌𝜌

𝑘𝑘𝑘𝑘𝑖 −𝜌𝜌𝜌𝜌

𝜌𝜌𝜌𝜌

𝑘𝑘𝑘𝑘𝑖 −𝜌𝜌𝜌𝜌

𝜌𝜌𝜌𝜌

ℎ𝑖 −𝜌𝜌𝜌𝜌

(ℎ, 𝑘𝑘𝑘𝑘, 𝑙𝑙𝑙𝑙)(exp�2𝛱𝛱𝛱𝛱𝛱𝛱𝛱𝛱(ℎ𝑥𝑥𝑥𝑥 + 𝑘𝑘𝑘𝑘𝑦𝑦𝑦𝑦 + 𝑙𝑙𝑙𝑙𝑧𝑧𝑧𝑧)�)

En esta, V representa el volumen de celda unitaria y h, k, l son los componentes del número de onda de

una onda sinusoidal dada en los tres ejes cristalinos. Conjuntamente nos dan la frecuencia de la onda y

su orientación en el espacio.

(5) 𝐹𝐹𝐹𝐹(ℎ,𝑘𝑘𝑘𝑘,𝑘𝑘𝑘𝑘) = 𝐹𝐹𝐹𝐹(ℎ𝑘𝑘𝑘𝑘𝑘𝑘𝑘𝑘) 𝑠𝑠𝑠𝑠𝑥𝑥𝑥𝑥𝑒𝑒𝑒𝑒 [𝛱𝛱𝛱𝛱Ø(ℎ𝑘𝑘𝑘𝑘𝑙𝑙𝑙𝑙)]

𝐼𝐼𝐼𝐼 𝛼𝛼𝛼𝛼 (𝐹𝐹𝐹𝐹(ℎ,𝑘𝑘𝑘𝑘,𝑘𝑘𝑘𝑘))2

El significado físico de la ecuación 4 es que la densidad electrónica a lo largo del cristal se puede obtener

por adiciones de un gran número ondas sinusoidales, cada una de ellas con una orientación (h,k,l) y

longitud de onda definidas, con su amplitud (F) y desplazamiento respecto al origen. En resumen, la

difracción por un cristal es un análisis de Fourier. Cada punto en el patrón 3D da información sobre un

término o una onda en la síntesis de Fourier; la intensidad es proporcional a [F (hkl)]2 y los componentes

h,k,l son idénticos a los índices de Miller. La información que no está dada por el pattern de difracción

es la fase (ϕh,k,l) de cada onda respecto a las otras.

Page 181: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura terciaria • 181

El significado físico de la ecuación 4 es que la densidad electrónica a lo largo del cristal se puede obtener por adiciones de un gran número ondas sinusoidales, cada una de ellas con una orientación (h,k,l) y longitud de onda definidas, con su amplitud (F) y desplazamiento respecto al origen. En resumen, la difracción por un cristal es un análisis de Fourier. Cada punto en el patrón 3D da información sobre un término o una onda en la síntesis de Fourier; la intensidad es proporcional a [F (hkl)]2 y los componentes h,k,l son idénticos a los índices de Miller. La información que no está dada por el pattern de difracción es la fase (ϕh,k,l) de cada onda respecto a las otras.

Cálculo del factor de estructura F (h,k,l) o amplitudes de dispersión

El coeficiente F (h,k,l) representa la dispersión de los rayos X por el cristal en la dirección dada en la imagen de difracción por los índices h,k,l. Es la dispersión de la celda unitaria total, o sea, es la suma de dispersión en esa dirección dada por los átomos j.

(6)

10

Cálculo del factor de estructura F (h,k,l) o amplitudes de dispersión [T3]

El coeficiente F (h,k,l) representa la dispersión de los rayos X por el cristal en la dirección dada en la

imagen de difracción por los índices h,k,l. Es la dispersión de la celda unitaria total, o sea, es la suma de

dispersión en esa dirección dada por los átomos j.

(6)

𝐹𝐹𝐹𝐹(ℎ,𝑘𝑘𝑘𝑘,𝑘𝑘𝑘𝑘) = �𝑓𝑓𝑓𝑓𝑁𝑁𝑁𝑁

𝑗𝑗𝑗𝑗𝑗𝑗

(𝑗𝑗𝑗𝑗)𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑒𝑒𝑒𝑒[2𝛱𝛱𝛱𝛱𝛱𝛱𝛱𝛱(ℎ𝑠𝑠𝑠𝑠𝑗𝑗𝑗𝑗 + 𝑘𝑘𝑘𝑘𝑦𝑦𝑦𝑦𝑗𝑗𝑗𝑗 + 𝑙𝑙𝑙𝑙𝑧𝑧𝑧𝑧𝑗𝑗𝑗𝑗)] = � exp (𝛱𝛱𝛱𝛱𝛱𝛱𝛱𝛱𝑗𝑗𝑗𝑗)𝑁𝑁𝑁𝑁

𝑗𝑗𝑗𝑗𝑗𝑗

En esta, F (h,k,l) es el coeficiente Fourier o factor de estructura; ƒj, la capacidad intrínseca de átomo j

para difractar, que depende del número de electrones y de su distribución; y αj, el factor de fase, que

reconoce el hecho de que todos los átomos no están en el mismo lugar y que cada uno ocupa una

posición definida por (xj, yj, zj).

𝐹𝐹𝐹𝐹𝐹𝐹 = 𝐴𝐴𝐴𝐴𝑛𝑛𝑛𝑛 + 𝐴𝐴𝐴𝐴𝑛𝑛𝑛𝑛

𝐹𝐹𝐹𝐹𝐹𝐹 = 𝐹𝐹𝐹𝐹 exp (φ)

F (h,k,l) se puede representar como un vector (figura 7a) y así se puede representar la dispersión total

(figura 7b), del diagrama del factor estructural con un átomo pesado (figura 7c), el diagrama con un

reemplazo isomorfo (figura 7d). La dispersión del átomo pesado es dominante. Si se pueden determinar

posiciones del átomo pesado, se pueden calcular su contribución a la dispersión total usando la ecución

6.

En esta, F (h,k,l) es el coeficiente Fourier o factor de estructura; ƒj, la capacidad intrínseca de átomo j para difractar, que depende del número de electrones y de su distribución; y αj, el factor de fase, que reconoce el hecho de que todos los átomos no están en el mismo lugar y que cada uno ocupa una posición definida por (xj, yj, zj).

10

Cálculo del factor de estructura F (h,k,l) o amplitudes de dispersión [T3]

El coeficiente F (h,k,l) representa la dispersión de los rayos X por el cristal en la dirección dada en la

imagen de difracción por los índices h,k,l. Es la dispersión de la celda unitaria total, o sea, es la suma de

dispersión en esa dirección dada por los átomos j.

(6)

𝐹𝐹𝐹𝐹(ℎ,𝑘𝑘𝑘𝑘,𝑘𝑘𝑘𝑘) = �𝑓𝑓𝑓𝑓𝑁𝑁𝑁𝑁

𝑗𝑗𝑗𝑗𝑗𝑗

(𝑗𝑗𝑗𝑗)𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑒𝑒𝑒𝑒[2𝛱𝛱𝛱𝛱𝛱𝛱𝛱𝛱(ℎ𝑠𝑠𝑠𝑠𝑗𝑗𝑗𝑗 + 𝑘𝑘𝑘𝑘𝑦𝑦𝑦𝑦𝑗𝑗𝑗𝑗 + 𝑙𝑙𝑙𝑙𝑧𝑧𝑧𝑧𝑗𝑗𝑗𝑗)] = � exp (𝛱𝛱𝛱𝛱𝛱𝛱𝛱𝛱𝑗𝑗𝑗𝑗)𝑁𝑁𝑁𝑁

𝑗𝑗𝑗𝑗𝑗𝑗

En esta, F (h,k,l) es el coeficiente Fourier o factor de estructura; ƒj, la capacidad intrínseca de átomo j

para difractar, que depende del número de electrones y de su distribución; y αj, el factor de fase, que

reconoce el hecho de que todos los átomos no están en el mismo lugar y que cada uno ocupa una

posición definida por (xj, yj, zj).

𝐹𝐹𝐹𝐹𝐹𝐹 = 𝐴𝐴𝐴𝐴𝑛𝑛𝑛𝑛 + 𝐴𝐴𝐴𝐴𝑛𝑛𝑛𝑛

𝐹𝐹𝐹𝐹𝐹𝐹 = 𝐹𝐹𝐹𝐹 exp (φ)

F (h,k,l) se puede representar como un vector (figura 7a) y así se puede representar la dispersión total

(figura 7b), del diagrama del factor estructural con un átomo pesado (figura 7c), el diagrama con un

reemplazo isomorfo (figura 7d). La dispersión del átomo pesado es dominante. Si se pueden determinar

posiciones del átomo pesado, se pueden calcular su contribución a la dispersión total usando la ecución

6.

F (h,k,l) se puede representar como un vector (figura 7a) y así se puede representar la dispersión total (figura 7b), del diagrama del factor estructural con un átomo pesado (figura 7c), el diagrama con un reemplazo isomorfo (figura 7d). La dispersión del átomo pesado es dominante. Si se pueden determinar posiciones del átomo pesado, se pueden calcular su contribución a la dispersión total usando la ecución 6.

Page 182: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

182 • Introducción al análisis estructural de proteínas y glicoproteínas

Figura 7. Representaciones de vectores de dispersión

Fuente: [3, p.618].

Con la fase y F, se puede calcular un mapa de densidad electrónica y determinar así valores fraccionarios para hx, ky, iz de otros átomos e intro-ducirlos en (6) para mejorar el cálculo de la fase y, así, ir localizando los diferentes átomos. Este enfoque es válido solo cuando la introducción del átomo pesado ocasiona que este “domine” la estructura, por ejemplo, es componente predominante en ella. Con las proteínas esto no es posible (no hay un átomo suficientemente grande para dominar PM 104-105) y es necesario acudir al reemplazo isomorfo.

Reemplazo isomorfo

Se introduce un átomo pesado o un grupo que no ocasione cambio en el sistema de cristalización pero que sí produce cambios en la intensidad y en el patrón de difracción. El tratamiento vectorial es

11

Figura 7. Representaciones de vectores de dispersión

Fuente: [3, p.618].

Con la fase y F, se puede calcular un mapa de densidad electrónica y determinar así valores fraccionarios

para hx, ky, iz de otros átomos e introducirlos en (6) para mejorar el cálculo de la fase y, así, ir localizando

los diferentes átomos. Este enfoque es válido solo cuando la introducción del átomo pesado ocasiona

que este “domine” la estructura, por ejemplo, es componente predominante en ella. Con las proteínas

esto no es posible (no hay un átomo suficientemente grande para dominar PM 104-105) y es necesario

acudir al reemplazo isomorfo.

Reemplazo isomorfo [T3]

Se introduce un átomo pesado o un grupo que no ocasione cambio en el sistema de cristalización pero

que sí produce cambios en la intensidad y en el patrón de difracción. El tratamiento vectorial es

𝐹𝐹𝐹𝐹𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃 = 𝐹𝐹𝐹𝐹𝑃𝑃𝑃𝑃 + 𝐹𝐹𝐹𝐹𝑃𝑃𝑃𝑃

Una vez que se han localizado los átomos pesados en la celda unitaria se puede calcular la contribución

de FH en términos de magnitud y fase. Al medir las intensidades de las reflexiones, con y sin átomo Una vez que se han localizado los átomos pesados en la celda unitaria se puede calcular la contribución de FH en términos de magnitud y fase. Al medir las intensidades de las reflexiones, con y sin átomo pesado, se conocen fpH y FP (amplitudes). La fase se encuentra con el método geométrico que tiene dos soluciones y permite calcular la probabilidad (figura 8).

Page 183: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura terciaria • 183

Eje real

1,0

A

H1F

Ph1F

p1F1 2

Ph2F

p2F

H2F

0,8

0,6

0,4

0,2

90 180 270 360

Pro

babi

lidad

fas

e

Ángulo de fase

Figura 8. Método geométrico para calcular la probabilidad de fase

Fuente: [2, p. 419].

Si se introduce un segundo átomo pesado y se repite el análisis solo hay un ángulo φ en el que coinciden los vectores componentes (o se intersec-tan los círculos). Los pasos sucesivos en un análisis estructural empleando reemplazo múltiple son:

• Cristalizar la proteína y hallar mínimo dos derivadas que sean isomorfos (problema de empiricidad).

• Coleccionar datos completos de difracción para cada una de las formas, hasta la resolución deseada.

• Localizar las posiciones de los átomos pesados usando la función autocorrelación Patterson en la celda unitaria (proyecciones Pa-tterson) y colocarlos en el mismo set de ejes.

• Calcular las contribuciones de dispersión del átomo pesado para cada punto. Con las intensidades medidas en b y los diagramas vectoriales, hallar la fase. Con ello se calcula F.

• Calcular la densidad electrónica de la proteína parental.

En la figura 9, se observa un difractograma obtenido por reemplazo iso-morfo para cristales triclínicos de lisozima. A la izquierda, se observan las señales de la proteína nativa y, a la derecha, luego de la difusión con HgBr2. Estos pasos implican resolver los siguientes problemas

• La cristalización es muy empírica y es afectada por el tipo de sal con el que se haga salting out, pH, temperatura, presencia de electrolitos, concentración de proteína, pureza y modificaciones químicas que haya sufrido la proteína. Se pueden obtener cristales disolviendo la proteína en solvente y variando sistemáticamente una condición (por ejemplo, fuerza iónica (µ) con NH4SO4). Al-gunos de los métodos usados son cristalización en cochada, por difusión de vapor o por diálisis de equilibrio.

• La resolución obtenible depende del número de reflexiones. Así para la lisozima con resolución 5.5 Å se requiere analizar 473 reflexiones, con resolución 2.2 Å se analizan 8542. En el caso de

Page 184: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

184 • Introducción al análisis estructural de proteínas y glicoproteínas

Figura 9. Reemplazo isomorfo. Se han superpuesto dos fotografías de cristales triclínicos de lisozima. El punto izquierdo de cada pareja de puntos proviene del cristal de la lisozima nativa y el punto derecho corresponde al cristal después de la difusión de HgBr2

Fuente: [3, p. 138].

la mioglobina, 6 Å se analizan 400 reflexiones, 2 Å se analizan 9600 y con 1.4 Å se analizan 25 000 reflexiones. El trazado de α-hélice es observable a 6 Å y la cadena polipeptídica a ≤ 4 Å y para los grupos químicos (cadenas laterales) se requiere ≤ 2.5 Å, lo que implica un número elevado de reflexiones. Además, los puntos de alta resolución (márgenes de la imagen) tienen me-nor intensidad en promedio que los puntos con baja resolución (zona central) y a alta resolución son más notorios los cambios de isomorfismo.

• El mayor cuello de botella está en obtener derivados isomorfos satisfactorios. Si el arreglo de átomos pesados en el cristal no posee un centro de simetría, se puede obtener la fase en forma rápida. El factor limitante no es tanto el tamaño del átomo (se puede usar calcio y bario en algunas proteínas) sino el manteni-miento del isomorfismo.

• Los métodos de obtención se realizan por ensayo y error, lo que da como resultado un empape de cristales en solución con ligandos de átomos pesados. Se hacen modificaciones químicas específicas del cristal, por ejemplo, con Hg en cisteínas para hemoglobina.

Interpretación y construcción de mapas de densidad electrónica

A bajas resoluciones se pueden construir uno de los sólidos que permita seguir el curso de la cadena polipeptídica y la localización de las α-hélices.

Page 185: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura terciaria • 185

Por ejemplo, para proteínas PM 50 000 Da, con una resolución de 6 Å, se requieren, aproximadamente, 2500 reflexiones y, para 2Å, se necesitan 25 000 reflexiones. Un caso especial se evidencia para la mioglobina y he-moglobina pero, en general, la información es limitada.

A alta resolución, generalmente, se compara la distribución de grupos R con la secuencia conocida (y viceversa, con estructura terciaria se pueden corregir errores de la primaria) y eventualmente con posición de marcadores introducidos por reacción de modificación o sustitución de grupos R, loca-lización de grupos prostéticos y de átomos pesados usados para determinar fases. Como chequeos adicionales, se debe observar que la estereoquímica resultante sea adecuada, que no haya regiones muy amplias sin asignar o sin explicar con el mapa y que grupos cargados no queden “enterrados” al interior en forma aislada. A alta resolución se pueden obtener también imágenes generadas por computador mediante programas especiales que usan los datos generados por difractómetro.

Solvente en los cristales de proteína

El solvente está en equilibrio rápido con el sobrenadante que rodea el cristal y no se puede comparar con el agua de cristalización en molécu-las pequeñas. Los contactos entre proteínas y moléculas son tenues y ello no impone cambios en la estructura terciaria durante la cristalización. La presencia de solvente permite realizar reacciones dentro del cristal, lo que es útil en mecanismos de enzimas. El contenido de solvente en cristal es:

∼ 60 % proteínas PM > 100 × 103

∼ 40-55 % proteínas PM < 100 × 107

Esto incide en el patrón de difracción, grado de resolución y en la sen-sibilidad de exposición a los rayos X. Finalmente, se ha encontrado que existe una correspondencia de las estructuras en solución y en el cristal, ya que proteínas con estructura primaria muy similar, cristalizada bajo di-ferentes condiciones y con formas cristalinas diferentes tienen estructura terciaria muy similar.

Aplicaciones adicionales a la estructura terciaria

1. Determinación del peso molecular (PM): conociendo la densidad del cristal y las dimensiones de la celda unitaria, se puede calcular el PM, usual-mente, con una desviación de 4 %, así:

PM = NV (Dc-Dw)/ η(1-Ṽρ *Dw)

Page 186: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

186 • Introducción al análisis estructural de proteínas y glicoproteínas

En esta, V es volumen de la celda unitaria; Dc, densidad del cristal; η, número de moléculas de la celda unitaria; Dw, densidad del agua unida al cristal y Ṽρ, volumen parcial específico.

2.Determinación de la simetría molecular en el caso de oligómeros: co-nociendo el grupo espacial a que pertenece el cristal y el número de molé-culas por celda unitaria, se puede establecer la simetría, por ejemplo, para la hemoglobina, el eje binario de simetría.

La difracción de rayos X (drx) es la técnica que permite resolver estruc-turas de proteínas, de gran tamaño. Hoy en día adelantos en la resolución de la estructura de proteínas incluyen la solución al problema de las fases en la difracción de rayos X por el enfasamiento de difracción anómala a múltiple longitud de onda (mad), la disponibilidad de las secuencias del genoma y los avances experimentales en técnicas de clonaje y de expresión de proteínas han llevado a un aumento de estructuras tridimensionales de proteínas en la última década. Sin embargo, muchas de estas estructuras son redundantes por mutaciones de aminoácidos y duplicaciones [4].

Resonancia magnética nuclear

Los núcleos de ciertos átomos (1H, 19F,31P,13C) poseen momentos magné-ticos o espines nucleares de 1/2 y, por lo tanto, dan señales de resonancia magnética nuclear cuando se colocan en un campo magnético uniforme. Estos átomos se colocan en dos orientaciones posibles:

• Orientación de baja energía: magneto nuclear alineado con campo.• Orientación de alta energía: magneto nuclear alineado contra

campo.

La transición entre estos dos estados se realiza absorbiendo un cuanto de radiación electromagnética de energía (һʋ). Si se emplean campos de, aproximadamente, 10 000 gaus, la energía requerida para la transición está en el rango de la radiofrecuencia del espectro. Dado que los 1H en una molécula orgánica tienen diferentes ambientes electrónicos, el valor preciso del campo para hacerlos resonar a una frecuencia dada variará de protón a protón. Para observar señales de resonancia se requiere:

• Emisor de radiofrecuencia.• Campo magnético homogéneo (el cual es un factor crítico).• Receptor de radiofrecuencia.

Si se opera el espectro a frecuencia fija se necesitará un barrido del campo magnético en un rango pequeño (∼10ppm).

Page 187: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura terciaria • 187

En rmn protónica de las proteínas, las señales de los H+ de grupos R se encuentran en un rango menor o igual a 8 ppm. El número alto de proto-nes da como resultado muy baja resolución y la presencia señales diferentes entre el espectro calculado en función de los aminoácidos para la proteí-na desnaturalizada y la proteína nativa. En la rmn 13C, el desplazamiento químico se da en rangos mayores que con 1H. Por otra parte, no hay ge-neralmente acoplamiento espín 13C- 13C porque hay una alta probabilidad que el carbono vecino sea 12C. Sin embargo, una ventaja es la posibilidad de reserción de 13C en un sitio determinado de la proteína sin perturbar la estructura terciaria. Entre las desventajas encontramos una baja abun-dancia de 13C y una menor sensibilidad en los desplazamientos cuando hay cambios en microambiente.

En el caso del 32P hay un rango amplio de desplazamiento químico y un menor contenido de fósforo con respecto a 1H y 13C. Se emplea, por lo general, para detectar cambios de pH en diferentes compartimentos midiendo el grado de ionización de los grupos fosfato de compuestos fos-forilados. Otros isótopos como el 19F también se trabajan en rmn, dado que la sensibilidad de detección del 19F es similar a 1H es muy apropiado para usarlo como sonda en sitios específicos, por ejemplo, para Lys1-Lys7 trifluoroacetiladas.

Desplazamiento químico

La frecuencia (ʋ) a la que un 1H resonará en el espectro rmn está dada por:

(1) ʋ = ƳH/ 2 π

en la que, Ƴ es la constante de relación giromagnética y H el campo local. El campo local (H) es diferente al campo aplicado (Ho) porque el núcleo

está rodeado de una coraza de electrones, cuya magnitud se puede repre-sentar por el parámetro σ de acercamiento definido (puede ser positivo o negativo, usualmente es positivo). Entonces, si:

(2) H = Ho (1-σ) (3) ʋ = Ƴ (Ho (1-σ)) /2 π

Protones con diferentes ambientes electrónicos (valor σ) se llevarán a resonancia con barrido Ho a frecuencia constante. El desplazamiento quími-co de un protón es independiente del instrumento utilizado y tiene valores característicos para cada grupo funcional. En la siguiente tabla están los desplazamientos para los 20 aminoácidos que se presentan en las proteínas.

Page 188: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

188 • Introducción al análisis estructural de proteínas y glicoproteínas

Tabla 1. Desplazamiento químico en estructura al azar de los 20 aminoácidos comunes

Residuos HN Hα Hβ Otros

Glicina 8.39 3.97(H2C)

Alanina 8.25 4.35 1.39(H3C)

Valina 8.44 4.18 (3.95*) 2.13(HC) 0.97(γH3C),0.94(γH3C)

Leucina 8.42 4.38 (4.17*) 1.65(H2C) 1.64(γHC),0.94(δH3C),0.90(δH3C)

Isoleucina 8.19 4.23 (3.95*) 1.90(HC) 1.48-1.19(γH2C), 0.95(γH3C),0.89(δH3C)

Fenilalanina 8.23 4.66 3.22-2.99(H2C) 7.30(H2),7.39(H3),7.34(H4)

Asparagina 8.75 4.75 2.83-2.75(H2C) 7.59-6.91(γH2N)

Glutamina 8.41 4.37 2.13-2.01(H2C) 2.38(δH2C),6.87-7.59(δH2N)

Triptófano 8.09 4.70 3.32-3.19(H2C) 7.24(H2),7.65(H4),7.17(H5),7.24(H6),7.50(H7),10.22(H)

Prolina - 4.44 2.28-2.02(H2C) 2.03(γH2C),3.68-3.65(δH2C)

Serina 8.38 4.50 3.88(H2C)

Treonina 8.24 4.35 4.22(HC) 1.23(γH3C)

Tirosina 8.18 4.60 3.13-2.92(H2C) 7.15(H2),6.86(H3)

Cisteína 8.31 4.69 (4.65*) 3.28-2.96(H2C)

Metionina 8.42 4.52 2.15-2.01(H2C) 2.64(γH2C),2.13(εH3C)

Ac aspártico 8.41 4.76 2.84-2.75(H2C)

Ac glutámico 8.37 4.29 2.09-1.97(H2C) 2.31-2.28(γH2C)

Lisina 8.41 4.36 1.85-1.76(H2C) 1.45(γH2C),1.70(δH2C),3.02(εH-

2C),7.52(εH3N+)

Arginina 8.27 4.38 1.89-1.79(H2C) 1.70(γH2C),3.32(δH2C),717-6.62(H3N)

Histidina 8.41 4.63 3.26-3.20(H2C) 8.12(H2),7.14(H4)

Los compuestos trimetil silil propionato (tsp) o 2,2 -dimetil-2silanopen-tano-5 sulfonato (dss) son patrones para biopolímeros por su solubilidad en agua. tms se toma como patrón de referencia porque sus 12 H+ son equi-valentes y resuenan en igual valor de campo (una línea), de manera que el valor de resonancia es menor que el H+1 de moléculas orgánicas.

Los factores que afectan el desplazamiento químico son:• Intramoleculares, debidos a efectos inductivos cuya desprotección

opera a través de enlaces CH3-O vs CH3-CH2-. • La anisotropía de enlaces que opera a través del espacio en el que

hay influencia de la distancia y el ángulo de los átomos se presenta en los enlaces C=O, C=C de los sistemas aromáticos.

• La desprotección que se da por las diversas fuerzas de Van der Waals.

Page 189: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura terciaria • 189

• Efectos como la temperatura, solvente y concentración.• La formación de puentes de hidrógeno, que lleva al desplazamiento

hacia menores campos (efecto paramagnético).• Los acoplamientos espín-espín resultantes de las diferentes orien-

taciones posibles de espín de H+1 adyacentes, que aparecen como dupletes, tripletes y cuadrupletes en el espectro.

• La separación entre las líneas da la constante de acoplamiento J, que caracteriza interacciones escalares (a través de enlaces). Los 1H adyacentes modifican el valor inicial del 1H en cuestión y ban-das con 2, 3, 4 picos.

# bandas = (ηa+1) (ηb+1) (ηc+1)

En esta, ηa es el número de protones C vicinal a y ηb, el número de protones C vicinal b.

Para proteínas > 200 kDa se puede hacer una proteólisis suave que lleve a rupturas en segmentos que unen dominios, y se generen fragmentos de tamaño intermedio (20 - 80 kDa). Posteriormente se comparan los mapas de los fragmentos proteicos obtenidos más grandes o de péptidos obtenidos por ruptura alternativa (usualmente, química). Finalmente, se determina la orientación de los grupos NH2, y cOOH de cada uno de los péptidos.

rmn bidimensional

La rmn unidimensional tiene limitaciones como la falta de resolución y dificultad de asignación de resonancias para algunos protones. Con esta técnica se varía la frecuencia de la radiación electromagnética y se registra la absorción de radiación. En 2D, se emplea un eje adicional con otro do-minio de frecuencia en el mismo rango dando una mayor resolución. El método proporciona un espectro bidimensional, en el que, gráficamente, se observa una nube de puntos entre dos ejes. Con este método se logra obtener información sobre:

1. Interacciones a través de enlaces (que incluyen la constante (J) de acoplamiento) mediante las técnicas Cosy y Relay.

2. Interacciones a través del espacio (mediante acoplamientos dipo-lares) por medio de la técnica Noesy.

Se busca obtener información estructural, la cual requiere la asignación de resonancia de cada uno de los protones de la proteína, esto se logra con un método secuencial desarrollado por Wuthrich [5] que se descompone en dos pasos:

Page 190: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

190 • Introducción al análisis estructural de proteínas y glicoproteínas

1. Identificación de resonancias para los aminoácidos en la que se trata a los residuos como entidades aisladas y se toma ventaja de la no existencia de los acoplamientos J a través de los enlaces peptídicos. Por medio de Cosy se obtienen tres grupos de perfiles:

• Aquellos característicos para un aminoácido (A, F, I, LP, T, V ) con un grupo R con carbono β.

• Aquellos redundantes (C, D, F, H, N, S, W, Y), principalmente los grupos aromáticos.

• Aquellos con carbono ε (E, M, Q).

La diagonal es el espectro monodimensional y por fuera de ella se pre-sentan unos picos que resultan interesantes. Las coordenadas de cada uno de los picos son los desplazamientos químicos de dos protones con acopla-miento de espines (que están separados por 3 enlaces químicos). Los picos corresponden a los protones de los distintos aminoácidos de la proteína. Cada aminoácido da un conjunto de picos característico; sin embargo, algunos aminoácidos dan un patrón Cosy idéntico (C, D, N, S, H, F, Y, W), (E, Q, M) mientras que otros poseen patrones específicos (G, A, I, L, V, P, K, R, T). En el espectro Cosy, los protones de cada residuo están aislados de los de residuos adyacentes de modo que no da información acerca de cómo se ordenan los aminoácidos en la proteína. Por medio de Tocsy se asignan todas las señales de un aminoácido (figura 10).

a

CbH3

C H

NH

Ala

a

H2

C H

NH

Gly

aC

a

C H3

C H

NH

Val

CbH

1

a

C H

C H

NH

AMX

CbH

2b

Figura 10. Espectro Tocsy patrón para algunos aminoácidos

2. Identificación de las resonancias con posición en la estructura primaria, usando la secuencia de la proteína.

En este punto se usa el método Noesy (acoplamiento a través del espacio) ya que cruza los picos que conectan las resonancias que están cercanas en el espacio ∼ 4 Å. Billeter et al. [6] demostraron que el H de la amida está a < 4 Å de NH, CαH, CβH (figura 11).

Los puntos que están fuera de la diagonal permiten identificar pares de protones separados por menos de 5 Å. La interpretación de un espectro bidimensional para una estructura tridimensional es un proceso que requie-re equipos informáticos con adecuados programas gráficos. El programa

Page 191: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura terciaria • 191

H H

H H H H

CR

R

N NC C C C

O O

Resíduo i Resíduo i + 1

Acoplamiento intraresidual (TOCSY y NOESY)

Acoplamiento interresidual (NOESY)

Figura 11. Conectividad Noesy y Tocsy en un dipéptido

Fuente: [7].

necesita información sobre los parámetros químicos, como la estructura primaria, longitudes, ángulos de enlaces y los radios de Van der Waals, etc. Entonces, el ordenador genera una familia de estructuras que representan una gama de conformaciones consistentes con las proximidades atómicas detectadas por nOe. Utilizando alternativamente Cosy (asignación H+1 a un átomo de C) y Noesy, en una región (conectividad dNH,daN,dbN, figura 11) se deduce la vecindad de los residuos AA y fragmento de secuencia. Luego se pasa a otra región y se repite el proceso hasta asignar todos los picos de Noesy [8].

Con respecto a la estructura secundaria, la constante de acoplamiento espín-espín depende de la geometría de los enlaces que los separan, es un parámetro importante para determinar el ángulo de dos protones adyacen-tes. En general, el ángulo diedro φ del esqueleto peptídico tiene la relación de Karplus con el tamaño de la constante de acoplamiento 3JHnHα de los hidrógenos y presenta los valores esperados para una hélice α del orden de 4 Hz y para una hebra β de 9 Hz. La estructura terciaria de baja resolución, se hace tratando los elementos de estructura secundaria como unidades rígidas. En β antiparalelas se observan interacciones CαH-CαH entre ban-das adyacentes que se detectan fácilmente por Noesy de rango medio. La ubicación de segmentos de α-hélice se logra analizando las interacciones cadena lateral-cadena lateral que se observan en Noesy de amplio rango. Así se obtiene el patrón de plegamiento de la cadena. La ubicación espa-cial de cada una de las cadenas laterales se obtiene analizando un conjunto completo de interacciones H+-H+ (rmn 400 MZ) por medio de algorit-mos diseñados para ese fin. Se encuentra una concordancia de estructura terciaria cristalina vs 2D rmn [9]. Una ventaja es que la determinación se hace en solución y por lo tanto se evita el proceso de cristalización. Por otra parte, aporta una imagen más fiel de localización de cadenas laterales en la superficie.

Page 192: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

192 • Introducción al análisis estructural de proteínas y glicoproteínas

Otras aplicaciones de la rmn se evidencian en el estudio de las interac-ciones soluto-soluto y el estudio de la dinámica de las proteínas; para este último se pueden estimar las frecuencias de vaivén (Flip) de anillos aromá-ticos como función de la temperatura (ƒ(T)) por ejemplo.

Microscopía crioelectrónica o criomicroscopía electrónica (Cryo-em)

Cryo-em es una forma de microscopía de transmisión electrónica (tem), en la que la muestra es estudiada a temperaturas criogénicas (generalmente temperaturas a las que se encuentra el nitrógeno líquido). Para realizar un análisis estructural de una proteína por Cryo-em, es necesario realizar una vitrificación de la muestra [10], para lo cual se requiere una congelación muy rápida de la solución de proteína asegurando de esta manera que las moléculas de agua no tengan tiempo de cristalizarse ya que de esta manera se forman sólidos amorfos que no generan ningún daño a la estructura de la proteína. Una ventaja que presenta esta técnica es que permite observar moléculas que no han sido aisladas o fijadas de ninguna manera, lo que permite tener información en su medio nativo, a diferencia de lo que ocu-rre en la cristalografía de rayos X, en la que el proceso de cristalización es complicado y exige colocar la molécula en un medio no fisiológico, que podría generar cambios conformacionales e incluso funcionales de la mo-lécula en estudio [11, 12].

La Cryo-em usa electrones de alta energía para iluminar muestras muy delgadas en un microscopio de transmisión electrónica, aprovechando la trayectoria de la carga negativa del electrón orientado por un campo mag-nético que lo dirige hacia la muestra a estudiar, haciendo que este la atra-viese [13]. De esta manera, la Cryo-em usa un lente de objetivo magnético para producir tanto un patrón de difracción de la muestra en el plano focal posterior, como una imagen ampliada en el plano de la imagen. Debido a que se genera una interacción coulómbica fuerte con cada átomo de la muestra, las moléculas individuales pueden ser descritas y la imagen am-pliada incluye la información estructural de la molécula. Debido a lo ante-rior, adicional a que no se requiere un sistema cristalino para ser analizada, esta técnica ha colaborado a la Biología Estructural a resolver estructuras a una resolución cercana a nivel atómico de macromoléculas aisladas, direc-tamente de sus imágenes obtenidas. Por cada muestra se pueden obtener entre cientos y miles de imágenes de cada molécula, para lo cual se realiza un análisis estadístico para clasificar, alinear y promediar las imágenes que finalmente van a mostrar los rasgos estructurales comunes de todas las imágenes de la molécula, con lo que se puede generar una estructura 3D

Page 193: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura terciaria • 193

virtual (normalmente, llamada un mapa 3D Cryo-em) en un computador. La resolución en la cual se puede obtener la imagen depende de algunos factores como el funcionamiento del microscopio (iluminación y eficiencia del detector), la similaridad entre las imágenes obtenidas (homogeneidad), la distribución de las orientaciones posibles de la molécula en la muestra, el número de imágenes, la robustez del método estadístico usado, entre otras. Cryo-em usa las proyecciones 2D para construir directamente la estructura 3D, de acuerdo con las limitaciones determinadas por las condiciones ins-trumentales, logrando detallar información estructural a diferentes niveles de resolución, desde los 3 Å hasta los 3 nm.

En un análisis estructural por Cryo-em, la información tridimensional puede obtenerse a partir de datos bidimensionales obtenidos de diferentes maneras, dependiendo del tipo de muestra, en las que se incluye el aná-lisis de partícula individual (útil para complejos proteicos purificados), re-construcción helicoidal (complejos proteicos con simetría helicoidal) [14], tomografía electrónica (con o sin subtomogramas, usado para ensamblajes

“únicos” como organelos y células aisladas) y cristalografía 2D (para proteínas menores a 150 kDa con arreglos estructurales ordenados) [15] .

Un análisis de partícula individual usa múltiples imágenes 2D que con-tienen muchas “partículas individuales” con diferentes orientaciones angu-lares. Las relaciones angulares entre cada vista de la molécula pueden ser calculadas en las imágenes que proveen la información 3D. La tomografía electrónica y cristalografía 2D obtienen diferentes vistas angulares al incli-nar la especie muchas veces (entre +/- 65 °) y tomando imágenes cada 2 °, para generar, aproximadamente, 65 imágenes de la misma área [16, 17]. En este caso, la relación angular entre cada imagen es conocida ya que el incremento del ángulo es previamente definido. Esta información se puede usar para reconstruir la información 3D [18].

Cuando se planea un análisis por Cryo-em (figura 12), se deben tener en cuenta las siguientes etapas [19, 20]:

• Preparación de la muestra. La muestra debe ser lo más homogénea posible, teniendo en cuenta que Cryo-em genera varias imágenes de una molécula. Una heterogeneidad en la muestra puede pro-ducir, por ejemplo, información errónea sobre la composición en subunidades de un complejo o la variación conformacional y flexibilidad del complejo. La variación en la composición de un complejo puede ser reducida bioquímicamente usando un mé-todo apropiado de purificación del mismo, aunque en ocasiones estas moléculas “puras” no se conservan como complejos en los experimentos de Cryo-em. Del mismo modo, la variación confor-macional y la flexibilidad pueden depender completamente de la composición del buffer en la que se encuentra la molécula. Sin em-bargo, un entrecruzamiento químico podría mejorar la estabilidad

Page 194: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

194 • Introducción al análisis estructural de proteínas y glicoproteínas

de la molécula. Métodos como GraFix se han desarrollado para purificar la molécula de interés basados en la estequiometría de la misma, aunque en ocasiones el entrecruzamiento puede ge-nerar artefactos como mantener la estructura en una forma no nativa y, por tanto, no funcional [21]. Otra manera de acercarse a la estructura funcional de la molécula es incluir en la muestra el ligando o sustrato específico de la misma, al igual que como se hace en cristalografía de rayos X.

• Preparación de la grilla. Para obtener imágenes con electrones, el microscopio se debe mantener con un alto vacío, en el cual las muestras biológicas se deben deshidratar rápidamente. Se debe tener en cuenta que la muestra debe fijarse, preferiblemente, en un estado nativo o casi nativo. La muestra debe ser lo suficiente-mente delgada para permitir que los electrones sean “transmitidos”. Para lograr este objetivo, los métodos usados incluyen la tinción negativa, seccionar, embeber en plástico y vitrificación (tabla 2).

Muestra

Visualización de tinción negativaReconstrucción de tinciónnegativa

La muestra aparecehomogénea

Visualización Cryo-EM

Optimización de la Grilla

Muestra agregada,heterogénea o maldistribuida sobre lagrilla, y/ooptimización delmétodo de tinción omuestra necesaria

Recolección de datos Cryo-EMPartículaindividual

Si fuera necesario se hace una reconstrucciónCryo-EM en el microscopio superior para obtener

una mejor resolución

Figura 12. Ejemplo de diagrama de flujo para determinación de estructura por el método de partícula individual con microscopía electrónica (em)

Fuente: [20, p. 2].

Page 195: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura terciaria • 195

Tabla 2. Características principales de los métodos de preparación comunes de las grillas.

Método de preparación de la grilla

Muestras a analizar Equipo habitual Resultados habituales

Visualización de tinción negativa

Complejos macromole-culares (> 50 kDa), orga-nelos, células procariotas.

em con filamentos de tungsteno.

Visualización de mues-tras con contraste alto.

Reconstruc-ción de tinción

negativa 

Complejos macromo-leculares que aparecen

homogéneos.

em con filamentos LaB6 y detector ccd.

Resolución limitada por el tamaño de muestra, habitualmente ~20 Å.

Visualización criogénica

Complejos macromo-leculares (> 150 kDa), liposomas, organelos y células procariotas y

eucariotas. 

em con filamentos LaB6 o feg.

Visualización de muestra con contraste bajo.

Reconstruc-ción criogénica de partículas individuales

Complejos macromole-culares (> 150 kDa).

ded como visualización criogénica preferida.

Depende de la muestra, reconstrucción de ~3-

20Å

Reconstruc-ción criogénica (tomografía)

Organelos, células proca-riotas, bordes delgados o laminares de células

eucariotas.

Como en visualización criogénica ded, filtros de energía y placas de

fase, pueden ser de gran beneficio.

Resoluciones de tomogramas > 10 nm,

subtomogramas pueden producir reconstruccio-

nes de > 10Å.

Fuente: [20, p. 3].

La tinción negativa se usa para analizar complejos macromoleculares a temperatura ambiente. En este procedimiento, la muestra se adsorbe en una película delgada de carbono y se recubre con una solución salina (1 - 2 % p/v) de un metal pesado como acetato o formato de uranio, ase-gurando una capa delgada sobre un solo lado de la película. Este proceso rápidamente deshidrata la muestra y la recubre con la tinción (donde no hay moléculas en la muestra, se visualiza la ausencia de tinción y la tinción negativa ocurre, mientras que donde la muestra por sí misma se tiñe, la tinción positiva se presenta). La capa resultante de los átomos de metales pesados genera contraste de amplitudes y una, relativamente, alta relación entre la señal y el ruido. Sin embargo, se debe determinar la tinción óptima para la determinación de la estructura, pues una tinción muy fuerte o muy difusa puede generar pérdida de información de la misma. La deshidratación de la muestra y su deformación durante la adsorción son inconvenientes de la preparación de la muestra en la tinción negativa. Adicionalmente, la resolución de las imágenes teñidas se limita por el tamaño de los puntos de tinción, lo que determina qué tan bien la cubierta de tinción refleja la estructura de la molécula.

Page 196: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

196 • Introducción al análisis estructural de proteínas y glicoproteínas

La técnica de embeber la muestra en plástico, al igual que la tinción nega-tiva, implica la deshidratación de la muestra, con lo que se remueve el medio acuoso de su forma nativa. Por el contrario, la inmovilización criogénica preserva ese ambiente acuoso, al tiempo que mejora el daño generado por la radiación, esta es una de las principales ventajas de la Cryo-em. La mues-tra debe congelarse extremadamente rápido (a una velocidad de ~106 °C/s), de tal manera que el agua interna, así como la que rodea las moléculas, se fija en un estado vítreo. Si la congelación ocurre de una manera lenta, o si se mantiene la muestra a una temperatura de -137 °C, temperatura a la cual el agua se desvitrifica, el hielo cristalino se forma, comprometiendo las aguas de la capa de hidratación de la muestra y modificando la manera como esta puede difractar los electrones.

La vitrificación se puede obtener por medio de inmersión helada (plunge freezing) o por congelación a alta presión (high pressure freezing). En el pri-mer caso, la técnica se usa para un amplio rango de muestras, incluyendo macromoléculas de ~150 kDa hasta células eucariotas completas. La ventaja principal es que la muestra es visualizada en un estado muy cercano al nativo, además de que el procesamiento de las imágenes puede proporcionar infor-mación estructural tridimensional de una buena resolución. Sin embargo, las muestras son tratadas con bajas dosis de electrones para evitar daño por la radiación que puede resultar en un bajo contraste. La segunda técnica se usa en muestras gruesas como regiones nucleares de células eucariotas, secciones de tejidos y organismos completos como C. elegans. La principal ventaja es que la muestra se conserva en un estado muy similar al nativo, lo que puede proporcionar información estructural de alta resolución. Sin embargo, para lograr esto, la muestra debe ser seccionada por un rayo láser después del proceso de congelación. Este proceso adicional puede generar artefactos que pueden producir resultados erróneos de la estructura 3D.

Adicional a la técnica usada para la congelación de la muestra, para la preparación de la grilla se debe seleccionar adecuadamente la película de soporte. Generalmente, se utilizan películas de carbono perforadas ya que permiten que la muestra se suspenda en hielo y el análisis se centra en las partes que están en los agujeros de la película. Del mismo modo, películas de carbono amorfo pueden ser usadas, aunque generan problemas adicio-nales, ya que la inestabilidad de la superficie puede desviar los rayos de electrones y son un material que se deteriora más fácilmente.

El análisis de las imágenes de Cryo-em depende en gran medida de la planeación del experimento, desde la preparación de la muestra como tal. En cualquier caso, hay una importante relación entre costo, conveniencia, calidad y disponibilidad del instrumento. A continuación, se describen los aspectos más importantes a tener en cuenta para una buena adquisición de imágenes:

Page 197: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura terciaria • 197

• Fuente de electrones: la pistola de electrones de un microscopio electrónico extrae y acelera electrones y funciona a la vez como una fuente termoiónica de electrones así como un emisor ter-moiónico de campo asistido, comúnmente conocida como una pistola de emisión Schottky, o como una pistola de campo de emisión (feg). Esta bomba posee un filamento extremadamente delgado de tungsteno recubiertos con óxido de zirconio, el cual opera con voltajes de extracción de 200 - 300 kV a 1800 K. Con esta fuente se obtienen resultados de una mayor resolución, aunque es mucho más costoso tanto para la obtención, así como para su mantenimiento.

• Detectores de electrones: los electrones de alta energía usados en microscopía electrónica de transmisión (tem) requieren detectores que van desde placas fotográficas, dispositivos acoplados cargados (ccd) o detectores directos de electrones (ded) [22].

• Filtros de energía y placas de fase: estas dos tecnologías se han desarrollado para maximizar la información de la resolución en las imágenes, teniendo en cuenta que estas deben ser tomadas cerca al foco, donde el contraste de la imagen es mínimo. Cuando se obtienen imágenes usando electrones, una proporción de éstos que interactúa con la muestra son dispersados inelásticamente, resul-tando con menor energía y una longitud de onda mayor, lo que indica que son enfocados en un plano diferente al de los electrones elásticamente dispersados. Los filtros de energía pueden llegar a prevenir los electrones dispersados inelásticamente, contribuyendo a la calidad de la imagen obtenida. Los filtros trabajan sobre el principio de que los electrones de diferentes energías/longitudes de onda pueden ser desviados por diferentes vías, lo que indica que solamente los electrones que interactúan elásticamente con la muestra contribuyen a la obtención de la mejor imagen. Sin embargo, cuando se adquieren imágenes de muestras sin tinción, se obtienen bajos contrastes, lo que generó el desarrollo de las placas de fase que permiten disminuir este problema. Las placas de fase introducen un cambio de fase adicional para los rayos dis-persados más fuertemente. Estas placas de fase permiten obtener imágenes más cercanas al foco, reteniendo información mientras se genera suficiente contraste para visualizar la muestra.

• Recolección automática de datos. Una gran cantidad de imágenes de partículas individuales (> 1000s) se requiere, normalmente, para generar una estructura usando los métodos de procesamien-to de partícula individual. El número de micrografías necesario es altamente variable y depende de la muestra (por ejemplo, su tamaño, su orientación y simetría), del número de partículas por

Page 198: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

198 • Introducción al análisis estructural de proteínas y glicoproteínas

micrografía, de la resolución deseada y de los niveles de hetero-geneidad en un set de datos. Para estos análisis, se han desarro-llado varios software que permiten automatizar esta recolección de datos y hacen más eficiente el tiempo de uso del microscopio.

Desarrollos recientes en el método de particula individual Cryo-em per-miten reconstruir moléculas pequeñas con resolución menor subnanomé-trica, lo que permite resolver el problema de las fases que se presenta en los estudios de difracción de rayos X.

Referencias 1. Pontificia Universidad Católica de Chile. Difracción de Bragg. Laboratorio de

Difracción de Rayos X. Disponible en: http://servicios.fis.puc.cl/rayosx/teoria.html. [05 de febrero de 2020].

2. Matthews BW. X-ray Structure of Proteins Structure. Neurath H, Hill R. The Proteins. Vol. iii. Tercera edición. Nueva York: Academic Press; 1977. 404-590.

3. Dickerson RE. X-Ray Analisys and Protein Structure. Hans N. The Proteins. Vol. II. Segunda edición. New York: Academic Press; 1964. 603-778.

4. Hendrickson WA. Anomalous diffraction in crystallographic phase evaluation. Quarterly Reviews of Biophysics. 2014;47(01):49-93. dOi:10.1017/s0033583514000018

5. Wuthrich K. Protein structure determination in solution by nuclear magnetic resonance spectroscopy. Science. 1989;243(4887):45-50. dOi:10.1126/science.2911719

6. Wüthrich K, Wider G, Wagner G, Braun W. Sequential resonance assignments as a basis for determination of spatial protein structures by high resolution proton nuclear magnetic resonance. Journal of Molecular Biology. 1982;155(3):311–319. dOi:10.1016/0022-2836(82)90007-9

7. Schirra HJ. Analysis of nmr spectra. Structure Determination of Proteins with nmr Spectroscopy. Disponible en: http://www.cryst.bbk.ac.uk/pps2/projects/schirra/html/assign.htm [20 de febrero de 2020].

8. Bangerter BW. Nuclear magnetic resonance. Glasel J, Deutscher M. Introduction to Biophysycal Methods for Protein and Nucleic Acid Research. San Diego, California: Academic Press; 1995. 317-379.

9. Billeter M. Comparison of Protein Structures Determined by nmr in Solution and by X-Ray Diffraction in Single Crystals. Quart. Rev Biophys. 1992;25:325-377.

10. Dubochet J, Adrian M, Chang J, Homo J, Lepault J, McDowall M. Cryo-Electron Microscopy of Vitrified Specimens. Q. Rev.

Page 199: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Estructura terciaria • 199

Biophys. 1988;21:129-228, Disponible en: http://dx.doi.org/10.1017/S0033583500004297

11. Cheng Y, Grigorieff N, Penczek P, Walz T. A Primer to Single-Particle Cryoelectron Microscopy. Cell. 2015;161:438-449. Disponible en: http://dx.doi.org/10.1016/j.cell.2015.03.050

12. Kühlbrandt, W. Cryo-em enters a new era. eLife, 3. 2014. dOi:10.7554/elife.03678

13. Orlova E, Saibil H. Structural Analysis of Macromolecular Assemblies by Electron Microscopy. Chem. Rev. 2011;111:7710-7748.

14. Egelman E. Three-Dimensional Reconstruction of Helical Polymers. Arch. Biochem. Biophys. 2015;581:54-58. dOi:10.1016/j.abb.2015.04.004

15. Briggs J. Structural Biology in situ. The potential of Subtomogram Averaging, Curr. Opin. Struct. Biol. 2013;23:261–267. Disponible en: http://dx.doi.org/10.1016/j.sbi.2013.02.003

16. Lucic V, Forster F, Baumeister W. Structural Studies By Electron Tomography: from Cells to Molecules. Annu. Rev. Biochem. 2005;74:833-865.

17. Schenk A, Castaño-Diez D, Gipson B, Arheit M, Zeng X, Stahlberg H. 3D Reconstruction from 2D Crystal Image and Diffraction Data. Meth. Enzymol. 2010;482(2010):101–129. Disponible en: http://dx.doi.org/10.1016/S0076-6879(10)82004-X.

18. Booth D, Avila-Sakar A, Cheng Y. Visualizing Proteins and Macromolecular Complexes by Negative Stain em: from Grid Preparation to Image Acquisition. J. Vis. Exp. 2011;(58):e3227. dOi: 10.3791/3227

19. Lau WcY, Rubinstein JL. Single Particle Electron Microscopy. Electron Crystallography of Soluble and Membrane Proteins. 2012;401-426. dOi:10.1007/978-1-62703-176-9_22

20. Thompson R, Walker M, Siebert A, Muench S, Ranson N. An Introduction to sample preparation and imaging by Cryo-Electron Microscopy for structural biology. Methods. 2016;100:3-15.

21. Stark H. GraFix: Stabilization of fragile macromolecular complexes for single particle Cryo-em. Meth. Enzymol. 2010;481:109-126. Disponible en: http://dx.doi.org/10.1016/S0076-6879(10)81005-5

22. McMullan G, Faruqi A, Clare D, Henderson R. Comparison of Optimal Performance at 300 Kev of Three Direct Electron Detectors for Use in Low Dose Electron Microscopy. Ultramicroscopy. 2014;147:156-163. Disponible en: http://dx.doi.org/10.1010/j.ultramic.2014.08.002.

Page 200: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural
Page 201: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Capítulo seis

Glicoproteínas y carbohidratos

Page 202: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural
Page 203: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Glicoproteínas y carbohidratos • 203

Uno de los campos de investigación que se está desarrollando es el estudio de la función de los glicanos y cómo pueden regular procesos biológicos que van desde la coagulación hasta procesos de infección viral y bacteriana, actuando en diferentes tipos de células. Esta área del conocimiento servirá para desarrollar nuevas alternativas en el tratamiento de enfermedades [1].

Los avances en proteómica han generado un interés que busca enten-der como participan los glicanos en las múltiples interacciones existentes a nivel celular, en las que las glicoproteínas juegan un papel importante. Por analogía con el genoma, proteoma y transcriptoma, el glicoma es el grupo completo de glicanos y glicoconjugados que son sintetizados por una célula u organismo bajo unas condiciones fisiológicas específicas. Por lo tanto, la glicómica se refiere a los estudios que se realizan para definir y cuantificar el glicoma de una célula, tejido u organismo [2, 3]. La glicómica, es solo una parte de la glicobiología, y busca caracterizar y establecer la función de los carbohidratos que codifican la información conducente a las interacciones receptor-ligando, macromolécula-célula, célula-célula y célula-matriz extra-celular, interacciones que se manifiestan en el establecimiento intracelular de asociaciones multiméricas, así como en la adhesión y reconocimiento intercelular. La diversidad de carbohidratos que participan en dichas in-teracciones es evidente dado que están presentes en glicoproteínas, glico-lípidos y proteoglicanos de la superficie celular o matriz extracelular, los cuales actúan como receptores de moléculas que desencadenan diferentes procesos biológicos.

Las interacciones conducentes a respuestas biológicas son proteína-pro-teína, proteína-carbohidrato y carbohidrato-carbohidrato, en las que hay evidencia experimental que las implica en procesos biológicos que incluyen tráfico celular, interacciones hospedero patógeno, embriogénesis, esperma-togénesis, fertilización, desarrollo del sistema nervioso y angiogénesis, entre otros [4, 5]. El reconocimiento biológico involucra estructuras altamente ordenadas. En el caso de la mediación por oligosacáridos, se realizan pro-cesos de multimerización de moléculas de carbohidrato para generar sufi-ciente afinidad o avidez para funcionar in vivo. En este capítulo, trataremos algunos aspectos concernientes a los glicanos de glicoproteínas, teniendo en cuenta el hecho de que la glicosilación, es una modificación postraduccional que es fundamental en procesos biológicos.

Page 204: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

204 • Introducción al análisis estructural de proteínas y glicoproteínas

Diversidad estructural de los oligosacáridos

Teóricamente, las posibilidades de combinación de los monosacáridos que conforman los oligosacáridos sobrepasan en varios órdenes de magnitud a la combinación de aminoácidos para generar los péptidos o de los nu-cleótidos en los ácidos nucleicos. Lo anterior se debe a que el número de monosacáridos, que está usualmente presente en los organismos, además de azúcares simples incluye también sus derivados más comunes, por ejemplo, aminoazúcares, acetilaminoazúcares, deoxiazúcares, ácidos urónicos y de-rivados sulfatados. En los carbohidratos hay varios de sitios de enlace por unidad constituyente (esta es de 2 - 4). Además, existen también estructuras ramificadas y la anomería de enlace α o β.

Si tenemos un conjunto de 20 aminoácidos, para un hexapéptido se pueden generar teóricamente del orden de 5x 107 isómeros estructurales, mientras que, para un oligosacárido de la misma longitud, se pueden generar 1015 estructuras diferentes [6]. Sin embargo, una limitación de la diversidad estructural reside en el número de glicosiltransferasas existentes. De hecho, solo unos pocos cientos de glicanos diferentes son conocidos por estructuras que contienen hasta 17 monómeros. La cantidad de información implícita en la secuencia y la estructura de los glicanos constituyen lo que se conoce como el “glicocódigo” [7]. Un elemento adicional de la secuencia que debe considerarse, que corresponde a los factores conformacionales determinados por el anillo piranosa y la presencia de sustituyentes voluminosos en los gli-canos, los cuales introducen restricciones conformacionales que disminuyen el costo en entropía para el funcionamiento del ligando en una interacción bioactiva. Un recurso muy útil que evidencia la diversidad estructural son las bases de datos disponibles, algunas de las cuales se citan en la tabla 1.

Tabla 1. Bases de datos para glicómica y glicoproteómica

Bases de datos generales

http://www.boc.chem.uu.nl/sugabase/carbbank.html CarbBank

http://www.glycosciences.de Glycoscien-ces_db

http://www.genome.jp/ligand/kcam/ Glycan

http://www.genome.jp/ligand/kcam/ Kegg

http://web.mit.edu/glycomics/cbp/cbpdb.shtml Carbohydrate db

N-glicanos http://glycominds.net Glycomicdb

http://glycosuite.com GlycoSuite

Page 205: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Glicoproteínas y carbohidratos • 205

Sitios de predicción para glicosilación

N- glicosilación http://www.cbs.dtu.dk/services/NetNGlyc/ NetNGlyc

O- glycosilación http://www.cbs.dtu.dk/services/NetOGlyc/ NetOGlyc

Glicofosforilación http://www.cbs.dtu.dk/services/YinOYang/ YinOYang

Glicosilfosfatidili-nositol (gpi)

http://mendel.imp.univie.ac.at/sat/gpi/gpi_server.html Big-pi Predictor

http://129.194.185.165/dgpi/DGPI_demo_en.html Predicción de gpi

Nomenclatura y representación gráfica

Nomenclatura http://www.chem.qmw.ac.uk/iupac/ upac

Codificación lineal http://www.glycosciences.de/tools/linucs/ linuncs

Representación gráfica

http://www.glycosciences.de/tools/LiGraph/ LiGraph

Estructura y conformación

Monosacáridos Estructura 3D

http://www.glycosciences.de/modeling/sweet2/doc/index.php

Sweet-II

http://www.cermav.cnrs.fr/cgi-bin/monos/monos.cgi Monosaccharide

Mapas conforma-cionales

http://www.cermav.cnrs.fr/cgi-bin/di/di.cgi Disaccharide

http://www.glycosciences.de/modeling/glycomapsdb/ GlycoMaps db

Fuente: [8, 9, 10].

Biosíntesis de oligosacáridos en las glicoproteínas

Los oligosacáridos son sintetizados por la acción finamente concertada de glicosiltransferasas y, por lo tanto, se obtienen de ellos estructuras altamente heterogéneas y complejas. Existen dos tipos principales de glicosilación, la N y O, en las que se observan diferencias sustanciales en el tipo de unión, el mecanismo de biosíntesis y los glicanos resultantes.

En las glicoproteínas, se presentan la N-glicosilación por el enlace glicosí-dico entre el azúcar y el aminoácido a través de un nitrógeno y, en oposición al oxígeno, en la O-glicosilación y carbono en C-manosilación. La unión del oligosacárido, se hace mediante un residuo de N-acetilglucosamina (Glc-NAc) al grupo amido de la asparagina (Asn). Todas las estructuras tienen un core común, que es la parte del carbohidrato más cercana a la proteína (color gris) (figura 1), independientemente de cuál sea la elongación que

Page 206: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

206 • Introducción al análisis estructural de proteínas y glicoproteínas

ocurra posteriormente. La N-glicosilación comienza con la transferencia del oligosacárido Glc3Man9GlcNAc2 unido al dolicolpirofosfato al residuo de Asn en la cadena polipeptídica, que se está sintetizando en el retículo endoplasmático rugoso.

NeuNAca2-6Gal 1-4GlcNAc 1

NeuNAca2-6Gal 1-4GlcNAc 1

NeuNAca2-6Gal 1-4GlcNAc 1-4

NeuNAca2-6Gal 1-4GlcNAc 12

6

4

NeuNAca2-6Gal 1-4GlcNAc 12

Man 1-4GlcNAc1 -4GlcNAc-Asn

Man 1a

Man 1a

6

3

4 6

Tipo complejo

Altos en manosa

Híbrido

aMan 1-2Man 1-2a

aMan 1-2Man 1a

aMan 1-2Man 1a

a

a

Man 1-4GLcNAc 1-GlcNAc-Asn

63

3

6

Man 1a63

Man 1a

Man 1a

Man 1a

24

NeuNAc 2-3Gal 1-4GlcNAc 1a

GlcNAc 1

6

3 4 6Man 1-4GlcNAc 1-4GlcNAc-Asn

Est

ruct

ura

s N

-glic

osi

dic

asco

re c

om

ún

aFuc 1GlcNAc 1

GlcNAc 1 Fuc 1a

Man 1

-Man 1

Figura 1. Glicosilación en glicoproteínas de tipo N en mamíferos

La síntesis de los N-glicanos se realiza por la acción de exomanosida-sas sobre el glicano Glc3Man9GlcNAc2, en la fase temprana del trans-porte a través de Golgi, para generar un core común de Manα3(Manα6) Manβ4GlcNAβ4GlcNAc-N-prot y, luego, a partir de este pentasacárido, se sintetizan, por la acción concertada de diversas glicosiltransferasas, los N-glicanos de tipo ricos en Manosa (High-Mannose), híbridos y complejos. En etapas tempranas de la N-glicosilación, el complejo multiproteico de la oligosacariltransferasa (Ot) está presente en el retículo endoplasmático rugoso, y juega un papel crítico en este proceso [11].

Los glicanos resultantes tienen una variabilidad estructural alta y la información detallada sobre la caracterización química de más de 600 estructuras están en bases de datos de dominio público, GlycomicDB y Glycosuite (tabla 1). Esto implica un alto número de genes codificantes para las enzimas involucradas en la biosíntesis de los N-glicanos y ello, a su vez, es una expresión del potencial para generar diversidad estructural.

Los estudios de las diferentes estructuras de oligosacáridos en las glico-proteínas, han mostrado que la N-glicosilación es muy similar en plantas e invertebrados, pero difiere de la que ocurre en vertebrados en los que están ausentes estructuras que contengan Fuc α1-3 y Xyl β1-2 unidas al core de Man3GlcNAc2 (figura 2). La disponibilidad de los genomas de Arabidopsis thaliana, Caenorhabditis elegans y Drosophila melanogaster ha permitido establecer

Page 207: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Glicoproteínas y carbohidratos • 207

la presencia de un elevado número de gicosiltransferasas, alrededor de 300, pero aún falta estudiar la existencia de los oligosacáridos producto de su acción. En plantas un caso de conservación bien documentado es el de las lectinas de semilla de Salvia sclarea, Vatairea macrocarpa, Robinia pseudoaca-cia y Erythrina variegata en las que la estructura del glicano es la misma y corresponde al hexasacárido Manα1-6(Manα1-3)(Xyl β1-2)Manβ1-4Glc-NAcβ1-4(Fuc α 1-3)GlcNAc [12].

Mana163

1

4

4

13

a1

Man

Fuc

GlcNAc

GlcNAc

1aFuc

6

1aFuc

GalNAc 1

4GlcNAc 1

Mana123

Mana163

1 43

Man GlcNAc6

4GlcNAc 1

1aFuc

1aFucMana1

Tipo complejo

Mana163 2

1 4 413

11a1

Man

Man

GlcNAc GlcNAc

Xyl aFuc

Tipo truncado

Tipo complejo

1aFuc

GlcNAc

1 1

1 1

111

111

3

333

6

Gal 2Mana4

Man

4

4

GlcNAc 1

GlcNAc42

Gal GlcNAc Mana2

aFucXyl aFuc

A B

Figura 2. Glicosilación en glicoproteínas de tipo N en plantas e invertebrados

Fuente: [13, p. 570].

La comparación de las secuencias de aminoácidos en las que ocurre la N-glicosilación ha revelado que el sequon nxt(S), en el que X es cualquier aminoácido, salvo prolina, constituye un sitio potencial de glicosilación que solo puede estar ocupado en aquellas proteínas secretadas que poseen un péptido señal; estos sitios se pueden predecir con herramientas bioinfor-máticas como NetNGlyc y SignalP (tabla 1). La diversidad estructural de las proteínas N-glicosiladas se incrementa notablemente por la existencia de glicoformas resultantes de variaciones en el oligosacárido unido a la cadena polipeptídica, en conjunto con la frecuencia de los eventos postra-duccionales que involucran glicosilación.

La O-glicosilación es el otro tipo de glicosilación presente en las gli-coproteínas, es la formación de un enlace con un átomo de oxígeno del aminoácido y el carbono del azúcar. La más común, se presenta por la for-mación de un enlace entre el residuo de N-acetil galactosamina (GalNAc) con el aminoácido a serina (Ser) o treonina (Thr), llamada “tipo mucina”. Está en glicoproteínas de alto peso molecular que recubren la superficie de células epiteliales. La unión es realizada por una familia de enzimas, llama-da N-acetilgalactosiltransferasas (udp-N-acetylgalactosamine: polypeptide N-acetylgalactosaminyltransferases (ppGaNTases, EC 2.4.1.41), residente en Golgi que utiliza GalNAc-udp como substrato [14]. En proteínas O-gli-cosiladas, la elongación del oligosacárido se hace a partir de 8 tipos de core (figura 3) que se forman del antígeno Tn (GalNAc-Ser/Thr) mediante la acción secuencial de glicosiltransferasas específicas. Los cambios en la síntesis

Page 208: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

208 • Introducción al análisis estructural de proteínas y glicoproteínas

normal de oligosacáridos conducen a la aparición de diferentes patologías, como desórdenes tumorales [15-20].

Thr/ser1

Tn antígeno

2

3

11 Core 2

Antígeno T core 19

6

8

10

Core 8

Sialil T antígeno

Core 5

Core 7

GalNAca1-6GalNAc-Thr/Ser

GalNAca1-3GalNAc-Thr/Ser

Gala1-3GalNAc-Thr/Ser

Sialil Tn antígeno

NeuAca2-6GalNAc-Thr/Ser

GalNAc-Thr/SerGalNAc-Thr/Ser

Gal 1-3

Gal 1-3

GlcNAc 1-6GalNAc-Thr/Ser

Gal 1-3GalNAc-Thr/Ser

NeuAca2-3

GlcNAc 1-3

GlcNAc 1-6GalNAc-Thr/Ser

5

Core 3

Core 6

7

4

GalNAc-Thr/SerGlcNAc 1-3

GalNAc-Thr/SerGlcNAc 1-6

Tk antígeno Core 4

Figura 3. Glicosilación de tipo O en mucinas epiteliales. El primer paso en el proceso de O-glicosilación es la adición de GalNaC A Ser/Thr por ppGalNAc-T (1). Ocho O- core glicanos pueden ser formados por glicosiltransferasas: core 1 β3Gal-T (2), core 2 β6GlcNAc-T (3), core 3 β3GlcNAc-T (4), core 4 β6GlcNAc-T (5), core 5 α3GalNAc-T (6), core 6 β6GlcNAc-T (7), core 7 α6GalNAc-T (8) y core 8 α3Gal-T (9). El paso de sialilación para formar sialil Tn (10) y sialil T (11) resulta en el bloqueo del alargamiento del oligosacárido. Las estructuras asociadas con tumores están color gris

Fuente: [21, p. 29].

Durante la síntesis, los azúcares son transferidos individualmente a la cadena polipeptídica una vez ha sido sintetizada y ha adquirido su plega-miento. En contraste con los N-glicanos, la glicosilación de tipo mucina no presenta una sola secuencia consenso; sin embargo, se han planteado algunas reglas para su predicción, estudiando la especificidad de las pp-GaNTases y un análisis estadístico de un gran número de sitios conocidos en glicoproteínas, lo cual ha generado herramientas como NetOGlyc (ta-bla 1). Se ha encontrado que solamente las serinas y treoninas expuestas pueden ser glicosiladas; por lo tanto, la O-glicosilación en mucinas ocurre

Page 209: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Glicoproteínas y carbohidratos • 209

principalmente sobre giros β de la estructura secundaria y otras regiones de conformación extendida con altas cantidades de prolina [22].

Las ppGaNTases presentan una secuencia señal en la que su extremo N-terminal está dirigido al citosol, un dominio catalítico (GT1), uno de reconocimiento GalNAc/Gal y un dominio C-terminal tipo lectina; sin embargo, hasta el momento no se ha esclarecido el mecanismo de acción de estas enzimas dado su compleja regulación espacial y temporal, evidenciada por los patrones de expresión de estas enzimas en varios tejidos. También se han realizado estudios genéticos encaminados a estudiar su funcionalidad. Por ejemplo, en el ratón, la deleción de genes que codifican para algunas de estas enzimas muestra la producción de un fenotipo aparente, sugiriendo la existencia de una redundancia funcional por la presencia de isoformas [14].

La O-glicosilación, en general, está implicada en funciones intramo-leculares e intermoleculares, mantenimiento de la estructura secundaria y terciaria de las glicoproteínas; estabilización de la estructura cuaternaria de complejos proteicos; reconocimiento, modulación de la actividad de enzimas y moléculas de señalización y en expresión y procesamiento de proteínas. En la figura 4, se observan otros tipos de O-glicosilación que se presentan en proteínas en mamíferos.

Ser/Thr Ser/Thr Ser/Thr

a3

3

a3

4

4

4

63

a33

a3

a3

4

3

3

a3 a3

a34 4

a332

Ser/Thr Ser/Thr Ser/Thr

O-manosa O-fucosa O-glucosa

ácido sialico

Galactosa

N-acetylglucosamina

N-acetylgalactosamina

Fucosa

Manosa

Glucosa

Xilosa

Figura 4. O-Glicosilación en glicoproteínas de mamíferos

Fuente: [23, p. 875].

Una de las funciones más importantes de glicoproteínas O-glicosiladas es mediar el reconocimiento entre células. Un ejemplo es el proceso de infla-mación mediado por las selectinas que se expresan en las células endoteliales, las cuales reconocen el epítope Sialil Lewis X (Neu5Acα2-3Galβ1-4[Fu-cα1-3]GlcNAcβ) que se expresa en la superficie de neutrófilos durante los

Page 210: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

210 • Introducción al análisis estructural de proteínas y glicoproteínas

procesos de inflamación aguda [24]. En las mucinas, el alto porcentaje de glicosilación imparte la lubricación en una variedad de tejidos por su ca-pacidad de hidratación y funciones de protección, bloqueando el acceso de proteasas en el tracto gastrointestinal.

Las mucinas transmembranales son heterogéneas y con una alta masa molecular , ricas en Pro, Ser, Thr y un alto porcentaje de carbohidratos, mayor al 50 %. Sus subunidades están unidas por puentes disulfuro a un core central de proteína. En condiciones reductoras se observan subunidades de alto peso molecular y un core de 70 kDa. Las proteínas del tipo mucin-like presentan las mismas características, pero son de menor peso molecular y se pueden aislar del suero, membranas y citoplasma. La caracterización bioquímica de estas proteínas es muy importante dado su papel no solo mecánico o de barrera física sino como agentes de señalización celular o como marcadores en células tumorales. Las mucinas altamente glicosila-das presentan en su estructura de 10 a 100 secuencias en tándem, en las cuales hay 5 sitios potenciales de glicosilación. En células normales solo se realiza la mitad de la glicosilación ya que aparentemente los oligosacáridos completos ocasionan impedimentos estéricos que no permiten que todos los sitos de glicosilación sean accesibles a las enzimas. En células anormales se glicosilan todos estos sitios y se sintetizan oligosacáridos más cortos y proteínas con altos porcentajes de antígeno Tn (core) [25]. En contraposi-ción a lo que ocurre con la N-glicosilación los estudios de O-glicosilación en plantas son pocos. La b1-3 glicosiltransferasa cataliza la formación de cadenas de arabinogalactanos que no tienen un papel en el desarrollo en la planta, pero probablemente son homólogas a los proteoglicanos de células animales [4]. Otro tipo de glicosilación en plantas es la unión de Arabinosa a Ser o Thr. El estudio en invertebrados ha aportado información acerca de la O-glicosilación en mamíferos. Por ejemplo, en Drosophila melanogaster las mucinas de tipo-O son esenciales para su desarrollo y las mutaciones en el gen que codifica para GalNAcT-11 son letales (figura 5).

Figura 5. O-Glicosilación en en plantas e invertebrados

Fuente: [13, p. 572].

Page 211: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Glicoproteínas y carbohidratos • 211

Aunque hay información puntual sobre la biosíntesis de algunos tipos de enlaces, los mecanismos de acción catalítica de las glicosiltransferasas no son del todo claros. Estas enzimas llevan a cabo su acción reteniendo o invirtiendo la configuración anomérica del sustrato y, aunque de estas últimas se conocen numerosos ejemplos y hay una propuesta para las gli-cosiltransferasas que retienen la estereoquímica con respecto al sustrato donor del fosfoazúcar, existe controversia en cuanto al mecanismo catalítico. Una excelente revisión sobre este tema se encuentra en Lairson et al. [26].

Usualmente, el glicano no causa un cambio drástico de actividad en las proteínas, más bien suministra un fino mecanismo de regulación. En el caso del factor de coagulación IXa, una mutación (R94S) es asociada con hemofilia B, esta mutación induce una O-glicosilación en Ser y causa una fuerte reducción en la actividad del factor IXa. El precursor de igfii es solamente procesado en su forma madura si la Thr 75 está glicosilada.

El splicing diferencial de dominios ricos en Ser/Thr puede regular varias clases de moléculas como receptores de membrana, citoquinas y enzimas. Estos dominios pueden ser definidos como un módulo separado en la pro-teína, el cual constituye un nivel de regulación adicional, que ha mostrado la generación de diferencias en la función de glicoproteínas. CD44 es una proteína de membrana que une ácido hialurónico (HA) [22] y regula la circulación de leucocitos; posee N-glicanos los cuales pueden disminuir la capacidad de unión al HA.

Otra forma de O-glicosilación es la unión de la serina o treonina a la N-acetilglucosamina (Glcnac). Al contrario de la unión tipo mucina, es encontrada en glicoproteínas nucleares y citoplasmáticas y es reversible dada la existencia de una N-acetil-β-glucosaminidasa que remueve el mo-nosacárido de la proteína. No hay una secuencia consenso para este tipo de glicosilación, pero se ha observado que tiene secuencias que son reconocidas por kinasas. Es probable que este tipo de glicosilación tenga propiedades reguladoras en la vía de fosforilación de proteínas intracelulares. En el fac-tor de crecimiento epidérmico (efg) un residuo de glucosa (Glc) es unido a Ser en una secuencia consenso (Cys-X-Ser-X-Pro-Cys-) y es extendido por una o más α 1.3 xilosiltransferasas; también se observan residuos de fucosa unidos a serina o treonina. Una forma inusual de glicosilación en mamíferos es la unión de Ser o Thr a manosa, la cual se ha identificado en un distroglicano del nervio periférico de bovino.

Los estudios de biosíntesis, estructura y función de los glicanos han per-mitido entender cómo estas moléculas modulan los procesos que llevan al desarrollo de enfermedades. El descubrimiento y la clonación de nuevas enzimas de biosíntesis, y la deleción de los genes que las codifican, han permitido hacer correlaciones con patologías, como letalidad embriónica, desórdenes congénitos y un rango de anormalidades que ilustran su papel en varios procesos.

Page 212: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

212 • Introducción al análisis estructural de proteínas y glicoproteínas

Análisis estructural y funcional de glicanos

Las técnicas analíticas que se han desarrollado para estudiar estructuras de proteínas y ácidos nucleicos sirven para realizar el estudio estructural de carbohidratos. El uso de microarreglos ha permitido determinar rápida y fácilmente cómo una diversidad de proteínas de diferente origen puede interactuar con carbohidratos que presentan actividad biológica.

Los glicoarreglos han sido elaborados con carbohidratos de origen na-tural o sintético, acoplándolos a diferentes clases de superficies, como ni-tr0ocelulosa, láminas de vidrio y microesferas. Cada uno de ellos varía en la cantidad de material necesario para analizar las interacciones [27, 28, 29, 30, 31]. Una de las aplicaciones de los glicoarreglos es analizar, detallada-mente y con mayor precisión, las interacciones proteína:carbohidrato y, por lo tanto, tienen potenciales aplicaciones médicas. Otras técnicas estándar en este campo permitirían, por ejemplo, descubrir inhibidores de adhesión celular y, por lo tanto, se avanzaría en el desarrollo de nuevos fármacos (far-macoglicómica) que impidan procesos infecciosos o de otra índole o en la producción de vacunas gracias al descubrimiento de nuevos antígenos [32].

Se han empleado técnicas espectroscópicas para el análisis de estas mo-léculas complejas tales como espectrometría de masas (Maldi-tOf, esi-ms y msn), resonancia magnética nuclear (rmn), infrarrojo (ir) y electroforesis capilar (ec), entre otras [33, 34, 35, 36, 37]. Estas técnicas permiten hacer análisis si se combinan con bioinformática y se pueden diferenciar entre estructuras de oligosacáridos muy cercanas; sin embargo, algunas veces es necesario usar exoglicosidasas ya que las técnicas tienen limitaciones. Por ejemplo, la espectrometría de masas no diferencia entre hexosas o diferentes N-acetilhexosaminas. Otras técnicas incluyen el desarrollo de separaciones basadas en chips y análisis de derivados fluorescentes de oligosacáridos por electroforesis en geles de poliacrilamida. La especificidad, intensidad, cinética y algunos parámetros fisicoquímicos de interacciones carbohidrato:proteína son fácilmente accesibles por resonancia de superficie de plasmón (spr) y microcalorimetría [38, 39].

Una estrategia rápida, fácil y reproducible que permite predecir la es-tructura de un oligosacárido es el estudio empleando lectinas vegetales. Las lectinas son proteínas que reconocen carbohidratos con gran afinidad y es-pecificidad y, por lo tanto, es posible purificar glicoproteínas y determinar la localización de los glicoconjugados en la célula. La cromatografía frontal de afinidad (fac) aprovecha la especificidad de las lectinas por los glicanos [40, 41, 42, 43] y, por medio del acoplamiento de estas proteínas al soporte, se pueden evaluar las interacciones de baja afinidad proteína:carbohidrato y así discriminar de manera muy fina entre estructuras glicosídicas, con esta técnica se pueden determinar las constantes de afinidad (Ka) de dichas

Page 213: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Glicoproteínas y carbohidratos • 213

interacciones. La información acerca de las lectinas que se han estudiado y sus constantes de afinidad están disponibles en la base de datos Lectin Fron-tier Database (LfDB) [44, 45] (http://jcggdb.jp/rcmg/glycodb/LectinSearch).

Uno de los grandes desafíos en el campo de la glicómica, es el desarrollo de software que permita codificar y transferir, con protocolos compatibles, la información obtenida sobre las estructuras de los glicanos con las diversas técnicas analíticas. La bioinformática ha jugado un papel importante para el avance de la genómica y la proteómica. La cantidad de información ge-nerada en estos dos campos es muy alta en comparación con la glicómica pero, dado el desarrollo de esta última, la necesidad de organizar este co-nocimiento ha crecido constantemente en los últimos años y ha aumentado el número de bases de datos [46].

Para el desarrollo de programas bioinformáticos la nomenclatura ha sido la primera dificultad; hasta el momento no hay una descripción universal-mente aceptada que permita crear bases de datos. El Consorcio funcional de Glicómica ha desarrollado nuevas nomenclaturas que presentan una descripción de estructuras complejas compatibles con Liner Code® y Li-nucs, respectivamente, pero aún no han sido ampliamente aceptadas. Para la representación estructural se ha propuesto el código Glyde que captura los detalles estructurales de los oligosacáridos y es compatible con un rango de aplicaciones que emplean diversas bases de datos como Carbank, Keeg, Sweet db y Sweet ii (esta última es una base de datos disponible que integra Carbank y Sugarbase). Existen bases de datos especializadas en mucinas de anfibios, en espectros de 1H rmn para fragmentos de xiloglucanos, en proteínas o-glicosiladas de E. coli y glicoproteínas y en metabolismo de glicanos (Keeg pathway). En Cermav [47] se han desarrollado métodos computarizados para modelado molecular, con los cuales por ejemplo han encontrado 90 conformaciones diferentes para 20 monosacáridos.

Análisis de la glicosilación en glicoproteínas

Para entender las bases estructurales de la función de una glicoproteína, es importante caracterizar estructuralmente sus oligosacáridos. Se puede estudiar la glicosilación durante la producción de glicoproteínas recombi-nantes, glicoproteínas en células, tejidos normales y tumorales y de esta forma encontrar las alteraciones que acompañan los diferentes estados pa-tológicos. Varios estudios se han enfocado, en el desarrollo de marcadores que sean de utilidad en el diagnóstico o pronóstico de enfermedades, en las que se detecten alteraciones en glicosilación [15, 48, 49, 50, 51]. En la

Page 214: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

214 • Introducción al análisis estructural de proteínas y glicoproteínas

figura 6 se propone una estrategia para realizar estudios de la glicosilación en una glicoproteína. Para seguirla, debemos tener en cuenta lo siguiente:

1. ¿La proteína es glicosilada?

Es la primera pregunta que se debe resolver para iniciar el estudio de aná-lisis de los oligosacáridos de una glicoproteína. Como se había mencionado, durante el estudio de estructura primaria de las proteínas, se debe hacer un análisis cualitativo y cuantitativo del porcentaje (%) de glicosilación em-pleando métodos químicos y enzimáticos.

2. Caracterización de la glicosilación en la proteína intacta

Una aproximación inicial hacia la estructura que se va a analizar permite proponer una estrategia de aislamiento de glicoproteínas. La interacción con lectinas es un procedimiento adecuado para evaluar como es el oli-gosacárido que se va a analizar. Estas proteínas reconocen carbohidratos con gran afinidad y especificidad. Las lectinas de origen vegetal han sido bioquímicamente caracterizadas y su interacción con carbohidratos se ha hecho empleando Cromatografía frontal de afinidad (Ka), glicoarreglos o ensayos de ellsa (Ella). Las constantes de afinidad de las lectinas están dis-ponibles en Lectin Frontier Database [42, 43, 44].

Un ejemplo del uso de los microarreglos de lectinas para evaluar el perfil de las glicoproteínas presentes en extractos citoplasmáticos obtenidos de la línea celular Hela de cáncer de cérvix (figura 7), muestra la presencia de glicoproteínas que contienen ácido siálico, fucosa y N-acetilglucosamina, una baja proporción de glicoproteínas O-glicosiladas y N-glicosiladas.

La técnica de los microarreglos basados en lectinas es muy versátil y ade-cuada para la investigación en el campo de los glicanos asociados a células tumorales, que pueden ser de importancia para el funcionamiento biológico de las células y, por supuesto, en el desarrollo de nuevas moléculas para estudiar las patologías con las que están relacionadas [53, 54].

Las diferencias en glicosilación de células tumorales son importantes por razones terapéuticas y para el diagnóstico o seguimiento de estas en-fermedades. Varias funciones han sido encontradas para estos glicanos, dependiendo de la proteína a la cual ellos están unidos, su composición de monosacáridos y su estructura; por lo tanto, los ensayos realizados con lec-tinas de diferentes especificidades nos dan una idea acerca de las estructuras glicosídicas presentes en las células y de su abundancia relativa.

Page 215: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Glicoproteínas y carbohidratos • 215

Figura 6. Estrategia para realizar estudios de glicosilación en glicoproteínas

Figura 7. Determinación del perfil de glicoproteínas citoplasmáticas en líneas celulares con microarreglos de lectinas

Page 216: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

216 • Introducción al análisis estructural de proteínas y glicoproteínas

Teniendo en cuenta que algunas de estas lectinas interactúan con gli-coproteínas, por ejemplo, mucinas, o con formas modificadas de ellas, el uso de microarreglos basados en lectinas permite hacer una aproximación inicial de los oligosacáridos que están en las glicoproteínas [52, 54]. Los microarreglos contienen mínimo tres lectinas acopladas con una afinidad similar, ya que, durante el acoplamiento al vidrio, no todas presentan la misma efectividad de unión y, por lo tanto, la sensibilidad disminuye de-bido a que el número de moléculas no es igual. Gracias a esto, no se ob-serva la misma intensidad en la señal empleando lectinas que tienen una especificidad similar. Las lectinas empleadas para estos análisis han sido caracterizadas molecularmente y sus constantes de afinidad han sido esta-blecidas previamente.

2.1. Análisis de los sitios potenciales de glicosilación

Para realizar un análisis de los sitios de glicosilación se puede hacer una hidrólisis enzimática o química de la glicoproteína con pronasa, con el fin de obtener los glicopéptidos y separarlos por Hplc-Fase reversa. La masa molecular (ms) de los glicopéptidos aislados se determina antes y después del tratamiento con endoglicopeptidasas o con trifluorometilensulfónico (tfms), por espectrometría de masas [55]. Para las glicoproteínas, con glicosilación de tipo N, se hace un tratamiento con la enzima Endo-H (figura 8) y luego una hidrólisis con pronasa. Los glicopéptidos tendrán 203 Da más que el péptido deglicosilado, ya que queda el carbohidrato N-acetilglucosamina unido a la asparagina; por otra parte, los glicopéptidos O-glicosilados pue-den ser tratados también con O-glicosidasas y se pueden determinar las diferencias en masa molecular por espectrometría de masas con ionización electrospray o Maldi.

1. PNGase F ( de Flavobacterium meningosepticum): hidroliza los enlaces N- glicosídicos

R-Asp GlcNAc........

de manosa y glicanos de tipo N-híbridos.

3. Endo GalNAc-Ser/Thra ( de Streptococcus pneumoniae )

2. Endoglicosidasa H (endo H) ( de Streptomices plicatus): hidroliza los enlaces N- glicosídicos

R-Asp-GlcNAc

-1-3GalNAc ser/Thr

Figura 8. Deglicosilación enzimática para glicoproteínas

Page 217: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Glicoproteínas y carbohidratos • 217

Posteriormente, se determina la estructura primaria del péptido y la secuencia consenso por cualquiera de los métodos mencionados previa-mente. Al final del proceso, se hace una comparación entre los sitios de glicosilación del péptido y los de la proteína. Este estudio se puede realizar si, previamente, se ha caracterizado la glicoproteína y se ha establecido su estructura primaria.

Los sitios de glicosilación pueden estar ocupados, parcialmente ocupados y sin ocupar. El grado de ocupación se determina por:

• las secuencias consenso encontradas en la proteína.• la identificación de los puntos de unión del oligosacárido.

Se debe tener en cuenta, que durante la degradación de Edman, para determinar estructura primaria de péptidos, los derivados son recuperados en una cantidad muy baja y son reportados como “blancos”.

Si no hay secuencia consenso se debe comparar con otras glicoproteí-nas estudiadas, por ejemplo, el porcentaje de glicosilación en el caso de las glicoproteínas que tienen glicosilación, O-Glcnac, O-Fuc es muy bajo.

La cromatografía líquida acoplada a masas (cl-ms/ms) es una técnica que puede dar información de los sitios de glicosilación en los glicopépti-dos, sin embargo, no es suficiente para entender la glicosilación. Factores como ionización baja del glicopéptido con respecto al péptido, la presen-cia de glicoformas, la falta de bases de datos con estructuras, como las que se encuentran en plantas y microrganismos, y la inhabilidad para asignar los fragmentos necesarios para la elucidación completa, no dejan que sea una técnica ideal. Aunque, actualmente, hay herramientas bioinformáticas disponibles para el análisis de glicopéptidos, también existen estructuras heterogéneas que aún faltan por describir.

La deglicosilación enzimática, con pngase [56], puede ser realizada en H2

18O, para tener fragmentos marcados que permitan determinar los sitios de glicosilación (figura 9A). Por otra parte, se pueden analizar los sitios de O-glicosilación, si el porcentaje es bajo, sin liberar los oligosacáridos para su análisis por masas. Cuando una glicoproteína es altamente glicosilada. Por ejemplo, las mucinas, su remoción es necesaria para hacer el mapeo de los sitos de glicosilación. Un método químico de hidrólisis, para O-gli-canos es la β eliminación de Michael, la cual se realiza en medio básico y en condiciones reductoras, usando dtt. Este enfoque lleva a la obtención de O-glicanos con marcaje en el sitio de glicosilación. De esta forma, los péptidos o glicopéptidos son separados y analizados por cl/ms (Maldi-tOf-ms o esi-ms). También se puede hacer el método de Bemad empleando cromatografía de afinidad previa marcación de la serina o treonina con ditiotreitol (figura 9B) [57].

Page 218: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

218 • Introducción al análisis estructural de proteínas y glicoproteínas

OH

ROHO

O HN

NHA C

O

péptido C C

O H

HN

PNGase F(H O)18

2

O

péptido C C

O H

HN

H O18

OH

ROHO

O

HN

NHA C

OH

ROHO

O

NHAC

HO2

péptido C C

O H

HN

péptido C C

O H

HN

HO

O

NHA C

O

ORHO

OH

OH

NHAC

péptido C C

O H

HN

HO

O

NHAC

O

OR2

R O1

HO

NaOHNaBH4

R O1

OR2

2

R O1

(BH )4

DTT-SH

DTT

péptido C C

O H

HN

DTT-S

A

B

Figura 9. Hidrólisis enzimática de glicanos en glicoproteínas. A: N-glicanos con PNGase F y marcación con 18O. B: Bemad, liberación de O-glicanos por β eliminación y reducción marcaje Bemad

Fuente: [58, p. 4488].

3. Caracterización de los oligosacáridos

Para realizar la caracterización de los oligosacáridos se debe comenzar por evaluar qué monosacáridos están presentes y, si es posible, determinar su análisis. Se puede realizar el siguiente procedimiento:

• Hidrólisis química total para romper todos los enlaces glicosídi-cos y obtener la mezcla de monosacáridos [59]. La velocidad de clevaje del enlace depende de cada azúcar y del enlace glicosídico, así que se deben hacer dos hidrólisis: • Ácido trifluoroacético (tfa): 2M, 5 h a 100 °C para obtener

los monosacáridos neutros• HCl: 4M, 3 H a 100 °C para obtener los azúcares aminados,

ya que los enlaces son más resistentes y posteriormente, una reacción de reacetilación para detectar los azúcares aminados.

Page 219: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Glicoproteínas y carbohidratos • 219

Los monosacáridos se pueden identificar por varios métodos, algunos de ellos se mencionan a continuación:

Por electroforesis en geles de poliacrilamida (PAGE), con geles de un alto porcentaje de entrecruzamiento para moléculas pequeñas. Para la de-tección se incorpora la marcación de los monosacáridos con un fluorocromo, el cual le da carga a las moléculas para que migren en el campo eléctrico. Se debe realizar una comparación con patrones de azúcares y se pueden cuantificar la proporción de cada uno por densitometría (figura 10). El aná-lisis se puede complementar realizando la cuantificación de carbohidratos neutros, reductores, cetosas, hexosaminas, en la tabla 2 se presentan los métodos colorimétricos.

La determinación cuantitativa también se hace por Hplc, el cual incluye cromatografía de intercambio aniónico (Hpac-pad) y catiónico sulfonado (Ag+, Pb+2). La detección se puede realizar con detectores de índice de refracción, pulso amperométrico (pad) o en el ultravioleta lejano entre 180-200 nm, este último presenta mucha interferencia. También se puede hacer con fluorocromos, los cuales aumentan la sensibilidad de detección.

Carril 1. Patrones monosacáridos

Carril 2. Hidrólisis de Fetuina-se preserva grupo aminoCarril 3. Glc y GlcNAcCarril 4. Fetuina-hidrólisis neutraCarril 5. Glc y GlcNAcCarril 6. N acetillactosaminaCarril 7. Patrones monosacáridos

1 2 3 54 6 7

GalNAC

GalFucGlcManGlcNAc

o

OH

OH

CH-O

AMAC

NH

ONH2

OH

CH N

AMAC

CH -N2

AMAC

CNNaBH3 OH

Figura 10. Análisis cualitativo y cuantitativo de carbohidratos por electroforesis en geles de poliacrilamida y marcación con fluorescencia

Fuente: [60, p. 151].

Page 220: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

220 • Introducción al análisis estructural de proteínas y glicoproteínas

Tabla 2. Métodos colorimétricos para cuantificación de carbohidratos

Método Sensibilidad Interferencias

Fenol sulfúrico–Azúcares neutros 30 µm – 2mM Metales, agentes reductores, azida de sodio

Ac. Dinitrosalicilico-Azúcares reductores 0.3-30 mM Oxígeno, metales y agentes reductores

Nelson-Somogy-Azúcares reductores 60-600 µm Oxígeno, metales y agentes reductores

Fenol Bórico Sulfúrico-Cetosas 30-500 µm Las cetosas absorben diferente

Morgan-Elson-Hexosaminas 1-110 µm …………………………………..

Carbazol-Ácidos urónicos 4-400 µm Azúcares neutros

Warren–Ácido siálico 3-300 µm Derivados metoxi

Fuente: [61, p. 1-7].

La determinación por medio de espectroscopia infrarroja (ftir) nos permite confirmar la identidad de la molécula por comparación con el espectro publicado; sin embargo, se necesitan cantidades altas de carbohi-drato, del orden de 1 mg. ftir nos permite hacer un análisis cuantitativo de soluciones simples de azúcar.

La cromatografía de gases es una técnica con una gran sensibilidad y resolución. Con ella, se pueden separar aproximadamente 30 componentes. Los derivados volátiles de los monosacáridos se sintetizan por acetilación, metilación o silanización y se deben tener patrones para comparación. La ionización y fragmentación se puede realizar por impacto electrónico (ms-ei), en conjunto con cromatografía de gases, para el análisis de mezclas complejas.

Se pueden analizar los fragmentos primarios derivados del ion molecu-lar y los fragmentos secundarios obtenidos por eliminación de moléculas neutrales (figura 11). La identificación se hace de acuerdo con el patrón de fragmentación y por comparación con espectros patrón.

Page 221: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Glicoproteínas y carbohidratos • 221

Figura 11. Patrones de fragmentación de monosacáridos por ionización de impacto electrónico (ei)

Fuente: [61, p. 38].

Análisis de la estructura del oligosacárido La hidrólisis de la glicoproteína para liberar los oligosacáridos no debe al-terar su estructura y, además, todos los oligosacáridos deben ser liberados en la misma proporción molar en la que están presentes en la glicoproteína. Para obtener los oligosacáridos se pueden realizar métodos químicos y en-zimáticos y se deben recuperar cantidades que permitan hacer los análisis de estructura.

Métodos químicos

Hidrazinólisis: es un método no selectivo que, bajo ciertas condiciones, libera los oligosacáridos que están unidos N y O glicosídicamente con el extremo reductor libre (figura 12) [62]. Se puede realizar manualmente y en forma automatizada; específicamente, para los O-glicanos se emplea hidrazina anhidra a baja temperatura.

Como se mencionó previamente, con trifluorometilensulfónico (tfms) se liberan N y O-glicanos por β-eliminación; si la reacción se hace en medio alcalino y en presencia de un reductor (NaLiH4) se recuperan los O-glicanos como alditoles [55].

Page 222: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

222 • Introducción al análisis estructural de proteínas y glicoproteínas

Figura 12. Reacción de hidrazonólisis para liberar oligosacáridos

Fuente: [63, p. 43].

Métodos enzimáticos

Se debe hacer una desnaturalización previa de la glicoproteína para asegu-rar la accesibilidad de las enzimas y evitar la modificación del oligosacári-do. Como se mencionó previamente, la degradación enzimática se puede realizar con pngase F y se deben establecer las condiciones de hidrólisis. También con Endoglicosidasa H (endo H) (Streptomioces plicatus), la cual rompe solo los oligosacáridos ricos en manosa y los N-híbridos. Luego de la hidrólisis, deja el residuo de GlcNAc unido a la Asp. Finalmente, con Endoα-GalNAc-Ser/Thr (Streptococcus pneumoniae), se liberan los O-gli-canos; sin embargo, hay 8 tipos diferentes de O-glicosilación y se deben buscar otras alternativas enzimáticas diferentes para liberar O-glicanos [55].

Una vez que se han liberado los oligosacáridos se puede hacer una eva-luación preliminar de la mezcla por electroforesis en geles de poliacrilamida (Page) y una cuantificación de cada uno por densitometría [64]. Para ello, se debe hacer un marcaje de estos que involucra el extremo reductor (figu-ra 13). Este marcaje es independiente de la secuencia y es compatible con electroforesis capilar, Hplc y espectrometría de masas.

Se puede llevar a cabo una purificación inicial de los glicanos para eliminar la complejidad de la mezcla de estudio con técnicas cromatográficas como:

La cromatografía de intercambio aniónico, que se realiza empleando eluen-tes que permitan el fraccionamiento de glicanos neutros y ácidos.

La filtración en gel para realizar separación por masa molecular en la que se pueden emplear soportes como sephadex G-10, G-25 o Biogel P2, P4, P6, para moléculas de baja masa molecular.

Page 223: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Glicoproteínas y carbohidratos • 223

Figura 13. Reacción de marcación de los oligosacáridos con 2-AB (2-aminobenzamida)

Fuente: [65, p. 232].

La cromatografía de afinidad, la cual permite separar moléculas por interac-ción con un ligando inmovilizado. Por ejemplo, lectinas, en las que se puede hacer la purificación de acuerdo con la estereoquímica y esteroespecificidad.

En una segunda etapa de purificación se pueden realizar técnicas como:

La electroforesis preparativa, en la cual se pueden separar mezclas con diferencias de masa de 1100 Da (aproximadamente, cinco monosacáridos). Sin embargo, se debe hacer una derivatización previa para hacer su detec-ción y mejorar la sensibilidad.

La hplc en fase reversa, en la que se pueden separar los oligosacáridos acoplados a fluorocromos u oligosacáridos sin derivatización previa. Si es posible, se deben realizar métodos preparativos para continuar con los análisis de estructura. La detección se puede realizar por medio de índice de refracción (uv), detectores electroquímicos (pad) (10 - 100 pmol) o de fluorescencia, si se hace marcación previa de los glicanos. En la figura 14, se observan algunos ejemplos de la separación de glicanos por cromatografía de filtración en gel y de intercambio aniónico.

La electroforesis capilar (ec) [66], que se puede emplear en etapas finales de purificación, ya que es una técnica de muy alta resolución. El gel se prepara dentro de un capilar de silica-boro muy delgado y con diferente entrecruzamiento, empleando una poliacrilamida con un bajo porcentaje de bisacrilamida. También se pueden emplear polímeros con tamaños de poro definidos (dextrano, hidroxietilcelulosa, polivinilalcohol), que son em-pacados a alta presión. La ec tiene la ventaja que se pueden realizar muchas

Page 224: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

224 • Introducción al análisis estructural de proteínas y glicoproteínas

30 min252015105

1400

1300

1200

1100

1000

900

800

700

600

500

400

300

200

AO-glicanos

N-glicanos

mVB

Monosialilados Disialilados

Fluorescencia

0 2 4 6 8 10 12 14 16 18 20 22 24 min

Neutros

Figura 14. Cromatografía para purificación de oligosacáridos. A: Filtración en gel para separar por masa molecular. B: Intercambio aniónico de alta resolución (hplc) y marcación para detección por fluorescencia

Fuente: [63, pp. 46-47].

inyecciones sobre el mismo soporte y la detección se hace en línea. Las cantidades de muestra empleadas son muy pequeñas (ml) y la técnica está acoplada a Hplc y espectrometría de masas. Con esta técnica se puede defi-nir la masa molecular y evaluar las mezclas de los oligosacáridos. Se deben establecer condiciones como, campo aplicado, temperatura, dimensiones del capilar (diámetro y longitud), tipo de gel y concentración muestra. Es necesario que las muestras tengan carga, por lo tanto, los oligosacáridos neutrales son convertidos a aminas primarias por medio de aminación reductiva. La detección se hace por uv o por la preparación de derivados fluorescentes.

La resonancia magnética nuclear (rmn) es una técnica que puede deter-minar sin ambigüedades la estructura completa de un oligosacárido, la li-mitante es la cantidad de muestra. En el espectro hay señales particulares de grupos reporteros; por ejemplo, para C1-anomérico hay señales entre 4.2 - 5 ppm, en el caso del ácido siálico se observan multipletes entre 2.7 - 1.8 ppm y para fucosa un doblete entre 1 - 2 ppm. Se encuentran bases de datos para oligosacáridos, 1H-Finger print, particularmente de N-glicanos. Además, las correlaciones entre H1-H1 del mismo monosacárido, Cosy (co-rrelation spectroscopy), Tocsy (correlación total), Relay y 13C-1H para asignar el protón a cada átomo de carbono, Noesy (nuclear overhauser effect spectros) y Roesy (Rotating-frame overhauser) permiten deducir la estructura completa.

La espectrometría de masas (ms) da información estructural de los oligosa-cáridos y, con ella, se pueden emplear ionización Maldi, esi, Nano-esi, fab, entre otras, para determinar la masa molecular de cada glicano y elucidar su estructura.

Page 225: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Glicoproteínas y carbohidratos • 225

Por Maldi se induce la desialilación del carbohidrato, mientras que por fab se produce la fragmentación de la molécula y, posiblemente, la deduc-ción de su estructura. Se obtiene una mejor señal por derivatización como acetilación o metilación. Por técnicas como cg-ei (impacto electrones), se hace derivatización (permetilación, peracetilación, pertrimetilación, silani-zación) para deducir la estructura. La determinación de la anomericidad se pude llevar a cabo previa oxidación con CrO3 en ácido acético, donde el enlace β es más susceptible que α.

La permetilación es la derivatización más común para caracterizar N y O glicanos por espectrometría de masas y tiene varias ventajas:

• Hay una reducción del carácter hidrofílico del carbohidrato y, por lo tanto, aumenta la sensibilidad con respecto a los glicanos no derivatizados.

• Los residuos cargados negativamente, por ejemplo, los ácidos car-boxílicos, pasan a ser glicanos neutrales y, por lo tanto, es posible obtener un perfil glicómico usando ionización en modo positivo.

• Permite el análisis estructural por incremento de la fragmentación del anillo de piranosas y furanosas.

• Suministra información de la secuencia de monosacáridos ya que los hidroxilos involucrados en los enlaces glicosídicos no son metilados y, por lo tanto, por una diferencia en 14 unidades de masa puede ser evidenciada en ms/ms.

La sensibilidad puede ser incrementada por marcación de los extremos reductores con 2-AB (2-aminobenzamida) o 4- acidoaminobenzoico, pero estas marcaciones no proporcionan la misma información que arroja la permetilación.

La metilación se lleva a cabo en condiciones básicas con dimetilsulfoxi-do (dmsO), iodometano u otros agentes de metilación. La etapa de extrac-ción se realiza con solventes orgánicos o por cromatografía en fase reversa (C18spe). En este último caso, se pueden recuperar los glicanos sulfatados los cuales no son metilados, por el contrario, los grupos fosfatos son mono o dimetilados y se diferencian de los sulfatados. En condiciones nativas, sin marcación, es difícil esta diferenciación por sus masas monoisotópicas idénticas. Para estudiar los monosacáridos que hacen parte de las unio-nes glicosídicas y establecer la secuencia, los glicanos permetilados son hidrolizados y, por lo tanto, los grupos OH de los monosacáridos que no participaron en las uniones glicosídicas, quedan libres para ser reducidos a alditoles y O-acetilación. Estas reacciones generan patrones característicos de cada monosacárido y cada unión, llamados pmaa.

Debido a la microheterogeneidad que presentan las glicoproteínas, se emplean varios métodos de ionización y fragmentación para la caracteri-zación de los glicopéptidos los cuales incluyen el modo cid, Hdc y etd. La

Page 226: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

226 • Introducción al análisis estructural de proteínas y glicoproteínas

fragmentación en modo cid, lleva a la pérdida del glicano ya que el enlace glicosídico es más débil que las uniones tipo amida y, por lo tanto, no es adecuado para determinar los sitios de glicosilación. Cuando el oligosa-cárido es permetilado, en modo cid se rompen los enlaces glicosídicos y de esta forma se puede establecer la composición de monosacáridos y de secuencia. También se produce el clivaje cruzado del anillo y los fragmen-tos resultantes son referidos como iones A y X, los cuales permiten hacer la determinación de la unión y ramificaciones (figura 15).

X1 X2 X3y1 Z1 Z2y2 y3 Z3

a1 a2 a3b1 c1 c2b2 b3 c3

+H N3

R1

R2O

NH

NH

O

O

R3

NH

R4

CO2H

a

X1Z2Y20,1 Y1 Z1

X01,5 Y0 Z0

A1 C10,2

1B A22,4 B C CB2 2 33

bOH

HO

O

OHHO

OH

O

O

OHHO

OH

O

O

OHHO

O H

Figura 15. Patrones de Fragmentación generados por espectrometría de masas en tándem (ms/ms) modo etd. A: patrones generados en péptidos. B: patrones generados en glicanos

Fuente: [58, p. 4495].

La disociación por colisión de alta energía (Hdc), usualmente, se lleva a cabo con analizadores orbitrap. Los iones precursores son aislados en el analizador de trampa de iones y transferidos a la celda de colisión donde son fragmentados por impacto con moléculas de gas. Con esta técnica de fragmentación se pueden detectar los iones diagnósticos como oxonium [50]. Los patrones de fragmentación son similares al modo cid (figura 16).

La disociación por transferencia de electrones (etd) es un proceso que no involucra la redistribución de la energía vibracional intramolecular, a

Page 227: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Glicoproteínas y carbohidratos • 227

diferencia de cid y Hdc. La interacción de electrones (e-) de baja energía en fase gaseosa con una molécula multiprotonada genera un radical catión excitado. Posteriormente, se dan procesos de acomodación de electrones y la liberación de energía potencial eléctrica por el radical catión, que producen la fragmentación de la molécula. La fragmentación del enlace N-Cα es abundante, específica y genera iones tipo c y z (figura 15), lo que muestra que es eficiente en el clivaje del enlace peptídico, dejando de lado el enlace glicosídico. En ese caso se puede analizar la estructura en con-junto del glicopéptido.

Por otra parte, suministra un cubrimiento mayor de secuencia y pre-serva las modificaciones postraduccionales (ptm). En consecuencia, etd es una técnica de fragmentación que es complementaria a la información que suministra la disociación cid y permite hacer estudios de secuenciación de novo, análisis de puentes disulfuro y ptm. Sin embargo, tiene limitaciones como el costo de la técnica, ya que utiliza un analizador de ciclotrón de resonancia de iones con transformada de Fourier (ft-icr) (figura 17).

100

80

60

40

20

0

% A

bu

nd

anci

a

(m/z)200 400 600 800 1000 1200 1400

y1

y2

y3

y4

y5 y

6

y7

y8

(2+) (2+)

(2+)(2+)

PepPep

PepPep

b2

b3

b4

PepPep

Pep

PepPep

(2+)

(3+)(3+)

(3+)

(3+)

(2+)

Pep

C* D532

E L K N H L ET Y N S K544

@

8 7 6 5 4 3 2 1 : Iones y

Iones b 2 3 4

Figura 16. Patrones de fragmentación generados por espectrometría de masas en tándem (ms/ms). Espectro ms/ms (hcd) para un N-glicopéptido alto en manosa (Man5GlcNAc2-Asn). En la zona de bajo m/z se observan señales para iones oxonium en 163.0603, 204.0868, 366.1398 y 528.1929. Se observan fragmentación del péptido con baja intensidad de iones b que permiten confirmar la secuencia del péptido y señales de diferente tamaño del glicopéptido

Fuente: [58, p. 4495].

Page 228: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

228 • Introducción al análisis estructural de proteínas y glicoproteínas

100

80

60

40

20

0

(m/z)200 400 600 800 1000 1200 1400

Z1Z

2Z

3Z

4

Z5

Z6 Z

7

Z9

Z10 Z

11

Z12

Z13

2+

2+2+

2+

2+2+

2+

2+

2+

2+2+

2+C7

C8

C9

C10

C12

C13

[M+3H]3+

[M+3H ]2+

[M+4H]4+

C1

C2

C3 C

4C

5

C11

C* D553322

E L K N H L ET Y N S K544

@

9 7 6 5 4 3 2 : Iones z

Iones c

110111213

: 1 2 3 4 5 6 7 8 9 10 11 12 13

% A

bu

nd

anci

a

Figura 17. Patrones de Fragmentación generados por espectrometría de masas en tándem (ms/ms). Espectro ms/ms etd para un N-glicopéptido alto en manosa (Man5GlcNAc2-Asn). Se observan todos los iones c y z que confirman la secuencia del péptido, el sitio y la glicosilación (@)

Fuente: [58, p. 4492].

Recientemente, se han hecho avances en el desarrollado de instrumen-tación para mejorar en la caracterización de glicoproteínas y oligosacáridos. Un ejemplo de esto es la introducción de nuevos métodos de fragmentación como fotodisociación ultravioleta (uvpd), separación por movilidad de ion (ms-im), antes de cid para discriminar iones oxonium epiméricos de las gli-coformas con D-GalNAc y D-GlcNAc. Discriminación de uniones α2-3 y α2-6 para uniones glicosídicas con ácido siálico, usando espectrometría de movilidad de iones en onda de desplazamiento (tW-im-ms) y, finalmente, el uso de la electroforesis capilar con la que se optimizan separaciones de oligosacáridos con diferencias muy pequeñas de masa molecular [58].

Métodos enzimáticos para elucidar estructura primaria de oligosacáridos

Para determinar la estructura primaria del oligosacárido, se pueden emplear exoglicosidasas con especificidad definida y cantidades bajas de la muestra

Page 229: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Glicoproteínas y carbohidratos • 229

(10 - 150 pmol). Con este método se puede determinar la configuración anomérica y la estereoisomería.

Se requiere derivatización previa, es decir marcaje por el extremo reductor para llevar a cabo una digestión secuencial desde el extremo no reductor y hacer la detección por disminución del tamaño por cromatografía líquida (cl) o electroforesis capilar. En cada etapa de digestión enzimática, el oli-gosacárido es recuperado y sometido a nueva digestión. Se puede trabajar en conjunto con espectrometría de masas (esi o Nano-esi) para determinar el peso molecular (figura 18).

Figura 18. Determinación de la estructura de un glicano por digestión enzimática secuencial

Fuente: [63, p. 48].

Otros métodos incluyen la digestión de la estructura empleando un arreglo (array) de diferentes enzimas. Al final, a cada una de las mezclas de reacción se les determina el volumen de retención por cromatografía líquida y se deduce la estructura del glicano de acuerdo con la masa molecular del fragmento (figura 19). Es importante tener en cuenta que se debe conocer la especificidad de cada una de las enzimas y las condiciones de hidrólisis (pH, T, [E], [S]). Además, la digestión se hace de forma secuencial, por lo que la exoglicosidasa previa no va a interferir y se elimina en el paso de recuperación del oligosacárido. Otros métodos incluyen la inmovilización del oligosacárido en un soporte sólido y una posterior exposición a glico-sidasas. Luego, cada monosacárido es identificado y cuantificado por cl u otras técnicas.

Page 230: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

230 • Introducción al análisis estructural de proteínas y glicoproteínas

Exoglicosidasa

a

-Nacetilhesoxaminidasa (s.pneumoniae)

-3/4 fucosidasa (Almendra)

a-fucosidasa (riñón de bovino)

-galactosidasa (testiculos de bovino)

-N-acetilhexosaminidasa (frijol)

Arreglo enzimas Especificidad

a

-2,3 unión GlcNAc

-3/4 unión fucosa

todas las uniones a- fucosa

-3,4 uniónes Galactosa

-2,3,4,6 uniones GlcNAc

1 2 3 4 5 6 7 8 9 Mezcla con enzimas

9 Alicotas oligosacárido

Ext

rem

oN

o r

edu

cto

r

Extrem

ored

ucto

r

1 4 1 2 16

1

1 4 1 2 13

4 1 46

1

4.8 4.8 5.8 9.0 12.25.8 5.8 12.2 12.2

Man Fuc GlcNAc Gal

Unidades de cada

Fragmento

marcado

1 2 3 4 5 6 7 8 9

Oligosacárido marcado

Nueve alícuotas del oligosacáridomarcado incubar con las enzimas

Digeridos

Inyección Secuenciador

Señal experimental

Unidades de glucosa

Señal teórica

Volumen de retención mL

9

mV

12.2

5.8

4.8

9.0

0 15 20 25

12 10 8 6 4

1 4 1 2 16

1

1 4 1 2 13

4 1 46

1

Unidades de glucosa12 10 8 6 4

Figura 19. Determinación de la estructura de un glicano por digestión enzimática secuencial, utilizando un arreglo de enzimas con diferente especificidad

Fuente: [63, p. 49].

Para tener la estructura final de un oligosacárido se debe establecer: • La naturaleza, secuencia y conformación del anillo de cada

monosacárido.• Anomericidad (α y β) de cada enlace glicosídico.• Patrones de sustitución y ramificación.• Estereoquímica absoluta (D o L) de cada residuo.• Naturaleza y localización de los sustituyentes (sulfato, fosfato,

metil) de un monosacárido dado.

En general, un conjunto de técnicas analíticas nos permite obtener la información estructural de la molécula de oligosacárido, de manera que se deben combinar técnicas físicas, químicas y bioquímicas. En la tabla 3, se hace un resumen de las técnicas que se emplean para elucidar la estructura primaria de un glicano, la cantidad de muestra que se requiere y la infor-mación que nos aportan cada una ellas.

Tabla 3. Métodos analíticos para elucidar estructura de oligosacáridos

Método Cantidad de

muestra

Determinación de la composición de

monosacáridos

Determinación de anómeros y enlace

glicosídico

Requiere derivatiza-

ción

rmn 10-20 nmol Sí Sí No

es-ms > pmol Hex/Hexnac No Sí

Maldi-ms 50 pmoles Hex/Hexnac No No

fab-es 10 pmoles Hex/Hexnac Limitada Sí

Secuenciación enzimática

150 pmoles Sí Sí Sí

Fuente: [63, p 46].

Page 231: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Glicoproteínas y carbohidratos • 231

Algunas limitaciones que se presentan en la determinación de la estruc-tura primaria de los oligosacáridos son:

• La aparición ocasional de un patrón inusual de unión de mono-sacáridos en los diferentes organismos, por ejemplo, en aquellos donde no se han realizado estudios de glicoproteínas.

• No hay disponibilidad de patrones. • Las técnicas analíticas algunas veces no se pueden emplear por

limitaciones como la cantidad de muestra para análisis, por ejem-plo, en el caso de rmn.

• Los métodos enzimáticos son limitados para glicosidasas nuevas, algunas veces no hay sustratos para su estudio.

• El enlace glicosídico Furanosa-piranosa es lábil en condiciones ácidas.

• No hay β-galactofuranosidasa para hidrólisis enzimática.• Hay pocas enzimas para furanosas.

En el siguiente diagrama se resumen las principales etapas de estudio de las glicoproteínas y los glicanos, junto con los métodos analíticos que se emplean más comúnmente (figura 20).

Glicómica GlicóproteómicaO-glicanos

N-glicanosGlicoproteína

Desnaturalización(ej. Reducción, Alquilación)

Digestión con proteasas

Liberación del N-glicanoy marcaje

Liberación del O-glicanoy marcaje

(ej. BEMAD)

DTT18

(ej. Digestión con endoenzimas,marcación con O)

Liberación del N-glicano(ej. PNGasaF/A, Hidrazinólisis)

N-glicano

Enriquecimiento(ej. C18 SPE)

N-glicanosO-glicopépidosy pépidos

Liberación del O-glicano

(ej. Permetilación,Marcaje 2AP)

Derivatización

Hidrazinólisis)

(ej. Permetilación,Marcación 2AP)

Derivatización

MS, HPLC MS, HPLC

Determinacióndel perfil deO-glicanos

Determinacióndel perfil deN-glicanos

Determinacióndel sitio de

N-glicosilación

Determinacióndel sitio de

O-glicosilación

Análisis deGlicopéptidos

LC-MS LC-MS LC-MS

18

(ej. -eliminación,

n

Figura 20. Diagrama general para estudios de glicómica, análisis estructural de los glicanos, y glicoproteómica, análisis de los glicopéptidos

Fuente: [58, p. 4485].

Page 232: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

232 • Introducción al análisis estructural de proteínas y glicoproteínas

Estudios de glicosilación, funciones biológicas y posibles aplicaciones

Las interacciones conducentes a respuestas biológicas son proteína-proteína, proteína-carbohidrato y carbohidrato-carbohidrato, en las que hay evidencia experimental que las implica en procesos biológicos que incluyen tráfico celular, interacciones hospedero patógeno, embriogénesis, espermatogénesis, fertilización, desarrollo del sistema nervioso y angiogénesis, entre otros. El reconocimiento biológico involucra estructuras altamente ordenadas. En el caso de la mediación por oligosacáridos se realizan procesos de multi-merización de moléculas de carbohidrato para generar suficiente afinidad y avidez y funcionar in vivo. Las funciones biológicas de los glicanos en las glicoproteínas implican tanto su reconocimiento directo, por las proteínas de unión al glicano (gbp), como por los efectos indirectos de los glicanos en las interacciones de la glicoproteína. El reconocimiento biológico está mediado por glicoproteínas de membrana, citoplasma y en organelos, en los cuales hay carbohidratos conjugados a proteínas y lípidos (figura 21).

I.Reconocimiento del glicano II. Efectos no directos del glicano

GPI

S-

P-

Glc

GlcNAc

GlcN

G(y)

GaNAc

Man

Fuc

Xyl

NeuSAc

GkA

ldoA

lns

Sulfato

Fosfato

-Asn-X-Ser/Thr-

N-glicanoX=aminoácidoX prolina=

-Ser/Thr- -Ser/Thr- -Ser/Thr- -Ser/Thr- -Ser- -Ser/Thr--Hyl-

GlicolípidoO-GlcNAcO-Gal-O-GalNAc O-Fuc O-Man O-Glc Ser-Xyl(GAG)

HidroxilisinacolágenoO-glicanos

P

NC-terminus

S

S

SS

GlicoproteínaReceptor

ContraGlicoproteína

Receptor

Membrana celular

GlicanoDe unión a proteína

GBP

Receptor Extracelular

GAG

GlicoproteínaLigando

unión a

Extracelular

glicano

Membranacelular

intracelularseñalización

Glicolípido

proteína

O-GlcNAcglicoproteína

GBP

P

S

S

SS

SSSS

Figura 21. Interacciones de los glicanos conjugados a proteínas y lípidos. Glicosilación de tipo N y O implicados en procesos celulares

Fuente: [67, p. 2].

Page 233: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Glicoproteínas y carbohidratos • 233

Con la comprensión de la función del glicano en una molécula biotera-péutica es posible preveer cómo alterar la eficacia y la vida media de una proteína in vivo o cambiar el efecto de las drogas. Ha sido posible también la obtención de moléculas de nueva generación, confeccionando sus carac-terísticas biológicas y desarrollando nuevas modalidades terapéuticas. Una de las áreas de investigación en glicobiología, es el desarrollo de nuevos métodos para la síntesis y el rediseño de oligosacáridos por métodos quí-micos y enzimáticos que permitan obtenerlos con patrones de glicosilación definidos y glicoformas heterogéneas con diferentes atributos fisicoquímicos y biológicos [68].

La modificación química o degradación de oligosacáridos a partir de fuentes naturales, permite obtener moléculas con mejores propiedades farmacológicas. Un ejemplo es el rediseño de heparina de bajo peso mo-lecular, la cual tiene mejores propiedades anticoagulantes.

La eritropoietina estimula la formación de eritrocitos y, por lo tanto, disminuye la anemia; la glicoproteína es manipulada genéticamente para crear sitios de N-glicosilación y por lo tanto introducir un número mayor de oligosacáridos con respecto a la molécula normal; de esta forma se po-tencializa su función y, por lo tanto, se logra reducir la anemia. En este caso, posiblemente una mayor glicosilación facilita un mayor tiempo de acción de la proteína en el organismo y, por lo tanto, hay una mejor estimulación de la producción de células rojas. El rediseño de oligosacáridos en las proteínas dio como resultado la creación drogas de segunda generación en donde su actividad y vida media se incrementa. Por otro lado, la eritropoietina desialilada posee propiedades neuroprotectivas. Esto nos indica que las dos aplicaciones terapéuticas pueden ser disociadas una de la otra.

Por medio de procesos in vitro se ha realizado la introducción quimio-selectiva o enzimática de un trisacárido en el N-terminal de la cadena poli-peptídica de la insulina, lo que ha llevado al desarrollo de una hormona con mejores características. Lo anterior nos muestra la importancia de desarrollar un sistema integrado que permita entender la relación estructura-función de glicanos para maximizar el potencial terapéutico de estas moléculas [1].

Otros de los estudios en esta área, es la síntesis de novo de glicanos complejos a escala preparativa en fase sólida, para producir vacunas con base en carbohidratos. La síntesis automatizada de oligosacáridos ha sido implementada adaptando algunos equipos utilizados en la síntesis de oligo-nucleótidos; un ejemplo es la síntesis de un hexasacárido que es producido como una toxina de Plasmodium falciparum para emplearlo como inmunó-geno en tratamientos clínicos. Igualmente se ha realizado la síntesis de un glicopéptido (4972 Da) presente en linfocitos T citotóxicos, con 2 cadenas de oligosacáridos sialilados, el cual mantiene la actividad biológica y pre-senta propiedades farmacocinéticas [69].

Page 234: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

234 • Introducción al análisis estructural de proteínas y glicoproteínas

La evaluación de la síntesis in vivo de glicanos, se puede realizar a través de la adición de glicosiltransferasas exógenas, azúcares activados y mono-sacáridos no naturales que permiten analizar las vías de modificación pos-transduccional en modelos definidos [22, 70]. Uno de los modelos para el estudio de la función de los glicanos a nivel celular es el uso de la ma-quinaria de síntesis de líneas celulares de insectos para obtener productos glicosilados. El estudio de la función de O-glicanos es una tarea difícil. Una de las estrategias consiste en eliminar el oligosacárido de una glicoproteína en condiciones no desnaturalizantes y analizar cómo se afecta su función y propiedades comparadas con la proteína glicosilada. La expresión de las glicoproteínas en sistemas celulares deficientes en alguna glicosiltransferasa es un enfoque que depende del tipo de célula. El diseño de inhibidores de glicosiltransferasas es un acercamiento interesante que está avanzado por el conocimiento acerca del mecanismo de acción de estas enzimas. Algunos substratos como α-benzil-GalNAc inhiben la síntesis de proteínas O-glico-siladas en células, pero no afectan la unión GalNAc a Ser o Thr y a menudo se necesitan concentraciones muy altas que resultan tóxicas para las células. Para estudiar la biosíntesis de estos oligosacáridos, se puede trabajar con una línea celular deficiente en O-glicosilación, o en la epimerasa udp-Glc/GlcNA; por lo tanto, no se genera GalNAc-udp.

Patologías asociadas a glicoproteínas

Uno de los desafíos de la glicómica funcional es la búsqueda e identificación de glicoproteínas relacionadas con diferentes patologías y de las cadenas de oligosacáridos que pueden regular diferentes procesos biológicos como la coagulación, inflamación, infecciones virales, bacterianas y enfermedades neoplásicas. La gran mayoría de los resultados en este campo se ha obtenido empleando animales transgénicos o con knock-out génico. Sin embargo, nue-vas tecnologías como los microarreglos basados en lectinas, glicoproteínas y estructuras glicosídicas acopladas a poliacrilamida han permitido entender cómo son las interacciones proteína:carbohidrato, obtener información es-tructural y buscar estructuras glicosídicas o asociadas a células tumorales o que se presentan en otras patologías [71, 72, 73]. La información estructural obtenida ha permitido sintetizar nuevos inhibidores para bloquear la acti-vidad de las glicosiltransferasas, diseñar nuevos antagonistas de citoquinas de importancia terapéutica, estudiar los patrones de sulfatación que están en enfermedades a causa de cambios en los glicosilaminoglicanos (gag) [74, 75] y elucidar estructuras complejas de polisacáridos presentes en bacterias y virus. En consecuencia, se ha avanzado en el desarrollo de nuevos métodos de diagnóstico y pronóstico. Un ejemplo es el estado de las infecciones con base en estructuras de carbohidratos [23, 72].

Page 235: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Glicoproteínas y carbohidratos • 235

Los cambios en los patrones de glicosilación se han relacionado con cambios en la actividad de las glicosiltransferasas y con alteraciones en la estructura de los carbohidratos, que conforman los antígenos de la superficie celular durante el proceso de transformación de la célula no neoplásica a tumoral. Se ha comprobado que en la mayoría de las células neoplásicas hay una elongación incompleta de la cadena de oligosacáridos, formando estructuras menos complejas. Esto determina que algunos tipos de core, que en células normales se encuentran enmascarados, queden expuestos en la superficie celular, resultando en la aparición de nuevos antígenos asociados al cáncer o antígenos oncofetales. Muchos de los marcadores fenotípicos utilizados para la identificación de los cánceres epiteliales corresponden a estructuras de carbohidratos sobre la cadena polipeptídica de las mucinas [76]. Las mucinas de membrana se han estudiado extensivamente tanto a nivel de la parte proteica como del glicano y a partir de ellas se han hecho extrapolaciones a las mucinas solubles.

El estudio bioquímico y molecular de las mucinas es de gran importan-cia y su expresión en sueros y efusiones ha sido relacionada por algunos autores con el grado de la enfermedad neoplásica. Por ejemplo, la sobre expresión de muc1 en el suero de pacientes con cáncer de mama avanzado se ha relacionado con la progresión de la enfermedad y la sobrexpresión de muc4 y muc16 se ha asociado con cáncer de páncreas y ovario, respecti-vamente [77, 78]. La glicosilación de todos los sitios potenciales en células neoplásicas causa la aparición de oligosacáridos muy cortos generando proteínas con altos porcentajes de antígenos Tn, T, sTn. Esta expresión de mucinas cortas se interpreta como un evento temprano en el desarrollo de ciertos cánceres. En un amplio rango de tumores sólidos, incluyendo seno, colon, pulmón, estómago, páncreas y ovario se expresa el antígeno Tn y su grado de expresión se ha relacionado con el grado de diferenciación del tumor, la agresividad y de ahí el pronóstico de la enfermedad [77, 79, 80]. Por otra parte, la deleción del gen muc2 en ratón lleva a la formación de cáncer colorectal ausente en la especie silvestre, lo que sugiere un papel en la homeostasis intestinal.

Otras patologías se han asociado con cambios en los oligosacáridos o en un único residuo de azúcar; el síndrome de deficiencia de adhesión de leucocitos (lad ii) se manifiesta por infecciones recurrentes y un aumento del número de neutrófilos. lad ii es causado por la carencia de fucosilación del determinante que está sobre las células endoteliales, por mutaciones que se presentan en el transportador de la gdp-fucosa; la administración de L-fucosa compensa su deficiencia. Una estrategia similar ha sido empleada en el caso de ciertos tipos de desórdenes congénitos de glicosilación (cdg), en los que se presentan defectos en glicosilación de las N-glicoproteínas presentes en el suero, debido a una mutación de la fosfomanomutasa y, por lo tanto, se presenta insuficiencia de la gdp-manosa [7]. En el caso del cáncer

Page 236: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

236 • Introducción al análisis estructural de proteínas y glicoproteínas

de páncreas, el análisis de la glicosilación en diferentes etapas, junto con el análisis de los marcadores proteicos y genéticos ha permitido realizar un diagnóstico precoz de la enfermedad. Los ejemplos anteriores, los cuales son pocos, nos muestran que el desarrollo de biomarcadores para el diag-nóstico y pronóstico de algunas enfermedades es un campo muy dinámico y en desarrollo en el estudio de carbohidratos [11, 18].

Otros enfoques se han encaminado al análisis del perfil de glicoproteínas séricas en pacientes con linfoma de Hodking, desórdenes congénitos, escle-rosis múltiple y enfermedades gastrointestinales, entre otras. En todas estas patologías, las glicoproteínas séricas mostraron diferencias con respecto a las del suero normal [29, 81].

Los antígenos asociados a tumores son de importancia en el estudio de la respuesta inmune y pueden ser empleados como alternativas terapéuticas [82, 83]. Es así como el estudio de nuevas estructuras glicosídicas ha permitido diseñar y obtener vacunas novedosas basadas en glicanos encontrados en patógenos y células tumorales conjugados a proteínas transportadoras o a virus. El desarrollo de una vacuna contra Ántrax se basa en el reconocimien-to especifico de un tetrasacárido de ramnosa presente en Bacillus anthracis, una de las vacunas contra el Sida está dirigida contra el N-oligosacárido de la glicoproteína gp120 del virus de inmunodeficiencia adquirida (Hiv), que juega un papel fundamental en la inmunoinvasión [84, 85].

Por otra parte, la exposición de los antígenos oncofetales puede desen-mascarar epítopes que provocan respuesta inmune. Varios estudios mues-tran que la vacunación de pacientes con carcinomas de seno usando car-bohidratos con el determinante Tn lleva a un mejor pronóstico [86]. Estas estructuras asociadas a tumores interactúan con lectinas de tipo C sobre células presentadoras de antígenos, dendritas y macrófagos, los cuales son importantes para tratamientos de inmunoterapia activa del cáncer. Tam-bién se han desarrollado métodos de síntesis química para la elaboración de vacunas, buscando mejores características de estabilidad con el empleo de aminoácidos no proteicos, como homoserina, o para la generación de nuevas vacunas polivalentes, que incluyen diferentes clases de carbohidra-tos asociados a cáncer para obtener una respuesta inmunológica variada. Lo anterior ha llevado a que las vacunas sintéticas basadas en glicanos se consideren un nuevo blanco terapéutico en oncología, particularmente en pacientes con enfermedad residual mínima [87, 88]. Se demostró que la eficacia de la respuesta antitumoral depende de la densidad de residuos Tn en el inmunógeno, obteniéndose el mejor efecto inmunoprotector cuando los glicopéptidos presentan tres residuos consecutivos [89].

El estudio de los oligosacáridos y de las glicoproteínas es de gran impor-tancia, sin embargo, aún falta mucho por resolver; por ejemplo, cuáles son los factores que determinan el grado de ocupación de los sitios potenciales de la proteína que pueden ser N u O-glicosilados. Aunque se han planteado

Page 237: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Glicoproteínas y carbohidratos • 237

varias hipótesis que involucran factores estéricos, accesibilidad de glico-siltransferasas o grado de exposición de los sitios determinado por la pre-sencia de glicanos vecinos, no hay actualmente evidencia experimental que sustente ninguna de ellas. Se deben continuar estudiando, los mecanismos que regulan el proceso de ocupación de los sitios durante la glicosilación y, de esta forma, encontrar el camino para controlar la microheterogenei-dad, que dificulta considerablemente la purificación y caracterización de muchas glicoproteínas.

El rápido crecimiento de las bases de datos que emplean la notación química de los glicanos y la necesidad de transformar esta información en representaciones estructurales, incluyendo los aspectos conformacionales, permiten prever que en corto tiempo se generará el software necesario que por una parte facilite esta transformación y que además tenga características de compatibilidad con diversas plataformas para permitir un uso generalizado.

El estudio de los mecanismos catalíticos de las glicosiltransferasas es fundamental para entender la exquisita especificidad mostrada por estas enzimas. Ya hemos señalado que el mecanismo con retención de configura-ción esta pobremente definido y, a pesar de los numerosos intentos hechos hasta ahora, todavía no se dispone de un modelo satisfactorio que explique a nivel molecular cómo funcionan estas enzimas. Esto es debido, en parte, a la gran diversidad de sustratos que usan las diferentes glicosiltransferasas lo cual dificulta generalizar los resultados obtenidos con mecanismos pun-tuales y, en parte, al requerimiento de obtener complejos enzima-inhibidor competitivo o enzima-análogo del sustrato susceptibles de ser cristalizados o que en solución sean suficientemente estables. Otro problema sin resol-ver es la estructura y el mecanismo de las glicosiltransferasas que realizan la biosíntesis de la celulosa, la quitina y el hialuronato, polisacáridos de enorme importancia en muchos campos. El estudio de estos mecanismos en organismos clave en conjunto con las correlaciones derivadas de la pro-teómica son aspectos objeto de investigación y, posiblemente, se obtendrán avances significativos en un plazo cercano.

Un último punto que merece considerarse es la importancia de los gli-canos en la pared celular de invertebrados y, particularmente, de aquellos que son de interés clínico por ser agentes infecciosos o comportarse como parásitos. Hoy en día, es muy poco lo que se sabe al respecto y dada la im-portancia de estos agentes, es un campo muy rico y de mucha relevancia. Los procesos de biosíntesis de los glicanos por acción de las glicosiltransfe-rasas han sido analizados extensivamente, sobre todo en mamíferos, pero hay todavía muchos interrogantes en cuanto a los mecanismos moleculares de la acción enzimática y en cuanto a su biosíntesis en invertebrados y en plantas que vale la pena investigar, este es otro campo de mucha riqueza. A pesar de los enormes avances realizados subsisten muchas incógnitas que hacen de la glicómica un fértil y subyugante campo de investigación.

Page 238: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

238 • Introducción al análisis estructural de proteínas y glicoproteínas

Referencias

1. Shriver Z, Raguram S, Sasisekharan R. Glycomics: a pathway to a class of new and improved therapeutics. Nature Reviews. 2004;3:863-873.

2. Bertozzi CR, Sasisekharan R. Glycomics. Varki A, Cummings RD, Esko JD, Freeze HH, Stanley P, Bertozzi CR, Hart GW, Etzler ME (eds). Essentials of Glycobiology. Second Edition. Cold Spring Harbor, NY: ColdSpring Harbor Laboratory Press; 2009.

3. Hart G, Copeland R. Glycomics hits the big time. Cell. 2010;143:672-676. 4. Bucior I, Burguer MM. Carbohydrate-carbohydrate interactions in cell

recognition. Curr. Opinion Struc. Biol.2004;14:631-637.5. Wormald MR, Sharon N. Carbohydrates and Glycoconjugates. Progress

in non-mammalian glycosylation, glycosyltransferases, invertebrate lectins and carbohydrate-carbohydrate interactions. Curr. Opinion Struc. Biol. 2004;14:591-592.

6. Laine RA. The information potential in the sugar code. Gabius HJ, Gabius S (eds). Glycosciences. Status and perspectives. London: Chapman and Hall; 1997. 1-14.

7. Gabius HJ, Andre S, Kaltner H, Siebert HC. The sugar code: functional lectinomics. Biochim.Biophys. Acta. 2002;1572:165-177.

8. Von der Lieth CW. Bioinformatics for glycomics: Status, methods, requirements and perspectives. Briefings in bioinformatics. 2004;5(2):164–178. dOi:10.1093/bib/5.2.164

9. Baycin Hizal D, Wolozny D, Colao J, Jacobson E, Tian Y, Krag SS et al. Glycoproteomic and glycomic databases. Clinical Proteomics. 2014;11(1):15. dOi:10.1186/1559-0275-11-15

10. Böhm M, Bohne-Lang A, Frank M, Loss A, Rojas-Macías MA, Lütteke T. Glycosciences. db: an annotated data collection linking glycomics and proteomics data (2018 update). Nucleic Acids Disponible en; doi:10.1093/nar/gky994. [6 de febrero de 2020].

11. Yan A, Lennarz W. Unraveling the mechanism of protein N-glycosylation. J.Biol. Chem. 2005;280:3121-3124. dOi:10.1074/jbc.R400036200

12. Medeiros A, Bianchi S, Calvete JJ, Balter H, Bay S, Robles A, et al. Biochemical and functional characterization of the Tn-specific lectin from Salvia sclarea seeds. Eur. J. Biochem. 2000;267(5):1434-1440

13. Wilson I. Glycosylation of proteins in plants and invertebrates. Current Opinion in Structural Biology. 2002;12(5):569–577. dOi:10.1016/s0959-440x(02)00367-6.

14. Hang HC, Bertozzi CR. The chemistry and biology of mucin-type O-linked glycosylation. Bioorg. Medicinal Chem. 2005;13:5021-5034.

Page 239: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Glicoproteínas y carbohidratos • 239

15. Caset A, Bobowski M, Burchell J, Delannoy P. Tumour-associated carbohydrate antigens in breast cancer. Breast Cancer Research. 2010;12:204-217.

16. Ju T, Aryal R, Kudelka M, Wang Y, Cummings R. The Cosmc connection to the Tn antigen in cancer. Cancer Biomarkers. 2014;14:63–81.

17. Ju T, Otto V, Cummings R. The Tn Antigen—Structural Simplicity and Biological Complexity. Angew. Chem. Int. Ed. 50: 1770 – 1791.2011

18. Kailemia MJ, Park D1, Lebrilla CB. Glycans and glycoproteins as specific biomarkers for cancer. Anal Bioanal Chem. 2017;409(2):395-410. dOi: 10.1007/s00216-016-9880-6.

19. Ju T, Wang Y, Aryal RP, Lehoux SD, Ding X, Kudelka MR et al. Tn and sialyl-Tn antigens, aberrant O-glycomics as human disease markers. Proteomics Clin Appl. 2013;(9-10):618-31. dOi: 10.1002/prca.201300024.

20. Lisowska E. Tn Antigens and their significance in Oncology. Acta Biochim. Pol. 1995;42:11-17.

21. Freire T, Osinaga E. A Immunological and biomedical relevance of the Tn antigen. Inmunología. 2003;22(1):27-38.

22. Van den steen P, Rudd P, Wormald M, Dwek, Opdenakker G. O-Linked glycosylation. Trends in Glycosc. Glycotech. 2000;12:35-49.

23. Marth JD, Grewal PK. Mammalian glycosylation in immunity. Nature Reviews Immunology. 2008; 8(11), 874–887. dOi:10.1038/nri2417

24. Fukuda M. Roles of mucin-type O-glycans in cell adhesion. Biochim. Biophys. Acta. 2002;1573:194-405.

25. Taylor-Papadimitriou J, Burchell J, Miles DW, Dalziel M. muc1 and cancer. Biochimica et Biophysica Acta (bba) - Molecular Basis of Disease. 1999;1455(2-3):301–313. dOi:10.1016/s0925-4439(99)00055-1

26. Lairson LL, Henrissat B, Davies GJ, Withers SG. Glycosyltransferases: Structures, functions, and mechanisms. Annual Review of Biochemistry. 2008;77(1):521–555. dOi:10.1146/annurev.biochem.76.061005.092322

27. Drickamer K, Taylor ME. Glycan arrays for functional glycomics. Genome Biol. 2002;3: 1034.1-1034.4.

28. Disney MD, Seeberger PH. Carbohydrate arrays as tools for the glycomics revolution. ddt:Targets. 2004;3:151-158.

29. Liang PH, Wu CY, Greenberg WA, Wong CH. Glycan arrays: biological and medical applications. Curr.Opinion. Chem.Biol. 2008;12:86-92.

30. Purohit S, Li T, Guan W, Song X, Song J, Tian Y, Li L, Sharma A, Dun B, Mysona D, Ghamande S, Rungruang B, Cummings RD, Wang PG, She JX. Multiplex glycan bead array for high throughput and high content analyses of glycan binding proteins. Nat Commun. 2018;9(1):258. dOi: 10.1038/s41467-017-02747-y.

31. Tateno H, Mori A, Uchiyama N, Yabe R, Iwaki J, Shikanai TT et al. Glycoconjugate microarray based on an evanescent–field

Page 240: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

240 • Introducción al análisis estructural de proteínas y glicoproteínas

fluorescence-assisted detection principle for investigation of glycan-binding proteins. Glycobiology. 2008:18:789-798.

32. Oyelaran O, Gildersleeve JC. Application of carbohydrate array technology to antigen discovery and vaccine development. Expert Review of Vaccines. 2007;6(6):957–969. dOi:10.1586/14760584.6.6.957

33. Bedair M, El Rassi Z. Affinity chromatography with monolithic capillary columns II. Polymethacrylate monoliths with immobilized lectins for the separation of glycoconjugates by nano-liquid affinity chromatography J. Chromat. 2005;1079: 236-245.

34. Hajba L, Csanky E, Guttman A. Liquid phase separation methods for N-glycosylation analysis of glycoproteins of biomedical and biopharmaceutical interest. A critical review. Anal Chim Acta. 2016; 943:8-16. dOi: 10.1016/j.aca.2016.08.035.

35. Haojie Lu, Ying Zhang, Pengyuan Yang. Advancements in mass spectrometry-based glycoproteomics and glycomics, National Science Review. Disponible en: https://doi.org/10.1093/nsr/nww019. [06 de febrero de 2020].

36. Hirabayashi J, Kasai K. Separation technologies for glycomics. J. Chromat. B. 2002;771:67-87.

37. Khajehpour M, Dashnau JL, Vanderkooi JM. Infrared spectroscopy used to evaluate glycosylation of proteins. Anal.Biochem. 2005; 348:40-48.

38. Duverger E, Frison N, Roche AC, Monsigny M. Carbohydrate-lectin interactions assessed by surface plasmon resonance. Biochimie. 2003;85:167-179.

39. Reynolds M, Pérez S. Thermodynamics and chemical characterization of protein–carbohydrate interactions: The multivalency issue. Comptes Rendus Chimie. 2011;14(1):74-95.

40. Shimomura O, Oda T, Tateno H, Ozawa Y, Kimura S, Sakashita S, … Ohkohchi N. A novel therapeutic strategy for pancreatic cancer: Targeting cell surface glycan using rBC2LC-N Lectin–Drug Conjugate (ldc). Molecular Cancer Therapeutics. 2017;17(1): 183–195. dOi:10.1158/1535-7163.mct-17-0232

41. Hirabayashi J. Oligosaccharide microarrays for glycomics. Trends Biotech. 2003;21:141-143.

42. Hirabayashi J, Tateno H, Shikanai T, Aoki-kinoshita KFf, Narimatsu H. The Lectin Frontier Database (lfdb), and data generation based on frontal affinity chromatography. Molecules. 2015;20(1):951-73. dOi: 10.3390/molecules20010951.

43. Nakamura-Tsuruta S, Uchiyama N, Kominami J. Hirabayashi J. Frontal affinity chromatography: Systematization for quantitative interaction analysis between lectins and glycans. Nilsson CL (ed.) Lectins: Analytical technologies. Amsterdam: Elsevier, 2007. 239-266

Page 241: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Glicoproteínas y carbohidratos • 241

44. Research Center for Medical Glycoscience. DataBase for glycan structure analysis and synthetic technology. Lectin Frontier Database. Disponible en: http://riodb.ibase.aist.go.jp/rcmg/glycodb/. [06 de febrero de 2020].

45. Narimatsu H, Sawaki H, Kuno A, Kaji H, Ito H, Ikehara Y: A strategy for discovery of cancer glyco-biomarkers in serum using newly developed technologies for glycoproteomics. Febs Journal. 2010; 277:95–105.

46. Hizal DB, Wolozny D, Colao J, Jacobson E, Tian Y, Krag SS et al. Glycoproteomic and glycomic databases. Clinical proteomics. 2014;11(1):15.

47. Cermav (cnrs). Cermav. Disponible en: www.cermav.cnrs.fr. [06 de febrero de 2020].

48. Brockhausen I. Pathways of O-glycan biosynthesis in cancer cells. Biochim.Biophys.Acta 1999;1473:67-95.

49. Freeze HH. Update and perspectives on congenital disorders of glycosylation. Glycobiology. 2001;11:129R-143R.

50. Madsen CB, Petersen C, Lavrsen K, Harndahl M, Buus S, Clausen H, Wandall HH. Cancer associated aberrant protein O-Glycosylation can modify antigen processing and immune response. PLoS One, 2012;7(11). e50139. http://doi.org/10.1371/journal.pone.0050139

51. Kailemia MJ, Park D1, Lebrilla CB. Glycans and glycoproteins as specific biomarkers for cancer. Anal Bioanal Chem. 2017;409(2):395-410.doi: 10.1007/s00216-016-9880-6.

52. Kuno A, Uchiyama N, Koseki-kuno S, Ebe Y, Takashima S, Yamada M, Hirabayashi J. Evanescent–field fluorescence-assisted lectin microarray: a new strategy for glycan profiling. Nature Methods. 2005;2:851-856.

53. Matsuda A, Kuno A, Ishida H, Kawamoto T, Shoda J, Hirabayashi J. Development of an all-in-one technology for glycan profiling targeting formalin-embedded tissue sections. Biochem. Biophys. Res. Comm. 2008;370:259-263.

54. Hu S, Wong DT. Lectin microarray. Proteomics - Clinical Applications. 2009;3(2):148–154. dOi:10.1002/prca.200800153

55. Edgea Faltynek C, Hof L, Reichert L, Weber P. Deglycosilation of glycoprotenis by trifuoromethane sulfonic acid. Analytical Biochemistry. 1981;118: 131-137.

56. Montreuil J, Bouquelet S, Debray H, Lemoine J, Michalski JC, Spik G, Strecker G. Glycoproteins in Carbohydrate Analysis. A practical approach 7. Chaplin MF, Kennedy J.F (eds). United Kingdom: irl Press, Oxford; 1994.

57. Wells L, Vosseller K, Cole RN, Cronshaw JM, Matunis MJ, Hart GW. Mapping sites of O-GlcNAc modification using affinity tags for serine and threonine post-translational modifications. Mol Cell

58. Proteomics. 2002;1:791–804.59. Shajahan A, Heiss C, Ishihara M, Azadi P. Glycomic and glycoproteomic

analysis of glycoproteins—a tutorial. Analytical and Bioanalytical Chemistry. 2017;409(19):4483–4505. dOi:10.1007/s00216-017-0406-7

Page 242: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

242 • Introducción al análisis estructural de proteínas y glicoproteínas

60. Quian Fan J, Namiky J, Matsuoka K, Lee YC. Comparison of acid hydrolitic conditions for asn linked oligosaccharides. Analytical Biochemistry. 1994;219: 375-378.

61. Biorad. Glycoprotein and Oligosaccharide Analysis. 1997;149-155.62. Chaplin MF. Monosacarides. Chaplin MF, Kennedy J.F (eds.) Carbohydrate

Analysis. A practical approach. United Kingdom: irl Press, Oxford; 1994.63. Patel TP y Parekh RB. Release of oligosaccharides from glyco¬proteins by

hydrazinolysis. Meth. Enzymol., 230, 57-66 (1994)64. Oxford Glyco Systems. Tools for Glycobiology. Oxford: Oxford Glyco

Systems; 1994. Pp. 152.65. Li SY, Höltje JV, Young KD. Comparison of high-performance liquid

chromatography and fluorophore-assisted carbohydrate electrophoresis methods for analyzing peptidoglycan composition of Escherichia coli. Analytical Biochemistry. 2004; 326(1): 1–12. dOi:10.1016/j.ab.2003.11.007

66. Bigge J, Patel T, Bruce J, Goulding P, Cahrles S y Parekh R. Non selective and efficient fluorescent labeling of glycans using 2-amino benzamide and antranilic acid.Anal.Biochem. 1995;230:229-238.

67. Kenedy J, Pagliuca G. Oligosaccharides in Carbohydrate Analysis. A practical approach. Chaplin MF, Kennedy JF (eds) United Kingdom: irl Press, Oxford; 1994. Pp 64-67.

68. Cummings R, Pierce M. The challenge and promise of glycomics. Chem Biol. 2014;21(1): 1–15. dOi: 10.1016/j.chembiol.2013.12.010.

69. Brocke C, Kunz H. Synthesis of tumor-associated glycopeptide antigens. Bioorg. Medicinal Chem. 2002;10: 3085-3112.

70. Hemmerich S. Glycomics: coming of age across the globe. ddt. 2005; 10:307-309.

71. Gouyer V, Leteurtre E, Zanetta J, Lesuffleur T, Delannoy P, Huer G. Inhibition of the glycosylation and alteration in the intracellular trafficking of mucins and other glycoproteins by GalNacαα-o-bn in mucosal cell lines: an effect mediated through the intracellular synthesis of complex GalNacαα-o-bn oligosaccharides. Front. Biosc. 2001;6: 1235-1244.

72. Hirabayashi J, Kuno A, Tateno H. Lectin-based structural glycomics: A practical approach to complex glycans. Electrophoresis. 2011;32(10):1118–1128. dOi:10.1002/elps.201000650

73. Hiono T, Matsuda A, Wagatsuma T, Okamatsu M, Sakoda Y, Kuno A. Lectin microarray analyses reveal host cell-specific glycan profiles of the hemagglutinins of influenza A viruses. Virology. 2019; 527:132–140. dOi:10.1016/j.virol.2018.11.010

74. Wang, YC, Nakagawa M, Garitaonandia I, Slavin I, Altun G, Lacharite RM, et al. Specific lectin biomarkers for isolation of human pluripotent stem cells identified through array-based glycomic analysis. Cell Research. 2011; 21(11): 1551–1563. doi:10.1038/cr.2011.148

Page 243: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Glicoproteínas y carbohidratos • 243

75. Pomin V, Mulloy B. Glycosaminoglycans and Proteoglycans. Pharmaceuticals. 2018; 11(1):27. dOi:10.3390/ph11010027

76. Sasisekharan R, Raman R y Prabhakar V. Glycomics approach to structure-function relationships of glycosaminoglycans. Annual Review of Biomedical Engineering. 2006; 8(1): 181–231. dOi:10.1146/annurev.bioeng.8.061505.095745

77. Ricardo S, Marcos-Silva L, Pereira D, Pinto R, Almeida R, Söderberg O, Mandel U, Clausen H, Felix A, Lunet N, David L. Detection of glyco-mucin profiles improves specificity of muc16 and muc1 biomarkers in ovarian serous tumours. Mol Oncol. 2015; 9(2):503-12. dOi: 10.1016/j.molonc.2014.10.005.

78. Storr SJ, Royle L, Chapman CJ, Hamid uma, Robertson JF, Murray A, ... y Rudd PM. The O-linked glycosylation of secretory/shed muc1 from an advanced breast cancer patient’s serum. Glycobiology.2008; 18: 456-462.

79. Revoredo L, Wang SH, Bennett E, Clausen H, Moremen K, Jarvis D, Ten Hagen K, Tabak L y Gerken T. Mucin-type O-glycosylation is controlled by short- and long-range glycopeptide substrate recognition that varies among members of the polypeptide GalNAc transferase family Glycobiology. 2016; 4:360-376. dOi: 10.1093/glycob/cwv108.

80. Kishikawa T, Ghazizadeh M, Sasaki Y, Springer GF. Specific role of T and Tn tumor-associated antigens in adhesion between a human breast carcinoma cell line and normal human breast epithelial cell line. Jpn. J. Cancer Res.1999; 90: 326-332.

81. Lisowska E. Tn Antigens and their significance in Oncology. Acta Biochim. Pol. 1995;42: 11-17.

82. Dotan N. Anti-glycan antibodies as biomarkers for diagnosis and prognosis. Lupus. 2006;15:442-450.

83. Arnoudse CA, García JJ, Saeland E, Van Kooyk Y. Recognition of tumor glycans by antigen-presenting cells. Curr. Opinion Immunol. 2005; 17: 1-7.

84. PrendergasT JM, Galvao Da Silva AP, Eavarone DA, Ghaderi D, Zhang M, Brady D, Wicks J, Desander J, Behrens J, Rueda BR. Novel anti-Sialyl-Tn monoclonal antibodies and antibody-drug conjugates demonstrate tumor specificity and anti-tumor activity. MAbs. 2017;9(4):615-627. dOi: 10.1080/19420862.2017.1290752

85. Bonomelli C, Crispin M, Scanlan CN, Doores KJ. Hiv Glycomics and Glycoproteomics. In: Pantophlet R. (eds). Hiv glycans in infection and immunity. New York, NY: Springer; 2014.

86. Wang D. Glyco-epitope diversity: An evolving area of glycomics research and biomarker discovery. Journal of Proteomics & Bioinformatics, 2014; 07(02). dOi:10.4172/jpb.10000e24

87. Lo-man R, Vichier-Guerre S, Bay S, Deriaud E, Cantacuzene D, Leclerc C. Anti-tumor immunity provided by synthetic multiple antigen glycopeptide displaying a tri-Tn glycotope. J. Immunol. 16: 2829-2854.2001

Page 244: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

244 • Introducción al análisis estructural de proteínas y glicoproteínas

88. Vichier–Guerre S, Lo-man R, Huteau V, Deriaud E, Leclerc C, Bay S. Synthesis and immunological evaluation of an antitumor neoglycopeptide vaccine bearing a novel homoserine Tn antigen. Bioorg. Medicinal Chem Letters. 2004; 14: 3567-3570.

89. Miyajima K, Takahiro N, Kiyoshi I, Kazuo A. Synthesis of Tn and sialil Tn antigen-lipid and analog conjugates for synthetic vaccines. Chem. Pharm. Bull. Tokyo. 1997;45: 1544-1546.

90. Bay S, Loman R, Osinaga E, Nakada H, Leclerc C, Cantacuzene D. Preparation of a multiple antigen glycopeptide (mag) carrying the Tn antigen-A possible approach to a synthetic carbohydrate vaccine. J. Peptide Res. 1997;49: 620-625.

Page 245: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Capítulo siete

Bioinformática estructural:

aplicaciones del modelamiento estructural de

proteínas

Page 246: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural
Page 247: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Bioinformática estructural: aplicaciones del modelamiento estructural de proteínas • 247

A continuación, se mencionarán algunos aspectos importantes para tener en cuenta cuando se realizan estudios computacionales de estructura de proteínas, haciendo énfasis en la predicción, modelamiento y alineamiento estructural como herramientas clave para el entendimiento de la función de la proteína y el análisis conformacional enfocado al diseño de drogas. Este campo de la Bioinformática, que se conoce como Bioinformática Es-tructural, ha crecido enormemente en los últimos años y ha generado un nuevo campo de investigación que agrupa a diferentes instituciones a nivel mundial, cuyo principal objetivo es desarrollar herramientas que permitan generar modelos estructurales de las proteínas basados en su secuencia y que ofrezcan resultados comparables a los obtenidos por métodos expe-rimentales (rmn y rayos X), pero sin el gasto de tiempo y dinero que se requiere para estos.

Otro aspecto a tener en cuenta es que la información proveniente de la genómica y la identificación de secuencias de proteínas nuevas crecen a un ritmo mucho más rápido que los datos estructurales. Por esto, es intere-sante contrastar la cantidad de secuencias reportadas en el National Center of Biotechnology (ncbi) a la fecha de edición de este escrito (superior a 73 000 000 entradas), con el número de estructuras reportadas a la misma fecha en el Protein Data Bank (pdb) que es mucho menor (81 755 entradas), es decir que los datos estructurales solo corresponden a cerca del 0.11 % de los datos de secuencia actuales. Debido a esta gran diferencia en los datos de secuencia contra los de estructura es importante reconocer cuáles son las herramientas de las que disponemos en la actualidad para analizar una secuencia peptídica y cómo generar modelos estructurales a partir de esta. Esto es posible ya que las proteínas presentan unos patrones de plegamien-to que se repite en muchas de ellas y que se muestra claramente en las estadísticas del pdb sobre crecimiento de plegamientos contra información estructural total reportada en esta base de datos (81 755 entradas), en la que se evidencia que desde el año 2008 no se han reportado plegamientos nuevos (1393 plegamientos, de acuerdo a clasificación de Scop), a pesar que el número de estructuras sí ha aumentado en los últimos años.

La estructura terciaria de las proteínas está estrechamente relacionada con su función biológica, por lo que proteínas con funciones similares mues-tran un cierto grado de similaridad en sus diferentes niveles estructurales, incluyendo lógicamente el primario [1, 2]. La estructura primaria de una proteína permite hacer un análisis de sus propiedades fisicoquímicas y pre-decir algunas características que son útiles al momento de iniciar proyectos de modelamiento de estructura terciaria de estas. Por ejemplo, en Expasy (www.expasy.org) se encuentran una serie de programas que permite calcular el peso molecular y el punto isoeléctrico de acuerdo a la secuencia, como Compute pI/mW (http://web.expasy.org/compute_pi/), lo que puede dar una idea de la posible ubicación de estas proteínas, si se utilizaran técnicas

Page 248: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

248 • Introducción al análisis estructural de proteínas y glicoproteínas

experimentales como electroforesis (sds-Page) o isoelectroenfoque, o si se planeara utilizar algunas otras técnicas como intercambiadores iónicos o soportes de filtración. Lógicamente, este dato es un cálculo basado única-mente en los aminoácidos que la conforman, la cual puede variar si sobre esta se presentan modificaciones postraduccionales como glicosilaciones, sulfonaciones, entre otras.

A continuación, veremos las herramientas y la forma de analizar una secuencia de aminoácidos hasta llegar a generar datos estructurales y fun-cionales de esta. También veremos cómo se puede utilizar esta metodología en problemas como el diseño de drogas de origen peptídico.

Predicción de estructura secundaria y terciaria de proteínas

El mayor objetivo de la predicción de estructura de proteínas es la estima-ción de la ubicación espacial de cada uno de los átomos de los aminoácidos de una proteína por métodos computacionales [3]. Dada la secuencia de aminoácidos de una proteína globular monomérica que se encuentre en una solución acuosa y a pH y temperatura fisiológicos, los objetivos de la predicción son determinar: 1) todos los segmentos helicales y hebras beta, 2) las parejas de hebras beta que pueden formar hojas beta, 3) todos los puentes disulfuro si las cisteínas que están presentes, 4) los loops que co-nectan los elementos de estructura secundaria y 5) el plegamiento para la formación de la estructura tridimensional [4].

Dependiendo de la disponibilidad de moldes de proteínas homólogas en la base de datos pdb, la predicción de estructura se puede categorizar como modelamiento basado en moldes (tbm) y modelamiento libre (fm). De los dos, tbm es un método más adecuado para la predicción ya que se basa en moldes de estructuras de proteínas de las que se conoce su estructura tridimensional por métodos experimentales (generalmente, cristalografía de rayos X, o resonancia magnética nuclear) y el reto de estos métodos es la construcción de plegamientos adecuados, tan cercanos como sea posible a la proteína en un estado nativo, siempre y cuando se tenga un molde adecuado. Actualmente, la utilidad de diferentes métodos de predicción de estructura de proteínas ha sido demostrada en algunas aplicaciones médicas y biológicas [3].

Page 249: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Bioinformática estructural: aplicaciones del modelamiento estructural de proteínas • 249

Métodos para predecir estructura secundaria de proteínas

Partiendo de un punto de vista estructural, es útil pensar en las proteínas como uniones de varios péptidos, consistentes en átomos de cadenas prin-cipales (backbone) sucesivas, unidas por enlaces peptídicos. En las estructu-ras de proteínas, los átomos de cada uno de los péptidos están fijos en un plano con ángulos y longitudes de enlace similares en todas las unidades. Cada péptido tiene esencialmente solo dos grados de libertad, dados por la libertad de rotación alrededor de sus enlaces N-C y C-C (ϕ y φ, res-pectivamente). La conformación del esqueleto de una proteína (backbone) puede ser entonces especificada con una serie de ángulos y longitudes de enlace, ya que existen solamente ciertas combinaciones posibles debido a los impedimentos estéricos entre los átomos del esqueleto de la proteína y los átomos de las cadenas laterales de los aminoácidos que se encuentran en ella [5].

Otro aspecto para tener en cuenta es el efecto hidrofóbico, ya que en el interior de las proteínas solubles hay un núcleo hidrofóbico, en el que, generalmente, se localizan sitios importantes para la función de estas. Sin embargo, el esqueleto de una proteína es altamente polar y esto no es favorable para el núcleo hidrofóbico, por lo que los grupos polares del esqueleto son neutralizados por los puentes de hidrógeno que se forman intracatenariamente. Estos puentes, a su vez, son la base del arreglo local que se obtiene en la cadena polipeptídica y que originan las estructuras secundarias regulares: hélices alfa y hojas beta (figura 1).

Figura 1. Representación de estructuras secundarias de proteínas

Page 250: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

250 • Introducción al análisis estructural de proteínas y glicoproteínas

Teniendo en cuenta los aspectos mencionados anteriormente y todo el conocimiento acumulado sobre las características de los arreglos de estruc-tura secundaria encontrados en las proteínas, se han desarrollado algunos métodos que permiten predecir, partiendo de su secuencia, el posible arreglo en estructuras secundarias conocidas. Los primeros programas usados para predicción de estructura secundaria consideraban solamente las estadísticas y propiedades individuales de los aminoácidos presentes en la cadena. Estos programas eran deficientes por la poca información estructural que había en ese momento. Hoy en día, el algoritmo más usado, se ha desarrollado a partir de los datos de Chou y Fasman [6] quienes usaron una combinación de reglas heurísticas y estadísticas para llegar a la predicción.

Chou y Fasman usaron un grupo de estructuras de proteínas resueltas experimentalmente y calcularon “propensiones” para cada uno de los ami-noácidos (ai), en cada conformación estructural (si), tomando la frecuencia de aparición de cada uno de los aminoácidos en cada una de las confor-maciones estructurales y normalizando los datos para llegar a determinar la posibilidad de aparición de cada uno de los aminoácidos en los patrones estructurales principales (hojas β, hélices α y estructuras al azar). Estas pro-pensiones (tabla 1) corresponden al concepto básico más importante en la predicción de la estructura secundaria de proteínas, diferentes aminoácidos ocurren preferentemente en diferentes elementos de estructura secundaria.

Una vez las propensiones son calculadas, estas son usadas para categorizar los aminoácidos como formadores de hélices (H o h, dependiendo de su mayor o menor probabilidad), disruptores de hélices (B o b, dependiendo de su mayor o menor probabilidad), o indiferentes para hélices (I o i, depen-diendo de su mayor o menor probabilidad) (tabla 1). Estas mismas categorías se emplean para los aminoácidos respecto a hojas beta o estructuras al azar (denominadas como giros). Posteriormente, se evalúan las propensiones encontradas para aminoácidos consecutivos en la secuencia y se determi-nan posibles “sitios de nucleación” a partir de los cuales se puede señalar la posibilidad de encontrar una estructura secundaria en ese segmento.

A partir de la información de las propensiones, la precisión de la pre-dicción alcanzada con la metodología llegó a estar entre un 50 % a 60 %, dependiendo de las características de la proteína a estudiar. Sin embargo, para estudios basados en estructura de proteínas, este porcentaje de preci-sión es muy bajo y poco confiable, por lo que se han desarrollado nuevos modelos de predicción que han superado este valor.

El método gOr fue propuesto inicialmente por Garnier et al. [7] y nom-brado de esa manera por sus autores: Garnier, Osguthorpe y Robson. Este método intenta incluir la información de un segmento más largo de la cadena polipeptídica para llegar a la predicción de la estructura secunda-ria. En lugar de utilizar las propensiones para un solo residuo, calcula las propensiones para todos los residuos dependiendo de la posición en la que

Page 251: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Bioinformática estructural: aplicaciones del modelamiento estructural de proteínas • 251

Tabla 1. Parámetros de Chou-Fasman para establecer propensiones de cada uno

de los aminoácidos a formar estructuras alfa (Pα), beta (Pβ) o al azar (Pt)

Residuo Pα Residuo Pβ Residuo Pt

Glu 1.51 Hα Val 1.70 Hβ Asn 1.56

Met 1.45 Ile 1.60 Gly 1.56

Ala 1.42 Tyr 1.47 Pro 1.52

Leu 1.21 Phe 1.38 hβ Asp 1.46

Lys 1.16 hα Trp 1.37 Ser 1.43

Phe 1.13 Leu 1.30 Cys 1.19

Gln 1.11 Cys 1.19 Tyr 1.14

Trp 1.08 Thr 1.19 Lys 1.01

Ile 1.08 Gln 1.10 Gln 0.98

Val 1.06 Met 1.05 Thr 0.96

Asp 1.01 Iα Arg 0.93 iβ Trp 0.96

His 1.00 Asn 0.89 Arg 0.95

Arg 0.96 iα His 0.87 His 0.95

Thr 0.83 Ala 0.83 Glu 0.74

Ser 0.77 Ser 0.75 bβ Ala 0.66

Cys 0.70 Gly 0.75 Met 0.60

Tyr 0.69 bα Lys 0.74 Phe 0.60

Asn 0.67 Pro 0.55 Bβ Leu 0.59

Pro 0.57 Bα Asp 0.54 Val 0.50

Gly 0.57 Glu 0.37 Ile 0.47

Fuente: [6, p. 223].

se encuentre. Así, la predicción es influenciada no solo por el aminoácido como tal sino también por los vecinos de este [8]. Las tablas de propensio-nes reflejan el hecho de que los residuos cargados positivamente están más frecuentemente localizados en el extremo carboxi terminal de las hélices y que los residuos cargados negativamente se localizan, preferencialmente, sobre el extremo amino terminal.

El método gOr usa básicamente teoría de la información y estadísti-ca Bayesiana simple. Este método ha sido modificado constantemente y mejorado durante las últimas décadas [9, 10]Este método intenta incluir la información de un segmento más largo de la cadena polipeptídica para llegar a la predicción de la estructura secundaria. En lugar de utilizar las propensiones para un solo residuo, calcula las propensiones para todos los

Page 252: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

252 • Introducción al análisis estructural de proteínas y glicoproteínas

residuos dependiendo de la posición en la que se encuentre. Así, la pre-dicción es influenciada no solo por el aminoácido como tal sino también por los vecinos de este [8]. Las tablas de propensiones reflejan el hecho de que los residuos cargados positivamente están más frecuentemente lo-calizados en el extremo carboxi terminal de las hélices y que los residuos cargados negativamente se localizan, preferencialmente, sobre el extremo amino terminal.

El método gOr usa básicamente teoría de la información y estadística Bayesiana simple. Este método ha sido modificado constantemente y me-jorado durante las últimas décadas [9, 10].La primera versión del método (gOr-I) usó una base de datos pequeña, con lo cual se consideraron pocos residuos. gOr-II usó una base de datos de 75 proteínas con cerca de 13000 residuos [8]. Estas dos versiones predicen cuatro conformaciones (H, hélice; E, beta pliegues; C, coil y T, vueltas) y utilizan frecuencia sencilla de infor-mación (singlets) dentro de la ventana para la predicción, lo que se conoce como información direccional. gOr-iii utiliza información adicional sobre las frecuencias de pares (doublets) de residuos en la ventana, de acuerdo a información de la misma base de datos de las versiones anteriores [9]. En gOr-iii el número de conformaciones predichas corresponde a las tres indicadas normalmente (H, E, y C). La versión gOr-IV surge de una base de datos de 267 proteínas las cuales corresponden a 63566 residuos [10]de 267 proteínas las cuales corresponden a 63566 residuos [10]. gOr-IV usa una ventana de 17 residuos, lo cual indica que para la predicción de un residuo se tienen en cuenta los 8 residuos más cercanos a lado y lado de este, a lo largo de la ventana. gOr-IV usa una ventana de 17 residuos, lo cual indica que para la predicción de un residuo se tienen en cuenta los 8 residuos más cercanos a lado y lado de este, a lo largo de la ventana. El estado conformacional de un residuo dado en la secuencia depende del tipo de cadena lateral del aminoácido, así como de los residuos vecinos dentro de la ventana de trabajo. La función de información de un evento complejo puede ser descompuesta en información de eventos simples y sumada, de acuerdo a la teoría de información. El método gOr-IV calcula la función de información como una suma de la información proveniente de residuos sencillos (singlets) y pares de residuos (doublets) dentro de la ventana de trabajo.

Una gran ventaja del método gOr sobre otros métodos es que identifica los factores que están incluidos en el análisis y calcula probabilidades para los tres estados conformacionales. Otra ventaja es que, computacionalmente, es rápido y con poco gasto de memoria. Una de las últimas versiones de este método, gOr-V, aplica el algoritmo de gOr-IV a alineamientos múltiples de secuencias. Los gaps en los alineamientos son usualmente omitidos por el algoritmo gOr durante el cálculo de probabilidades de conformación de cada residuo en la matriz del alineamiento múltiple, pero la información

Page 253: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Bioinformática estructural: aplicaciones del modelamiento estructural de proteínas • 253

sobre la posición del gap se mantiene [11]. La principal modificación reali-zada a gOr-IV fue el estudio sistemático de los métodos gOr y la utilización de alineamientos múltiples (Psiblast) para incrementar la precisión de la predicción de estructura secundaria de proteínas.

Las redes neuronales artificiales (ann) se basan en el mecanismo de conexiones sinápticas de las neuronas del cerebro, en el que una entrada es procesada en varios niveles y procesada hasta obtener una salida final. En la predicción de la estructura secundaria de proteínas, la información de un aminoácido central de cada entrada es modificada por un factor de peso y es enviada a otro nivel de la red hasta que este pase a la capa de sa-lida. La capa de salida, entonces, decide si el residuo se plegará en forma de hélice, pliegue o coil. Qian y Sejnowski [12] implementaron el uso de redes neuronales en la predicción de estructura secundaria de proteínas. Las redes neuronales aprenden a clasificar los vectores de entrada en dos o más categorías y se retroalimentan con la información de dos o más capas conectadas. La primera capa es la de entrada y la última es la de salida, la cual indica la categoría predicha para la entrada. Todas las demás capas se denominan capas ocultas.

Holley y Karplus [13] construyeron una red neuronal que intentaba pre-decir la estructura secundaria de un residuo considerando los 16 residuos vecinos (8 antes y 8 después). Cada uno de esos residuos es representado con 21 bits, correspondiente a los 20 aminoácidos y un bit extra por si la ventana se sobrelapa con el comienzo o fin de la secuencia. Así, cada ejemplo es representado por una matriz de 17 × 21 bits, con 17 entradas diferentes de cero. La topología de la red neuronal tiene una capa oculta con dos nodos y dos nodos de salida, uno correspondiente a hélice alfa y otro a pliegue beta (figura 2). Para el entrenamiento de la red, si la estructura secundaria del residuo de la mitad es hélice, entonces la salida de hélice tiene establecido el valor de 1 y la de pliegue, establecido en 0. Para una nueva secuencia, la hélice es asignada a cuatro o más residuos adyacentes con un valor de salida de hélice mayor que el de salida de pliegues y algún umbral. Los pliegues son asignados de manera similar, aunque solo dos residuos adyacentes son requeridos para una salida de pliegues.

Qian y Sejnowski [12] usaron una red neuronal con una sola capa ocul-ta de 40 unidades para este propósito. Una ventana móvil de 13 residuos consecutivos fue usada como entrada a la red para predecir la estructura secundaria del residuo en mitad de la ventana. La ventana se usa para incor-porar la influencia de los residuos vecinos en la predicción. La red usaba tres nodos de salida, cada uno representaba una clase de estructura secundaria. Los 20 residuos distintos fueron representados usando una codificación or-togonal en la cual cada residuo es asignado a un vector binario único (100, 011, 001 para alfa, beta y coil, respectivamente). Para la red, la dimensión de la matriz de entrada fue de tamaño de (20 bits binarios) × (13 residuos)

Page 254: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

254 • Introducción al análisis estructural de proteínas y glicoproteínas

-8 -7 -6 -5 -4 -3 -2 -1 0 +1 +2 +3 +4 +5 +6 +7 +8

Hélice Pliegue

Figura 2. Representación de la estructura de la red neuronal

Fuente: [13, p. 153].

= 260. Después de la etapa de entrenamiento con el algoritmo estándar, la red arrojó resultados de 64.3 % de precisión de la predicción.

Maclin and Shalvik [14] combinaron la estadística de los residuos presen-tada por Chou y Fasman [6] en el diseño de su red neuronal para mejorar la precisión de la predicción. Sin embargo, Rost y Sander [15] habían incor-porado lo que ellos llamaron información evolutiva a sus redes neuronales. Este fue el primer intento de introducir los efectos generados por procesos evolutivos a los modelos predictivos. La red neuronal de Rost y Sander alcanzó una precisión de 71.9 % en la predicción (pHd, Profile network from HeiDelberg). Posterior a este resultado, se ha reportado que servidores como ssPro han alcanzado una precisión del 74.5 % en la predicción [16].

Predicción de estructura terciaria Los métodos de predicción de estructura terciaria de proteínas han sido clasificado en tres categorías, dependiendo de la similaridad de esta con la disponibilidad de estructuras experimentalmente determinadas y reportadas en pdb: modelamiento de plegamiento ab initio (o de novo), modelamiento por compactación y modelamiento por threading.

• Ab initio: por definición, el modelamiento ab initio es referido a los métodos que están basados en las leyes de primeros principios de la física y química. El principio de estos métodos es que el estado nativo de la proteína se encuentra en un mínimo global de energía libre [17]. Estos métodos tratan de mostrar el plegamiento de una proteína dada a partir de su secuencia, usando varios campos de fuerza y algoritmos de búsqueda conformacional extensiva. Sin embargo, hasta el momento no se han logrado resultados muy

Page 255: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Bioinformática estructural: aplicaciones del modelamiento estructural de proteínas • 255

precisos y aplicables usando programas basados en estos princi-pios fisicoquímicos. Los métodos con mejores resultados usan información evolutiva y comparativa para determinar restricciones espaciales y generar fragmentos estructurales cortos que se usarán para ensamblar la estructura proteica [18, 19]. Esta categoría es conocida como “modelamiento libre” (fm) en los experimentos del Casp (Critical Assessment of Protein Structure Prediction), ya que muchos de los métodos no se basan realmente en los primeros principios [20]. Una limitante de estos métodos es el tamaño de la secuencia a utilizar, ya que hay un elevado número de elementos de estructura secundaria que se deben asignar a la proteína, lo cual resulta en un elevado número de posibles arreglos de ple-gamientos y en que los campos de fuerza usados en los métodos ab initio no son capaces de reconocer el plegamiento correcto, o más adecuado, entre las numerosas opciones generadas. Por lo tanto, incrementar la precisión del campo de fuerza y el poder de la búsqueda conformacional son los aspectos más importantes a desarrollar para solucionar el problema [3].

• Modelamiento por comparación (cm) o por homología. Con este modelamiento la estructura de la proteína es construi-

da al comparar la secuencia de la proteína de interés (blanco) con una proteína evolutivamente relacionada de estructura conocida (molde o plantilla) en el pdb. Para proteínas blanco que posean homólogos en el pdb con una identidad superior al 50 %, modelos adecuados pueden llegar a ser construidos. Los esqueletos de los modelos generados usando las técnicas cm pueden tener una pre-cisión de entre 1Å y 2 Å de rmsd (Root Mean Square Deviation) con respecto a la estructura nativa. Para proteínas blanco que tienen un molde con una identidad entre 30 % y 50 % de identidad, el modelamiento es menos preciso pero los modelos, usualmente, tienen cerca de un 85 % de sus regiones nucleares en un rmsd de 2 Å a 4 Å respecto a la estructura nativa, en las que los errores se encuentran principalmente en las regiones de loops [21].

Sin embargo, cuando la identidad entre la secuencia blanco y el molde es menor de 30 %, la precisión del modelamiento por cm decrece debido a los errores en el alineamiento y a la pérdida de coincidencias significativas con el molde. cm construye mo-delos al copiar las estructuras alineadas y al satisfacer restriccio-nes de distancia y contacto del molde [22], un límite esencial de esta metodología es que los modelos, usualmente, se encuentran más cercanos a la estructura molde que a la estructura nativa de la proteína blanco [23, 24]. En consecuencia, uno de los retos más importantes del modelamiento por cm es cómo refinar los

Page 256: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

256 • Introducción al análisis estructural de proteínas y glicoproteínas

modelos para que se parezcan más a la estructura nativa de las proteínas blanco que a la de sus moldes iniciales.

• Threading (o reconocimiento del plegamiento): corresponde al modelamiento en el que se identifican proteínas molde en pdb con un plegamiento similar o con motivos estructurales simila-res a la proteína blanco. Es similar a cm en el sentido que ambas metodologías tratan de construir un modelo estructural a partir de datos estructurales obtenidos experimentalmente de proteínas molde. Sin embargo, partiendo del hecho que muchas proteínas pueden tener plegamientos similares, el threading trata de detec-tar alineamientos blanco-molde sin tener en cuenta la relación evolutiva. La identificación de los alineamientos blanco-molde precisos es un gran problema cuando la identidad en secuencia es baja. En este punto y debido a que muchas proteínas se pueden alinear en diferentes sectores de la proteína blanco, el diseño de una función de score del alineamiento precisa es esencial en la eficiencia de estos programas. Los scores de alineamiento común-mente usados incluyen alineamiento de estructura secundaria, o alineamientos secuencia-perfil estructural [25], alineamientos de secuencia perfil-perfil [26, 27] y contactos residuo-residuo [28, 29]. Sin embargo, los mejores scores de alineamiento se logran usualmente con programación dinámica [30] o con modelos ocultos de Markov [31]. Adicionalmente, se ha demostrado que métodos con funciones de score compuestas incluyendo múltiples rasgos estructurales (accesibilidad al solvente, ángulos de torsión, hidrofobicidad, entre otras) pueden brindar datos importantes en la identificación de la proteína molde [32, 33] y en la generación del modelo estructural de la proteína blanco.

Metodología sugerida para generar modelos estructurales

A continuación se muestra un esquema para la predicción de estructura de proteínas, el cual incluye cinco pasos principales (figura 3): (a) identificación de las estructuras molde y construcción de alineamientos blanco-molde; (b) construcción del modelo inicial en regiones alineadas a partir de alinea-mientos con moldes y regiones no alineadas por modelamiento ab initio; (c) ensamblaje estructural y simulaciones de refinamiento; (d) construcción y refinamiento del modelo a nivel atómico y (e) selección del modelo.

Page 257: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Bioinformática estructural: aplicaciones del modelamiento estructural de proteínas • 257

a) Identificación de moldes y alineamiento: este es indudablemente el pri-mer paso en el proceso de predicción de estructura terciaria de proteínas. Las herramientas más sencillas usan alineamientos de secuencia basados en matrices de sustitución pam o Blosum que usan algoritmos de progra-mación dinámica como Needleman-Wunsch o Smith-Waterman. Cuando existen proteínas con moldes homólogos con identidades de secuencia de 30 % o superior en las bases de datos estructurales, los modelos generados por esta metodología son generalmente de alta precisión. Sin embargo, cuando la identidad de secuencia con el molde es menor a ese 30 %, los errores en alineamientos y modelamientos crecen rápidamente. Para la mayoría de proteínas, es difícil identificar homólogos cercanos en bases de datos estructurales usando el método de alineamiento secuencia-secuencia. Otros métodos usan algoritmos de “ensamblaje” o threading para generar los

Búsqueda en librería deestructuras molde

e

d

c

bNo Si

a Secuencia de laproteína blanco

estructuras moldeBúsqueda en librería de

Moldedisponible?

Iniciar modelo usando ab initio Iniciar modelo a partir delalineamiento blanco-molde

Completar regiones no alineadasmediante modelamiento ab initio

Simulaciones y ensamblajeestructural

Selección y evaluación delmodelo

construcción y refinamiento delmodelo a nivel atómico

Figura 3. Metodología propuesta para la generación de modelos estructurales a partir de secuencia blanco

Fuente: [3, p. 988].

Page 258: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

258 • Introducción al análisis estructural de proteínas y glicoproteínas

modelos. En esta metodología se pretende identificar patrones estructurales en segmentos de la secuencia patrón, así sean a partir de diferentes moldes, y unirlos o ensamblarlos para generar un modelo estructural único, con lo cual se pueden producir modelos estructurales de muy buena precisión, pero también se corre el riesgo de trabajar con moldes errados en algunos segmentos en particular y obtener un modelo totalmente erróneo.

Muchas veces un programa de threading falla en identificar el mejor ho-mólogo, es recomendable tener información de alineamientos realizados por varios programas de threading, con lo que se incrementa la cobertura de posibles moldes. Así mismo, la información consenso de alineamientos con varios moldes puede ser usada para identificar el mejor molde y los residuos estructuralmente conservados. Uno de los primeros servidores de threading que tiene en cuenta esta posibilidad es 3D-Jury [34], el cual colecta resultados de alineamientos de varios servidores en línea a través de búsquedas por internet. Sin embargo, a veces se tiene el inconveniente de la disponibilidad de los servidores correspondientes para acceder a ellos y obtener los resultados deseados. Una solución se encontró con el meta-ser-vidor Lomets [35], que tiene todos los programas instalados localmente, con lo cual se logra mejorar la velocidad y veracidad de los resultados. Lomets consiste en 9 programas de threading, basados en diferentes métodos de alineamiento entre los cuales se incluyen alineamiento perfil-perfil (Muster, ppa, sp3, Sparks), modelos ocultos de Markov (HHsearch, sam-t02), perfiles estructurales (Fugue) y alineamientos basados en contactos (Prospect2, Print).

b) Construcción del modelo inicial usando alineamiento blanco-molde: una vez el molde es seleccionado basado en los resultados de alineamiento, el siguiente paso es generar modelos iniciales de la proteína blanco, al copiar las coordenadas de carbonos alfa (X, Y, Z) de los residuos del molde en los residuos que correspondan en la secuencia blanco. La conectividad de la cadena es requerida y, en caso que no se obtenga en el modelo inicial, se pueden usar otros métodos para construir los modelos estructurales de las regiones sin alinear. Por ejemplo, I-Tasser construye modelos completos al llenar los espacios usando vectores de longitudes variables de 3.26 Å a 4.35 Å en el camino de los enlaces carbono alfa-carbono alfa. Para garantizar que el último paso del camino se encuentra con el primer carbono alfa del siguiente fragmento del molde, la distancia (l) entre el último carbono alfa del primer fragmento y el primer carbono alfa del segundo fragmento es revisada en cada paso y solamente los caminos con l < 3, 54n Å son per-mitidos, en el que n es el número de enlaces entre carbonos alfa faltantes en el camino. Si el espacio con respecto al molde es muy grande, un gran enlace carbono alfa-carbono alfa es mantenido hasta el final del camino y se procederá a ingresar los residuos faltantes en el paso siguiente de en-samblaje estructural [3].

Page 259: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Bioinformática estructural: aplicaciones del modelamiento estructural de proteínas • 259

c) Ensamblaje estructural y simulaciones de refinamiento: una vez un mo-delo inicial es generado, las simulaciones de refinamiento se deben realizar para organizar la topología global y la estructura local de la cadena peptí-dica. El éxito de las simulaciones de refinamiento depende de la precisión del campo de fuerza y la eficiencia del motor de búsqueda. El campo de fuerza provee información sobre las interacciones atómicas teniendo en cuenta diferentes factores que pueden influir en la ubicación del átomo en un sitio en particular. Sin embargo, debido al tamaño de las proteínas, es un proceso largo y computacionalmente costoso de desarrollar. Los po-tenciales aplicados en los diferentes campos de fuerza se han derivado de las regularidades presentadas en la base de datos pdb y han mostrado ser eficientes tanto para el reconocimiento de estructura de proteínas como para las simulaciones de ensamblaje de plegamientos [36, 37], en los que la selección apropiada de los estados de referencia y rasgos estructurales son de vital importancia [38]. Adicionalmente, teniendo en cuenta el campo de fuerza utilizado es importante identificar el mínimo global de energía lo cual es complicado ya que cuando se aplican los campos de fuerza para refinar la estructura mediante minimizaciones de energía, es posible seleccionar una en la que se encuentre un mínimo local energético y no corresponda necesariamente el mínimo global, causando errores en la simulación del plegamiento. Una forma de agilizar el proceso de búsqueda computacional es reducir la entropía conformacional. Por ejemplo, en Touchstone-II [39], los autores restringieron los cambios conformacionales de la estructura proteica en un sistema de celda cristalina. En Rosetta [18] y en I-Tasser [40] las estructuras de fragmentos fueron copiadas de los moldes en pdb y se mantuvieron rígidas durante la simulación. Esas técnicas pueden ayudar significativamente, ya que reducen la entropía de búsqueda porque restringe los movimientos conformacionales [3].

Finalmente, un aspecto importante en la búsqueda conformacional de proteínas es la utilización de algoritmos apropiados de optimización, como simulaciones por Dinámica Molecular (md) y Monte Carlo (mc), las cuales básicamente deciden la eficiencia de todas las búsquedas conformacionales [18, 19, 39, 41].

d) Construcción y refinamiento del modelo a nivel atómico: Los métodos usados hasta el momento representan la proteína en un modelo reducido y los átomos del esqueleto y cadenas laterales necesitan ser adicionados para la construcción de un modelo que contemple todos los átomos y, así, ob-tener un modelo que permita ser usado y validado. Para esto es necesario aplicar las reglas de la física y los datos conseguidos de proteínas obtenidas experimentalmente como longitudes de enlace, restricciones de ángulos, sobrelapamientos estéricos e interacciones tipo puentes de hidrógeno. Va-rios algoritmos se han desarrollado para construir modelos de todos los

Page 260: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

260 • Introducción al análisis estructural de proteínas y glicoproteínas

átomos a partir de modelos reducidos, como por ejemplo Maxsprout [42], Pulchra [43], Remo [44], entre otros. Varios programas intentan refinar la topología de los modelos paso a paso a medida que se agregan los átomos ausentes [45].

e) Evaluación y selección del modelo: varias conformaciones estructura-les son el resultado de las simulaciones de ensamblaje estructural. El ob-jetivo del último paso es seleccionar el modelo 3D de mayor calidad, de acuerdo a un correcto plegamiento de todas las conformaciones posibles que se relacionan más con la estructura nativa. Una prueba inicial es rea-lizar una evaluación estereoquímica y determinar cómo se encuentra el modelo respecto a regularidades estructurales encontradas en estructuras determinadas experimentalmente. Sin embargo, muchas veces, los rasgos estructurales obtenidos no corresponden necesariamente con la estructura nativa buscada. Existen varias formas de realizar la evaluación del modelo, entre las cuales se cuentan herramientas estadísticas como el Z-score [46], o topológicas como el diagrama de Ramachandran, entre otros. Debido a la importancia de este aspecto, se ha generado una nueva categoría en los experimentos realizados en Casp, la cual se denomina programas de valoración de la calidad de un modelo (mqap) [47-49], que intenta identi-ficar los mejores modelos a partir de todas las estructuras generadas por la comunidad de predictores. Generalmente, el mejor método de seleccionar modelos en mqap está basado en consensos de modelos generados por di-ferentes programas [3].

Los programas y servidores desarrollados hasta el momento para reali-zar predicciones y modelamientos de estructuras de proteínas se resumen en la tabla 2.

Tabla 2. Lista de programas disponibles para predicción de estructura terciaria de proteínas

Servidores en línea

I-Tasser http://zhanglab.ccmb.med.umich.edu/I-TASSER/ tbm+fm

Robetta http://robetta.bakerlab.org/ fm

ModWeb https://modbase.compbio.ucsf.edu/scgi/modweb.cgi tbm

SwissModel http://swissmodel.expasy.org/ tbm

HHpred http://hhpred.tuebingen.mpg.de/hhpred tbm

chunk-Tasser http://cssb.biology.gatech.edu/skolnick/webservice/chunk-TAS-SER/index.html

tbm+fm

Quark http://zhanglab.ccmb.med.umich.edu/QUARK/ fm

Phyre http://www.sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id=index tbm

Page 261: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Bioinformática estructural: aplicaciones del modelamiento estructural de proteínas • 261

SAM-T08 http://compbio.soe.ucsc.edu/SAM_T08/T08-query.html tbm

3D-Jury http://meta.bioinfo.pl tbm (me-ta-server)

Lomets http://zhanglab.ccmb.med.umich.edu/LOMETS/ tbm (meta–server)

PSIpred http://bioinf.cs.ucl.ac.uk/psipred/ tbm+ss

Programas descargables libres

Modeller http://salilab.org/modeller/ tbm

I-Tasser http://zhanglab.ccmb.med.umich.edu/I-TASSER/download/ tbm+fm

Rosetta http://www.rosettacommons.org/software/ fm

HHsearch ftp://toolkit.lmb.uni-muenchen.de/HHsearch/ tbm

Scwrl4 http://dunbrack.fccc.edu/scwrl4/ sc

tbm: template-based modelling. fm: free modelling. ss: secondary structure prediction. sc: si-de-chain structure modelling.

Fuente: [3, p.2].

Aplicaciones La utilidad biológica y biotecnológica de los modelos depende de la preci-sión y calidad de la predicción de estructura (figura 4). Por ejemplo, algu-nos modelos generados por cm usando homólogos cercanos, puede llegar a mostrar los requisitos estructurales para una interacción o estudiar el efecto de mutaciones sobre una estructura en particular. Así mismo, con una buena calidad del modelo generado se puede utilizar esta estructura para determinar la interacción con compuestos presentes en librerías de ligando o compuestos activos y, de esta manera, ser útil en diseño de fár-macos basados en estructura [50]. Por ejemplo Sali y colaboradores [51] evaluaron compuestos presentes en la librería Kegg Drug Library contra el modelo del transportador de norepinefrina (net) generado por cm, descu-briendo y validando experimentalmente nuevos fármacos dirigidos contra esta proteína. En otra aplicación, Giorgetti et al. [52] generaron modelos para obtener la información de fase de datos de difracción de rayos X por remplazamiento molecular y encontraron que la aplicación depende de la calidad de los modelos generados más que de las estructuras iniciales obtenidas de por sí.

Si tenemos en cuenta modelos de resolución media con un rmsd de 2.5 Å a 5 Å respecto a la estructura nativa, son usualmente generados por

Page 262: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

262 • Introducción al análisis estructural de proteínas y glicoproteínas

threading y cm usando como moldes homólogos distantes. Esos modelos pueden ser usados para identificar localizaciones espaciales de residuos fun-cionalmente importantes como sitios activos o sitios de unión de proteínas y las relaciones de mutaciones sobre estos con enfermedades. Por ejemplo, Arakaki et al. [53] evaluó la posibilidad de asignar número de la comisión enzimática (ec) al comparar motivos en sitios activos de estructuras obte-nidas en varias resoluciones y encontraron que los modelos de resolución de 3 Å a 4 Å pueden ser usados para asignar los tres primeros dígitos del número ec con una precisión del 35 %, mientras que la precisión cae a 22 % cuando se usan modelos de 4 Å a 5 Å.

En cuanto a modelos con resolución más baja, pero con topología co-rrecta ya sea usando ab initio o threading débil, tienen también varios usos, incluyendo identificación de dominios, reconocimiento de topología y asignación de familia/superfamilia. Malmstrom et al. [54] modelaron 3338 dominios de proteínas pequeñas (5150 residuos) del genoma de levadura usando Rosetta. La asignación de superfamilias usando Scop fue generada para 404 dominios con buenos porcentajes de confianza, basados en la

Método Aplicaciones

Modelamiento

por homología

Diseño de drogas

0 1

1

2

3

4

5

6

7

8

9

10

0,5

0,3

Threading o

reconocimiento

de plegamiento

Modelamiento

ab initio

RMSD (A)° SCORE DECONFIANZA

Screening de drogas

Docking Molecular

Remplazamiento

molecular

Mutagénesis

Detección de sitios

activos, mutaciones

puntuales, splicing

alternativo

Reconocimiento de

topología, dominios.

Asignación de

familia/superfamilia

Figura 4. Correspondencia aproximada entre calidad del modelamiento, precisión, metodología usada y posibles aplicaciones de los modelos

Fuente: [3, p. 6].

Page 263: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Bioinformática estructural: aplicaciones del modelamiento estructural de proteínas • 263

comparación estructural entre los modelos predichos y las estructuras pre-sentes en Scop. Otras 117 asignaciones adicionales fueron hechas después de integrar las anotaciones hechas en Gene Ontology (gO).

Conclusiones La predicción de la estructura de una proteína ofrece una alternativa teórica, pero debe estar bien fundamentada con respecto a la determinación experi-mental de la estructura. La bioinformática ha mostrado ser una vía eficiente para obtener información estructural cuando las técnicas experimentales no son exitosas o no se cuenta con ellas. Las estructuras de proteínas pre-dichas han sido utilizadas en diferentes campos como el diseño de drogas, identificación de sitios de unión o sitios activos de proteínas, experimentos de mutagénesis, reemplazamientos moleculares, identificación de variación estructural por mutaciones puntuales y su relación con enfermedades, entre otras. Incluso, los modelos construidos a partir de homólogos lejanos o ab initio han sido útiles en la determinación de familia y superfamilia a la que pertenece una proteína o para la determinación de dominios estructurales.

Referencias 1. Chan HS, Dill KA. The protein folding problem. Physics today.

1993;46(2):24-32.2. Voet D, Voet JG. Techniques of protein purification. Biochemistry. New York,

NY: John Wiley and Sons Inc., 1990.75.3. Roy A, Zhang Y. Recognizing protein-ligand binding sites by global structural

alignment and local geometry refinement. Structure. 2012;20(6):987-997.4. Floudas CA, Fung HK, McAllister SR, Mönnigmann M, Rajgaria R.

Advances in protein structure prediction and de novo protein design: A review. Chemical Engineering Science. 2006;61(3):966-988.

5. Singh M, Kim PS. Towards predicting coiled-coil protein interactions. recOmb01: The Fifth Annual International Conference on Computational Molecular Biology. Association for Computing Machinery: Quebec, Montreal, Canada; 2001. 279-286.

6. Chou PY, Fasman GD. Prediction of protein conformation. Biochemistry. 1974;13(2):222-245.

7. Garnier J, Osguthorpe DJ, Robson B. Analysis of the accuracy and implications of simple methods for predicting the secondary structure of globular proteins. Journal of molecular biology. 1978;120(1):97-120.

Page 264: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

264 • Introducción al análisis estructural de proteínas y glicoproteínas

8. Garnier J, Robson B. The gOr method for predicting secondary structures in proteins. Prediction of protein structure and the principles of protein conformation: Springer; 1989. 417-465.

9. Gibrat JF, Garnier J, Robson B. Further developments of protein secondary structure prediction using information theory: new parameters and consideration of residue pairs. Journal of molecular biology. 1987;198(3):425-443.

10. Garnier J, Gibrat JF, Robson B. gOr method for predicting protein secondary structure from amino acid sequence. Methods in enzymology. 266: Elsevier; 1996. 540-553.

11. Kloczkowski A, Ting KL, Jernigan RL, Garnier J. Combining the gOr v algorithm with evolutionary information for protein secondary structure prediction from amino acid sequence. Proteins: Structure, Function and Bioinformatics. 2002;49(2):154-166.

12. Qian N, Sejnowski TJ. Predicting the secondary structure of globular proteins using neural network models. Journal of molecular biology. 1988;202(4):865-884.

13. Holley LH, Karplus M. Protein secondary structure prediction with a neural network. Proceedings of the National Academy of Sciences. 1989;86(1):152-156.

14. Maclin R, Shavlik JW. Using knowledge-based neural networks to improve algorithms: Refining the Chou-Fasman algorithm for protein folding. Machine Learning. 1994;11(2-3):195-215.

15. Rost B, Sander C. Prediction of protein secondary structure at better than 70 % accuracy. Journal of molecular biology. 1993;232(2):584-599.

16. Pollastri G, Przybylski D, Rost B, Baldi P. Improving the prediction of protein secondary structure in three and eight classes using recurrent neural networks and profiles. Proteins: Structure, Function, and Bioinformatics. 2002;47(2):228-235.

17. Anfinsen CB. Principles that govern the folding of protein chains. Science. 1973;181(4096):223-230.

18. Simons KT, Kooperberg C, Huang E, Baker D. Assembly of protein tertiary structures from fragments with similar local sequences using simulated annealing and Bayesian scoring functions. Journal of molecular biology. 1997;268(1):209-225.

19. Xu D, Zhang Y. Ab initio protein structure assembly using continuous structure fragments and optimized knowledge‐based force field. Proteins: Structure, Function and Bioinformatics. 2012;80(7):1715-1735.

20. Moult J, Fidelis K, Kryshtafovych A, Rost B, Tramontano A. Critical assessment of methods of protein structure prediction—Round viii. Proteins: Structure, Function and Bioinformatics. 2009;77(S9):1-4.

Page 265: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Bioinformática estructural: aplicaciones del modelamiento estructural de proteínas • 265

21. Jauch R, Yeo HC, Kolatkar PR, Clarke ND. Assessment of casp7 structure predictions for template free targets. Proteins: Structure, Function, and Bioinformatics. 2007;69(S8):57-67.

22. Martí-Renom MA, Stuart AC, Fiser A, Sánchez R, Melo F, Šali A. Comparative protein structure modeling of genes and genomes. Annual review of biophysics and biomolecular structure. 2000;29(1):291-325.

23. Read RJ, Chavali G. Assessment of casp7 predictions in the high accuracy template‐based modeling category. Proteins: Structure, Function, and Bioinformatics. 2007;69(S8):27-37.

24. Tramontano A, Morea V. Assessment of homology‐based predictions in casp5. Proteins: Structure, Function, and Bioinformatics. 2003;53(S6):352-368.

25. Bowie JU, Luthy R, Eisenberg D. A method to identify protein sequences that fold into a known three-dimensional structure. Science. 1991;253(5016):164-170.

26. Rychlewski L, Jaroszewski L, Li W, Godzik A. Comparison of sequence profiles. Strategies for structural predictions using sequence information. Protein Science. 2000;9(2):232-241.

27. Söding J. Protein homology detection by Hmm–Hmm comparison. Bioinformatics. 2005;21(7):951-960.

28. Skolnick J, Kihara D, Zhang Y. Development and large scale benchmark testing of the prOspectOr_3 threading algorithm. Proteins: Structure, Function, and Bioinformatics. 2004;56(3):502-518.

29. Xu Y, Xu D, Crawford OH, Einstein JR, Larimer F, Uberbacher E, et al. Protein threading by prOspect: a prediction experiment in casp3. Protein engineering. 1999;12(11):899-907.

30. Needleman SB, Wunsch CD. A general method applicable to the search for similarities in the amino acid sequence of two proteins. Journal of molecular biology. 1970;48(3):443-453.

31. Eddy SR. Profile hidden Markov models. Bioinformatics (Oxford, England). 1998;14(9):755-63.

32. Wu S, Zhang Y. muster: improving protein sequence profile–profile alignments by using multiple sources of structure information. Proteins: Structure, Function and Bioinformatics. 2008;72(2):547-556.

33. Yang Y, Faraggi E, Zhao H, Zhou Y. Improving protein fold recognition and template-based modeling by employing probabilistic-based matching between predicted one-dimensional structural properties of query and corresponding native properties of templates. Bioinformatics. 2011;27(15):2076-2082.

34. Ginalski K, Elofsson A, Fischer D, Rychlewski L. 3d-Jury: a simple approach to improve protein structure predictions. Bioinformatics. 2003;19(8):1015-1018.

35. Wu S, Zhang Y. lOmets: a local meta-threading-server for protein structure prediction. Nucleic acids research. 2007;35(10):3375-3382.

Page 266: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

266 • Introducción al análisis estructural de proteínas y glicoproteínas

36. MacCallum JL, Hua L, Schnieders MJ, Pande VS, Jacobson MP, Dill KA. Assessment of the protein‐structure refinement category in casp8. Proteins: Structure, Function, and Bioinformatics. 2009;77(S9):66-80.

37. Summa CM, Levitt M. Near-native structure refinement using in vacuo energy minimization. Proceedings of the National Academy of Sciences. 2007;104(9):3177-3182.

38. Skolnick J. In quest of an empirical potential for protein structure prediction. Current opinion in structural biology. 2006;16(2):166-171.

39. Zhang Y, Kihara D, Skolnick J. Local energy landscape flattening: parallel hyperbolic Monte Carlo sampling of protein folding. Proteins: Structure, Function, and Bioinformatics. 2002;48(2):192-201.

40. Zhang Y. Template‐based modeling and free modeling by i‐tasser in casp7. Proteins: Structure, Function, and Bioinformatics. 2007;69(S8):108-117.

41. Liwo A, Khalili M, Czaplewski C, Kalinowski S, Ołdziej S, Wachucik K, et al. Modification and optimization of the united-residue (unres) potential energy function for canonical simulations. I. Temperature dependence of the effective energy function and tests of the optimization method with single training proteins. The Journal of Physical Chemistry B. 2007;111(1):260-285.

42. Holm L, Sander C. Database algorithm for generating protein backbone and side-chain co-ordinates from a C? trace. Journal of molecular biology. 1991;218(1):183-194.

43. Rotkiewicz P, Skolnick J. Fast procedure for reconstruction of full‐atom protein models from reduced representations. Journal of computational chemistry. 2008;29(9):1460-1465.

44. Li Y, Zhang Y. remO: A new protocol to refine full atomic protein models from C‐alpha traces by optimizing hydrogen‐bonding networks. Proteins: Structure, Function, and Bioinformatics. 2009;76(3):665-676.

45. Zhang J, Liang Y, Zhang Y. Atomic-level protein structure refinement using fragment-guided molecular dynamics conformation sampling. Structure. 2011;19(12):1784-1795.

46. Zhang L, Skolnick J. What should the Z‐score of native protein structures be? Protein science. 1998;7(5):1201-1207.

47. Cozzetto D, Kryshtafovych A, Tramontano A. Evaluation of casp8 model quality predictions. Proteins: Structure, Function, and Bioinformatics. 2009;77(S9):157-166.

48. Fischer D. Servers for protein structure prediction. Current opinion in structural biology. 2006;16(2):178-182.

49. Kryshtafovych A, Fidelis K, Tramontano A. Evaluation of model quality predictions in casp9. Proteins: Structure, Function, and Bioinformatics. 2011;79(S10):91-106.

50. Zhang Y. Protein structure prediction: when is it useful? Current opinion in structural biology. 2009;19(2):145-155.

Page 267: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Bioinformática estructural: aplicaciones del modelamiento estructural de proteínas • 267

51. Schlessinger A, Geier E, Fan H, Irwin JJ, Shoichet BK, Giacomini KM, et al. Structure-based discovery of prescription drugs that interact with the norepinephrine transporter, net. Proceedings of the National Academy of Sciences. 2011;108(38):15810-5.

52. Giorgetti A, Raimondo D, Miele AE, Tramontano A. Evaluating the usefulness of protein structure models for molecular replacement. Bioinformatics. 2005;21(suppl_2):ii72-ii76.

53. Arakaki AK, Zhang Y, Skolnick J. Large-scale assessment of the utility of low-resolution protein structures for biochemical function assignment. Bioinformatics. 2004;20(7):1087-1096.

54. Malmström L, Riffle M, Strauss cem, Chivian D, Davis TN, Bonneau R, et al. Superfamily assignments for the yeast proteome through integration of structure prediction with the gene ontology. plos biology. 2007;5(4). Disponible en: https://doi.org/10.1371/journal.pbio.0050076

Page 268: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural
Page 269: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Editado por la Centro Editorial de la Facultad de Ciencias,Universidad Nacional de Colombia, sede Bogotá,

Fuente principal Baskerllive y Fira SansEn el interior se utilizó papel Bond de 90 gramos

y en la carátula papel esmaltado blanco de 250 gramosSe imprimieron xxx ejemplares en los talleres de xxxxx.

Page 270: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural
Page 271: ntoduccin al análisis estuctual de protenas glicootenasciencias.bogota.unal.edu.co/fileadmin/Facultad_de... · Bogotá, D. C., Colombia, mayo de 2020 Introducción al análisis estructural

Química

textosColección

Los seres vivos están conformados por gran diversidad de proteínas

con diferentes características físicas, químicas, estructurales y funcionales.

Para entender la función de una proteína se necesita conocer su secuencia y,

mejor aún, su estructura tridimensional. Hoy en día es significativo el incremento en el número de secuencias reportadas,

al igual que el aumento en la determinación del número de estructuras

tridimensionales por métodos experimentales e in silico. Todo este conjunto de estudios ha sido de gran importancia en la formulación de los

conceptos modernos de la bioquímica y ha permitido entender la relación que se da entre estructura y función de las proteínas, esto es una premisa

fundamental que guía el quehacer bioquímico. En el presente texto

brindamos una descripción general de algunos de los aspectos más relevantes

sobre los componentes estructurales de proteínas y glicoproteínas, así como

algunas técnicas que se han usado para estudiar cada uno de los niveles

estructurales que se encuentran en ellas.