UNIVERSIDAD CENTRAL DEL ECUADOR · 2018-08-16 · universidad central del ecuador facultad de...

76
UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE CIENCIAS QUÍMICAS CARRERA DE QUÍMICA FARMACÉUTICA IDENTIFICACIÓN DE PROTEÍNAS DE DNA REPLICATION CHECKPOINT EN TRIPANOSOMÁTIDOS, UTILIZANDO HERRAMIENTAS DE BIOINFORMÁTICA Y MODELADO TRIDIMENSIONAL TRABAJO DE TITULACIÓN, MODALIDAD PROYECTO DE INVESTIGACIÓN PREVIO A LA OBTENCIÓN DEL TÍTULO DE QUÍMICO FARMACÉUTICO AUTOR: CARLOS ANDRÉS PARRA CRUZ [email protected] TUTORA: ANA POVEDA GABALDÓN Ph.D [email protected] QUITO Agosto 2018

Transcript of UNIVERSIDAD CENTRAL DEL ECUADOR · 2018-08-16 · universidad central del ecuador facultad de...

UNIVERSIDAD CENTRAL DEL ECUADOR

FACULTAD DE CIENCIAS QUÍMICAS

CARRERA DE QUÍMICA FARMACÉUTICA

IDENTIFICACIÓN DE PROTEÍNAS DE DNA REPLICATION CHECKPOINT

EN TRIPANOSOMÁTIDOS, UTILIZANDO HERRAMIENTAS DE

BIOINFORMÁTICA Y MODELADO TRIDIMENSIONAL

TRABAJO DE TITULACIÓN, MODALIDAD PROYECTO DE

INVESTIGACIÓN PREVIO A LA OBTENCIÓN DEL TÍTULO DE QUÍMICO

FARMACÉUTICO

AUTOR: CARLOS ANDRÉS PARRA CRUZ

[email protected]

TUTORA: ANA POVEDA GABALDÓN Ph.D

[email protected]

QUITO

Agosto 2018

UNIVERSIDAD CENTRAL DEL ECUADOR

FACULTAD DE CIENCIAS QUÍMICAS

CARRERA DE QUÍMICA FARMACÉUTICA

INSTITUTO DE INVESTIGACIÓN EN SALUD PÚBLICA Y

ZOONOSIS CIZ

UNIVERSIDAD SAN FRANCISCO DE QUITO

INSTITUTO DE SIMULACIÓN COMPUTACIONAL

IDENTIFICACIÓN DE PROTEÍNAS DE DNA REPLICATION CHECKPOINT

EN TRIPANOSOMÁTIDOS, UTILIZANDO HERRAMIENTAS DE

BIOINFORMÁTICA Y MODELADO TRIDIMENSIONAL

TRABAJO DE TITULACIÓN, MODALIDAD PROYECTO DE

INVESTIGACIÓN PREVIO A LA OBTENCIÓN DEL TÍTULO DE QUÍMICO

FARMACÉUTICO

AUTOR: CARLOS PARRA CRUZ

TUTORA: ANA POVEDA GABALDÓN Ph.D

CO-TUTOR: MIGUEL ÁNGEL MÉNDEZ Ph.D

QUITO

Agosto 2018

iii

© DERECHOS DE AUTOR

Yo, Parra Cruz Carlos Andrés con C.I.: 060376931-6 en calidad de autor del trabajo de

investigación: “Identificación de proteínas de DNA Replication Checkpoint en

tripanosomátidos, utilizando herramientas de bioinformática y modelado tridimensional”,

autorizo a la Universidad Central del Ecuador, a hacer uso de todos los contenidos que

me pertenecen o parte de los que contiene esta obra, con fines estrictamente académicos

o de investigación.

Los derechos que como autor me corresponden, con excepción de la presente

autorización, seguirán vigentes a mi favor, de conformidad con lo establecido en los

artículos 5, 6, 8; 19 y demás pertinentes de la Ley de Propiedad Intelectual y su

Reglamento.

También, autorizo a la Universidad Central del Ecuador a realizar la digitalización y

publicación de este trabajo de investigación en el repositorio virtual, de conformidad a lo

dispuesto en el Art. 144 de la Ley Orgánica de Educación Superior.

En la ciudad de Quito, a los ___ del mes agosto de 2018.

_____________________

Carlos Parra Cruz

C.C. 060376931-6

[email protected]

iv

ACEPTACIÓN DEL TUTOR

Por la presente, dejo constancia que he leído la propuesta del trabajo de titulación,

presentada por el señor CARLOS ANDRÉS PARRA CRUZ cuyo tema es “Identificación

de proteínas de DNA Replication Checkpoint en tripanosomátidos, utilizando

herramientas de bioinformática y modelado tridimensional” y en tal virtud acepto

asesorar a la estudiante en calidad de Tutor durante la etapa del proyecto de investigación

e informe final del trabajo de investigación, hasta su correspondiente presentación y

evaluación.

Dado en la ciudad de Quito a los………………. del mes de…………………… de 2018.

--------------------------------------------------

Firma

Ana María Poveda Gabaldón Ph.D

C.I. 175066812-9

v

ACEPTACIÓN DEL CO-TUTOR

Por la presente, dejo constancia que he leído la propuesta del trabajo de titulación,

presentada por el señor CARLOS ANDRÉS PARRA CRUZ cuyo tema es “Identificación

de proteínas de DNA Replication Checkpoint en tripanosomátidos, utilizando

herramientas de bioinformática y modelado tridimensional” y en tal virtud acepto

asesorar a la estudiante en calidad de Co-tutor durante la etapa del proyecto de

investigación e informe final del trabajo de investigación, hasta su correspondiente

presentación y evaluación.

Dado en la ciudad de Quito a los………………. del mes de…………………… de 2018.

--------------------------------------------------

Firma

Miguel Angel Méndez Ph.D

C.I. 1708544596

vi

CONSTANCIA DE APROBACION DEL TRIBUNAL

El tribunal constituido por Msc. Eliana Lara, y Dr. Luis Castillo, luego de revisar el

trabajo de investigación titulado “Identificación de proteínas de DNA Replication

Checkpoint en tripanosomátidos, utilizando herramientas de bioinformática y modelado

tridimensional” previo a la obtención del título (o grado académico) de Químico

Farmacéutico presentado por el señor Carlos Andrés Parra Cruz, APRUEBA el trabajo

presentado.

Dado en la ciudad de Quito a los………………. del mes de…………………… de 2018.

Para constancia de lo actuado firman:

--------------------------------------------------

Firma

Eliana Lara Msc.

C.I. __________________

--------------------------------------------------

Firma

Dr. Luis Castillo

C.I. __________________

vii

A Dios, a mi familia y a

la comunidad científica del mundo

viii

AGRADECIMIENTOS

El autor expresa su ferviente agradecimiento a:

Ana Poveda, docente investigadora de la Universidad Central del Ecuador por su calidad

humana y alto intelecto demostrado como guía en el presente trabajo de investigación.

Miguel Ángel Méndez, docente de la Universidad San Francisco de Quito, por su

constante apoyo y motivación en las tareas desarrolladas, demostrando siempre su

brillantez e integridad moral.

A la Dra. Liliana Naranjo, directora de carrera de Química Farmacéutica de la UCE, por

su cálida tutela y gran contribución en la formación profesional de los jóvenes

investigadores del país.

ix

CONTENIDO

pág.

AGRADECIMIENTOS ................................................................................................. viii

CONTENIDO .................................................................................................................. ix

LISTA DE TABLAS ...................................................................................................... xii

LISTA DE FIGURAS ................................................................................................... xiii

LISTA DE ANEXOS ..................................................................................................... xv

LISTA DE ABREVIATURAS ...................................................................................... xvi

RESUMEN ................................................................................................................... xvii

ABSTRACT ................................................................................................................ xviii

INTRODUCCIÓN ............................................................................................................ 1

1. EL PROBLEMA........................................................................................................... 3

1.1 Planteamiento del Problema ................................................................................... 3

1.2 Formulación del problema ...................................................................................... 4

1.3 Justificación ............................................................................................................ 4

1.4 Preguntas de investigación ...................................................................................... 6

1.5 Objetivos ................................................................................................................. 7

1.5.1 Objetivo General .............................................................................................. 7

1.5.2 Objetivos Específicos ....................................................................................... 7

2. MARCO TEÓRICO ..................................................................................................... 8

2.1 Antecedentes ........................................................................................................... 8

2.2 Marco Referencial ................................................................................................... 9

2.2.1 Leishmaniasis ................................................................................................... 9

2.2.2 Ciclo celular ................................................................................................... 11

2.2.3 DNA Damage Checkpoint .............................................................................. 11

2.2.4 Similitud de secuencias .................................................................................. 14

2.2.5 Similitud a nivel de estructura ........................................................................ 15

2.2.6 Modelado de Proteínas ................................................................................... 15

x

2.2.7 Servidor para modelado de proteínas ............................................................. 15

2.2.8 Comparación de estructuras proteicas ............................................................ 16

2.2.9 Métricas de calidad......................................................................................... 17

2.3 Marco Legal .......................................................................................................... 18

2.4 Hipótesis ............................................................................................................... 19

2.5 Sistema de Variables ............................................................................................. 19

2.5.1 Variables caracterización ............................................................................... 19

2.5.2 Variables de interés ........................................................................................ 19

3. MARCO METODOLÓGICO .................................................................................... 20

3.1 Diseño de la investigación .................................................................................... 20

3.1.1 Paradigma de la investigación ........................................................................ 20

3.1.2 Nivel de la investigación ................................................................................ 20

3.1.3 Tipo de investigación ..................................................................................... 20

3.1.4 Procedimiento para alcance de objetivos ....................................................... 21

3.2 Materiales y Métodos ............................................................................................ 21

3.2.1 Materiales ....................................................................................................... 21

3.2.2 Servidores ....................................................................................................... 21

3.2.3 Métodos .......................................................................................................... 21

3.2.4 Matriz de operacionalización de variables ..................................................... 24

3.2.4 Técnicas e instrumentos de recolección de datos ........................................... 25

3.2.5 Técnicas de Procesamiento y Análisis de Datos ............................................ 25

4. MARCO ADMINISTRATIVO .................................................................................. 26

4.1 Recursos ................................................................................................................ 26

4.1.1 Talento humano .............................................................................................. 26

4.1.2 Recursos materiales ........................................................................................ 26

4.2 Presupuesto ........................................................................................................... 26

4.3 Cronograma........................................................................................................... 27

5. DISCUSIÓN DE RESULTADOS.............................................................................. 28

5.1 Definición de proteínas de DNA Replication Checkpoint ..................................... 28

5.2 Desarrollo del método de búsqueda ...................................................................... 29

5.3 Búsqueda de homólogos a spMrc1 en Leishmania mexicana .............................. 31

5.4 Homología estructural Mrc1/Claspin entre S. pombe, H. sapiens y L. mexicana 33

5.5 Validación de Estructuras ..................................................................................... 36

5.7 Homología Mrc1/Claspin en tripanosomátidos .................................................... 40

7. CONCLUSIONES Y RECOMENDACIONES ......................................................... 41

xi

7.1 Conclusiones ......................................................................................................... 41

7.2 Recomendaciones ................................................................................................. 42

CITAS BIBLIOGRÁFICAS........................................................................................... 43

ANEXOS ........................................................................................................................ 48

xii

LISTA DE TABLAS

pág.

Tabla 1. Operacionalización de variables .................................................................. 24

Tabla 2. Presupuesto requerido .................................................................................. 26

Tabla 3. Posibles genes homólogos a spMrc1 en H. sapiens ordenados en función de

su solapamiento. ......................................................................................................... 30

Tabla 4. Comparación por BLAST posibles homólogos a spMrc1 en H. sapiens .... 31

Tabla 5. Posibles genes homólogos a spMrc1 en L. mexicana ordenados en función de

su solapamiento. ......................................................................................................... 32

Tabla 6. Comparación por BLAST entre posibles homólogos a spMrc1 en L. mexicana

................................................................................................................................... 32

Tabla 7. Comparación entre proteínas de referencia y de L. mexicana. .................... 34

Tabla 8. Comparación entre estructuras de control. .................................................. 36

Tabla 9. Métricas de calidad de las proteínas modeladas. ......................................... 38

Tabla 10. Comparación entre familias de proteínas modeladas ................................ 39

Tabla 11. Resultados de BLAST entre LmxM.34.1090 (putative Mrc1) y a otros

tripanosomátidos ........................................................................................................ 40

xiii

LISTA DE FIGURAS

pág.

Figura 1. DNA Replication Checkpoint. ................................................................ 13

Figura 2. Protocolo I-TASSER para predicción de estructuras proteicas ............. 16

Figura 3. Gráfica de error Errat.. ........................................................................... 17

Figura 4. Red de interacción entre proteínas del mecanismo de DNA Replication

Checkpoint en Homo Sapiens................................................................................ 29

Figura 5. Red de interacción String entre proteínas del mecanismo de DNA

Replication Checkpoint en Saccharomyces cerevisiae. ........................................ 29

Figura 6. Estructura modelada por ITASSER de Claspin en H. sapiens. ............. 33

Figura 7. Estructura modelada por ITASSER de Mrc1 en S. pombe .................... 33

Figura 8. Estructura modelada por ITASSER de LmxM.33.0690 ......................... 35

Figura 9. Estructura modelada por ITASSER de LmxM.34.1090 ......................... 35

Figura 10. Superposición de estructuras modeladas.. ........................................... 34

Figura 11. Superposición de estructuras predichas. Dorado: hsClaspin, Naranja:

putative hsClaspin L. mexicana (LmxM.330690).. ............................................... 35

Figura 12. Superposición de estructuras modeladas. Azul: spMrc1, Violeta: putative

spMrc1 L. mexicana (LmxM.34.1090). ................................................................. 35

Figura 13. Superposición de estructuras scRad53. Dorado: S. cerevisiae, Celeste:

LmjF.17.0060. Control Positivo ............................................................................ 37

Figura 14. Superposición de estructuras Control Negativo. Azul: spMrc1, Rojo:

ACC....................................................................................................................... 37

Figura 15. Superposición de estructuras Control Negativo. Dorado: hsClaspin,

Rojo: ACC. Modeladas por I-TASSER. ............................................................... 37

xiv

Figura 16. Superposición de estructuras modeladas por I-TASEER para Claspin.

Dorado: H. sapiens, Verde: X. laevis .................................................................... 39

Figura 17 Superposición de estructuras predichas para putative Mrc1. Violeta: L.

mexicana, Blanco: L. major (LmjF.35.1090). ....................................................... 39

Figura 18. Superposición de estructuras predichas para Mrc1. Azul: S. pombe,

Amarillo: S. cerevisiae .......................................................................................... 39

xv

LISTA DE ANEXOS

pág.

Anexo A. Árbol de Problemas ............................................................................. 49

Anexo B. Categorización de variables ................................................................. 50

Anexo C. Instrumento de recolección de datos .................................................... 52

Anexo D. Diagrama de Flujo Metodología .......................................................... 53

Anexo E. Posibles genes homólogos a spMrc1 en Homo sapiens en KEGG ...... 54

Anexo F. Gráfica de distribución de Error Errat .................................................. 58

xvi

LISTA DE ABREVIATURAS

ADN: Ácido Desoxirribonucleico

ATM: Ataxia telangiectasia mutated

ATR: Ataxia telangiectasia and Rad3-related protein

CHK: Checkpoint

CLSPN: Claspin encode gene

KEGG: Kyoto Encyclopedia of Genes and Genomes

MRC: Mediator of Replication Checkpoint

NCBI: National Center for Biotechnology Information

PDB: Protein Data Bank

TIPIN: TIMELESS-interacting protein

GeneDB: Gene Data Base

xvii

Título: Identificación de proteínas de DNA Replication Checkpoint en tripanosomátidos,

utilizando herramientas de bioinformática y modelado tridimensional

Autor: Carlos Parra Cruz

Tutora: Ana Poveda

Co-tutor: Miguel Angel Méndez

RESUMEN

Leishmaniasis y tripanosomiasis americana son enfermedades tropicales causadas por

parásitos del orden de los tripanosomátidos. Estas enfermedades presentan tratamientos

con elevados efectos adversos. Actualmente, se investigan nuevas dianas terapéuticas

para el desarrollo de tratamientos alternativos, como por ejemplo los checkpoints. Estos

son mecanismos de verificación de la integridad del ADN, descritos e identificados en

diferentes organismos modelo. En tripanosomátidos, no se ha identificado varios

componentes proteicos que intervienen en el DNA Replication Checkpoint. En el presente

trabajo de investigación se identificaron posibles homólogos a hsClaspin/spMrc1 del

DNA Replication Checkpoint en tripanosomátidos. Se desarrolló un método que permite

realizar la búsqueda de genes con similitud de secuencia baja a esta proteína en

Leishmania mexicana. Las secuencias proteicas con mayor similitud atravesaron el

proceso de modelado de estructura terciaria. Además, se realizó comparaciones de

superposición estructural entre las proteínas de estudio y las de referencia. Se encontró

elevada similitud estructural entre spMrc1/hsClaspin y las proteínas codificadas por los

genes LmxM.34.1090 y LmxM.33.0690 respectivamente. Es posible la existencia de estos

dos homólogos en tripanosomátidos, sin embargo, se recomienda la investigación in vitro,

para confirmar esta teoría. Adicionalmente se encontró genes con alta similitud de

secuencia a LmxM.34.1090 en L. major, L. infantum, L. donovani, L. braziliensis y genes

con similitudes considerables en T. cruzi y T. brucei.

Palabras clave: CHECKPOINT, CLASPIN, MRC1, BIOINFORMÁTICA,

HOMÓLOGOS, Leishmania

xviii

Title: Identification of DNA Replication Checkpoint proteins in trypanosomatids, using

bioinformatics tools and structural modeling

Author: Carlos Parra Cruz

Tutor: Ana Poveda

Co-tutor: Miguel Angel Méndez

ABSTRACT

Leishmaniasis and American trypanosomiasis are tropical diseases caused by parasites of

the order trypanosomatids. These diseases present treatments with high adverse effects.

Currently, new therapeutic targets are being investigated for the development of

alternative treatments, such as checkpoints. These checkpoints are DNA verification

mechanisms, described and identified in different model organisms. In trypanosomatids,

several protein components that intervene in DNA Replication Checkpoint have not been

identified. In the present research, possible homologues to hsClaspin / spMrc1 in

trypanosomatids are identified. We develop a method that allows searches of genes with

low sequence similarity to this protein in Leishmania mexicana. The protein sequences

with greater similarity was modeled at its tertiary structure. In addition, comparisons of

structural overlap were made between the study and reference proteins. High structural

similarity was found between spMrc1 / hsClaspin and the proteins encoded by the genes

LmxM.34.1090 and LmxM.33.0690 respectively. The existence of these two homologous

genes in trypanosomatids is possible, however, in vitro research is recommended to

confirm this theory. Additionally, genes with high sequence similarity were found at

LmxM.34.1090 in L. major, L. infantum, L. donovani, L. braziliensis and genes with

considerable similarities in T. cruzi and T. brucei.

Keywords: CHECKPOINT, CLASPIN, MRC1, BIOINFORMATICS, HOMOLOGUES,

Leishmania

1

INTRODUCCIÓN

Leishmaniasis y tripanosomiasis americana, son enfermedades parasitarias

causadas por microorganismos del orden trypanosomatida que afectan al ser humano y

animales domésticos (OMS, 2018). En las últimas décadas se han realizado diversos

estudios orientados a la búsqueda de terapias alternativas a estas enfermedades

(Uzcanga et al., 2016), debido a que los tratamientos convencionales presentan elevados

efectos adversos (MSP, 2014). Para abordar esta problemática, se ha recurrido al estudio

de los mecanismos biológicos que rigen el ciclo celular en parásitos tripanosomátidos.

Durante el ciclo celular, la célula obtiene información del código genético, el cual

controla los procesos bioquímicos necesarios para su normal funcionamiento. Por tanto,

es de vital importancia que la integridad del ADN se conserve adecuadamente

(Beishline & Clifford, 2014). Para verificar esto, se utilizan checkpoints, los cuales

activan los mecanismos de reparación, en caso de existir daño en cualquiera de las fases

del ciclo celular: G0. G1, S y G2 (Abraham, 2001).

Existen diferentes tipos de checkpoints, dependiendo de la fase del ciclo celular

en la cual se realice el control. Por ejemplo, los checkpoints de mitosis, verifican el

correcto ensamblaje del uso mitótico. Los DNA Damage Checkpoint detectan daños en

el ADN. En la fase S, se realiza la verificación de la integridad del ADN a través de

unos de los checkpoints de daño denominado DNA Replication Checkpoint (Beishline

& Clifford, 2014).

Este checkpoint está conformado por grupos de proteínas que cumplen la función

verificadora. En Homo sapiens, se denominan proteínas sensoras (ATM/ATR),

transmisoras (Claspin/Tipin/Timeless) y efectoras (Chk1/Chk2). En Saccharomyces

cerevisiae son: proteínas sensoras (Tel1/Mec1), transmisoras (Mrc1/Csm3/Tof1) y

efectoras (Chk1/Rad53) (Beishline & Clifford, 2014). Es importante mencionar que no

se encuentran referencias documentadas del complejo transmisor

(Claspin/Tipin/Timeless) en tripanosomátidos (Uzcanga et al., 2016) (Genois, E., &

Laffitte, 2014).

2

A través de estudios preliminares se realizó la búsqueda de homólogos al complejo

Claspin/Tipin/Timeless en Leishmania sp., utilizando comparación de secuencias en

base a organismos de referencia (H. sapiens y S. cerevisiae) a través de la herramienta

bioinformática básica BLAST. En esta búsqueda elemental, no se encontraron

similitudes significativas (Genois, y otros, 2014).

En la actualidad, los mecanismos que rigen la integridad de ADN en

tripanosomátidos no se encuentran completamente caracterizados (Uzcanga, y otros,

2016). Sin embargo, en las últimas décadas, se han desarrollado herramientas

bioinformáticas más complejas que permiten realizar estudios comparativos del genoma

de tripanosomátidos frente a organismos de referencia, con la finalidad de inferir

información que permita caracterizar dichos mecanismos (Nunes, Damasceno, Freire,

& Tosi, 2011).

Este fue el caso de la identificación de Hus1, una proteína perteneciente al sistema

de checkpoint, realizada por Damasceno y colaboradores. Al realizar una búsqueda a

nivel de secuencia se presentó baja similitud entre la proteína de referencia spHus1 y el

proteoma de Leishmania major. Sin embargo, cuando se realizó la búsqueda a nivel de

estructura terciaria, fue posible encontrar homologías para esta proteína (Nunes,

Damasceno, Freire, & Tosi, 2011).

La caracterización acertada de los mecanismos de DNA Replication Checkpoint

en Leishmania y Trypanosoma, permite establecer nuevas dianas terapéuticas, con la

finalidad de desarrollar tratamientos alternativos frente a estos parásitos. En el presente

trabajo de investigación, se utilizaron herramientas bioinformáticas aplicadas, enfocadas

en la búsqueda e identificación de proteínas de DNA Replication Checkpoint en parásitos

tripanosomátidos, en función de la información descrita en organismos de referencia.

3

1. EL PROBLEMA

1.1 Planteamiento del Problema

Según la Organización Mundial de la Salud, cada año se producen entre 700 000

y un millón de nuevos casos de leishmaniasis y 30 000 defunciones (OMS, 2018).

Además, existen entre 6 y 7 millones de personas infectadas por Trypanosoma cruzi, el

parásito causante de la enfermedad de Chagas, la mayoría de ellas en América Latina

(OMS, 2018). En Ecuador, una zona geográfica tropical, se presentan las condiciones

apropiadas para el desarrollo de microorganismos parasitarios causantes de

enfermedades tropicales. De hecho, según el Ministerio de Salud Pública, se registraron

1.045 casos de leishmaniasis, en 22 de las 24 provincias (MSP, 2014), y se reportaron

cerca de 170 000 personas infectadas con tripanosomiasis americana (Larreátegui,

2011).

El tratamiento disponible en la actualidad frente a leishmaniasis, aprobado por el

Ministerio de Salud Pública del Ecuador, consiste en la administración múltiple de

inyecciones de antimoniato de meglumina, un fármaco con elevados efectos adversos,

entre los cuales se destacan: daños gastrointestinales, hepatotoxicidad y alteraciones

cardíacas (MSP, 2014). Otro medicamento utilizado es miltefosina, el cual presenta un

rango terapéutico muy estrecho, hecho que pone en riesgo la salud de los pacientes

tratados. (MSP, 2014). Miltefosina en la actualidad se considera como un medicamento

huérfano, pues bajo condiciones normales de mercado, la industria farmacéutica tiene

poco interés en desarrollar y comercializar este tipo de producto (Comisión de las

Comunidades Europeas, 2008).

En el caso de tripanosomiasis americana, el tratamiento farmacológico para las

etapas agudas corresponde a benznidazol y nifurtimox. Estos fármacos son usados bajo

vigilancia sanitaria, debido a sus efectos adversos que superan el 30% de los casos, a su

vez, las resistencias a la terapia son un problema notable. Se ha demostrado que, en

etapas crónicas de la enfermedad, los medicamentos descritos presentan menor eficacia

(Bern et al., 2007).

4

La cooperación establecida por la Universidad Central del Ecuador y el Instituto

de Simulación Computacional de la Universidad San Francisco de Quito, mediante la

modalidad de trabajo de titulación y el uso de software libre, permiten la ejecución del

presente trabajo de investigación que contribuye al desarrollo de enfoques terapéuticos

innovadores frente a leishmaniasis.

1.2 Formulación del problema

¿Existen homólogos de proteínas del complejo de Claspin/Tipin/Timeless de DNA

Replication Checkpoint en Leishmania mexicana?

1.3 Justificación

La leishmaniasis y tripanosomiasis son enfermedades que afectan

significativamente a los sectores más vulnerables del país (MSP, 2014). A través del

presente estudio, se pretende contribuir a la línea de investigación impulsada por el CIZ

“Development of innovative therapeutic approaches against leishmaniasis”, que tiene

como objetivo identificar fármacos y dianas terapéuticas para desarrollar tratamientos

alternativos frente a Leishmania sp., utilizando conocimientos que se encuentran a la

vanguardia en investigación científica a nivel mundial, dentro del campo de la

bioinformática, biología molecular e ingeniería genética.

Estudios previos han identificado la presencia de posibles dianas terapéuticas

relacionadas con la integridad del ADN en Leishmania sp. (Uzcanga, y otros, 2016). De

hecho, experimentalmente se ha comprobado la existencia de mecanismos de verificación

de la integridad del ADN en tripanosomátidos (Genois, E., & Laffitte, 2014) (Conway,

Proudfoot, Burton, & al., 2002). No obstante, la información disponible acerca de los

mecanismos moleculares relacionados con el DNA Replication Checkpoint en

tripanosomátidos, no se encuentra totalmente definida en Leishmania sp. Esto se debe a

que se observa la presencia de proteínas homólogas a ATM/ATR/Chk1/Chk2, sin

embargo, no se verifica la presencia del complejo Claspin/Tipin/Timeless en Leishmania

sp. (Uzcanga et al., 2016).

5

El uso del enfoque bioinformático aplicado a la búsqueda de proteínas del

complejo Claspin/Tipin/Timeless del sistema de DNA Replication Checkpoint en

Leishmania sp., permite un análisis eficiente de la información genética disponible

(Higgins & Taylor, 2000). De hecho, la bioinformática es una disciplina amplia que tiene

como objetivo la aplicación de tecnologías computacionales y estadísticas para la gestión

de datos biológicos (Luscombe, Greenbaum, & Gerstein, 2001). Entre las herramientas

que se utilizan se puede mencionar: búsqueda de homologías por secuencia, búsqueda de

homologías por estructura, modelado de proteínas, acomplamiento molecular o docking,

entre otras (Higgins & Taylor, 2000). Estudios preliminares realizados a través de

búsqueda de homologías por secuencia, sugieren la ausencia de homólogos al sistema

Claspin/Tipin/Timeless en L mexicana. Además, al realizar la búsqueda en la base de

datos UniProt, no se encuentra referencias a este sistema para Leishmania sp. en la

actualidad (The UniProt Consortium, 2017).

Otro enfoque bioinformático, consiste en la comparación de estructuras proteicas.

Es así, que se realizó la búsqueda de proteínas de DNA Replication checkpoint en el

Protein Data Bank, encontrándose los siguientes resultados. Existen alrededor de 62

entradas de estructuras cristalográficas de Leishmania mexicana en el Protein Data Bank,

lo cual representa una cantidad pequeña, en comparación con las 36.821 entradas

encontradas para Homo sapiens. Por tanto, se podría afirmar que el estudio de Leishmania

mexicana se podría beneficiar del uso de herramientas bioinformáticas dado que la

evidencia puramente experimental estructural aún es escasa (RCSB, 2018) (Berman et

al., 2000).

Al realizar la búsqueda de las estructuras cristalográficas del complejo

Claspin/Tipin/Timeless en la base de datos Protein Data Bank, se evidenció que no

existen en la actualidad entradas relacionadas con esta temática. Este hecho, dificulta el

estudio de los mecanismos de DNA Replication Checkpoint, en los cuales intervienen

estas proteínas (RCSB, 2018).

Disponer de una identificación bioinformática permite tener un punto de partida

valido para realizar experimentaciones in vitro, como podía ser introducción de

mutaciones genéticas y represión de genes. De esta manera, es posible optimizar los

recursos, ya que, al carecer de esta información previa que identifique genes, la

experimentación in vitro resultaría menos eficiente. Para el presente estudio, se ha tomado

6

en cuenta las cepas de Leishmania sp. almacenadas en el Laboratorio de replicación del

DNA e instabilidad del genoma del CIZ, y su relevancia clínica y epidemiológica.

Posterior a la identificación bioinformática y modelado tridimensional de

proteínas de Checkpoint de Leishmania sp., se puede continuar con la investigación

experimental que permita verificar los resultados obtenidos a través de las colecciones de

datos genéticos, ya que, en el laboratorio de replicación del ADN e inestabilidad del

genoma del CIZ, se dispone de la infraestructura y el personal requerido para continuar

con esta línea de investigación.

1.4 Preguntas de investigación

- ¿Qué proteínas se encuentran involucradas actualmente en el DNA Replication

Checkpoint en organismos de referencia?

- ¿Qué proteína del complejo Claspin/Tipin/Timeless de DNA Replication Checkpoint,

se estudiará en la presente investigación?

- ¿Cómo verificar la homología entre los organismos de referencia H. sapiens y S.

pombe, a través de técnicas bioinformáticas?

- ¿Qué estrategia bioinformática se puede aplicar para la identificación de homólogos

del complejo Claspin/Tipin/Timeless de DNA Replication Checkpoint en Leishmania

sp.?

- ¿Qué controles se puede establecer para validar los procedimientos descritos?

- ¿Qué homologías se pudiese interpolar a otros tripanosomátidos, como Trypanosoma

cruzi?

7

1.5 Objetivos

1.5.1 Objetivo General

Identificar homólogos a hClaspin/spMrc1 en Leishmania mexicana utilizando

herramientas bioinformáticas.

1.5.2 Objetivos Específicos

- Verificar el sistema de proteínas involucrado actualmente en DNA Replication

Checkpoint en organismos de referencia.

- Seleccionar la proteína de DNA Replication Checkpoint, que se estudiará en la

presente investigación.

- Verificar bioinformáticamente la homología documentada entre el sistema de DNA

Replication Checkpoint en organismos de referencia.

- Desarrollar una estrategia bioinformática que permita identificar homólogos del

complejo Claspin/Tipin/Timeless de DNA Replication Checkpoint en L. mexicana.

- Establecer las relaciones existentes entre Mrc1 y el genoma de L. mexicana.

- Realizar controles para validar los procedimientos descritos.

- Interpolar homologías frente a otros tripanosomátidos, como Trypanosoma cruzi.

8

2. MARCO TEÓRICO

2.1 Antecedentes

El Centro Internacional de Zoonosis CIZ, a través de Laboratorio de replicación del

DNA e instabilidad del genoma, impulsa la línea de investigación: “Development of

innovative therapeutic approaches against leishmaniasis”, en el cual se busca

identificar tratamientos alternativos a los expuestos frente a leishmaniasis. Es así, que

se ha estudiado los mecanismos de verificación de la integridad del ADN, con el fin de

identificar nuevas dianas potencialmente susceptibles a tratamientos alternativos, como

por ejemplo los mecanismos de checkpoint.

Uzcanga y col. han realizado una revisión bibliográfica en la que se describe las rutas

de control de la integridad del ADN en tripanosomátidos, como el Checkpoint de

Replicación de ADN (Uzcanga et al., 2016). Entre las proteínas homólogas identificadas

en este checkpoint se encuentran ATM, ATR, Chk1, y Chk2, sin embargo, Claspin,

Tipin y Timeless no han sido identificados debido a su baja similitud a nivel de secuencia

(Genois et al., 2014). El problema radica en que el método utilizado para realizar esta

identificación corresponde a una búsqueda bioinformática básica, por tanto, se podría

presentar el inconveniente de omitir ciertas proteínas con baja similitud de secuencia.

(Moore, Asselbergs, & Williams, 2010)

Esta omisión se ha evidenciado en diferentes estudios entre especies, como, por

ejemplo, el realizado por Sánchez y col. en el cual se identifica la proteína Sld3 tanto en

hongos como en animales utilizando herramientas de modelado de proteínas, a pesar de

que su similitud a nivel de secuencia es relativamente baja (Sanchez, Diffley, & Ponting,

2010). En otro estudio, Damasceno y col. identificaron la proteína Hus1, involucrada en

el DNA Damage Checkpoint, en Leishmania major, mediante la predicción de su

estructura secundaria, aunque la similitud a nivel primario entre la secuencia humana y

de Leishmania es relativamente baja. Por tanto, se puede afirmar que el reconocimiento

acertado de homólogos estructurales simplifica la búsqueda de proteínas similares

(Nunes, Damasceno, Freire, & Tosi, 2011).

9

2.2 Marco Referencial

2.2.1 Leishmaniasis

La leishmaniasis es una enfermedad causada por un protozoo parásito del género

Leishmania sp., transmitido por la picadura de flebótomos infectados. Es conocida como

rara o huérfana, pues los medicamentos utilizados para su tratamiento representan bajos

beneficios económicos para las industrias farmacéuticas productoras. La enfermedad,

que afecta a las poblaciones más pobres del planeta, está asociada a la malnutrición, los

desplazamientos de población, las malas condiciones de vivienda, la debilidad del

sistema inmunitario y la falta de recursos.

La leishmaniasis está vinculada a los cambios ambientales, como la deforestación, la

construcción de presas, los sistemas de riego y la urbanización. Se estima que cada año

se producen entre 700 000 y un millón de nuevos casos y entre 20 000 y 30 000

defunciones (OMS, 2018). La leishmaniasis que se encuentra en las Américas es muy

similar a la observada en la cuenca mediterránea. Se piensa que la costumbre de tener

perros y otros animales domésticos en el interior de las viviendas facilita la infección

humana (OMS, 2018).

2.2.1.1 Manifestaciones clínicas

Se distinguen tres tipos diferentes de manifestaciones clínicas, en función de la

especie de Leishmania involucrada, se puede presentar:

a. Leishmaniasis cutánea: Causada por L. braziliensis, L. major, L. mexicana

(IICAB, 2009). Se manifiesta con lesiones y úlceras que pueden cambiar de

tamaño y de apariencia con el tiempo. Inicialmente están cubiertas por una costra

que, al desprenderse, presenta una ulcera típica de fondo limpio, la cual puede

infectarse. Provoca deterioro del tejido, y lesiones permanentes y moderadas

(OMS, 2018).

b. Leishmaniasis mucocutánea: puede derivarse de la cutánea, afecta a las

mucosas, el sitio donde inicia la infección frecuentemente es el tabique nasal, y

puede progresar hasta perforarlo. El proceso puede extenderse al paladar y

10

faringe; la úvula se infiltra, se hipertrofia y luego se amputa. Cuando acomete a

la nariz se puede presentar obstrucción, sangrado, secreción nasal y la aparición

de costras y heridas. El compromiso de la laringe y la faringe puede ocasionar

dolor, ronquera, disfonía y disfagia (OMS, 2018).

c. Leishmaniasis visceral: Es causada generalmente por las cepas L. donovani, L.

infantum, L. trópica y L. amazoncensis (IICAB, 2009). Se considera como una

enfermedad crónica. Los síntomas más comunes son fiebre ondulante

prolongada, pérdida de peso, disminución del apetito, signos de anemia y

distensión abdominal con esplenomegalia y hepatomegalia. Puede comprometer

la vida del paciente (IICAB, 2009).

2.2.1.2 Tratamiento

La leishmaniasis es una enfermedad que se puede tratar y curar, pero para ello es

necesario un sistema inmunitario competente, dado que los medicamentos, por sí solos,

no son capaces de eliminar el parásito del organismo. De ahí el riesgo de recidiva en

caso de inmunodepresión. Todos los pacientes a quienes se haya diagnosticado

leishmaniasis visceral requieren la administración inmediata de un tratamiento

completo. En la actualidad, los tratamientos aprobados por el Ministerio de Salud

Pública del Ecuador, presenta diversas desventajas, entre las cuales constan, molestias

relacionadas a la administración, alto grado de toxicidad, resistencia parasitaria (MSP,

2014).

Por tanto, surge la necesidad de estudiar los mecanismos moleculares que rigen el

ciclo de vida del microorganismo, con la finalidad de desarrollar enfoques terapéuticos

innovadores, entre los que se incluye reposicionamiento de fármacos, como es el caso

de las fluoroquinolonas, y la identificación de nuevas dianas terapéuticas, como el caso

de los checkpoints (Uzcanga et al., 2016).

2.2.1.3 Ciclo de vida

Leishmaniasis es transmitida por la picadura de insectos flebótomos, los cuales

son vectores de Leishmania sp. Los promastigotes (forma extracelular del parásito) son

inoculados en el torrente sanguíneo de los infectados, luego son fagocitados por

11

macrófagos, donde se transforman en promastigotes (forma intracelular) (Sánchez &

Sáenz, 2004). En esta forma se reproducen a través de división celular, que incluye la

replicación de su material genético. Finalmente, un nuevo insecto ingiere la sangre del

hospedero infectado. Los amastigotes se diferencia en promastigotes en el intestino del

vector. (Romero, Machuca, & Padrón, 2007).

2.2.2 Ciclo celular

El ciclo celular es el conjunto de fases que atraviesa una célula y la conducen a su

crecimiento y división en dos células hijas. Durante estas fases (G1, S, G2 y mitosis,),

existen puntos de control denominados checkpoints, que aseguran la progresión del

ciclo, verificando su avance correcto (Abraham, 2001). Los checkpoints están

conformados por sistemas de proteínas que actúan a manera de sensores de daño celular,

los cuales desencadenan una cascada bioquímica que detiene el ciclo, para permitir que

los mecanismos de reparación desempeñen su función (Kastan, Zhan, & Deiry, 1992).

Existen diferentes checkpoints, en función de la fase del ciclo celular donde

actúan. Por ejemplo, el checkpoint de restricción, donde se decide si la célula atraviesa

de fase G1 a S, continuando con la síntesis de ADN, o de G1 a G0, permaneciendo en un

estado latente (Beishline, Kate, & Azizkhan, 2014). Este punto de control está mediado

por los inhibidores CDKs. Además, existen mecanismos de checkpoint, que se encargan

de detectar daños en el ADN (DNA Damage Checkpoint) y otros que verifican el

correcto ensamblaje del uso mitótico (Gorgoulis, 2005).

2.2.3 DNA Damage Checkpoint

El ADN es el código que almacena la información genética a copiarse, para la

generación de dos células hijas (Sutton & Walker, 2002). Este proceso puede sufrir

interferencias debido a daños en el ADN. Por tanto, existen los mecanismos de DNA

Damage Checkpoint, que detectan estos daños, tanto en la transición de G1/S, (DNA

Replication Checkpoint), y en la transición G2/M (G2/M Checkpoint), Cuando se

detectan anomalías en el ADN se recurre a la inactivación de los orígenes de replicación,

hasta que el daño genético se repare (Beishline & Clifford, 2014).

El inicio de la replicación del ADN está controlado por el encendido de los orígenes

de replicación. Un origen de replicación corresponde a un segmento específico del

12

cromosoma en el cual se inicia el proceso de replicación del ADN. Los orígenes de

replicación eucariota se desencadenan de forma secuencial, activando orígenes

adyacentes, que forman una maquinaria de replicación capaz de ser regulada a través

del tiempo. Este proceso especifico, se denomina timing de la replicación. Para llevar a

cabo el proceso de timing, los orígenes de replicación han de activarse en función del

tiempo (Beishline & Clifford, 2014).

Los orígenes de replicación que se activan al inicio de la replicación se denominan

tempranos, mientras que los que se activan luego de iniciado el proceso, se conocen

como tardíos. La activación de los orígenes de replicación en función de los checkpoints

del ciclo celular proporciona grandes ventajas a la replicación eucariota, pues las células

deben replicar grandes cantidades de datos con precisión en cortos lapsos de tiempo

(Musiałek & Rybaczek, 2015).

2.2.3.1 DNA Replication Checkpoint

El encendido adecuado de los orígenes de replicación en eucariotas está regulado por

diferentes mecanismos. Entre los primeros identificados se encuentra el DNA

Replication Checkpoint. Este checkpoint está mediado por los sensores ATM/ATR, los

transmisores Claspin/Tipin/Timeless y las quinasas efectoras Chk1 / Chk2, que regulan

a las proteínas que conforma el origen de replicación. Este mecanismo se encuentra

ampliamente conservado en levadura y células humanas (Musiałek & Rybaczek, 2015)

(Alcasabas, A. et al., 2001) (Bando, M. et al., 284) (Koundrioukoff, S. et al, 2013). Los

orígenes de replicación, tanto tempranos como tardíos, son regulados por la presencia

de factores limitantes esenciales para su activación secuencial (Mantiero, D.,

Mackenzie, A., Donaldson, A. & Zegerman, P., 2011). Esto se correlaciona con la

accesibilidad al origen, controlado por la estructura epigenética de la cromatina

(Yoshida, K. et al. , 2014).

Además, se ha relacionado el encendido de los orígenes con los niveles de

desoxirribonucleótidos trifosfatos (dNTPs) (Poli, J. et al. , 2012). La presencia de estos

mecanismos se ha verificado en animales y hongos, sin embargo, en tripanosomátidos

no se ha confirmado en su totalidad (Alcasabas, A. et al., 2001). (Bando, M. et al., 284).

(Alabert, Poveda, & Pasero, 2009). El daño provocado en el ADN genera un

desacoplamiento de la horquilla de replicación, dando lugar a largos tramos de ADN

13

monocatenario (single stranded DNA), que inmediatamente se recubre por las proteínas

RPA (figura 1). Esta estructura es detectada por las proteínas ATM/ATR (scMec1/Tel1),

quinasas de la familia PI3K. ATM/ATR activadas, fosforilan a las quinasas efectoras

Chk1/Chk2, (scChk1/scRad53), reguladores principales que desencadenan una oleada

de fosforilación a múltiples objetivos, que detienen el avance de la horquilla de

replicación, la estabilizan y previenen el ingreso de la célula a fase de mitosis.

Entre los detectores y efectores, existe un complejo heterotrimérico compuesto

por Claspin/Tipin/Timeless (scMrc1/ scTof1/ scCsm3) (figura 1). Las mutaciones o

defectos en estos componentes desencadenan hipersensibilidad frente a los genotóxicos,

incrementando la inestabilidad genómica y la presencia de daño del ADN (Beishline &

Clifford, 2014).

Figura 1. DNA Replication Checkpoint (Poveda, A. 2017). Se muestra el complejo

Clspn/Tipin/Tim (en color verde), como un nexo entre el complejo CMG y la DNA

Polimerasa. El desacoplamiento entre estos tres complejos forma tramos de ssDNA,

los cuales se recubren de proteínas RPA. Esta estructura es detectada por ATM/ATR,

desencadenando el sistema de checkpoint, y el detenimiento del avance de la horquilla

de replicación. (Beishline & Clifford, 2014).

En su revisión bibliográfica, Uzcanga y col. identifican la presencia de homólogos

de ATM/ATR, Chk1 y Chk2, en tripanosomátidos, lo que sugiere la presencia de este

mecanismo de protección del ADN. Sin embargo, es importante mencionar que no se

encontraron homólogos a nivel de secuencia del complejo intermediario

Claspin/Tipin/Timeless (Uzcanga et al., 2016). Por tanto, resulta interesante, realizar un

estudio se similitud de secuencias avanzado, para buscar los homólogos faltantes.

14

2.2.4 Similitud de Secuencias

La bioinformática puede responder a diversas interrogantes, basándose en

modelos de interacción generados por ordenador. El desarrollo incipiente de esta rama

del conocimiento ha traído consigo una innovadora forma de gestionar la genética

(Moore, Asselbergs, & Williams, 2010). Esta disciplina utiliza diferentes herramientas

computacionales para la administración de información de sistemas biológicos

(Luscombe, Greenbaum, & Gerstein, 2001). Entre las herramientas que surgen de la

gestión de genomas se puede describir el análisis de similitud de secuencias.

En el contexto genético, la similitud de secuencias de ADN entre diferentes

organismos hace referencia a que tan parecido es el orden en el que están dispuestas las

bases nitrogenadas que conforman las cadenas de nucleótidos (Higgins & Taylor, 2000).

Esta propiedad puede ser trasladada a la síntesis de proteínas. En este caso, los

aminoácidos que se comparten pueden ser idénticos, o formar parte de un mismo grupo

con propiedades fisicoquímicas similares que le confieren a la estructura un plegamiento

similar (Chothia & Lesk, 1986).

Esta similitud de secuencias es útil, pues permite reconocer homologías entre

distintos genes, y sus respectivas proteínas, además de identificar funciones

desconocidas por deducción a partir de genes ya descritos. Se dice que un gen es

homologo a otro, cuando ambos descienden de un ancestro común (Koonin, 2005).

La comparación se realiza mediante el alineamiento de las secuencias de

aminoácidos que conforman las proteínas que se pretenden analizar. Para cuantificar la

similitud se aplican diversas matrices que asignan un puntaje en función de la identidad

de las secuencias, o su equivalencia fisicoquímica (Hirosawa, Totoki, Hoshida, &

Ishikawa, 1995).

Para realizar la búsqueda de secuencias homólogas a un gen identificado, se debe

comparar la secuencia de referencia, frente a todo el genoma de la especie problema.

Por tanto, se han desarrollado sistemas informáticos, que permiten procesar grandes

volúmenes de información de forma eficiente (Stephens & Stephens, 1990). Entre estos

sistemas encontramos BLAST y KEGG SSDB.

a. BLAST: (Del inglés, Basic Local Alignment Search Tool), la herramienta de

búsqueda de alineación local básica BLAST encuentra regiones de similitud

15

local entre secuencias. El algoritmo compara las secuencias de nucleótidos o

proteínas con las bases de datos de secuencias y calcula la significancia

estadística de las coincidencias. BLAST puede usarse para inferir relaciones

funcionales y evolutivas entre secuencias, así como para ayudar a identificar

miembros de familias de genes (NCBI, 2014).

b. KEGG SSDB: (Del ingles, Sequence Similarity Data Base of Kyoto

Encyclopedia of Genes and Genomes). Es una biblioteca informática que

almacena genes homólogos obtenidos mediante el algoritmo de similitud creado

por Smith-Waterman, basado en programación dinámica (Pearson, 2013).

2.2.5 Similitud a nivel de Estructura

Se han identificado proteínas que, a pesar de presentar baja similitud a nivel de

secuencia, poseen una estructura terciaria muy similar. En este caso, es posible que

cumplan una función relacionada. Este hecho se ha comprobado mediante experimentos

realizados por Damasceno y colaboradores, además de los ensayos realizados por

Sanchez y colaboradores (Sanchez, Diffley, & Ponting, 2010) (Nunes, Damasceno,

Freire, & Tosi, 2011).

2.2.6 Modelado de Proteínas

El modelado de proteínas por homología es una técnica que permite predecir la

estructura tridimensional de proteínas a partir de su secuencia, utilizando como molde,

estructuras cristalográficas de proteínas similares almacenas en el Protein Data Bank

(Singh, M. K. & Dominy, B. N., 2010).

2.2.7 Servidor para modelado de proteínas

I-TASSER, (Del inglés, Iterative Threading Assembly Refinement) Algoritmo de

refinamiento para montaje vía iteración. Según la CASP, (Critical Assessment of

Techniques for Protein Structure Prediction), Evaluación Crítica de Técnicas Para la

Predicción de Estructura de Proteínas, el servidor I-TASSER se posiciona como el

número uno en cuanto a indicadores de precisión en el modelado de proteínas (Moult,

Fidelis, & Kryshtafovych, 2013). El protocolo del servidor incluye varias etapas. En

primer lugar, la secuencia de datos enviada se compara con las estructuras secundarias

plegadas que están almacenadas en el PDB Bank (Roy, Kucukural, & Zhang, 2010).

16

Los fragmentos análogos encontrados se reensamblan mediante simulaciones de Monte

Carlo. Estas simulaciones permiten realizar un análisis computacional acerca de la

probabilidad de éxito y el riesgo asociado a la toma de decisiones (McGreevy & Pusztai,

2007). Los estados de baja energía libre son agrupados por el algoritmo SPICKER, el

cual asocia las posibles estructuras predichas y las compara con los modelos reales del

PDB BANK (Zhang, Y. & Skolnick, J., 2004). En una tercera etapa, se reconstruye

nuevamente la estructura obtenida (figura 2). De esta manera se elimina el choque

estérico, y se refina la topología grupal de los centroides del grupo (Yang et al., 2015).

2.2.8 Comparación de estructuras proteicas

TM- Align es un algoritmo de comparación de estructuras proteicas, independiente

del orden de secuencia. Para dos estructuras de proteínas de equivalencia desconocida,

TM-Align genera un alineamiento optimizado residuo a residuo, basado en su similitud

estructural, utilizando circuitos de programación dinámica. Se emite una superposición

óptima de las estructuras, junto con un TM-Score que cuantifica la similitud estructural.

Este se encuentra en un rango de 0 a 1, donde 1 representa una alineación perfecta. De

acuerdo con estrictos parámetros estadísticos, valores menores a 0,2 indican un

alineamiento aleatorio, mientras que valores superiores a 0,5 suponen un alineamiento

similar. (Zhang & Skolnick, 2005).

Figura 2. Protocolo I-TASSER para predicción de estructuras y funciones proteicas (Yang et al., 2015).

(Zhang & Skolnick, 2005).

17

2.2.9 Métricas de Calidad

Son métodos encargados de evaluar la calidad de las estructuras de las proteínas,

en base a parámetros fisicoquímicos, como, por ejemplo, las fuerzas de Van der Waals

que intervienen en la interacción de los átomos de los aminoácidos con el medio (Kihara,

Chen, & Yang, 2009). Entre estos encontramos:

a. Errat: Es un servidor diseñado para determinar la calidad de estructuras

cristalográficas. El límite de confianza está graficado en función de número de

residuo. El cálculo de la función de error se basa en las estadísticas de las

interacciones átomo-átomo no enlazados, comparado con las estructuras de alta

resolución almacenadas en la biblioteca. Las proteínas con alto grado de

confianza no sobrepasan el 95% del límite (figura 3) (Mac, Laskowski, &

Thornton, 1994).

b. C-Score: Es un puntaje de confianza que estima la calidad de las proteínas

predichas por I-TASSER. Es calculado en base a la significancia de los

alineamientos de los modelos concatenados y los parámetros de convergencia de

las simulaciones de montaje de estructuras. Se encuentra típicamente en un

rango de 2 a -5, donde los valores más altos representan mayor significancia en

la predicción acertada y viceversa (Yang, Roy, & Zhang, 2013).

Figura 3. Gráfica de error Errat. Los residuos que se muestran en color rojo superan el 95% del

límite de confianza, incrementado su probabilidad de error. A. Muestra el modelo inicial, con

errores de estructura. B. Muestra un modelo procesado, con menores errores de estructura (Mac,

Laskowski, & Thornton, 1994).

A

B

18

2.3 Marco Legal

Ley Orgánica de Salud Ref. 2015

Capitulo III-A

De las enfermedades catastróficas y raras o huérfanas

Art. ...(1).- El Estado ecuatoriano reconocerá de interés nacional a las enfermedades

catastróficas y raras o huérfanas; y, a través de la autoridad sanitaria nacional,

implementará las acciones necesarias para la atención en salud de las y los enfermos que

las padezcan, con el fin de mejorar su calidad y expectativa de vida, bajo los principios

de disponibilidad, accesibilidad, calidad y calidez; y, estándares de calidad, en la

promoción, prevención, diagnóstico, tratamiento, rehabilitación, habilitación y curación.

Art. .. (2). - Son obligaciones de la autoridad sanitaria nacional:

a) Emitir protocolos para la atención de estas enfermedades, con la participación de las

sociedades científicas, las mismas que establecerán las directrices, criterios y

procedimientos de diagnóstico y tratamiento de las y los pacientes que padezcan

enfermedades raras o huérfanas;

b) Promover, coordinar y desarrollar, conjuntamente con organismos especializados

nacionales e internacionales públicos y privados, investigaciones para el estudio de las

enfermedades raras o huérfanas y catastróficas con la finalidad de favorecer diagnósticos

y tratamientos tempranos en pro de una mejor calidad y expectativa de vida;

2.4 Art. .. (4). - La autoridad sanitaria nacional promoverá acciones destinadas a la

capacitación, a nivel de pregrado, postgrado y la educación permanente, para todo el

personal y profesionales de la salud, a fin de divulgar el conocimiento científico de las

enfermedades raras o huérfanas.

19

2.4 Hipótesis

Hi: Herramientas bioinformáticas y modelado de proteínas permiten identificar

homólogos de spMrc1/hClaspin en Leishmania mexicana.

H0: Herramientas bioinformáticas y modelado de proteínas no permiten identificar

homólogos de spMrc1/hClaspin en Leishmania mexicana.

2.5 Sistema de Variables

2.5.1 Variables caracterización

Homólogos de spMrc1/hClaspin

2.5.2 Variables de interés

- Herramientas Bioinformáticas

- Modelo de estructuras de proteínas

- Proteomas de tripanosomátidos

- Proteomas de organismos modelo

20

3. MARCO METODOLÓGICO

3.1 Diseño de la investigación

3.1.1 Paradigma de la investigación

Se utilizó el paradigma cuantitativo ya que la investigación se realiza con técnicas de

análisis de información que permiten identificar de forma cuantitativa posibles

homólogos de Claspin/scMrc1 en tripanosomátidos.

3.1.2 Nivel de la investigación

Se realizó una investigación descriptiva ya que se identifica de forma cuantitativa posibles

homólogos de Claspin/scMrc1 en tripanosomátidos.

3.1.3 Tipo de investigación

a. Investigación experimental. - Se utilizó este tipo de investigación pues se basa

en el modelado de proteínas, donde se realizó la predicción de estructuras a partir

de secuencias de aminoácidos.

b. Investigación básica. - Se buscó complementar los conocimientos teóricos sobre

los mecanismos implicados en el DNA Replication Checkpoint en Leishmania

mexicana, además de determinar filogenéticamente una diana farmacológica, con

el objetivo de aplicar estos conocimientos obtenidos para el desarrollo de posibles

tratamientos innovadores.

c. Investigación documental. - Ya que se utilizó fuentes bibliográficas para obtener

información previa sobre la investigación. Además, se realizó la búsqueda de

metodologías desarrolladas para la identificación de homólogos a Claspin y Mrc1

en Leishmania mexicana.

d. Investigación cuantitativa. - Ya que se realizaron procesos cuantificados. El

principal método en el que se realiza una descripción cuantitativa es la búsqueda

de homologías las cuales se encuentran cuantificadas mediante los puntajes de

similitud de cada procedimiento.

e. Investigación cualitativa. – Por lo que se basa en describir de manera cualitativa

el posible gen identificado como análogo a Claspin/Mrc1.

21

3.1.4 Procedimiento para alcance de objetivos

Para la consecución de objetivos se utilizará un enfoque bibliográfico y experimental,

mediante la aplicación de protocolos de laboratorio bioinformático que permitirán

desarrollar el método. Se utilizan herramientas bioinformáticas como son el análisis

de genomas a través de algoritmos de comparación de secuencias, herramientas de

modelado y métricas de calidad de proteínas.

3.2 Materiales y Métodos

3.2.1 Materiales

- Computador

- Office 365

- Chimera 1.12

- Genoma y proteoma de organismos de estudio

- Genoma y proteoma de organismos de referencia

MHOM/GT/2001/U1103 (taxid:929439)

3.2.2 Servidores

- STRING

- KEGG SSDB

- NCBI BLAST

- PDB Bank

- Uniprot

- GeneDB

- I-TASSER

3.2.3 Métodos

3.2.3.1 Proteínas de DNA Replication Checkpoint

La metodología utilizada en el presente trabajo de investigación inició con el

estudio de las proteínas involucradas en el DNA Replication Chekpoint en organismos

de referencia como H. Sapiens y Saccharomyces, mediante el uso de la base de datos

STRING, la cual busca relaciones entre proteínas en las últimas publicaciones de modo

22

automatizado, abarcando los avances más recientes en la investigación. Para esto se

ingresó al servidor de STRING a través de la dirección: https://string-db.org/. Se

seleccionó el modo Search / Multiple proteins, y se escribió el nombre de algunas

proteínas del mecanismo de checkpoint en humanos: ATM/ATR, Claspin, Tipin,

Timeless, Chk1/Chk2. Se procedió a registrar la gráfica de relaciones de todas las

proteínas resultantes. Para el caso de Saccharomyces cerevisiae se procede de igual

manera a la anterior, colocando como entrada las proteínas: Tel1, Mec1, Mrc1, Csm3,

Tof1, Chk1, Rad53, análogas al sistema de DNA Replication Checkpoint en humanos.

Se registraron las gráficas de redes de interacción de proteínas obtenidas de STRING.

3.2.3.2 Homología Claspin/Mrc1

Se seleccionó una de las proteínas implicadas en el DNA Replication Checkpoint,

hsClaspin/spsMrc1 en humanos y Saccharomyces respectivamente, en base a su

importancia en la activación de la respuesta al daño del ADN, y la regulación de la

velocidad de avance de la horquilla de replicación (Beishline, Kate, & Azizkhan, 2014).

El siguiente paso consistió en caracterizar la relación existente entre hClaspin y

spMrc1, para corroborar bioinformáticamente su homología. Por tanto, se busca

homólogos de spMrc1 en Homo sapiens, utilizando la base de datos KEGG SSDB

(Secuence Similarity Database), con su código de tres letras "hsa". Se utilizó

Saccharomyces pombe, principalmente por dos razones, en primer lugar, debido a que

esta especie presenta el dominio Mrc1 más conservado que Saccharomyces cerevisiae

(Zech, Godfrey, Masai, Hartsuiker, & Dalgaard, 2015). Además, este estudio se

fundamenta en la metodología utilizada por Damasceno y colaboradores, donde se

utiliza S. pombe (Nunes, Damasceno, Freire, & Tosi, 2011).

Luego se ordenaron los genes encontrados en base a su solapamiento. Posterior a

ello, se realizó un BLAST proteína - proteína, entre dos secuencias, manteniendo como

secuencia de referencia a spMrc1, y comparándola frente a cada uno de los posibles

homólogos obtenidos anteriormente. Se ordenan los resultados de BLAST, en base al

valor E (E Value). Se comprobó analíticamente que el resultado con menor E value, se

corresponde exactamente con hsClaspin, proteína homóloga a spMrc1.

23

3.2.3.3 Predicción y validación de modelos de estructuras de referencia

Además, se identificó la similitud estructural entre dos proteínas homólogas,

spMrc1 y scMrc1 de Saccharomyces pombe y S. cerevisiae respectivamente, y entre

hsClaspin y xlClaspin de Homo sapiens y Xenopus laevis respectivamente, modeladas

a través del servidor I-TASSER. Se ingresó en la página:

https://zhanglab.ccmb.med.umich.edu/I-TASSER/, y se agregó la secuencia FASTA del

modelo de la proteína a predecir. Los resultados obtenidos son descargados, a la vez que

se registraron los C-Score de los modelos predichos. Estos se visualizan utilizando el

programa Chimera 1.12, y se superpusieron a través del algoritmo del servidor TM-

Align, obteniéndose su coeficiente de superposición.

3.2.3.4 Homología Claspin/Mrc1 en L. mexicana

Para realizar la identificación de proteínas homólogas a Claspin/Mrc1 en

Leishmania sp. se utilizó la metodología descrita anteriormente para Saccharomyces

pombe y Homo Sapiens. En este caso se comparó Saccharomyces pombe frente a

Leishmania mexicana. El código de tres letras de L. mexicana en KEGG, es "lmi". Las

proteínas candidatas a homólogo de Mrc1 en L. mexicana y sus similares en L. major

obtenidas por BLAST, se sometieron al proceso de modelado tridimensional descrito

anteriormente. Se comprueba si las proteínas identificadas presentan una función ya

definida en el GeneDB.

3.2.3.3 Métricas de calidad

Se utilizó los métodos Errat y C-Score para evaluar la calidad de las estructuras

estudiadas. En el primer caso se ingresó en la página web del servidor Errat en

http://services.mbi.ucla.edu/ERRAT/ y luego se cargó el archivo .pdb de la proteína que

se pretende evaluar, en el icono de subida de la página de Errat. Posterior a ello, se da

clic en la opción Run. Las gráficas de calidad y los coeficientes de confianza se

presentan en resultados. El C-Score se obtiene junto con los resultados de modelado de

proteínas en el servidor I-TASSER.

24

3.2.3.4 Controles

El control positivo utilizado corresponde a la proteína de DNA Replication

Checkpoint, Rad53, la cual presenta su homólogo en L. major. Se espera encontrar alta

similitud entre el modelo predicho para L. major, y su correspondiente homólogo

almacenado en el PDB.

El control negativo utilizado en el presente experimento corresponde a una de las

proteínas descartadas durante la búsqueda por BLAST debido a su baja homología. Este

control negativo corresponde a la proteína descrita como ACC (acetyl-CoA

carboxylase) en el GeneDB, LmxM.30.2970. Se esperaría que esta proteína presente una

estructura modelada muy diferente a la proteína homóloga que sí corresponde a

Mrc1/Claspin. La comparación se realiza mediante el servidor TM-Align.

3.2.3.5 Búsqueda de Mrc1/Claspin en otros tripanosomátidos

Con la secuencia de la proteína identificada como Mrc1/Claspin en Leishmania

mexicana, se procede a realizar un BLAST, frente a otras especies de tripanosomátidos

como son L. major, L. brazilienzis, T. brucei y T. cruzi. Se registró los posibles

homólogos en otras especies de Leishmania y Trypanosoma. Para esto, buscó la

secuencia del gen de estudio en la base de datos Uniprot. En su buscador se escribió el

código del gen, por ejemplo, LmxM_34_1090. En la opción secuencia FASTA, se copió

la secuencia a la plataforma de NCBI, y en la opción Organism se escogió

Trypanosomatidae. Se registraron los datos obtenidos para los diferentes genes

encontrados.

3.2.4 Matriz de operacionalización de variables

Tabla 1. Operacionalización de variables

Variables Dimensiones Indicadores

Herramientas de alineación

de secuencias

BLAST E value

KEGG SSDB % Solapamiento Relativo

Modelos de Proteínas I-TASSER C- Score

Métricas de Calidad: Errat

Homólogos a Mrc1/Claspin Gen Problema Identificado TM-Score, E-value

Elaborado por Parra C.

25

3.2.4 Técnicas e instrumentos de recolección de datos

La técnica utilizada para la recolección de datos fue la observación por medio del

instrumento guía de observación la cual se puede observar en el Anexo C. Los datos se

obtuvieron de bases de datos reconocidas oficialmente, como son NCBI, UniProt y

KEGG, actualizados hasta la fecha de registro del trabajo de titulación. Se utiliza la

observación ya que se realizará un registro informático de los resultados, con los

resultados obtenidos de los servidores en tiempo real. La guía de observación es un

instrumento de la observación que ayuda a dirigir la investigación, donde se lleva una

lista de datos obtenidos para posteriormente procesarlos y establecer enlaces sobre lo

estudiado que en este caso es la búsqueda e identificación de genes homólogos a

Mrc1/Claspin en Leishmania mexicana.

3.2.5 Técnicas de Procesamiento y Análisis de Datos

Para el procesamiento de los datos, se utiliza el programa Microsoft Excel, de la

Suite Office 365, licencia académica de la Universidad Central del Ecuador. El análisis

se realiza mediante graficas comparativas de las estructuras de las proteínas identificadas

y su superposición utilizando dos programas: Chimera 1,12 y el Algoritmo TM-Align de

Zhang Lab.

El análisis estadístico utilizado es propio de cada herramienta bioinformática,

entre las utilizadas encontramos NCBI a través de E value, donde se representa el número

de alineaciones diferentes con puntajes equivalentes o mejores hallados por casualidad,

cuanto menor es el puntaje de E, más significativo es el puntaje de alineación. (Fassler &

Cooper.P., 2011). Otro valor utilizado corresponde al TM-Score de Tm- Align, el cual

mide la similitud global del pliegue y es menos sensible a las variaciones estructurales

locales, similar al RMSD, (Desviación cuadrática media de las posiciones atómicas),

donde se mide la distancia promedio entre los átomos de cadenas de proteínas

superpuestas. (Zhang & Skolnick, 2005).

26

4. MARCO ADMINISTRATIVO

4.1 Recursos

4.1.1 Talento humano

- Tutor y cotutor

- Expertos

- Profesores

- Ayudantes de Investigación

- Estudiante

4.1.2 Recursos materiales

- Material de oficina

- Laboratorios de bioinformática

- Material bibliográfico

- Internet

- Servidores en internet

4.2 Presupuesto

Tabla 2. Presupuesto requerido

Concepto Costo USD

Material de oficina 10,00

Hora Uso de Laboratorio 15,00

Uso Hora de Servidores 2,00

Elaboración de documentos 20,00

Movilización 30,00

Defensa de Proyecto 40,00

Total 117,00

Elaborado por Parra C.

27

4.3 Cronograma

Actividades

Año 2018

Responsab

le

Enero Febrero Marzo Abril Mayo Junio Julio Agosto

1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4

1. Revisión

Bibliográfica Estudiante

2. Elaboración del

Perfil Estudiante

3. Revisión de Perfil Tutores

4. Corrección de

Perfil Estudiante

5. Presentación a

Concejo de Carrera Estudiante

6. Ejecución de

ensayos piloto Estudiante

7. Ejecución de la

investigación Estudiante

8. Elaboración de

borrador de tesis Estudiante

9. Corrección del

escrito de tesis Tutores

10. Corrección de

errores del escrito Estudiante

11. Presentación de

Informe de tesis Tutora

12. Designación de

Tribunales

Consejo de

Carrera

13. Revisión del

Escrito Tribunales

14. Corrección del

Escrito Estudiante

15. Defensa oral Estudiante

Elaborado por Parra C.

28

5. DISCUSIÓN DE RESULTADOS

Filogenéticamente, se ha demostrado que las estructuras terciarias proteicas se

conservan más íntegramente que las secuencias de ácidos nucleicos. Esto se debe a que

las proteínas interactúan en sistemas biológicos dependientes de su conformación

tridimensional y su naturaleza fisicoquímica, la cual puede mantenerse entre grupos

químicos de aminoácidos con características en común. (Pellegrini, Marcotte, Thompson,

Eisenberg, & Yeates, 1999).

El presente estudio, tiene como objetivo principal, realizar la identificación de

proteínas de DNA Replication Checkpoint en tripanosomátidos, las cuales pueden

presentar una homología a nivel tridimensional frente a sus similares en organismos de

referencia. (Nunes, Damasceno, Freire, & Tosi, 2011).

5.1 Definición de proteínas de DNA Replication Checkpoint

Se ha utilizado la herramienta bioinformática STRING para verificar las rutas

bioquímicas que conforman los mecanismos de DNA Replication Checkpoint (Szklarczyk

et al., 2017). Los resultados obtenidos para la relación de proteínas en los sistemas H.

sapiens y S. cerevisiae se presentan en la figura 4 y figura 5 respectivamente.

En la figura 4 se puede observar la red de interacción de proteínas formada por

Claspin/Tipin/Timeless. Se muestra una relación directa entre las tres proteínas, con

relaciones de interacción de bases de datos curadas, en color azul, y determinadas

experimentalmente, en color violeta. Entre Claspin y Tipin no se han encontrado

interacciones determinadas experimentalmente. Sin embargo, existe relación de bases de

datos curados que confirman la interacción de estas proteínas. La búsqueda sistemática

realizada confirma analíticamente la interacción entre este sistema de proteínas. No

existen datos para estos mecanismos en Leishmania sp. o Trypanosoma sp. (Szklarczyk,

y otros, 2017).

29

5.2 Desarrollo del método de búsqueda

5.1 Desarrollo del método de búsqueda

Es conocida la homología existente entre las proteínas hsClaspin y spMrc1 a nivel

experimental (Masai, Yang, & Matsumoto, 2017). Por tanto, en el presente estudio se

desarrolla un método que permite identificar esta homología mediante técnicas

bioinformáticas, con la finalidad de identificar homólogos en organismos problema, como

por ejemplo Leishmania spp. (Sar et al., 2004).

Figura 5. Red de interacción String entre proteínas del

mecanismo de DNA Replication Checkpoint en

Saccharomyces cerevisiae.

Figura 4. Red de interacción entre proteínas del mecanismo

de DNA Replication Checkpoint en Homo Sapiens. Las

líneas de colores representan la interacción: Celeste: Base de

datos curada, Violeta, determinado experimentalmente,

Amarillo: extracción de textos. Negro: Co-expresado.

30

El método inicia con la búsqueda de homologías en la base de datos KEGG. En la

tabla 3, se muestran algunos de los posibles genes homólogos a spMrc1 obtenidos de

KEGG, los cuales, al ser ordenados en base a su solapamiento, muestran a hsClaspin en

sexto lugar. Este hecho demuestra la baja selectividad del algoritmo de búsqueda KEGG

SSDB, pues el resultado con mayor similitud de secuencia encontrado no se corresponde

precisamente con la homología descrita experimentalmente (hsClaspin/spMrc1) (Masai,

Yang, & Matsumoto, 2017). La tabla completa se despliega en el anexo E.

Tabla 3. Posibles genes homólogos a spMrc1 en H. sapiens

ordenados en función de su solapamiento.

N ° Gen Definition Solapamiento

1 MYH7 myosin heavy chain 7 1076

2 MYH6 myosin heavy chain 6 1070

3 CEP128 centrosomal protein 128 1066

4 BOD1L1 biorientation of chromosomes

in cell division 1 like 1 1058

5 CEP1 centriolin 1050

6 CLSPN Claspin 1043

7 ANKRD11 ankyrin repeat domain-

containing protein 11/12 1042

8 MYH8 myosin heavy chain 1034

9 CENPE centromere protein E 1029

10 KIF21A kinesin family member 21A 1015

… … … …

83 C18orf30 piezo type mechanosensitive

ion channel component 2 110

Por tanto, se toman todos los posibles genes homólogos a spMrc1 obtenidos por

KEGG SSDB, y se realiza la comparación uno a uno a través de BLAST. Estos resultados

se muestran en la Tabla 4.

Elaborado por Parra C. (KEGG, 2018).

31

Tabla 4. Comparación por BLAST entre posibles homólogos a spMrc1 en H.

sapiens

N ° Gen Code Definition Max Score E Value

1 CLSPN Claspin 39,7 1 x 10-6

2 PLEC Plectin 30,0 0,004

3 CNTLN Centlein 26,9 0,010

4 MAP3K19 mitogen-activated protein

kinase 26,2 0,017

5 C18orf30 piezo type mechanosensitive

ion channel 25,4 0,056

6 ANKRD11 ankyrin repeat domain 11 25,4 0,062

7 CGN Cingulin 23,9 0,076

8 IWS1 SUPT6H interacting protein 22,7 0,097

9 CGNL1 Cingulin like 1 22,7 0,170

10 KIF20B Kinesin family member 20B 23,1 0,200

… … … … …

83 GOLGA4 golgin subfamily A member 4 NA* NA

En la Tabla 4, se puede observar los resultados de posibles genes homólogos

obtenidos de KEGG SSDB, comparados a través de BLAST. Se puede apreciar que la

proteína hsClaspin, presenta el mayor resultado de Max Score y E value. Comprobándose

que es posible identificar la homología spMrc1/hsClaspin mediante herramientas

bioinformáticas de comparación de secuencias (Masai, Yang, & Matsumoto, 2017).

5.3 Búsqueda de homólogos a spMrc1 en Leishmania mexicana

Se aplicó el método desarrollado con anterioridad al genoma de Leishmania

mexicana. En la Tabla 5, se muestran los resultados de la búsqueda de genes homólogos

a spMrc1 frente a L. mexicana en KEGG SSDB.

* NA: No Aplica, no se encontraron similitudes estadísticas significativas.

Elaborado por Parra C. (NCBI, 2014).

32

* NA: No Aplica, no se encontraron similitudes estadísticas significativas.

Elaborado por Parra C. (NCBI, 2014).

Tabla 5. Posibles genes homólogos a spMrc1 en L. mexicana

ordenados en función de su solapamiento.

N ° Gen Definition Solapamiento

1 LmxM.16.1460c.1 hypothetical protein 1053

2 LmxM.16.1460 putative kinesin 1045

3 LmxM.22.1320 hypothetical protein,

unknown function 951

4 LmxM.14.1100 putative kinesin K39 934

5 LmxM.15.0440 tb-292 membrane associated

protein 913

6 LmxM.14.1120 putative kinesin K39 905

7 LmxM.33.0690 hypothetical protein 903

8 LmxM.34.1090 hypothetical protein 812

9 LmxM.14. 1120a.1 hypothetical protein 761

10 LmxM.16. 1460a.1 hypothetical protein 718

11 LmxM.26.2490 hypothetical protein 710

12 LmxM.30.2970 putative acetyl-CoA

carboxylase 136

En la Tabla 6 se muestran los posibles genes homólogos a spMrc1 en L. mexicana

obtenidos anteriormente (tabla 5), comparados a través de BLAST uno a uno. Las

proteínas que presentan la mayor puntuación de Max Score podrían ser consideradas

como posibles homologas a spMrc1/hsClaspin. Entre las proteínas mejor puntuadas se

encuentran las codificadas por los genes LmxM.34.1090 y LmxM.33.0690. Con estas

proteínas se realizó el modelado de estructura terciaria.

Tabla 6. Comparación por BLAST entre posibles homólogos a spMrc1 en L. mexicana

N ° Gen Code Definition Max Score E Value

1 LmxM.34.1090 hypothetical protein 22,3 0,17

2 LmxM.33.0690 hypothetical protein 20,8 1,2

3 LmxM.30.2970 putative acetyl-CoA

carboxylase 19,2 3,7

4 LmxM.26.2490 hypothetical protein 17,7 7,4

5 LmxM.16.1460c.1 hypothetical protein 17,7 9,1

6 LmxM.16.1460 putative kinesin NA NA

7 LmxM.22.1320 hypothetical protein,

unknown function NA NA

8 LmxM.14.1100 putative kinesin K39 NA NA

9 LmxM.15.0440 tb-292 membrane associated

protein NA NA

10 LmxM.14.1120 putative kinesin K39 NA NA

11 LmxM.14. 1120a.1 hypothetical protein NA NA

12 LmxM.16. 1460a.1 hypothetical protein NA NA

Elaborado por Parra C. (KEGG, 2018).

33

5.4 Homología estructural Mrc1/Claspin entre S. pombe, H. sapiens y L. mexicana

Los resultados presentados a continuación identifican la homología entre los

modelos predichos para hsClaspin (figura 6) y spMrc1 (figura 7) a nivel de estructura

tridimensional. En la figura 8, se muestra la superposición tridimensional entre spMrc1 y

hsClaspin. En la tabla 7, se cuantifica esta superposición, la cual es estadísticamente

significativa, con un TM-Score de 0,672, lo que verifica la homología existente (Zhang

& Skolnick, 2005), a pesar de que su porcentaje de identidad de secuencia es bajo: 5,8%.

Debe considerarse que esta comparación se realizó con el dominio terminal de la

proteína spMrc1 correspondiente a los aminoácidos del 790 al 1019, pues la estructura

completa presenta menor similitud. No obstante, la comparación aporta información

relevante debido a que las proteínas están conformadas por dominios, los cuales pueden

conservarse filogenéticamente de manera diferenciada (Hanks, Quinn, & Hunter, 1988).

De hecho, una comparación a través de dominios evolutivos es realizada por Adak y

Datta, donde el dominio proximal de la proteína peroxidasa APX, en L. major, es idéntico

en un 34 % a su homólogo en Glycine max (Adak & Datta, 2005). En la figura 6 y figura

7, se muestran las estructuras modeladas de hsClaspin y spMrc1 respectivamente.

Figura 6. Estructura modelada por ITASSER de

Claspin en H. sapiens (Yang, y otros, 2015).

Figura 7. Estructura

modelada por ITASSER de

Mrc1 en S. pombe (Yang, y

otros, 2015)

34

Tabla 7. Comparación entre proteínas de referencia y de L. mexicana.

TM-Score entre 0 y 1. Donde 1 indica un alineamiento idéntico.

Gen

Codificante

Análogo

Estructural % Seq_ID TM-Score

spMrc1 hsClaspin 5,8 0,672

LmxM.34.1090 spMrc1 7,4 0,828

LmxM.330690 hsClaspin 8,3 0,772

LmxM.34.1090 hsClaspin 7,0 0,288

LmxM.330690 spMrc1 8,3 0,291

Además, se establece la relación existente entre las proteínas de referencia

hsClaspin/spMrc1 y las proteínas LmxM.34.1090 (figura 9) y LmxM.33.0690 (figura 10)

identificadas por el método desarrollado en el presente estudio. Las superposiciones

(figura 11 y 12) fueron realizadas por el algoritmo TM-Align y se cuantifican en la tabla

7. Las proteínas codificadas por LmxM.34.1090 y LmxM.33.0690 presentaron alta

correspondencia con los modelos de referencia, spMrc1 y hsClaspin respectivamente. Los

valores de TM-Align indican elevada similitud estructural a pesar de que su identidad a

nivel de secuencia es baja: 5,8% y 6,8% respectivamente. Esta similitud entre las

estructuras modeladas en L. mexicana y las de los organismos de referencia spMrc1 y

hsClaspin, podría sugerir la presencia de sistemas múltiples de DNA Replication

Checkpoint en L. mexicana (Nunes, Damasceno, Freire, & Tosi, 2011) (Genois, y otros,

2014).

Figura 8. Superposición de estructuras

modeladas. Dorado: hsClaspin, Azul: spMrc1.

Realizado con Chimera 1.12

Elaborado por Parra C.

35

La proteína codificada por el gen LmxM.34.1090, (putative Mrc1), no se encuentra

identificada en el GeneDB. (Sanger Institute, 2018). Esto puede sugerir que la

identificación realizada es acertada, por tanto, se recomienda que se compruebe la

homología a través de experimentos de biología molecular. El segundo gen,

LmxM.33.0690, se encuentra descrito en el GenDB como FAZ1, relacionado con la zona

Figura 9. Estructura modelada

por ITASSER de LmxM.34.1090

(Yang, y otros, 2015)

Figura 10. Estructura modelada por

ITASSER de LmxM.33.0690 (Yang, y

otros, 2015)

Figura 11. Superposición de

estructuras modeladas. Azul:

spMrc1, Violeta: putative spMrc1

L. mexicana (LmxM.34.1090).

Realizado con Chimera 1.12

Figura 12. Superposición de estructuras predichas.

Dorado: hsClaspin, Naranja: putative hsClaspin L.

mexicana (LmxM.330690). Realizado con Chimera

1.12.

36

de anclaje del flagelo (Wheeler R. , Sunter, Gull, & K, 2016), sin embargo, en Uniprot no

está identificado, requiriéndose mayor evidencia científica para su etiquetado. (The

UniProt Consortium, 2017). Es posible que la similitud encontrada entre LmxM.33.0690

y hsClaspin tenga relación con la morfogénesis del flagelo y el ADN mitocondrial.

(Wheeler, Sunter, & Gull, 2016). La presencia de estos sistemas de reparación, tanto en

homólogos de hsClaspin y spMrc1 podría sugerir la conservación de dos sistemas de

reparación, tanto en ADN nuclear, como ADN mitocondrial. Por tanto, se debe considerar

estos mecanismos de checkpoint en L. mexicana.

5.5 Validación de estructuras proteicas modeladas

El sistema de modelado fue validado a través de tres vías. La primera consiste en

establecer controles. En la Tabla 8, se presentan los controles positivos y negativos. El

control positivo presenta un elevado valor de TM-Score, lo que supone una estructura

similar para las proteínas de Checkpoint Rad53 tanto en S. pombe como en Leishmania

major. Esto concuerda con la identificación documentada por Genois y colaboradores

(Genois et al., 2014). El control negativo presenta un TM-Score bajo, esto indica que a

pesar de que la proteína ACC, de L. mexicana, presenta similitud con hsClaspin/spMrc1,

su estructura no posee relación significativa con los modelos de las proteínas de

referencia. Se puede visualizar los alineamientos estructurales para los controles en la

Figura 13, Figura 14 y Figura 15.

Tabla 8. Comparación entre estructuras de control. TM-Score

entre 0 y 1. Donde 1 indica un alineamiento idéntico.

Control Estructura1 Estructura 2 TM-Score

Positivo Rad53 PDB

(4pdp)

LmjF.17.0060

modelado 0,827

Negativo

lmACC spMrc1

modelado 0,230

lmACC hsClaspin

modelado 0,242

Elaborado por Parra C.

37

La segunda forma de validación corresponde al control de calidad de las proteínas

modeladas a través de las métricas de calidad. Mediante el factor de calidad Q de Errat,

se puede observar que las proteínas cumplen con una calidad superior al 80% (Tabla 9).

Este factor resulta significativo, al compararlo con la proteína de referencia Chk1, la cual

presenta un coeficiente de calidad similar, de aproximadamente 86,2%. Es importante

mencionar que idealmente se preferiría trabajar con estructuras cristalográficas del PDB,

las cuales presentan una calidad ERRAT, cercana al 95%, sin embargo, al no encontrarse

las proteínas a estudiar en el PDB, se predice las estructuras del complejo, obteniéndose

modelos con una calidad aceptable para este ensayo. De hecho, proteínas con estructuras

Figura 13. Superposición de estructuras scRad53.

Dorado: S. cerevisiae, Celeste: LmjF.17.0060

modelado por I-TASSER. Control Positivo

Figura 15. Superposición de estructuras

Control Negativo. Azul: spMrc1, Rojo:

ACC. Modeladas por I-TASSER.

Figura 14. Superposición de estructuras

Control Negativo. Dorado: hsClaspin, Rojo:

ACC. Modeladas por I-TASSER.

38

cristalográficas disponibles en el PDB (referencias: hsChk1 y LmxM.30.2970), presentan

métricas de calidad similares a las obtenidas por modelado con I-TASSER. En el anexo

F, se muestra a manera de ejemplo, la gráfica de distribución del coeficiente de error Errat

en función del cada residuo proteico para hsClaspin

La segunda métrica de calidad utilizada corresponde al C-Score. En la Tabla 9, se

puede apreciar que el C-Score de las proteínas estudiadas varía entre -1,66 y 0,71. Estos

valores indican una distribución central aceptable del coeficiente, considerando que el

rango de confianza se expresa entre -5 y 2. Para esta prueba se utilizó como referencia

proteínas con estructuras cristalográficas como son hsChk1 y LmxM.30.2970 (RCSB,

2018). Sin embargo, se debe mencionar que la proteína modelada para el gen

LmxM.34.1090 presenta el menor C-Score (-3,28). Este hecho, pone en manifiesto la

necesidad de realizar una validación de la estructura adicional, utilizando otra especie de

Leishmania, en este caso se realizó la validación adicional utilizando la similitud

filogenética con L. major.

Tabla 9. Métricas de calidad de las proteínas modeladas.

C-Score: Entre 2 y -5, donde 2 corresponde a un modelo

de elevada confianza y viceversa.

Proteína Q Factor

% (Errat) C-Score

hsClaspin 83,76 0,13

xlClaspin 82,50 0,71

spMrc1 93,69 -1,27

scMrc1 85,75 -1,66

LmxM.34.1090 79,99 -3,28

LmjF.35.1090 91,98 -1,09

LmxM.33.0690 90,90 -0,42

Chk1 Control humano 86,21 -0.18

LmxM.30.2970 Control 85,03 0,26

La tercera forma de validación corresponde a la identificación de similitud

filogenética. Se esperaría que, en especies cercanas en términos evolutivos, la estructura

terciaria se conserve de mejor manera (Pellegrini, Marcotte, & Thompson, 1999). Por

tanto, en la tabla 10, se ha comparado las estructuras en diferentes especies relacionadas.

Para las estructuras modeladas en animales: H. sapiens y X. laevis, se muestra una

correspondencia de estructuras de 0,971. Entre S. pombe y S. cerevisiae el coeficiente de

Elaborado por Parra C.

39

alineamiento es de 0,933. Finalmente, para la familia de proteínas predichas entre L.

mexicana y L. major, el coeficiente de superposición es de 0.803. Por tanto, se puede

afirmar que existe alta correspondencia estructural entre especies filogenéticamente

cercanas (figuras 16, 17 y 18).

Tabla 10. Comparación entre familias de proteínas modeladas

Proteína Organismo 1 Organismo 2 TM-Score

Claspin H. sapiens X. laevis 0,971

Mrc1 S. pombe S. cerevisiae 0,933

Putative

Mrc1 L. mexicana L. major 0,803

Elaborado por Parra C.

Figura 16. Superposición de estructuras modeladas

por I-TASEER para Claspin. Dorado: H. sapiens,

Verde: X. laevis

Figura 17. Superposición de estructuras

predichas para Mrc1. Azul: S. pombe,

Amarillo: S. cerevisiae

Figura 18. Superposición de estructuras

predichas para putative Mrc1. Violeta: L.

mexicana, Blanco: L. major (LmjF.35.1090).

40

5.7 Homología Mrc1/Claspin en tripanosomátidos

Finalmente, se esperaría que un gen que codifica para una proteína de un rol tan

importante, como Claspin/Mrc1, se encuentre altamente conservada en el género

Leishmania sp. Al realizar una búsqueda por BLAST (Tabla 11), se aprecia una identidad

de secuencia superior al 90% en las especies L. major, L. infantum, L. donovani y superior

al 79% en L. braziliensis. Este hecho confirma la presencia de homólogos al gen

LmxM.34.1090 en el género Leishmania sp. En el caso del género Trypanosoma sp., se

observa similitud de identidad cercana al 40%. Esto pone en manifiesto, la alta

variabilidad del genoma en tripanosomátidos, sin embargo, no se descarta la presencia de

homólogos a nivel de estructura, para estas similitudes en Trypanosoma, las cuales son

relativamente altas.

Tabla 11. Resultados de BLAST entre LmxM.34.1090 (putative

Mrc1) y a otros tripanosomátidos

Gen Organismo Max

Score

E Value Ident

%

LmjF.35.1090 Leishmania

major 1591 0,0 91

LinJ.35.1100 Leishmania

infantum 1583 0,0 90

LdbPK.35.1100 Leishmania

donovani 1753 0,0 90

LbrM.27.0390 Leishmania

braziliensis 1422 0,0 79

TcCLB.503599.40 Trypanosoma

cruzi 460 3 x 10-144 37

Tb927.5.840 Trypanosoma

brucei 454 5 x 10-142 41

Elaborado por Parra C. (NCBI, 2014).

41

7. CONCLUSIONES Y RECOMENDACIONES

7.1 Conclusiones

- A través del presente estudio se han identificado proteínas homólogas a

hsClaspin/spMrc1 en Leishmania mexicana, utilizando herramientas

bioinformáticas como la comparación de secuencias de aminoácidos y la

comparación de estructuras modeladas.

- Entre los genes que codifican proteínas con similitud estructural a spMrc1 y

hsClaspin se encuentran LmxM.34.1090 y LmxM.33.0690 respectivamente.

- Es posible la existencia de posibles mecanismos de checkpoint mediados por

homólogos a hsClaspin y spMrc1 en Leishmania spp.

- La similitud estructural entre hsClaspin y el dominio terminal de spMrc1 en

proteínas modeladas es significativa, hecho que pone en manifiesto la relación

filogenética entre las especies comparadas.

- Se presentó elevada similitud estructural entre especies filogenéticamente

cercanas: H. sapiens y X. laevis, S. cerevisiae y S. pombe; L. mexicana y L.

major.

- Los controles de calidad para las proteínas generadas por ordenador presentan

valores de confianza aceptables para el presente estudio.

- Los controles positivo y negativo presentan resultados que validan la acertada

predicción de los modelos de proteínas y la especificidad del método, al verificar

la ausencia de falsos positivos.

- Se identifican posibles homólogos de spMrc1, en otras especies de Leishmania,

como L. major, L. infantum, L. donovani, L. braziliensis y genes con similitudes

considerables en T. cruzi y T. brucei.

42

7.2 Recomendaciones

- Se recomienda verificar la función de las proteínas identificadas en los

mecanismos de DNA Replication Checkpoint in silico, en experimentos in vitro

en L. mexicana.

- Se sugiere realizar experimentos de modelado tridimensional de proteínas con

los posibles homólogos a spMrc1 en Leishmania spp. y Trypanosoma spp.

descritos en este trabajo.

- Se sugiere realizar cortes de las proteínas en función de sus dominios en

proteínas de elevado tamaño. >1500 AA

- Se recomienda continuar con el estudio bioinformático de las proteínas que

conforman el complejo de DNA Replication Checkpoint Tipin/Timeless.

- Se sugiere optimizar el tiempo dedicado al modelado tridimensional de

proteínas, a través de la implementación del Servidor I-TASSER en una estación

de trabajo local.

- Se recomienda trabajar con múltiples cuentas institucionales de la universidad,

para optimizar el proceso de modelado de proteínas.

- Es altamente recomendable trabajar con un ordenador con interfaz de 64 bits,

pues varios programas requieren de esta característica.

- Se sugiere el trabajo en terminales de escritorio a través del control remoto de

estación en procesos que requieren alta capacidad de procesamiento.

- Se sugiere almacenar respaldos en la nube de los resultados obtenidos en las

diferentes etapas bioinformáticas, para evitar pérdida de información.

43

CITAS BIBLIOGRÁFICAS

Abraham, R. (2001). Cell cycle checkpoint signaling through the ATM and ATR kinases. Genes

& Development, 2177-2186.

Adak, S., & Datta, A. (2005). Leishmania major encodes an unusual peroxidase that is a close

homologue of plant ascorbate peroxidase: a novel role of the transmembrane domain.

Biochem Journal, 3-9.

Alabert, C., Poveda, A., & Pasero, P. (2009). Yeast as a Model for Human Disease. ed. Witt, S.

N, 199-222.

Alcasabas, A. et al. (2001). Mrc1 transduces signals of DNA replication stress to activate

Rad53. Nat. Cell Bio, 3, 65, 958.

Bando, M. et al. (284). Csm3 , Tof1 , and Mrc1 Form a Heterotrimeric Mediator Complex That

Associates with DNA Replication Forks. Journal of Biological Chemistry, 2009.

Beishline, K., & Clifford, J. (2014). Interplay Between the Cell Cycle and Double-Strand Break

Response in Mammalian Cells. Methods in molecular biology, 44-46.

Beishline, Kate, & Azizkhan, J. (2014). Interplay Between the Cell Cycle and Double-Strand

Break Response in Mammalian Cells. Methods in molecular biology, 50-51.

Berman, H., Westbrook, J., Feng, Z., Gilliland, G., Bhat, T., Weissig, H., . . . Bourne, P. (2000).

The Protein Data Bank. Nucleic Acids Research, 235-242.

Bern, C., Montgomery, S., Herdwalt, B., Maguire, J., Kirehoff, L., Gilman, R., & Moore, A.

(2007). Evaluation and Treatment of Chagas Disease in the United States. Clinician´s

Corner, 2176.

Bowie, J. L., & Eisenberg, D. (1991). A method to identify protein sequences that fold into a

known three-dimensional structure. Science, 164-166.

Chothia, C., & Lesk, A. (1986). The relation between the divergence of sequence and structure

in proteins. The Embo Journal, 1-2.

Comisión de las Comunidades Europeas. (2008). Desición de la comisión relativa a la

transferencia de la declaración del medicamento "Miltefosina" como medicamento

huérfano, con arreglo al Reglamento (CE) n° 141/2000 del Parlamento Europeo y del

Consejo. Brucelas: Agencia Europea de Medicamentos.

Conway, C., Proudfoot, C., Burton, P., & al., e. (2002). Two pathways of homologous

recombination in Trypanosoma brucei. Mol Microbiol, 700.

Fassler, J., & Cooper.P. (2011). BLAST Glosary. NCBI Help Manual, 53-55.

Genois, M., E., P., & Laffitte, M. (2014). DNA repair pathways in trypanosomatids: from DNA

repair to drug resistance. Microbiol Mol Biol, 40-73.

44

Genois, M., Paquet, E., Laffite, M., Maity, R., Rofrigue, A., Oullette, . . . Masson, J. (2014).

DNA Repair Pathways in Trypanosomatids: from DNA Repair to Drug Resistance.

Microbiol Mol Biol Rev, 70-43.

Gorgoulis, V. (2005). Activation of the DNA damage checkpoint and genomic instability in

human precancerous lesions. International Journal of Science, 907-911.

Hanks, S., Quinn, A., & Hunter, T. (1988). The protein kinase family: conserved features and

deduced phylogeny of the catalytic domains. Science, 42-52.

Higgins, D., & Taylor, W. (2000). Bioinformatics: sequence, structure, and databanks: a

practical approach. Oxford: Oxford University Press.

Hirosawa, M., Totoki, Y., Hoshida, M., & Ishikawa, M. (1995). Comprehensive study on

iterative algorithms of multiple sequence alignment. Bioinformatics, 11(1), 13-18.

IICAB. (2009). Leishmaniasis (cutánea y viceral). The Center for Food Security and Public

Health, 1-2.

Kastan, M., Zhan, Q., & Deiry, W. (1992). A mammalian cell cycle checkpoint pathway

utilizing p53 and GADD45 is defective in ataxia-telangiectasia. Cell, 587-590.

KEGG. (5 de Marzo de 2018). KEGG Pathway: Cell Cycle. Obtenido de Kyoto Encyclopedia of

Genes and Genomes: http://www.kegg.jp/kegg-

bin/highlight_pathway?scale=1.0&map=hsa04110&keyword=checkpoint

Khanra, S., Sarraf, N., Lahiry, S., & Roy, S. M. (2017). Leishmania genomics: a brief account.

The Nucleus, 227-228.

Kihara, D., Chen, H., & Yang, Y. (2009). Quality Assessment of Protein Structure Models.

Current Protein and Peptide Science, 216-219.

Koonin, E. (2005). Orthologs, Paralogs, and Evolutionary Genomics. Annual Review of

Genetics, 1.

Koundrioukoff, S. et al. (2013). Activation of the ATR Signaling Pathway upon Increasing

Replication Stress Impacts Fragile Site Integrity. PLos Genet, 9.

Larreátegui, D. (2011). Enfermededad de Chagas en el Ecuador: 100 años de historia. Post-

Grado. Medicina Interna. Universidad Internacional del Ecuador, 5,6. Obtenido de

https://es.scribd.com/doc/50321101/Revision-Chagas-100-anos-en-Ecuador

Luscombe, M., Greenbaum, D., & Gerstein, M. (2001). What is Bioinformatics? A Proposed

Definition and Overview of the Field. Schattauer GmbH, 346-347.

Mac, A., Laskowski, M., & Thornton, J. (1994). Knowledge-based validation of protein

structure coordinates derived by X-ray crystallography and NMR spectroscopy. El

Sevier, 731-733.

Mantiero, D., Mackenzie, A., Donaldson, A. & Zegerman, P. (2011). Limiting replication

initiation factors execute the temporal programme of origin firing in budding yeast. .

EMBO J., 30.

Martinez, M. (2009). Estructura y función del ADN y de los genes. Tipos de alteraciones de la

función del gen por mutaciones. El Sevier, 1-2.

45

Masai, H., Yang, C., & Matsumoto, S. (2017). Mrc1/Claspin: a new role for regulation of origin

firing. Current Genetics, 813-818.

McGreevy, R., & Pusztai, L. (2007). Reverse Monte Carlo Simulation: A New Technique for

the Determination of Disordered Structures. Molecular Simulation, 359-367.

Moore, J. H., Asselbergs, F. W., & Williams, S. M. (2010). Bioinformatics challenges for

genome-wide association studies. Bioinformatics, 445-446.

Moult, J., Fidelis, K., & Kryshtafovych, A. (2013). Critical assessment of methods of protein

structure prediction (CASP) — round x. Proteins, 1-2.

MSP. (2014). Cuadro Nacional de Medicamentos Básicos y Registro Terapéutico. Quito:

Publiasesores Cía. Ltda.

MSP. (4 de Diciembre de 2014). Gaceta Epidemiológica Semanal No. 47. Subsecretaria de

Vigilancia de la Salud Pública. Obtenido de Dirección Nacional de Vigilancia

Epidemiológica.

Musiałek, M. W., & Rybaczek, D. (2015). Behavior of replication origins in Eukaryota – spatio-

temporal dynamics of licensing and firing. . Cell Cycle, 00-00.

NCBI. (Febrero de 2014). BLAST. Obtenido de National Center for Biotechnology Information,

U.S. National Library of Medicine: https://blast.ncbi.nlm.nih.gov/Blast.cgi

Nunes, V., Damasceno, J., Freire, R., & Tosi, L. (2011). The Hus1 homologue of Leishmania

major encodes a nuclear protein that participates in DNA damage response. Molecular

& Biology Parasitology, 1-2.

OMS. (1 de Febrero de 2018). Centro de Prensa: La enfermedad de Chagas (tripanosomiasis

americana). Obtenido de Organización Mundial de la Salud:

http://www.who.int/es/news-room/fact-sheets/detail/chagas-disease-(american-

trypanosomiasis)

OMS. (14 de Marzo de 2018). Centro de Prensa: Leishmaniasis. Obtenido de Organización

Mundial de la Salud: http://www.who.int/es/news-room/fact-sheets/detail/leishmaniasis

Pearson, W. (2013). An Introduction to Sequence Similarity (“Homology”) Searching. Bulletin

of Mathematical Biology, 3.

Pellegrini, M., Marcotte, E., & Thompson, M. (1999). Assigning protein functions by

comparative genome analysis: Protein phylogenetic profiles. PNAS, 4285-4288.

Pellegrini, M., Marcotte, E., Thompson, M., Eisenberg, D., & Yeates, T. (1999). Assigning

protein functions by comparative genome analysis: Protein phylogenetic profiles.

Proceedings of the National Academy of Sciences, 4285.

Poli, J. et al. . (2012). dNTP pools determine fork progression and origin usage under

replication stress. . EMBO J., 31.

RCSB. (05 de 16 de 2018). Protein Data Bank. Obtenido de RCSB PDB : https://www.rcsb.org

Romero, A., Machuca, C., & Padrón, M. (2007). Valor pronóstico de los cambios fisiológicos

asociados a la quimio-resistencia en Leishmania. Researchgate, 2-4.

Roy, A., Kucukural, A., & Zhang, Y. (2010). I-TASSER: a unified platform for automated

protein structure and function prediction. Nature Protocols, 725-738.

46

Sánchez, L., & Sáenz, E. (2004). Leishmaniasis. Educación Médica Continua, 82-84.

Sanchez, L., Diffley, J., & Ponting, C. (2010). Homology explains the functional similarities of

Treslin/Ticrr amd SId3. Magazine R509, 1-2.

Sanger Institute. (16 de 05 de 2018). Kynetoplastid Protozoa. Obtenido de GenDB:

www.gendb.org

Sar, F., Lindsey Boltz, L., Subramanian, D., D., C., S., H., J., G., & A., S. (2004). Human

claspin is a ring-shaped DNA-binding protein with high affinity to branched DNA

structures. Journal of Biological Chemistry, 1-3.

Shankar, P., Borrman, T., Liu, V., Yang, S., Bechloefer, J., & Rhind, N. (2015). Replication

timing is regulated by the number of MCMs loaded at origins. Genome Research, 1-2.

Singh, M. K. & Dominy, B. N. (2010). Thermodynamic resolution: how do errors in modeled

protein structures affect binding affinity predictions? . Proteins, 78.

Stephens, T., & Stephens, R. (1990). Sequence logos: a new way to display consensus

sequences. Nucleic Acids Research, 1.

Sutton, M., & Walker, C. (2002). Managing DNA polymerases: Coordinating DNA replication,

DNA repair, and DNA Recombination. Pnas, 2-3.

Sverdlov, E. (1998). Perpetually mobile footprints of ancient infections in human genome.

FEBS Letters, 1-2.

Szklarczyk, D., Morris, J., Cook, H., Kuhn, M., Wyder, S. S., Doncheva, N., . . . Mering, C.

(2017). The STRING database in 2017: quality-controlled protein-protein association

networks, made broadly accessible. Nucleic Acids Research, 362-364.

The UniProt Consortium. (2017). UniProt: the universal protein knowledgebase. Nucleic Acids

Research, 1-5. Recuperado el 12 de 04 de 2018, de

http://www.uniprot.org/uniprot/?query=claspin&sort=score

Uzcanga, G., Lara, E., Gutiérrez, F., Beaty, D., Beske, T., Teran, R., . . . Poveda, A. (2016).

Nuclear DNA replication and repair in parasites of the genus Leishmania: Exploiting

differences to develop innovative therapeutic approaches. Critical Reviews in

Microbiology, 9-10.

Wheeler, R., Sunter, J., & Gull, K. (2016). Flagellar pocket restructuring through the

Leishmania life cycle involves a discrete flagellum attachment zone. Journal of Cell

Cience, 1.

Wheeler, R., Sunter, J., Gull, & K. (2016). Flagellar pocket restructuring through the

Leishmania life cycle involves a discrete flagellum attachment zone. J Cell Sci, 854-

857.

Yang, J., Roy, A., & Zhang, Y. (2013). Proteinm ligand binding site recognition using

complementary. Bioinformatics, 29.

Yang, J., Yan, R., Roy, A., Xu, D., Poisson, J., & Zhang, Y. (2015). The I-TASSER Suite:

Protein structure and function prediction. Nature Methods, 12, 7-8.

Yoshida, K. et al. . (2014). The histone deacetylases sir2 and rpd3 act on ribosomal DNA to

control the replication program in budding yeast. Cell, 7.

47

Zech, J., Godfrey, E., Masai, H., Hartsuiker, E., & Dalgaard, Z. (2015). The DNA Binding

Domain of S.pombe Mrc1 (Claspin) Acts to Enhance Stalling at Replication Barriers.

PLOS One, 1-3.

Zhang, Y. & Skolnick, J. (2004). SPICKER: a clustering approach to identify near-native

protein folds. Journal of Computational Chemistry, 1-2.

Zhang, Y., & Skolnick, J. (2005). TM-align: A protein structure alignment algorithm based on

TM-score. Nucleic Acids Research, 2302-2309.

Zhao, H., Tanaka, K., Eishi, N., Nogochi, C., & Russell, P. (2003). Replication Checkpoint

Protein Mrc1 Is Regulated by Rad3 and Tel1 in Fission Yeast. Molecular And Cellular

Biology, 8395-8400.

48

ANEXOS

49

Anexo A. Árbol de Problemas

Desconocimiento acerca de la presencia de homólogos de Mrc1/Claspin en

Leishmania mexicana, durante el periodo 2018-2018?

.

Mecanismo de acción

de los fármacos no

elucidado

Alta variabilidad

genética

Baja inversión en I&D en

parasitosis tropicales

Métodos moleculares de

localización de proteínas

poco desarrollados

Dianas farmacológicas

muy recientes en L.

mexicana

Desarrollo acelerado de

bases de datos genéticas

Atribución incorrecta

de la diana

farmacológica

Desconocimiento sobre

posibles resistencias

ocasionadas por

mutaciones

Desarrollo de la terapia

limitado

Teorías moleculares

complejas

Potencial uso clínico no

valorado

Falta de insumos de

laboratorio (costosos)

Recursos económicos

limitados para investigación

Mayores efectos

adversos con otros

fármacos

Baja calidad de vida de

enfermos de

Leishmaniasis

50

Anexo B. Categorización de variables

- Leishmania mexicana

- DNA Replication Checkpoint

Parásitos tropicales

CaracterísticasManifestaciones

clínicasTratamiento

Leishmaniasis

Leishmania mexicana

Replicación de ADN

ATM/ATR, Chk1/Chk2

Claspin/Tipin/

Timeless

Orígenes de Replicación

DNA Replication Checkpoint

51

- Similitud de Secuencias

Estudio Filogenético

Similitud a nivel de estructura

Modelado de Proteinas

Métricas de Calidad

Genes Homólogos

Similitud de Secuencias

52

Anexo C. Instrumento de recolección de datos

Aspecto Valor

Nombre del Gen

Código GenDB

Solapamiento

Max Score

E value NCBI

Estructura predicha

53

Anexo D. Diagrama de Flujo Metodología

54

Anexo E. Posibles genes homólogos a spMrc1 en Homo sapiens en KEGG

Entry SW_score bits identity overlap

hsa:10525 102 29.0 0.300 130

hsa:1062 248 62.3 0.202 1029

hsa:1063 236 59.6 0.205 830

hsa:10763 172 45.0 0.251 398

hsa:11064 221 56.2 0.210 1050

hsa:11113 201 51.6 0.227 603

hsa:127254 203 52.1 0.188 936

hsa:129446 208 53.2 0.200 1001

hsa:145508 248 62.3 0.210 1066

hsa:151246 244 61.4 0.201 877

hsa:1538 208 53.2 0.202 563

hsa:1832 225 57.1 0.190 701

hsa:1834 283 70.3 0.183 737

hsa:22852 217 55.3 0.203 695

hsa:22989 225 57.1 0.221 869

hsa:23013 215 54.8 0.195 912

hsa:23085 228 57.8 0.207 884

hsa:23091 243 61.2 0.193 791

hsa:23253 216 55.0 0.186 862

hsa:23285 205 52.5 0.193 803

hsa:25836 221 56.2 0.198 885

hsa:259282 266 66.4 0.193 1058

hsa:27445 200 51.4 0.219 722

55

Entry SW_score bits identity overlap

hsa:2803 226 57.3 0.186 962

hsa:2804 233 58.9 0.206 866

hsa:284992 201 51.6 0.211 570

hsa:287 225 57.1 0.206 980

hsa:29123 246 61.9 0.200 1043

hsa:339965 212 54.1 0.210 749

hsa:343099 203 52.1 0.190 977

hsa:375248 262 65.5 0.199 961

hsa:387680 201 51.6 0.216 941

hsa:3895 212 54.1 0.196 1003

hsa:399687 244 61.4 0.197 952

hsa:4131 201 51.6 0.192 689

hsa:440193 210 53.7 0.196 982

hsa:4619 237 59.8 0.197 897

hsa:4620 237 59.8 0.195 902

hsa:4621 229 58.0 0.211 883

hsa:4622 238 60.0 0.192 1007

hsa:4624 264 66.0 0.209 1070

hsa:4625 273 68.0 0.207 1076

hsa:4626 232 58.7 0.196 1034

hsa:4627 211 53.9 0.203 665

hsa:4628 279 69.4 0.212 958

hsa:4629 238 60.0 0.202 960

hsa:4744 203 52.1 0.196 881

hsa:51742 211 53.9 0.207 1000

56

Entry SW_score bits identity overlap

hsa:5339 219 55.7 0.200 858

hsa:546 225 57.1 0.203 809

hsa:54875 219 55.7 0.188 884

hsa:5493 205 52.5 0.205 844

hsa:55088 239 60.3 0.199 860

hsa:55605 210 53.7 0.181 1015

hsa:55677 216 55.0 0.197 694

hsa:55704 262 65.5 0.194 954

hsa:55835 201 51.6 0.214 823

hsa:57530 210 53.7 0.212 735

hsa:5930 234 59.1 0.195 718

hsa:6093 210 53.7 0.199 599

hsa:6249 262 65.5 0.200 824

hsa:63895 101 28.8 0.327 110

hsa:63967 225 57.1 0.217 1042

hsa:643677 202 51.8 0.199 845

hsa:7175 240 60.5 0.204 825

hsa:7798 221 56.2 0.224 697

hsa:79741 235 59.4 0.205 874

hsa:7994 227 57.5 0.226 807

hsa:800 219 55.7 0.195 652

hsa:80122 103 29.3 0.312 112

hsa:80184 222 56.4 0.208 849

hsa:8411 287 71.2 0.201 971

hsa:84952 220 55.9 0.213 844

57

Entry MF_score bits identity overlap

hsa:8735 262 65.5 0.225 867

hsa:9321 245 61.6 0.213 957

hsa:9360 204 52.3 0.190 638

hsa:9416 118 32.7 0.311 135

hsa:9475 234 59.1 0.197 751

hsa:9585 218 55.5 0.214 695

hsa:9648 220 55.9 0.213 927

hsa:9669 212 54.1 0.218 593

hsa:9696 206 52.8 0.206 817

hsa:9857 231 58.5 0.210 946

58

Anexo F. Gráfica de distribución de Error Errat

Anexo F. Gráfica de error Errat para la proteína hsClaspin. La línea inferior muestra los residuos que

sobrepasan el 95% de coeficiente de confianza de color amarillo. Los residuos que sobrepasan la

segunda línea se muestran con rojo, y superan el 99% de error de modelado. Se aprecia que más del

80% de la proteína modelada presenta una confianza aceptable (en color verde). Elaborada con Errat