DESARROLLO DE UNA ESTRATEGIA DE ANÁLISIS DE DATOS DE
Transcript of DESARROLLO DE UNA ESTRATEGIA DE ANÁLISIS DE DATOS DE
DESARROLLO DE UNA ESTRATEGIA DE ANÁLISIS DE DATOS DE SECUENCIACIÓN DE GENOMA COMPLETO PARA LA PRIORIZACIÓN DE
VARIANTES EN NUEVOS GENES DE DISTROFIAS HEREDITARIAS DE RETINA
1 UGC Medicina Maternofetal, Genética y Reproducción, Instituto de Biomedicina de Sevilla, H. U. Virgen del Rocío/Universidad de Sevilla/CSIC, Sevilla, España. 2 Centro de Investigación Biomédica en Red de Enfermedades Raras (CIBERER), Sevilla, España.
3 UGC Oftalmología, H.U. Virgen Macarena, Sevilla, España. 4 Retics Oftared, Instituto de Salud Carlos III, Madrid, España.
Elena Fernández-Suárez1, 2, María González-del Pozo1,2, Nereida Bravo-Gil1,2, Cristina Méndez-Vidal1,2, Marta Martín-Sánchez1, Enrique Rodríguez-de la Rúa3,4, Mª José Morillo-Sánchez4, Salud Borrego1,2 and Guillermo Antiñolo1,2
PACIENTES Y MÉTODOS
RESULTADOS
1. Toulis V y cols., Genes (Basel) 20202. Arno G y cols., Am J Hum Genet 20163. van El CG y cols., Eur J Hum Genet 20134. Niroula A y cols., PLoS Comput Biol. 2019
REFERENCIAS AGRADECIMIENTOS
Para más información:[email protected]
Los autores agradecen a las familias que han participado en el estudio. Este trabajo ha sido apoyado por el Instituto de Salud Carlos III (ISCIII), el Ministerio de Economía yCompetitividad de España y cofinanciado por la Unión Europea (FEDER, “Una manera de hacer Europa) [PI18-00612], Consejería de Salud y Familias de la Junta de Andalucía[PEER-0501-2019] y la Fundación Isabel Gemio/Fundación Cajasol [FGEMIO-2019-01]. El CIBERER es una iniciativa del ISCIII y del Ministerio de Economía y Competitividad.EFS tiene una ayuda del ISCIII [FI19/00091) (FSE, “Invirtiendo en tu futuro”). NBG tiene una ayuda de la Consejería de Salud y Familias de la Junta de Andalucía [RH-0118-2020]. MMS tiene una ayuda asociada al proyecto CTS-1664 financiado por la Consejería de Economía, Conocimiento y Emprendimiento de la Junta de Andalucía.
Definir un flujo de trabajo parael análisis de datos de WGS
basado en el uso de predictores que permita la identificación de nuevos genes/variantes
asociadas con las DHR.
INTRODUCCIÓN OBJETIVO
Las distrofias hereditarias de retina (DHR) constituyen un grupo de enfermedades raras que afectan a los fotorreceptores de la retina provocando la pérdida total o parcial de visión. Se caracterizan por su gran heterogeneidad clínica y genética1.
*
La traslación de WGS a la práctica clínica es difícil debido a la ausencia de protocolos de análisis estandarizados3.
Las herramientas de predicción ayudan a la priorización de las variantes en los estudios de WGS4.
*
La correcta aplicación de los predictores se debe basar en el uso de cutoffs confiables para el grupo de variantes en estudio.
*
Hay una gran falta de consenso entre qué predictor(es) usar y el cutoff a aplicar.
*
FASES DEL ESTUDIO
1 Curación de los datos de NGS de la cohorte de entrenamiento: Las variantes
exónicas y de splicing (primer codón del exón y ±10 pb del intrón) en genes ya asociados
a las DHR fueron clasificadas según el criterio ACMG y su significancia clínica.
2 Estudio estadístico de 14 predictores: Comparación y redefinición de los cutoffs de 14 herramientas
de predicción mediante el análisis de curvas ROC. Estudio combinatorial en el que se analizaron 93 modelos. Modelos óptimos: Verdaderos positivos ≥ 85%; Falsos positivos ≤ 35%; Valores perdidos ≤ 30%.
3 Validación del flujo de trabajo desarrollado: Evaluación de su eficacia y traslación a otras
enfermedades genéticas hereditarias.
4 Aplicación en la cohorte de descubrimiento: Análisis de los datos de WGS de la cohorte de
descubrimiento para la identificación de nuevas variantes/genes asociados a las DHR.
Alamut Bacth®Bystro CADD
Non-splicing Splicing
PhyloPPhastCons
SIFTMAPP
Grantham
SSFNNS
MaxEntSPiCE
PhyloP-100wPhastCons-
100CADD v1.3
CADD v1.6
SpliceAI
1 Variantes curadas en los 209 pacientes de la cohorte de entrenamiento:
695 variantes → 65 variantes de splicing
247 variantes → 34 variantes de splicing942 variantes en genes DHR
Selección del mejor modelo combinado y de los cutoffs óptimos.2
La aplicación del flujo de trabajo sobre los datos de WGS permite la identificación de una variante candidata en la familia A.
4
AL APLICAR LOS CUTOFFS PERSONALIZADOS SE
REDUCE EN UN 84,62% EL NÚMERO DE
VARIANTES PARA ANALIZAR MANUALMENTE
FLUJO DE TRABAJO DESAROLLADO
NON-SPLICING
CADD v1.6
≥22,25
SIFT
≤0,175
MAPP
≤0,098
GRANTHAM
≥28,00
SpliceAI
≥0,405
NNS
≥62,73
MEJORES MODELOS
CONCLUSIONES
*Individuos secuenciados por WGS.
3
SPLICING
El algoritmo desarrollado permite recuperar el ~90% de las variantes causales del conjunto de variantes de validación en todas las patologías analizadas.
Cohorte validación de pacientes con DHR
I. La curación de las variantes del grupo de entrenamiento ha permitido tener unos datos de partida de calidad para calcular cutoffs más confiables para cada una de las herramientas de predicción.
II. La combinación de las herramientas CADD, MAPP, Grantham y SIFT ha permitido reducir la tasa de falsos positivos en nuestra estrategia de filtrado.
III. El mejor modelo combinado para la priorización de las variantes de splicing ha sido “SpliceAI+NNS”.
IV. La aplicación de cutoffs personalizados ha permitido aumentar la eficacia en el análisis de datos de WGS ya que se ha conseguido reducir considerablemente el número de variantes a ser analizadas manualmente.
V. La estrategia de análisis desarrollada permite una correcta priorización y valoración de los datos WGS de pacientes con DHR en la práctica clínica.
Significancia clínica
B
P
Tras el análisis rutinario el 40% permanece sin diagnóstico genético2.
Técnicas de mayor alcance
*
*
Reanálisis
Secuenciación completa de genoma (WGS)
Secuenciación completa de exoma (WES)