II-FISI Equipo de Investigación: Responsable: Ulises Román C Miembros: 1.Luís Alarcón (docente)...

12
II-FISI Equipo de Investigación: Responsable: Ulises Román C Miembros: 1. Luís Alarcón (docente) 2. Daniel Ortega (docente) 3. Norberto Osorio (Alumno-UPG-FISI) 4. Pablo Romero (docente) Colaboradores: 1. Roberto Calmet (docente) 2. De la Cruz Melo (docente) 3. Carlos Yañez (docente) Curso: Tecnologías de Información Emergentes Proyecto de Investigación SIN SIN Aplicación de Análisis de Cluster para exploración y detección de patrones de comportamiento en pacientes diabéticos en centro de Salud Santa Rosa

Transcript of II-FISI Equipo de Investigación: Responsable: Ulises Román C Miembros: 1.Luís Alarcón (docente)...

Page 1: II-FISI Equipo de Investigación: Responsable: Ulises Román C Miembros: 1.Luís Alarcón (docente) 2.Daniel Ortega (docente) 3.Norberto Osorio (Alumno-UPG-FISI)

II-FISI

Equipo de Investigación:Responsable: Ulises Román CMiembros:1. Luís Alarcón (docente)2. Daniel Ortega (docente)3. Norberto Osorio (Alumno-UPG-FISI)4. Pablo Romero (docente)Colaboradores:1. Roberto Calmet (docente)2. De la Cruz Melo (docente)3. Carlos Yañez (docente)

Curso: Tecnologías de Información EmergentesProyecto de Investigación SIN SIN

“Aplicación de Análisis de Cluster para exploración y detección de patrones de comportamiento en pacientes diabéticos en centro de Salud Santa Rosa”

Page 2: II-FISI Equipo de Investigación: Responsable: Ulises Román C Miembros: 1.Luís Alarcón (docente) 2.Daniel Ortega (docente) 3.Norberto Osorio (Alumno-UPG-FISI)

II-FISI

AGENDA

• INTRODUCCION• ANTECEDENTES Y FUNDAMENTACION DEL ESTUDIO• JUSTIFICACION• OBJETIVOS• METAS ESPECIFICAS• POSIBLE CONTRIBUCION E IMPACTO• METODOLOGIA DEL TRABAJO• TIPO DE INVESTIGACION• RELACION CON OTROS ESTUDIOS• CALENDARIO DE ACTIVIDADES• REFERENCIAS BIBLIOGRAFICAS

Page 3: II-FISI Equipo de Investigación: Responsable: Ulises Román C Miembros: 1.Luís Alarcón (docente) 2.Daniel Ortega (docente) 3.Norberto Osorio (Alumno-UPG-FISI)

II-FISI

INTRODUCCION

Según la OMS [1], la diabetes ocupa el 8vo. Lugar de enfermedades que producen muerte a nivel mundial y el 80% en los países en vía de desarrollo, en nuestro país afecta a casi 2 millones de personas según datos oficiales del Ministerio de Salud (MINSA)[ 2]. Lo grave es que esta cifra va en aumento y se calcula que la mitad de los afectados ignora su condición.

Una de las causas fundamentales de esta situación es la falta de información oportuna y adecuado para el diagnostico y pronostico utilizando técnicas modernas de análisis y extracción de datos que permitan la detección de patrones de comportamiento en pacientes diabético en los centros de salud.

Actualmente existen técnicas modernas como el cluster dentro de la Minería de datos que permite clasificación automática de datos[3]

El presente estudio permitirá lograr: Identificar los algoritmos adecuados de clustering para uso en el comportamiento de las enfermedades de Diabetes; Generación de patrones y tendencias de comportamiento usando técnicas de cluster y Estimar la eficiencia de la técnica del Cluster jerárquicos y no jerárquicos para predecir comportamientos. En base a este técnica los médicos podrán diagnosticar oportuna y adecuadamente las patologías de los pacientes diabético, lo cual contribuirá a disminuir la tasa de mortalidad en el país.

Las unidades participantes: Departamento de Medicina Preventiva de la Fac. Medicina Humana -UNMSM, Grupo de Investigación Bioestadística Fac. Ciencias Matemáticas, Centro de Salud Santa Rosa y Instituto de Investigación de la FISI.

Page 4: II-FISI Equipo de Investigación: Responsable: Ulises Román C Miembros: 1.Luís Alarcón (docente) 2.Daniel Ortega (docente) 3.Norberto Osorio (Alumno-UPG-FISI)

II-FISI

2. ANTECEDENTES Y FUNDAMENTACION DEL ESTUDIO

Existen diversos trabajos e investigaciones en el campo de la Minería de Datos aplicados a la Medicina, Bioinformática y Biología, tanto en las Universidades , Empresas e instituciones. A continuación mencionamos:

- “Aplicación de análisis de cluster para definir grupos homogéneos desde el punto de vista de su posición condilar” Por Juan Baldeón – Granada

- - "Utilización de tecnología de minería de datos para el tratamiento de datos biomédicos". Por : Victor Maojo Grupo de

Informática Médica. Departamento de Inteligencia Artificial.Fac.de Informática. Univer.Politécnica de Madrid - 2004 - "Aplicación de la minería de datos al estudio de alteraciones respiratorias durante el sueño" por :Carlos Zamarrón Sanz, Vanesa García Paz, Uxío Calvo Álvarez, Fernanda Pichel Guerrero, José Ramón Rodríguez Suárez. Servicio de Neumología. Hospital Clínico Universitario de Santiago de Compostela España. 2006.

- "El papel de la Minería de Datos en la Detección y Diagnóstico de Cáncer" por: Damian Mora Eguiarte. Universidad de Salamanca, España. 2001 - "Extracción y Visualización de Conocimiento de Bases de Datos Médicas" por: José Hernández Orallo, M.Carmen Juan, Lizandra Neus, Minaya Collado, Carlos Monserrat Aranda. México. 2002

- "Aplicación de minería de datos para el diagnóstico de accidentes cerebrovasculares agudos (ACVAs). DAEDALUS – Data, Decisions and Language, S.A. 2003

Fundamentación:El proyecto se fundamenta en: Minería de Datos(MD), Informática Medica, Bioinformática, Bioestadística, Tecnologías de

Información ( TI), Métodos Estadísticos, reconocimiento de patrones y modelos matemáticos. Las áreas directamente relacionadas a la MD son: ( Base de Datos, Visualización, Learning Machine,) [4 , 5].

Page 5: II-FISI Equipo de Investigación: Responsable: Ulises Román C Miembros: 1.Luís Alarcón (docente) 2.Daniel Ortega (docente) 3.Norberto Osorio (Alumno-UPG-FISI)

II-FISI

3. JUSTIFICACION

La propuesta de Investigación obedece a la necesidad de abrir una línea de investigación en el área de Minería de Datos e Bioinformática por su utilización y almacenamiento de grandes cantidades de información biomédica y sus procesos de Descubrimiento de Conocimiento en Bases de Datos ( Knowledge Discovery in Databases, KDD) ha crecido espectacularmente en las ultimas decanas [6,7]

Teniendo en cuenta que la diabetes es problema epidemiológico serio porque es una enfermedad de naturaleza común. El uso adecuado de la técnica de cluster permitirá tener información oportuna y de calidad, para que los especialistas tomen decisiones para predecir tendencia y comportamientos de dicha enfermedad, lo que permitirá reducir los niveles de patología de diabetes en el país.

Asimismo, Importancia de las aplicaciones de la ( MD ) en el ámbito CLINICO resulta de ayuda para la identificación y diagnóstico de patologías, para el descubrimiento de posibles interrelaciones entre diversas enfermedades, a nivel de MEDICINA PREVENTIVA, resulta de interés para la detección de pacientes con factores de riesgo para sufrir una patología.

A nivel de GESTION HOSPITALARIA, se puede usar para obtener predicciones temporales que permitiesen optimizar los recursos disponibles y priorizar el uso de los diversos tratamientos para una misma patología [3,7].

.

Page 6: II-FISI Equipo de Investigación: Responsable: Ulises Román C Miembros: 1.Luís Alarcón (docente) 2.Daniel Ortega (docente) 3.Norberto Osorio (Alumno-UPG-FISI)

II-FISI

4. OBJETIVOS

1. Identificar los algoritmos adecuados de clustering para uso en el comportamiento de las

enfermedades de Diabetes.

2. Generación de patrones y tendencias de comportamiento usando técnicas de cluster

3. Estimar la eficiencia de la técnica del Cluster jerárquicos (dendogramas) y no jerárquicos (k-medias y otros) para predecir comportamientos .

5. METAS

1. Detección de patrones de comportamiento (20%) usando el Análisis de Cluster

2. Generar un ( 01) Articulo de Investigación

3. Extracción de datos útiles para generar tendencias de comportamiento (30%)

4. Selección del algoritmo optimo para análisis de conglomerados (20%)

5.Establecer un (01) método adecuado de distancias para medidas de similaridad

Page 7: II-FISI Equipo de Investigación: Responsable: Ulises Román C Miembros: 1.Luís Alarcón (docente) 2.Daniel Ortega (docente) 3.Norberto Osorio (Alumno-UPG-FISI)

II-FISI

5. POSIBLE CONTRIBUCION E IMPACTO

A través de análisis de cluster se revelaran concentraciones de datos para su

agrupamiento eficiente en conglomerados [8,9] de pacientes diabéticos según su

homogeneidad y que facilitara a los médicos especialistas a tomar decisiones

oportunas y adecuadas en el diagnostico y su cura correspondiente.

Asimismo, el presente estudio permitirá lograr: Identificar los algoritmos adecuados de

clustering para uso en el comportamiento de las enfermedades de Diabetes;

Generación de patrones y tendencias de comportamiento usando técnicas de cluster y

Estimar la eficiencia de la técnica del Cluster jerárquicos y no jerárquicos para

predecir comportamientos. En base a esta técnica los médicos y los pacientes podrán

diagnosticar oportuna y adecuadamente las patologías de diabetes, lo cual contribuirá a

disminuir la tasa de mortalidad en el país

Page 8: II-FISI Equipo de Investigación: Responsable: Ulises Román C Miembros: 1.Luís Alarcón (docente) 2.Daniel Ortega (docente) 3.Norberto Osorio (Alumno-UPG-FISI)

II-FISI

6. METODOLOGIA DE TRABAJO

El presente estudio se desarrollara según los siguientes pasos:

1. Revisión de fuentes y proyecto de Investigación relacionados con el tema de investigación.

2. Revisión y Estudio de la Técnica de Cluster y sus algoritmos

3. Evaluación y selección de herramientas a usar: SPSS Clementine, Weke, RapidMiner, SQL

Server [9,10,11,12]

4. Determinación de los mecanismos y procedimientos para el diseño

5. Diseño de la aplicación

6. Evaluación de métodos de conglomerados

7. Implementación y pruebas de exploración y predicción datos médicos ( casos )

8. Informes técnicos y/o documentación

9. Redacción del Relatorio Técnico

10. Redacción del Articulo de Investigación

Page 9: II-FISI Equipo de Investigación: Responsable: Ulises Román C Miembros: 1.Luís Alarcón (docente) 2.Daniel Ortega (docente) 3.Norberto Osorio (Alumno-UPG-FISI)

II-FISI

Adaptativa y Aplicativa

7. TIPO DE INVESTIGACION

8. RELACION CON OTROS ESTUDIOSEstudio preliminar de un programa de estudio a iniciarse

9. CALENDARIO DE ACTIVIDADESEl estudio comienza en Junio y termina en Diciembre 2008

Page 10: II-FISI Equipo de Investigación: Responsable: Ulises Román C Miembros: 1.Luís Alarcón (docente) 2.Daniel Ortega (docente) 3.Norberto Osorio (Alumno-UPG-FISI)

II-FISI

10. REFERENCIAS BIBLIOGRAFICAS[1] OMS, datos y estadísticas, Organización Mundial de la Salud, (24/o5/2008), http://www.who.int/infobase/report.aspx

[2].MINSA, Estrategias sanitarias Nacionales, Ministerio de Salud, (20/05/08), http://www.minsa.gob.pe/portal/03esn/default2.asp

[3].Cesar Pérez., Daniel Santin, Minería de Datos: Técnicas y Herramientas. Thomson Editores, (2007) España.

[4].Cesar Pérez.,Data Mining Soluciones con enterprise miner, Ra-Ma, (2005) Madrid.

[5].José Hernández O, José Ramírez Q, Cesar Ferri R, Introducción a la Minería de Datos, Pearson – Prentice Hall, (2004) España.

[6]Sushmita Mitra., Tinku Acharya, Data Mining: Multimedia,Soft Computing,and Bioinformatics. Wiley-Interscience ,(2004) USA.

[7].Jiawei Han., Micheline Kamber, Data Mining: Concepts and Techniques, 2nd ed. The Morgan Kaufmann Series in Data

Management Systems, (2006) USA.

[8].SAS, Data mining with SAS® Enterprise MinerTM, SAS Institute, (20/05/08) -

http://www.sas.com/technologies/analytics/datamining/miner/

[9] Microsoft, Libros en pantalla de SQL Server 2005, Microsoft Developer Network,

(26/05/08),http://msdn.microsoft.com/es-es/library/ms174879.aspx

[10].SPSS,Software and Solutions - Clementine,(25/05/08), http://www.spss.com/es/

[11].Universidad de Waikato, WEKA, (20/05/08), http://www.cs.waikato.ac.nz/ml/weka/

[12].YALE, RapidMiner, YALE SOLUTIONS, (26/05/08), http://rapid-i.com/

Page 11: II-FISI Equipo de Investigación: Responsable: Ulises Román C Miembros: 1.Luís Alarcón (docente) 2.Daniel Ortega (docente) 3.Norberto Osorio (Alumno-UPG-FISI)

II-FISI

MUCHAS GRACIAS …….. ??MUCHAS GRACIAS …….. ??

Page 12: II-FISI Equipo de Investigación: Responsable: Ulises Román C Miembros: 1.Luís Alarcón (docente) 2.Daniel Ortega (docente) 3.Norberto Osorio (Alumno-UPG-FISI)

MUCHAS GRACIAS …….. ??MUCHAS GRACIAS …….. ??