TRABAJO PRACTICO No.02 DE INVESTIGACION

3
TRABAJO PRACTICO DE INVESTIGACION No. 2 APLICACIONES AL ANÁLISIS DE DATOS USANDO SPSS PARA INVESTIGACIONES MEDICAS – Minería de Datos Curso: Informática Aplicada a la Investigación - Prof. Ulises ROMAN C- Enero. 2008 Problema 1: (15 puntos) Análisis de Cluster (conglomerados) el SPSS incorpora un procedimiento que implementa el análisis de cluster (no jerárquicos, jerárquicos, dos fases). Estos procedimiento intenta identificar grupos de casos relativamente homogéneos basándose en las características seleccionadas y utilizando un algoritmo que puede gestionar un gran numero de casos. El usuario debe especificar el numero de conglomerados (centros iniciales de los conglomerados si conoce de antemano). a) Convertir el archivo de DIABETES_DBF.XLS a DIABETES_DBF.SAV las 49 variables deberán ser definidos según la vista de variables de SPSS según su tipo y característica de datos/variable. b) Llenar los datos con (N=230) pacientes con Diabetes Mellitus, guardar la información. c) Hacer la clasificación por : clusters - no jerárquicos/conglomerados (k-medias), clusters jerárquicos/conglomerados(jerárquicos) y cluster de (dos fases). d) Usando el archivo DIABETES_DBF.SAV hacer la regresión logística binaria ( analizar, regresión, logística binaria, variables dependientes y covariables). La regresión logística resulta útil para los casos en los que se desea predecir la presencia o ausencia de una característica o resultado según los valores de un conjunto de variables predictoras e) Para cada caso definir su grafico correspondiente. f) Tomando como referencia su trabajo practico No.1 sobre DIABETES, desarrollar casos de PREDICCION, TENDENCIAS,

Transcript of TRABAJO PRACTICO No.02 DE INVESTIGACION

Page 1: TRABAJO PRACTICO No.02 DE INVESTIGACION

TRABAJO PRACTICO DE INVESTIGACION No. 2APLICACIONES AL ANÁLISIS DE DATOS USANDO SPSS PARA

INVESTIGACIONES MEDICAS – Minería de Datos

Curso: Informática Aplicada a la Investigación - Prof. Ulises ROMAN C- Enero. 2008

Problema 1: (15 puntos)Análisis de Cluster (conglomerados) el SPSS incorpora un procedimiento que implementa el análisis de cluster (no jerárquicos, jerárquicos, dos fases). Estos procedimiento intenta identificar grupos de casos relativamente homogéneos basándose en las características seleccionadas y utilizando un algoritmo que puede gestionar un gran numero de casos. El usuario debe especificar el numero de conglomerados (centros iniciales de los conglomerados si conoce de antemano).

a) Convertir el archivo de DIABETES_DBF.XLS a DIABETES_DBF.SAV las 49 variables deberán ser definidos según la vista de variables de SPSS según su tipo y característica de datos/variable.

b) Llenar los datos con (N=230) pacientes con Diabetes Mellitus, guardar la información.

c) Hacer la clasificación por : clusters - no jerárquicos/conglomerados (k-medias), clusters jerárquicos/conglomerados(jerárquicos) y cluster de (dos fases).

d) Usando el archivo DIABETES_DBF.SAV hacer la regresión logística binaria ( analizar, regresión, logística binaria, variables dependientes y covariables). La regresión logística resulta útil para los casos en los que se desea predecir la presencia o ausencia de una característica o resultado según los valores de un conjunto de variables predictoras

e) Para cada caso definir su grafico correspondiente.

f) Tomando como referencia su trabajo practico No.1 sobre DIABETES, desarrollar casos de PREDICCION, TENDENCIAS, PATRONES DE COMPORTAMIENTO DE LA ENFERMEDAD. Pueden usar módulos de clasificación y otros que creen conveniente.

a) Analizar e interpretar los resultados, según los resultados del calculo.

b) Deberán presentar las Pantallas de las variables definidas ya sea dependientes o de grupo de casos/agrupación, y los procedimientos de calculo.

Problema 2: (6 puntos)

Page 2: TRABAJO PRACTICO No.02 DE INVESTIGACION

Hacer un análisis estadístico usando SPSS para predecir el comportamiento de los usuarios externos de los hospitales y/o Clínicas y/o enfermedades para determinar: Cuales son los patrones de comportamiento en el presente y como será en el futuro respecto a la atención, diagnostico, enfermedades y pronostico. Se debe determinar cual es el perfil del usuario del servicio (edad, sexo, procedencia, grado de instrucción, a que servicios acude más y otros). Para complementar en el análisis de datos usar el concepto de minería de datos y generar gráficos y reportes correspondientes usando el paquete SPSS (opcionalmente puede usar el Modulo de Minería en EXCEL). Nota los datos deben ser reales para ver comportamiento real y la predicción real (mínimo 230 usuarios, mejor si es mayor).

Para el Análisis de Datos pueden tomar 2 o más categorías debajo descritos- estos son algunas aplicaciones que se puedan realizar en los Hospitales, Postas de Salud, Clínicas, EsSalud y Consultorio de Salud.

1. Descubrir distintos comportamientos de una misma patología. 2. Realizar pronósticos ajustados a cada paciente. 3. Predecir las patologías que pueden aparecer como complicación de una

enfermedad determinada. 4. Encontrar la predisposición a padecer determinadas enfermedades. 5. Descubrir asociaciones entre patologías.6. Determinar el mejor tratamiento individual para cada paciente. 7. Sistema de apoyo al diagnóstico. 8. Descubrir nuevas características de una patología. 9. Comparación entre parámetros clínicos.

Así, por ejemplo, en el caso de descubrir comportamientos de una misma patología, los sistemas de minería de datos pueden encontrar subgrupos, dentro de una determinada patología, que tienen características comunes dentro del mismo subgrupo y diferentes entre los diversos subgrupos. Estas clasificaciones pueden encontrarlas el sistema de manera automática, es decir, a partir de las relaciones que el sistema encuentra por sí mismo y que no tienen porqué atenerse a las clasificaciones clásicas realizadas con interés académico, clínico o fisiopatológico.

Nota: Presentar impreso + CD(archivos .SAV, .SPO y .DOC) – Entrega Miércoles

17 de Diciembre del 2008, Hora 5pm (Hora Exacta), Lugar: Auditorio, Grupo máximo de 20 alumnos.

CRONOGRAMA DE EVALUACIONES

- Sábado 13 de Diciembre : LABORATORIO No.4 (3pm)- Lunes 15 de Diciembre : Proyectos de Investigación (CD+Impreso)

5pm- Miércoles 17 de Diciembre : Trabajo practico No.2 reemplaza al

examen Final (5pm - auditorio)- Jueves 18 de Diciembre: Sustitutorio Todo el curso (5pm -

auditorio)

Page 3: TRABAJO PRACTICO No.02 DE INVESTIGACION

- Sábado 20 de Diciembre: Publicación y Entrega de Notas a la EAPMH

Recomendaciones traten de entregar en las fechas y horas indicadas, pasadas ya no se reciben.