Rosales Sedano Carmen Datamart Toma Decisiones

download Rosales Sedano Carmen Datamart Toma Decisiones

of 81

Transcript of Rosales Sedano Carmen Datamart Toma Decisiones

  • 1

    PONTIFICIA UNIVERSIDAD CATLICA DEL PER

    FACULTAD DE CIENCIAS E INGENIERA

    ANLISIS, DISEO E IMPLEMENTACIN DE UN DATAMART

    PARA EL SOPORTE DE TOMA DE DECISIONES Y EVALUACIN DE LAS ESTRATEGIAS SANITARIAS EN LAS

    DIRECCIONES DE SALUD

    Tesis para optar por el Ttulo de Ingeniero Informtico, que presenta el bachiller:

    Carmen Pamela Rosales Sedano

    ASESOR: Carla Basurto Figueroa

    Lima, Enero del 2009

  • Resumen El presente proyecto de tesis tiene como objetivo la implementacin de un datamart

    que permita apoyar la toma de decisiones necesarias para cumplir con los objetivos

    especficos de cada estrategia sanitaria nacional dentro de las direcciones de salud.

    Se tom como estrategia sanitaria piloto, la estrategia de Alimentacin y Nutricin

    Saludable. Para ella, se realiz la captura de requerimientos, anlisis, diseo y

    construccin del datamart.

    Los resultados obtenidos son los reportes analticos tiles para tomar decisiones de

    forma rpida y confiable.

  • Dedicatoria: Este proyecto de tesis est dedicado

    a mis padres por brindarme su apoyo

    incondicional y por creer en m cada

    da.

  • Agradecimientos: A Dios, por acompaarme siempre

    A mis padres Carmen y Vctor, por su

    infinito amor y su confianza en m

    A mis hermanos, por su comprensin

    A mis profesores, por sus consejos

    Y a mis mejores amigos, por

    brindarme su amistad sincera.

  • Tabla de Contenido Resumen.................................................................................................................................. 2 Tabla de Contenido.................................................................................................................. 2 ndice de Figuras...................................................................................................................... 3 ndice de Cuadros.................................................................................................................... 4 Introduccin.............................................................................................................................. 1 1. Captulo 1: Generalidades ............................................................................................ 2

    1.1. Definicin del Problema.......................................................................................... 2 1.2. Marco conceptual del problema ............................................................................. 4 1.2.1. Conceptos: Inteligencia de Negocios ..................................................................... 4 1.2.2. Conceptos: Anlisis Dimensional ........................................................................... 5 1.2.3. Conceptos: Software Libre ..................................................................................... 7 1.2.4. Conceptos: Sector Salud........................................................................................ 9 1.3. Plan de Proyecto .................................................................................................. 12 1.4. Estado del Arte ..................................................................................................... 17 1.4.1. Herramientas de extraccin de datos................................................................... 17 1.4.2. Herramientas de explotacin de datos................................................................. 23 1.4.3. Tesis y productos similares .................................................................................. 28 1.5. Descripcin y sustentacin de la solucin............................................................ 31

    2. Captulo 2: Anlisis ..................................................................................................... 33 2.1. Definicin de la metodologa ................................................................................ 33

    2.1.1. El modelo de Inmon ......................................................................................... 33 2.1.2. Metodologa de Ralph Kimball ......................................................................... 36 2.1.3. Eleccin de la metodologa .............................................................................. 38

    2.2. Identificacin de Requerimientos ......................................................................... 41 2.2.1. Requerimientos Funcionales............................................................................ 41 2.2.2. Requerimientos no funcionales........................................................................ 44

    2.3. Anlisis de la Solucin.......................................................................................... 45 2.3.1. Consideraciones sobre el sistema ................................................................... 45 2.3.2. Actores del sistema.......................................................................................... 46 2.3.3. Anlisis tcnico y econmico ........................................................................... 47 2.3.4. Definicin del sistema ...................................................................................... 47

    3. Captulo 3: Diseo....................................................................................................... 51 3.1. Arquitectura de la solucin ................................................................................... 51 3.2. Proceso de Extraccin.......................................................................................... 52 3.3. Proceso de Explotacin........................................................................................ 57

    4. Captulo 4: Construccin............................................................................................. 59 4.1. Configuracin del software ................................................................................... 59

    4.1.1. Configuracin de la base de datos................................................................... 59 4.1.2. Configuracin de Pentaho................................................................................ 60

    4.2. Construccin de procesos de carga..................................................................... 64 4.2.1. Carga de dimensin: ACTIVIDAD_ENFERMEDAD ........................................ 64

    4.3. Construccin de reportes ..................................................................................... 65 4.3.1. Reporte: Prevalencia de Enfermedades .......................................................... 65

    4.4. Ejecucin de pruebas de proceso de carga ......................................................... 67 4.5. Ejecucin de reportes........................................................................................... 68

    5. Capitulo 5: Observaciones, conclusiones y recomendaciones................................... 70 5.1. Observaciones...................................................................................................... 70 5.2. Conclusiones ........................................................................................................ 71 5.3. Recomendaciones y trabajos futuros ................................................................... 71

    Bibliografa ............................................................................................................................. 73

  • ndice de Figuras

    Figura 1.1 Modelo Estrella ....................................................................................................... 7 Figura 1.2 Esquema Copo de Nieve........................................................................................ 7 Figura 1.3 Procesos de direccin de proyectos..................................................................... 13 Figura 1.4 reas de Conocimiento de la Direccin de Proyectos ......................................... 15 Figura 1.5 Proyecto de Tesis - WBS...................................................................................... 16 Figura 1.6: IBM WebSphere DataStage ................................................................................ 19 Figura 1.7: SQL Server Integration Services ......................................................................... 20 Figura 1.8: Transformation en Kettle-Pentaho (Data Integration) ......................................... 21 Figura 1.9: Ejemplo de Reporte de Anlisis Pentaho Anlisis. .......................................... 26 Figura 2.1 Estructura del DW\................................................................................................ 34 Figura 2.2. ERD ..................................................................................................................... 35 Figura 2.3. Relacin entre ERD y DIS ................................................................................... 35 Figura 2.4. Elementos bsicos del DWH segn Kimball ....................................................... 36 Figura 3.1 Arquitectura de extraccin.................................................................................... 52 Figura 3.2 Ejemplo de Reporte Diseo de Explotacin...................................................... 58 Figura 4.3. Kettle Pantalla Inicio ......................................................................................... 61 Figura 4.4. Kettle - Configuracin de Conexin..................................................................... 62 Figura 4.5. Cube Designer Descripcin del cubo ............................................................... 63 Figura 4.6. Cube Designer Conexin JNDI ........................................................................ 63 Figura 4.7. Kettle Carga dimensin ACTIVIDAD_ENFERMEDAD..................................... 65 Figura 4.8. Cube Designer Seleccin de dimensiones y tabla de hecho ........................... 66 Figura 4.9. Cube Designer Creacin de medidas............................................................... 66 Figura 4.10. Cube Designer Publicacin de Cubo.............................................................. 67 Figura 4.11. Kettle Ejecucin de carga............................................................................... 68 Figura 4.12. Kettle Resultado de ejecucin ........................................................................ 68 Figura 4.13. Reporte de Prevalencia de Enfermedades (1) .................................................. 69 Figura 4.14. Reporte de Prevalencia de Enfermedades (2) .................................................. 69

  • ndice de Cuadros Cuadro 1.1 Procesamiento OLAP............................................................................................ 9Cuadro 1.2 Estrategias Sanitarias Nacionales ...................................................................... 10Cuadro 1.3 Cuadro Comparativo Herramientas Extraccin . Error! Marcador no definido.Cuadro 1.4 Cuadro Comparativo Herramientas Explotacin ............................................. 28Cuadro 2.1 Facts vs Dimensiones......................................................................................... 50Cuadro 3.1 Dimensin Actividad_Enfermedad Descripcin de Tablas Fuentes................ 53Cuadro 3.2 Dimensin Actividad_Enfermedad Limpieza de Datos.................................... 53Cuadro 3.3 Dimensin Actividad_Enfermedad Tablas Fuentes......................................... 54Cuadro 3.4 Dimensin Actividad_Enfermedad Tabla Destino ........................................... 54Cuadro 3.5 Fact Table Alimentacion_PANTBC Tablas Fuentes........................................ 55Cuadro 3.6 Fact Table Alimentacion_PANTBC Limpieza de Datos................................... 55Cuadro 3.7 Fact Table Alimentacion_PANTBC Tablas Fuentes........................................ 56Cuadro 3.8 Fact Table Alimentacion_PANTBC Tabla Destino .......................................... 56

  • 1

    Introduccin

    En nuestro pas, uno de los servicios importantes que, sin embargo, no cuenta con

    el apoyo suficiente que debera recibir, es el rea de salud, en este hay tres

    problemas principales que el estado debe afrontar: problemas sanitarios, del

    sistema de salud y de los factores determinantes (medio ambiente, nutricin,

    educacin, entre otros).

    El ministerio de salud (MINSA) ha emprendido un nuevo plan concertado de salud para lograr disminuir y eliminar los problemas antes mencionados, parte del plan es

    mejorar el sistema de salud all donde el adecuado manejo de informacin ayudara

    al mejor control y seguimiento de acciones que se estn realizando. En general, el

    MINSA tiene como obligacin establecer las polticas necesarias para llevar a cabo

    todo tipo de acciones y adems ha establecido 10 estrategias sanitarias

    nacionales con la finalidad de dar nfasis a temas fundamentales para la salud del

    pas, a travs del abordaje, control, reduccin erradicacin o prevencin de los

    daos-riesgos priorizados.

    Uno de los objetivos principales del plan concertado es el de lograr la total

    descentralizacin, es decir que cada gobierno regional vele por el cumplimiento del

    plan y las estrategias sanitarias dentro de su jurisdiccin. Esta misin esta a cargo

    de la Direccin de Salud (DISA), la cual controla y dirige a centros de salud

    designados.

    El proyecto se centra en el punto del manejo eficiente de informacin de cada

    estrategia sanitaria dentro de cada una de las DISAs del pas.

  • 2

    1. Captulo 1: Generalidades Este captulo tratar sobre la definicin del problema que se desea solucionar,

    marco conceptual necesario para entender el contexto, gestin del proyecto, estado

    del arte y descripcin de la solucin.

    1.1. Definicin del Problema El sistema de salud en el Per ha sido manejado de forma centralizada por muchos

    aos, siendo el centro la capital, Lima, sin embargo esto ha demostrado que los

    resultados no son satisfactorios sobretodo ha causado ineficiente distribucin de

    recursos mdicos y personal. Como parte de la modernizacin del estado peruano,

    se ha incluido la descentralizacin del sector de salud en respuesta al problema,

    para llevarlo a cabo se ha tenido que realizar anlisis de ventajas y desventajas de

    dicho proceso, as como la estimacin de costos y la anticipacin de problemas que

    se pudieran presentar (problemas socio-econmicos, ambientales, polticos.).

    Aunque la descentralizacin parece ser una buena solucin, no todas las

    actividades pueden se descentralizadas, entre estas estn las que establecen

    normas de control de calidad de servicios, de enfermedades transmisibles, de salud

    ocupacional y otras polticas administrativas, en la actualidad el encargado de estas

    actividades es el ministerio de salud (MINSA).

    Aquellas actividades de salud que s son factibles de ser descentralizadas, sern

    ejecutadas por cada uno de los gobiernos regionales, especficamente por las

  • 3

    Direcciones Regionales de Salud (DISA) que son encargadas de dicho sector.

    El tema de descentralizacin se encuentra en el Plan Nacional Concertado de

    Salud, en uno de sus lineamientos de poltica denominado La Descentralizacin

    de la funcin salud a nivel del Gobierno Regional y Local seala que objetivo

    estratgico es que los gobiernos regionales y locales ejerzan plenamente sus

    funciones en materia de salud.

    A continuacin se muestran las metas al 2011 del lineamiento:

    - Culminar el proceso de transferencia de las funciones de salud a los

    gobiernos regionales

    - Incrementar las capacidades de gobierno suficientes y necesarias para la

    gestin en salud en el nivel regional y local.

    El estado ha iniciado el proceso de descentralizacin de salud siguiendo el

    lineamiento mencionado, sin embargo an falta la total transferencia de funciones a

    los gobiernos regionales y locales. Se muestra a continuacin aquellos puntos

    importantes que todava no han sido totalmente implementados [ART01]:

    - Formular, aprobar, ejecutar, evaluar, dirigir, controlar y administrar las

    polticas de salud de la regin en concordancia con las polticas naciones y

    los planes sectoriales.

    - Coordinar las acciones de salud integral en el mbito regional

    - Promover y ejecutar en forma prioritaria las actividades de promocin y

    prevencin de la salud.

    - Organizar, implementar y mantener los servicios de salud para la

    prevencin, proteccin, recuperacin y rehabilitacin en materia de salud, en

    coordinacin con los gobiernos locales.

    - Conducir y ejecutar coordinadamente con los rganos competentes la

    prevencin y control de riesgos y daos de emergencia y desastres.

    El objetivo de la descentralizacin es hacer un estado al servicio de los ciudadanos

    y que los servicios que presta sean cada vez mejores a travs del ejercicio del

    gobierno en los niveles nacional, regional, local.

    Como parte del desarrollo del objetivo, el MINSA ha definido las estrategias

    sanitarias, las cuales se definirn en la seccin siguiente, las que debern ser

    controladas y monitoreadas de forma descentralizada por cada DISA.

    Actualmente cada DISA cuenta con un rea central de estadstica la cual

  • 4

    proporciona solo reportes estticos a todas las estrategias sanitarias que alberga.

    Sin embargo el proceso de solicitud puede demorar cierto tiempo ya que el rea de

    estadstica, adems, tiene que atender otras solicitudes de las dems reas que se

    encuentran en la DISA. Es por ello que la toma de decisiones se ve retrasada por

    no contar con los reportes en el tiempo estimado.

    Para hacer posible que el objetivo y las metas del lineamiento se cumplan se

    requiere un sistema de informacin que permita el monitoreo y la evaluacin de las

    estrategias dentro de cada direccin regional siguiendo siempre las polticas fijadas

    en el Plan Concertado, de esta manera se podr controlar los avances que se

    realicen y el cumplimiento de las polticas. La inteligencia de negocios ser de

    utilidad para la evaluacin de los resultados de cada estrategia sanitaria de las

    DISAs.

    Para el alcance del proyecto de fin de carrera, solamente se realizar la solucin

    para la estrategia sanitaria de Alimentacin y Nutricin Saludable.

    1.2. Marco conceptual del problema En esta seccin procederemos a explicar los conceptos mnimos requeridos para

    llevar a cabo el presente trabajo de fin de carrera.

    1.2.1. Conceptos: Inteligencia de Negocios

    Inteligencia de Negocios Es un enfoque para la gestin empresarial que permite a una organizacin definir

    que informacin es til y relevante para la toma de decisiones corporativas.

    Inteligencia de Negocios es un esquema polifactico que fortalece a las

    organizaciones para tomar mejores decisiones mas rpidamente, convertir los datos

    en informacin y usar una estrategia inteligente para la gestin empresarial [BIB01].

    Data Warehouse Es un almacn o repositorio para los datos. Muchos expertos definen el data

    warehouse como un almacn de datos centralizados que introduce datos en un

    almacn de datos especfico llamado datamart. Otros aceptan una amplia definicin

    de data warehouse, como un conjunto integrado de datamarts.

    Es utilizado para el proceso de toma de decisiones gerenciales. [BIB01]

  • 5

    Datamart Es un conjunto de datos que son estructurados de forma que facilite su posterior

    anlisis. Un datamart contiene la informacin referente a un rea en particular, con

    datos relevantes que provienen de las diferentes aplicaciones operacionales. Los

    datamarts pueden ser de diversas bases de datos OLAP dependiendo del tipo de

    anlisis que se quiera desarrollar

    Explotacin de datos La explotacin de la informacin se realiza a travs de un amplio conjunto de

    herramientas de consulta y anlisis de la informacin. Estas herramientas de

    explotacin son sistemas que ayudan al usuario a la exploracin de los datos y

    generacin de vistas de informacin. Se dividen en reporteadores, sistemas de

    anlisis multidimensional, sistemas de apoyo a la toma de decisiones y sistemas de

    informacin ejecutiva.

    ETL (extract - transformation - load) ETL significa en espaol extraccin, transformacin y carga de los datos.

    La extraccin es el primer paso en el proceso de obtencin de datos en el entorno

    del data warehouse. Extraccin significa leer, entender los datos fuentes y copiar

    los datos necesarios para el DWH en el Staging Area (rea de ETL) para su

    manipulacin posterior.

    Una vez que la data es extrada del Staging Area, hay numerosas y potenciales

    transformaciones como la limpieza de datos (correccin de datos escritos de forma

    errnea, resolviendo conflictos, colocacin en formatos nuevos, etc.), combinando

    datos de mltiples fuentes, eliminando datos duplicados y asignando warehouse

    keys (llaves primarias en el data warehouse).

    Finalmente con todas las transformaciones, los datos son cargados en el rea de

    presentacin del data warehouse [BIB01].

    1.2.2. Conceptos: Anlisis Dimensional

    Fact Table Es la tabla central del esquema en estrella que representa datos numricos en el

    contexto de las entidades del negocio. La tabla de hechos esta constituida por

    medidas y por foreign keys La fact table expresa la relacin muchos a muchos entre

    las dimensiones dentro del modelo dimensional. [BIB01]

  • 6

    Dimensiones Son objetos del negocio con los cuales se puede analizar la tendencia y el

    comportamiento del mismo. Las definiciones de las dimensiones se basan en

    polticas de la compaa, e indican la manera en que la organizacin interpreta o

    clasifica su informacin para segmentar el anlisis facilitando la observacin de los

    datos. [BIB01]

    Medidas o mtricas Son caractersticas cualitativas o cuantitativas de los objetos que se desean

    analizar en las empresas. Las medidas cuantitativas estn dadas por valores o

    cifras porcentuales. Por ejemplo las ventas en dlares, cantidad de unidades en

    stock, cantidad de unidades de productos vendidos, etc. [BIB01]

    Esquema Estrella Este esquema est formado por un elemento central que consiste en una tabla

    llamada la Tabla de Hechos (Fact Table), que est conectada a varias tablas de

    dimensiones.

    Las tablas de hechos contienen los valores precalculados que surgen de totalizar

    valorizar operacionales atmicos segn las distintas dimensiones, tales como

    clientes, productos o periodos de tiempo. Se presenta un ejemplo, el cual

    representa un evento crtico y cuantificable en el negocio como ventas o costos. Su

    clave est compuesta por las claves primarias de las tablas de dimensin

    relacionadas. [BIB01]

    Esquema copo de nieve La figura que se muestra a continuacin, presenta una variante del esquema

    estrella en el cual las tablas de dimensin estn normalizadas, es decir, pueden

    incluir claves que apuntan a otras tablas de dimensin. Las ventajas de esta

    normalizacin son la reduccin del tamao y redundancia en las tablas de

    dimensin y un aumento de la flexibilidad en la definicin de dimensiones.

    Sin embargo, el incremento en la cantidad de tablas hace que se necesiten ms

    operaciones de unin para responder a las consultas, lo que empeora el

    rendimiento, adems del mantenimiento que requieren las tablas adicionales.

    [BIB01]

  • 7

    Figura 1.1 Modelo Estrella

    Figura 1.2 Esquema Copo de Nieve

    1.2.3. Conceptos: Software Libre Open Source Es el software que, una vez obtenido, puede ser usado, copiado, estudiado,

    modificado y redistribuido libremente. El software libre suele estar disponible

    gratuitamente, pero no se debe asociar software libre a software gratuito, o a precio

    del costo de la distribucin a travs de otros medios; sin embargo no es obligatorio

    que sea as y, aunque conserve su carcter de libre, puede ser vendido

    comercialmente

  • 8

    Open Source Business Intelligence (OSBI) Es una solucin de Inteligencia de negocios basada en tecnologas open source

    Sistemas OLTP vs sistemas OLAP Sistemas OLTP (On-Line Transaction Processing)

    Mientras su tecnologa subyacente ha cambiado dramticamente con el tiempo, las

    bases de datos operacionales mantienen su misma funcionalidad bsica: capturar,

    actualizar, almacenar y recuperar archivos de datos, dichas base de datos estn

    estructuradas con el propsito de dar apoyo a las operaciones diarias procesando

    transacciones; ellas no han sido diseadas para desarrollar anlisis de negocio.

    [BIB02]

    Sistemas OLAP (On-Line Analytical Processing)

    OLAP es una tecnologa de anlisis de datos que presenta una visin

    multidimensional lgica de los datos en el data warehouse. La visin es

    independiente de cmo se almacenan los datos, comprende siempre la consulta

    interactiva y el anlisis de los datos con rapidez, de modo que el proceso de

    anlisis no se vea interrumpido.

    Los sistemas OLAP organizan los datos directamente como estructuras

    multidimensionales, incluye herramientas fciles de usar por usuarios para

    conseguir la informacin en mltiples y simultneas vistas dimensionales.

    OLAP genera rpidos tiempos de respuesta los cuales permiten a los gerentes y

    analistas preguntar y resolver ms situaciones en un corto perodo de tiempo

    El motor de clculo de OLAP organiza los datos en una forma que permite a los

    analistas escribir sencillas y directas frmulas que se ejecutan a travs de mltiples

    dimensiones. Cuenta con tres formas principales de procesamiento: [CLA01]

    Forma de Procesamiento Diagrama

    MOLAP (Multidimensional OLAP) La data es pre-agregada y almacenada en estructuras propietarias conocidas como Cubos OLAP. Tiene un tiempo de respuesta muy bueno para consultas interactivas.

  • 9

    ROLAP (Relational OLAP) Obtiene los datos del data warehouse y los almacena en cubos temporales Su tiempo de respuesta es menor

    HOLAP (Hybrid OLAP)

    HOLAP consiste en diseminar los datos a travs de bases de datos relacionales y multidimensionales con la finalidad de obtener lo mejor de ambos sistemas

    Cuadro 1.1 Procesamiento OLAP

    1.2.4. Conceptos: Sector Salud

    Direccin de Salud MINSA define a las Direcciones de Salud (DISAs) en [URL07] como los rganos

    desconcentrados que ejercen la autoridad de salud por delegacin de la Alta

    Direccin y tienen a su cargo, las siguientes funciones generales en sus respectivas

    jurisdicciones:

    a) Implementar la visin, misin, poltica, objetivos y normas sectoriales, en su

    jurisdiccin.

    b) Brindar, en forma eficaz y oportuna, la asistencia, apoyo tcnico y

    administrativo a la gestin de las Direcciones de Red de Salud y de los

    Hospitales bajo su dependencia y jurisdiccin.

    c) Mantener informadas a las entidades pblicas y organizaciones en general,

    que desarrollen actividades afines para el Sector Salud sobre los

    dispositivos legales para la Salud, evaluando su cumplimiento.

    Estrategias sanitarias La priorizacin de problemas especficos de salud requiere que se aborden por

    estrategias sistematizadas con enfoque de Salud Pblica. La mayora de dichas

    prioridades (riesgos y daos) son las Estrategias Sanitarias Nacionales.

    Las estrategias sanitarias atraviesan todas las etapas de vida de la persona, no

    tienen estructura orgnica, requieren de mecanismos propios para el seguimiento

    de su evolucin epidemiolgica y de los procesos clave para la produccin de

  • 10

    servicios que se relacionan con estos problemas.

    El desarrollo de las Estrategias Sanitarias considera:

    - Definicin precisa de las prioridades sanitarias nacionales y regionales, a

    partir de un anlisis cuidadoso de la salud nacional y regional.

    - Identificacin del problema de salud, considerando todas las evidencias

    disponibles de sus factores crticos que influyen en su origen y perpetuacin

    - Plan de accin intersectorial, como producto del proceso de concertacin,

    que incluye la definicin de responsabilidades a todo nivel. [ART03]

    Las direcciones regionales deben aplicar dichas estrategias en la poblacin con sus

    respectivas lneas de accin de cada una. [URL06]

    El ministerio de salud ha establecido 10 estrategias sanitarias, se muestra un

    cuadro con las respectivas estrategias y sus rganos responsables

    Cuadro 1.2 Estrategias Sanitarias Nacionales

    Estrategia de Alimentacin y Nutricin Saludable La Estrategia Sanitaria "Alimentacin y Nutricin Saludable" es una de las 10

    estrategias del Ministerio de Salud que integra intervenciones (consejera

    nutricional, sesiones demostrativas, campaas, charlas, talleres) y acciones

    Estrategia Sanitaria Nacional rganos responsables

    Inmunizaciones Direccin General de Salud de las Personas

    Prevencin y Control de Enfermedades

    Metaxnicas y otras Transmitidas por Vectores

    Direccin General de Salud de las Personas

    Prevencin y Control de Infecciones de

    Transmisin Sexual y VIH-SIDA

    Direccin General de Salud de las Personas

    Prevencin y Control de Tuberculosis Direccin General de Salud de las Personas

    Salud Sexual y Salud Reproductiva Direccin General de Salud de las Personas

    Prevencin y Control de Daos No Transmisibles Direccin General de Salud de las Personas

    Accidentes de Trnsito Oficina General de Defensa Nacional

    Salud de los Pueblos Indgenas Centro Nacional de Salud Intercultural del

    Instituto Nacional de Salud

    Alimentacin y Nutricin Saludable Centro Nacional de Alimentacin y Nutricin

    del Instituto Nacional de Salud

    Salud Mental y Cultura de Paz Direccin General de Promocin de la Salud

  • 11

    priorizadas dirigidas a la reduccin de la morbi-mortalidad materna e infantil y a la

    reduccin de las deficiencias nutricionales. Debe coordinar, supervisar y monitorear

    las diversas actividades relacionadas a la alimentacin y nutricin que ejecutan los

    establecimientos de salud. Su objetivo general mejorar el estado nutricional de la

    poblacin peruana a travs de acciones integradas de salud y nutricin, priorizadas

    los grupos vulnerables y en pobreza extrema y exclusin.

    La estrategia de Alimentacin, se propone metas anuales las cuales deben intentar

    cumplir.

    El Modelo de Atencin Integral de Salud (MAIS) Es la forma de aplicar las acciones de salud tomando como eje central las

    necesidades de salud de las personas en el contexto de la familia y de la

    comunidad, antes que a los daos o enfermedades especficas. El modelo de

    atencin integral establece la visin multidimensional y biosicosocial de las

    personas e implica la provisin continua y coherente de acciones dirigidas al

    individuo, a su familia y a su comunidad desarrollada en corresponsabilidad por el

    sector salud, la sociedad y otros sectores, para la promocin, prevencin,

    recuperacin y rehabilitacin de la salud, con la finalidad de mejorar el estado de

    salud para el desarrollo sostenible.

    Las estrategias sanitarias nacionales son parte del Modelo de Atencin Integral,

    conforman uno de los ejes brindando los contenidos de la mayora de los cuidados

    esenciales, resolviendo el qu y cmo lograr la meta.

    Los Paquetes de Atencin Integral de Salud:

    El Paquete de Atencin Integral de Salud, es un conjunto de cuidados esenciales

    que requiere la persona para satisfacer sus necesidades de salud, brindados por el

    personal de salud, la propia persona, familia, los agentes comunitarios y otros

    actores sociales de la comunidad. [URL17]

    Programa PANTBC Es el Programa de Alimentacin y Nutricin para el Paciente Ambulatorio con

    Tuberculosis y Familia. Este programa forma parte del conjunto de intervenciones

    del Estado Peruano para apoyar la alimentacin de grupos vulnerables de la

    poblacin.

  • 12

    El Programa PANTBC permite ejecutar actividades de complementacin

    alimentaria-nutricional y evaluacin nutricional, para contribuir a la recuperacin

    integral del paciente ambulatorio con tuberculosis, y a la proteccin de su familia.

    Este programa se integra y complementa con otras actividades que desarrollan los

    establecimientos de salud en atencin a la enfermedad.

    Tiene como objetivo principal: contribuir a la recuperacin del paciente tuberculoso

    ambulatorio y proteger a su familia mediante el desarrollo de actividades

    educativas, evaluacin nutricional y el aporte de una canasta de alimentos que

    brinde el 28% de los requerimientos calricos y el 38% de los requerimientos

    proticos de la familia compuesta por un paciente y dos contactos.

    Apoya a los pacientes y familia (dos personas) con diagnstico de tuberculosis

    pulmonar o extrapulmonar, que reciben tratamiento ambulatorio en el Programa de

    Control de Tuberculosis (PCT), de los establecimientos de salud del MINSA.

    HIS El sistema transaccional utilizado para el proyecto de fin de carrera es HIS (en el

    idioma original, Health Information System).

    HIS es una herramienta indispensable que garantiza, el adecuado registro de las

    actividades de salud, contribuyendo a mejorar la calidad del registro de datos,

    homogenizando criterios, incorporando nuevas formas de registro y consolidndolo

    como nica fuente de informacin, con el propsito de instrumentalizar el soporte

    para la toma de decisiones.

    HIS, permite adecuarse a la situacin actual de la organizacin del Sistema de

    Servicios de Salud, Estrategias Sanitarias Nacionales, Etapas de Vida y

    Componentes Especiales.

    Tiene como finalidad servir como fuente de informacin bsica de la atencin

    ambulatoria diaria brindada a las personas que acuden a los establecimientos de

    salud, de las Direcciones de Salud y Direcciones Regionales de Salud del Pas.

    Tambin sirve de fuente bsica de informacin para la vigilancia epidemiolgica en

    cuanto a morbilidad y de las actividades preventivo-promocionales, realizadas tanto

    a nivel familiar como en grupos organizados de la comunidad. [ART07]

    1.3. Plan de Proyecto En esta seccin se explicar los pasos a seguir para la planeacin del proyecto. Se

  • 13

    basa en las mejores prcticas establecidas en el PMBOK del PMI

    Se definirn algunos conceptos respecto a la direccin de proyectos

    Direccin de Proyectos (Project Management) Es la aplicacin de conocimientos, habilidades, herramientas y tcnicas con el fin

    de cumplir los requerimientos de un proyecto. Se logra mediante los procesos de

    direccin de proyectos: inicio, planeamiento, ejecucin, monitoreo y control, y cierre

    - Iniciacin. Definen y autorizan el proyecto o una fase del proyecto. - Planificacin. Definen y refinan los objetivos y los planes de accin

    requeridos para lograr los objetivos y el alcance del proyecto. - Ejecucin. Integra a las personas y otros recursos para llevar a cabo el plan

    de proyecto. - Monitoreo y Control. Mide y monitorea el progreso para identificar

    desviaciones del plan de proyecto, y as tomar acciones correctivas cuando

    sea necesario. - Procesos de Cierre. Formaliza la aceptacin del producto, servicio o

    resultado, y conduce al proyecto o una fase del proyecto a su final.

    Fuente: A Guide to the Project Management Body of Knowledge (PMBOK Guide) - Third Edition

    Figura 1.3 Procesos de direccin de proyectos

    reas de Conocimiento. Para la direccin de proyectos se tiene 44 procesos agrupados en 9 reas de

    conocimientos.

  • 14

    - Integracin del proyecto (Project Integration Management)

    Consiste en los procesos para asegurar la coordinacin, unificacin y definicin de

    elementos del proyecto.

    - Alcance del proyecto (Project Scope Management)

    Incluye los procesos para asegurar que el proyecto contiene todo el trabajo

    necesario para completar el proyecto satisfactoriamente. En el proyecto a

    desarrollar se estableci como alcance el anlisis, diseo, construccin y pruebas

    del datamart para la estrategia sanitaria: Alimentacin y Nutricin Saludable, es

    decir hasta obtener el producto que vendra a ser los reportes analticos segn los

    requerimientos que solicita la estrategia.

    Con respecto al tiempo, el proyecto tendr una duracin estimada de 12 meses.

    - Costes del proyecto (Project Cost Management)

    La direccin de costos del proyecto incluye los procesos de planeamiento,

    estimacin y control de costos, de manera que se asegure que el proyecto sea

    completado dentro del presupuesto establecido.

    El proyecto a desarrollar ser utilizando en gran parte herramientas libres por lo que

    no habra problemas por las licencias de estas herramientas y aquellas que

    requieran de licencia, estas sern proporcionadas por la universidad.

    - Calidad del proyecto (Project Quality Management)

    La direccin de calidad del proyecto incluye los procesos necesarios para asegurar

    que el proyecto satisfaga las necesidades para la que se ha llevado a cabo. Incluye

    todas las actividades de la direccin que determinan las polticas de la calidad,

    objetivos y responsabilidades, as como su desarrollo a travs de la planificacin, el

    control y el aseguramiento de la calidad. Por ejemplo, las reuniones con el asesor

    del tema sirven para realizar correcciones y/o modificaciones, esto es para

    garantizar que se est cumpliendo con lo planeado en el proyecto.

    - Comunicaciones del proyecto. (Project Communications Management)

    La direccin de comunicaciones del proyecto incluye los procesos requeridos para

    asegurar la precisa y apropiada generacin, recoleccin, distribucin,

    almacenamiento y obtencin de la informacin del proyecto. Provee vnculos

    crticos entre las personas y la informacin que son necesarios para una

    comunicacin exitosa entre miembros del proyecto, usuarios, asesores, etc. En el

  • 15

    proyecto a realizar no se aplica esta rea del conocimiento.

    - Riesgos del proyecto. (Project Risk Management)

    La direccin de riesgos incluye los procesos relacionados con la identificacin,

    anlisis y respuesta a los riesgos del proyecto. Su objetivo es incrementar los

    efectos positivos de los distintos eventos y minimizar las consecuencias de sus

    efectos negativos.

    - Recursos Humanos del proyecto (Project Human Resource Management)

    La direccin de recursos humanos del proyecto incluye los procesos que organizan

    y administran al equipo del proyecto. Asigna roles y responsabilidades a los

    miembros que conforman el equipo para lograr completar el proyecto. Debido a que

    el proyecto ser realizado por una nica persona, esta rea de conocimiento no se

    aplica.

    Fuente: A Guide to the Project Management Body of Knowledge (PMBOK Guide) - Third Edition

    Figura 1.4 reas de Conocimiento de la Direccin de Proyectos

    - Aprovisionamiento del proyecto (Project Procurement Management)

    La direccin de aprovisionamiento del proyecto incluye los procesos para comprar o

    adquirir los productos, servicios o resultados necesarios para la realizacin del

  • 16

    trabajo. En el presente proyecto no se adquirir materiales extras, por lo tanto esta

    rea del conocimiento no aplica.

    - Plazos del proyecto (Project Time Management)

    La direccin de plazos del proyecto incluye los procesos necesarios para asegurar

    la conclusin del proyecto en los tiempos establecidos. Con ayuda de un diagrama

    de Gantt se puede gestionar el tiempo para cada fase que ha sido definida en el

    WBS (The Work Breakdown Structure).

    WBS es una herramienta que define un proyecto en grupos de elementos de trabajo

    (subdivisin del esfuerzo) para as organizar y definir el trabajo total del alcance del

    proyecto a realizar.

    A continuacin se presenta el diagrama WBS para el proyecto de tesis:

    Figura 1.5 Proyecto de Tesis - WBS

    Para poder realizar un correcto seguimiento a los plazos establecidos se ha

    elaborado el Diagrama de Gantt, el cual se encuentra en el Anexo 1.

  • 17

    1.4. Estado del Arte Se presenta aqu las principales soluciones actuales en herramientas de extraccin

    y explotacin de datos as como otros trabajos con datamarts.

    1.4.1. Herramientas de extraccin de datos En esta seccin se expondrn los requisitos para la eleccin de la herramienta ETL

    y luego realizar la comparacin de caractersticas y ventajas entre las herramientas

    que existen en el mercado.

    Requerimientos a cumplir:

    1. Forma parte de una plataforma integrada de BI Forma parte de una plataforma integrada de BI.

    2. Es multiplataforma. 3. Limpieza de datos. 4. Trabajo con ms de una fuente de datos. 5. Filtrado de datos 6. Interfaz grfica para el desarrollo del proceso ETL. 7. Monitoreo y diseo del proceso ETL. 8. Programacin del proceso ETL para que se ejecute

    automticamente. 9. Trabajo con las principales bases de datos del mercado como:

    Microsoft SQL Server, Oracle, PostgreSQL, MySQL entre otras. 10. Soporte de la herramienta.

    Oracle Warehouse Builder

    Descripcin

    Oracle Warehouse Builder (OWS) es una herramienta grfica de Oracle destinada a

    la extraccin, transformacin y carga de los datos (ETL); al modelamiento relacional

    y dimensional; y a la administracin de todo el ciclo de vida de los datos y

    metadatos.

    OWS est diseado para base de datos Oracle.

    Requerimientos de hardware y software

    OWS est escrito en Java y actualmente se encuentra en la versin 11g.

    Adems, OWS es multiplataforma, los sistemas operativos que soporta son:

    Microsoft Windows, Linux/Unix y Solaris.

    A continuacin se muestra los requerimientos de hardware para MS-Windows y

    Linux/UNIX

  • 18

    Sistema Operativo Requerimiento

    MS-Windows Las arquitecturas de 32bit y 64bit son soportadas.

    Se requiere que la computadora cuente con un mnimo de

    850MB de espacio de disco y 768MB de memoria disponible.

    Linux/UNIX Se requiere que la computadora cuente con un mnimo de

    1100MB de espacio de disco y 768MB de memoria disponible.

    Cuadro 1.3 Requerimientos de HW y SW - OWS

    Caractersticas y ventajas

    Permite realizar las siguientes actividades:

    - Data Profiling: Permite descubrir y cuantificar los defectos de los datos antes

    y durante el proceso de creacin del data warehouse o aplicacin de

    inteligencia de negocios.

    - Modelado de datos relacionales y estructuras dimensionales

    - Soporte para el manejo de las cambios: Permite almacenar y gestionar tanto

    los datos actuales como histricos a travs del tiempo en el data warehouse.

    - Integracin con Oracle OLAP: Permite cargar directamente la fuente de

    datos desde la opcin OLAP, eliminando el uso de un rea temporal para

    data relacional.

    - Permite planificar la ejecucin automtica de los procesos ETL.

    - Integracin con con los principales ERPs del mercado tales como SAP; E-

    Business Suite y PeopleSoft.

    - Administracin de Seguridad: Permite controlar la seguridad de acuerdo a la

    metadata del perfil de usuario.

    - Auditora de datos.

    - Limpieza de datos para maximizar la calidad de la informacin

    - Diseo y gestin de metadatos corporativos.

    IBM Websphere DataStage

    Descripcin

    IBM WebSphere DataStage es una herramienta ETL que integra los datos de

    mltiples y grandes volmenes de fuentes de datos y metadatos.

    DataStage gestiona los datos que llegan en tiempo real, as como los datos

    recibidos a diario, semanal o mensual

  • 19

    Requerimientos de software

    IBM WebSphere DataStage es multiplataforma, soporta los sistemas operativos

    Microsoft Windows, Linux (Red Hat).

    Caractersticas y ventajas

    - Brinda soporte para la extraccin, integracin y transformacin de grandes

    cantidades de datos, con estructuras de datos que van desde simple a muy

    complejas

    - Ofrece una plataforma escalable que permite a las compaas resolver

    grandes problemas de negocios a travs del alto rendimiento en

    procesamiento de datos masivos.

    - Usa notaciones grficas para construir la solucin de integracin de datos.

    - Soporta un nmero ilimitado de fuentes de datos heterogneas,

    prcticamente todas las bases de datos como Oracle, IBM DB2, IBM

    Informix, Sybase, Teradata y Microsoft SQL Server, adems incluye otras

    fuentes como: archivos de texto, complejas estructuras de datos en XML,

    sistemas ERP como SAP y PeopleSoft. [URL10]

    Fuente: http://www.mainstream.co.il/ComplexSortJob.jpg

    Figura 1.6: IBM WebSphere DataStage

  • 20

    SQL Server Integration Services (SSIS)

    Descripcin

    SSIS es un componente de Microsoft SQL Server 2005 y 2008, est disponible

    nicamente en sus versiones Estndar y Enterprise.

    SSIS ha reemplazado a la caracterstica del SQL Server 2000, Data Transformation

    Service (DTS). Provee una plataforma para disear y generar soluciones de

    integracin de datos y aplicaciones workflows.

    Su principal caracterstica es ser una herramienta flexible para el proceso de ETL.

    Requerimientos de software

    El sistema operativo que lo soporta es Microsoft Windows

    Caractersticas y ventajas

    - SSIS puede extraer y transformar datos de una amplia variedad de fuentes

    como archivos XML, archivos planos y bases de datos relacionales para

    luego cargar los datos en uno o ms destinos.

    - SSIS posee un amplio rango de componentes como lookups, ordenamiento,

    agregacin, combinaciones entre otros. Que son usados para el diseo del

    ETL.

    - Provee de modo debug grfico.[URL20]

    Fuente: http://www.programminghelp.com/

    Figura 1.7: SQL Server Integration Services

  • 21

    Kettle, Pentaho (Actualmente Data Integration)

    Descripcin

    Kettle Pentaho es una herramienta que permite implementar el proceso de ETL,

    adems forma parte de la plataforma Open Source Pentaho Business Intelligence.

    Requerimientos de software

    Es multiplataforma, soporta sistemas operativos MS-Windows, Linux/UNIX.

    Caractersticas y Beneficios:

    - Soporta las siguientes base de datos, desde MySQL, Oracle, AS/400, MS

    Access, MS SQL Server, IBM DB2, PostgreSQL, Intersystems, Cach,

    Informix, Sybase, Gupta SQL Base, dBase III, IV o 5, Firebird SQL, MaxDB

    (SAP DB), Hypersonic, Generic, CA Ingress, SAP R/3 System.

    - La creacin de transformations o jobs (secuencia de pasos para realizar la

    carga de una dimensin o tabla de hechos) se pueda realizar a travs del

    mtodo drag-and-drop que provee el ambiente grfico de Kettle.

    - Permite la migracin de datos entre diferentes bases de datos.

    - Exporta e importa archivos Excel, txt, entre otros.

    - Cuenta con licencia Open Source.

    Fuente: http://www.pentaho.com/products/

    Figura 1.8: Transformation en Kettle-Pentaho (Data Integration)

  • 22

    - Cuenta con cuatro herramientas indispensables para el desarrollo de los

    procesos ETL:

    o Spoon: Disea transformaciones ETTL usando el entorno grfico.

    o PAN: ejecuta las transformaciones diseadas por Spoon. o CHEF: crea los jobs o trabajos de ETL. o Kitchen: ejecuta los jobs o trabajos ETL.

    Anlisis y Comparacin

    Luego de revisar las principales caractersticas de las herramientas de extraccin

    candidatas: Oracle Warehouse Builder, IBM Websphere DataStage, SSIS y Kettle-

    Pentaho, se realiz un cuadro comparativo (Cuadro 1.4) con los requerimientos

    que debe cumplir la herramienta seleccionada.

    Para ello se le ha asignado una calificacin a cada requerimiento que va de 0 (no

    cumple) a 5 (cumple totalmente).

    Se muestra que Pentaho Kettle obtuvo mayor puntaje adems tiene una ventaja

    sobre las otras que es contar con licencia open source, a pesar que actualmente no

    existe un vasto soporte, la documentacin que se encuentra disponible de forma

    oficial cubre la mayor parte de las principales necesidades del proyecto de tesis.

    Recientemente, el personal de Pentaho est brindando soporte tcnico,

    actualizaciones y/o mejoras aunque no est cubierto por la licencia open source.

    La herramienta Kettle, al igual que las otras herramientas, es intuitiva y de fcil

    aprendizaje ya que presenta un entorno grfico para el diseo del ETL.

  • 23

    Cuadro 1.4 Cuadro Comparativo Herramientas Explotacin

    1.4.2. Herramientas de explotacin de datos

    Se tienen tambin diversas herramientas de explotacin. Desde el momento en que

    la mayora de los ejecutivos estn aplicando sus propias pruebas y preparan sus

    propios informes, es imperativo que estas herramientas sean, al mismo tiempo, de

    Criterio Pentaho Kettle SSISIBM Websphere

    DataStageOracle Warehouse

    BuilderForma parte de una plataforma integrada de BI

    5 5 5 5

    Es multiplataforma 5 3 5 5

    Limpieza de datos 5 5 5 5

    Trabajo con ms de una fuente de datos. 4 5 5 5

    Filtrado de datos 4 4 4 4

    Interfaz grfica para el desarrollo del proceso ETL

    5 4 5 3

    Permitir el monitoreo del proceso ETL, as como el diseo del mismo.

    4 3 3 3

    Programacin del proceso ETL para que se ejecute automticamente

    5 4 4 5

    Trabajo con las principales bases de datos del mercado como: Microsoft SQL Server 2005 y Oracle Database9g.

    5 5 4 5

    Soporte de la herramienta. 4 5 5 5

    Puntaje Total 46 43 45 45

  • 24

    fcil acceso y simples de usar para la exploracin de los datos.

    A continuacin se muestran los requisitos necesarios para la eleccin de la

    herramienta y luego una comparacin entre algunas de las principales

    herramientas.

    Requerimientos a cumplir:

    o Anlisis de la informacin en todas las dimensiones o Generacin de reportes grficos en base a la informacin o Exportacin a archivos Excel para visualizar la informacin o Drill and Down: Detalle de los datos accediendo directamente a las

    fuentes multidimensionales. o Filtros y bsquedas personalizables. o Slice and Dice: Operaciones de corte y rotacin de datos. o Soporte de la herramienta. o Ser multiplataforma.

    Business Objects OLAP Intelligence Es una herramienta que permite acceder y analizar los datos almacenados

    en el servidor OLAP.

    Caractersticas:

    - Provee una interfaz basada en web que permite a los usuarios seleccionar

    dimensiones y miembros de un panel de consultas, dando la posibilidad

    interactuar directamente con la informacin y generar consultas

    espontneas que permitan descubrir anomalas.

    - Provee una interfaz intuitiva y rica en funciones para catalogar, filtrar y

    realizar rpidos clculos sobre la informacin. A su vez permite esconder

    dimensiones que no sean relevantes para el anlisis de la informacin.

    - Acceso a servidores OLAP de Microsoft, Hyperion y SAP, as como a

    servidores de datos multidimensionales como Microsoft SQL Server Analysis

    Services, Hyperion Essbase, IBM DB2 OLAP, y SAP BW.

    - Entorno grfico y asistente para desarrollo de hojas de trabajo para OLAP,

    donde se puede colocar la informacin en el formato que se crea

    conveniente para luego ser publicada para otros usuarios del sistema.

    - Opciones de drill-down de informacin sumarizada a reportes detallados.

    Esto permite ampliar el nivel de anlisis de los usuarios, permitindoles

    visualizar un mayor detalle de la informacin con que se cuenta para

    descubrir alguna anomala en la misma.

  • 25

    - Interfaz con Excel para mostrar la informacin desde este sistema de hoja

    de clculo. [URL21]

    Microsoft AS (Analysis Services)

    Es una aplicacin que permite ofrecer una visin unificada e integrada de

    todos los datos del negocio como base para la elaboracin de todos los

    informes y anlisis OLAP.

    Caractersticas:

    - Modelo Dimensional Unificado: El UDM (Unified Dimensional Model) es el

    repositorio central de metadatos del Analysis Services. En este se definen

    las entidades empresariales, lgica empresarial, clculos y medidas que

    sirven de origen para todos los informes, hojas de clculo, exploradores

    OLAP y aplicaciones de anlisis. Los usuarios pueden emitir consultas en el

    UDM mediante diversas herramientas de cliente, como Microsoft Excel.

    - Almacenamiento en cache proactivo: Cuenta con almacenamiento en cach

    proactivo, que permite combinar las ventajas de las actualizaciones en

    tiempo real con el rendimiento que brinda la arquitectura MOLAP. Esto

    permite mantener automticamente la cach mientras los datos se van

    modificando en los orgenes de datos subyacentes. Adems se logra

    obtener un rendimiento sobresaliente en las consultas.

    - Procesamiento analtico en lnea (OLAP): permite obtener acceso a datos

    organizados y agregados de orgenes de datos empresariales, como por

    ejemplo almacenamientos de datos, en una estructura multidimensional

    denominada cubo. El Analysis Services proporciona herramientas y

    caractersticas para OLAP que puede utilizar para disear, implementar y

    mantener cubos y otros objetos compatibles. [URL18]

    Pentaho Open BI Suite - Pentaho Analysis

    Parte de la suite Pentaho BI.

    Pentaho Anlisis suministra a los usuarios un sistema avanzado de anlisis

    de informacin. Con uso de las tablas dinmicas (pivot tables, crosstabs),

    generadas por Mondrian y JPivot, el usuario puede navegar por los datos,

    ajustando la visin de los datos, los filtros de visualizacin, aadiendo o

    quitando los campos de agregacin. [URL09]

  • 26

    Caractersticas:

    - Genera informes de forma gil y permite a travs de Pentaho Reporting la

    distribucin de los resultados del anlisis en mltiples formatos, incluyendo

    la opcin de imprimir o exportar a formato PDF, XLS, HTML y texto.

    - Para el anlisis toma en cuenta los 6 elementos bsicos del sistema OLAP:

    Dimensiones, valores, jerarquas, niveles, atributos e indicadores.

    - Al utilizar la arquitectura MOLAP esta permite tener datos agregados o pre-

    calculados, ya que estos residen en el mismo formato multidimensional.

    - Funcionalidad de procesamiento, donde dos aplicaciones ayudan a obtener

    los procesos OLAP, estos son el servidor OLAP Mondrian, y el Jpivot,

    gracias a estos se pueden realizar querys a Datamart, visualizacin de

    resultados mediante un browser, permitir el drill-down.

    Fuente: http://www.pentaho.com/images/snap_analysis_olap.png

    Figura 1.9: Ejemplo de Reporte de Anlisis Pentaho Anlisis.

    - Suministra a los usuarios un sistema avanzado de anlisis de informacin.

    Con uso de las tablas dinmicas (pivot tables, crosstabs), generadas por

    Mondrian (Servidor OLAP escrito en Java) y JPivot, el usuario puede

    navegar por los datos, ajustando la visin de los datos, los filtros de

    visualizacin, aadiendo o quitando los campos de agregacin.

    - Permite trabajar sobre diferentes bases de datos, como Oracle, DB2, SQL-

    Server, MySQL, PostgreSQL, etc., esto a travs de Mondrian.

  • 27

    - Puede ser utilizada en UNIX, LINUX y Microsoft Windows.

    Anlisis y Comparacin

    Se consideraron tres herramientas candidatas: Pentaho Analysis, Business Objects

    OLAP y Microsoft Anlisis Services.

    Al igual que para la seleccin de herramientas ETL, se ha asignado una calificacin

    por cada requerimiento que debe cumplir la herramienta de 0 (no cumple) a 5

    (cumple totalmente).

    La herramienta que obtuvo ms puntaje, segn el cuadro comparativo (Cuadro 1.5),

    fue Pentaho Anlisis y tiene la ventaja de formar parte de la plataforma integral

    Pentaho BI Suite con licencia Open Source. Como las dems herramientas

    comparadas, cuenta con una interfaz grfica para fcil manejo por parte de los

    usuarios

    Otra ventaja es que si se reduce la inversin en licencias, se puede destinar ese

    dinero a mejorar el anlisis, el diseo, la formacin de usuarios, la toma de

    decisiones. La DISA podr administrar el dinero ahorrado para enfocarse en

    solucionar los verdaderos problemas, es decir los de salud.

    Como una desventaja seria el tema del soporte tcnico, pues el que brinda Pentaho

    tiene un costo y es este el que la DISA tendr que asumir en caso se presente

    algn problema con el sistema.

  • 28

    Cuadro 1.5 Cuadro Comparativo Herramientas Explotacin

    En el captulo 2, se realizar el anlisis tecnolgico, econmico y de tiempo de la

    solucin y se comprobar la seleccin de la herramienta.

    1.4.3. Tesis y productos similares A continuacin se muestran algunos trabajos de tesis con datamarts y productos

    que existen en el mercado relacionadas a mejoras en el sector salud.

    Tema: Una metodologa para sectorizar pacientes en el consumo de medicamentos aplicando datamart y datamining en un hospital Autores: Ivn Tapia Rivas, Maria Ruiz Rivera y Edgar Ruiz Lizama

    Propone un mtodo para el anlisis de datos en la forma con que se consumen los

    medicamentos en un hospital peruano a fin de poder identificar algunas realidades

    o caractersticas no observables que produciran desabastecimiento o insatisfaccin

    del paciente, el cual servir como una herramienta para la toma de decisin sobre

    el abastecimiento de medicamentos en el hospital. Aqu se complementan tcnicas

    Criterio PentahoAnalysis

    BusinessObjects

    AnalysisServices

    Anlisis de la informacin en todas las dimensiones

    5 5 5

    Generacin de reportes grficos 5 5

    5

    Exportacin a archivos Excel para visualizar la informacin 5 5

    5

    Drill and Down 5 5 4

    Filtros y bsquedas personalizables. 4 3 4

    Slice and Dice: Operaciones de corte y rotacin de datos 5 5 5

    Soporte de la herramienta 4 5 5

    Ser Multiplataforma 5 4 3

    Puntaje Total 38 37 36

  • 29

    de datamart, de extraccin y carga de datos, as como algoritmos de minera de

    datos como K-means para sectorizar los consumos de medicamentos

    mencionados. [TES02]

    Tema: Anlisis, diseo e implantacin e impacto de un datamart para el rea de ventas de empresas de sector farmacutico Autor: Moro Ros, Christian.

    El objetivo de esta tesis fue realizar un datamart en el rea de ventas de gran

    facilidad de uso, aprendizaje, y que tena costos reducidos en aspectos de

    hardware y software.

    Dicho datamart se desarroll con el propsito de mejorar la toma de decisiones de

    la alta gerencia ya que era indispensable contar con informacin altamente

    disponible y de mejor calidad, que es normalmente brindado por sistemas de data

    warehouse.

    Como es sabido se haba desarrollado gran competitividad entre farmacuticas

    transaccionales, as mismo se contaba con bajo presupuestos para proyectos

    locales, debido a la baja rentabilidad de la industria farmacutica en nuestros

    mercados comparativamente con otras zonas del mundo, tal como Europa o Asia.

    Toda la compaa farmacutica, tena el gran compromiso de tomar las mejores

    decisiones en sus distintas reas, eran operaciones de uno o varios pases en las

    que no se poda tener conocimiento o cercana de los clientes por los escasos

    recursos humanos y las grandes distancias.

    Se determin que era indispensable informacin altamente disponible y de mejor

    calidad, normalmente brindada por los sistemas de data warehouse.

    Impacto estratgico luego de la implantacin del datamart:

    Se obtuvo una organizacin muy gil donde el anlisis de informacin es

    completamente asequible por los empleados de todo nivel, y este fue usado como

    una ventaja competitiva en el muy gil mercado farmacutico.

    Se mejor notablemente los procesos de toma de decisiones, la comprensin del

    negocio, las reas de responsabilidad de los empleados, el control de gestin e

    identificacin de las oportunidades de mercado que permitan mejorar la

    rentabilidad y ventas de la compaa. [TES01]

  • 30

    Empresa: Med-Vantage Med-Vantage ha desarrollado varias aplicaciones complementarias y mtodos de

    negocios. Adems proporciona aplicacin propietaria para realizar los procesos de

    ETL (extraer, transformar y cargar datos) la cual mejora el rendimiento de la

    produccin, validacin de datos y la transformacin de un gran conjunto de datos

    administrativos en concretos resultados

    Mtricas de acciones y resultados - Costo de atencin y reportes analticos de calidad con mltiple niveles,

    adems de permitir manejar la informacin (drill and downs)

    - Registro de pacientes y recordatorios para realizar seguimientos

    Presentacin de resultados integrados y personalizados - Aplicaciones de soporte a decisiones de salud para mdicos y miembros

    - Navegacin web personalizada

    - Recopilacin de datos y la integracin de contenido de salud

    - Informes de anlisis estadsticos [URL13]

    Empresa: Planwatch Anlisis Completo del Plan de Beneficios de Salud Planwatch ofrece un anlisis financiero completo de los programas de beneficio de

    salud (planes de salud) actualmente en curso (ofrecidos actualmente) incluyendo

    los 25 reportes de nivel superior (top 25) acerca de datos demogrficos, diagnstico

    / indicadores de estilo de vida, uso del beneficio o plan, proveedor / utilizacin de la

    red, y ms.

    Modelamiento de Plan y Motor de Readjudicacin Calcule el impacto de las modificaciones propuestas al diseo de un plan con

    cambios simulados con respecto al historial de reclamos y/o quejas. Readjudicacin

    completa usando cantidades modificadas deducibles y co-pagos, porcentajes de co-

    seguros, mximo nivel de beneficio, y ms.

    Informes interactivos Enfoque orientado al informe de anlisis avanzado. Planwatch combina la

    familiaridad de los reportes de negocios estndar con la potencia del software

    inteligente para negocios modernos. El resultado: una herramienta prctica tanto

    para informes simples como lo es para las tareas de anlisis puro.

    Reclamos al Datamart, almacenado y gestionado plenamente La informacin se extrae de los sistemas de procesamiento de reclamos TPA,

  • 31

    transformado en una estructura optimizada para el anlisis, y se aloja en nuestro

    centro de datos gestionados. Se ingresa de manera segura desde cualquier equipo

    con conexin a Internet y navegador web. La gestin de servicios incluye la

    supervisin, monitoreo, backup automtico y soporte. [URL12]

    1.5. Descripcin y sustentacin de la solucin

    La solucin al problema de la descentralizacin del sector salud con respecto al

    manejo de informacin de las 10 estrategias sanitarias dentro de las direcciones de

    salud es el desarrollo de un sistema de informacin que permita supervisar,

    controlar, evaluar los avances y resultados de estas a travs del fcil acceso a los

    datos provenientes de todos los centros de salud asignados a cada DISA. De esta

    forma se llevara a cabo una estandarizacin, es decir que cada DISA del pas

    presente la misma forma de manejo y control de las 10 estrategias.

    El sistema de informacin del proyecto de fin de carrera consiste en una solucin

    de inteligencia de negocios que es el anlisis, diseo y construccin de un datamart

    para la evaluacin de resultados de las 10 estrategias sanitarias a travs de la

    generacin de reportes segn requerimientos especficos para cada una de las

    estrategias y con ello, como se mencion, permitir predecir que nuevas acciones

    tomar para mejorar. La informacin inicial ser obtenida del sistema OLTP llamado

    HIS (Health Information System) en la cual se recogen las consultas mdicas y sus

    diagnsticos realizados en los centros de salud de cada direccin regional, dicha

    informacin ser dividida y clasificada por estrategia sanitaria y posteriormente ser

    evaluada segn sus lneas de accin (requerimientos y acciones).

    Para el proyecto de fin de carrera, nicamente se realizar la implementacin de la

    estrategia piloto (Alimentacin y Nutricin Saludable,) y esta hace uso de un

    sistema transaccional adicional que maneja la informacin del programa PANTBC

    mencionado en el punto 1.2.4.

    En general, cada estrategia sanitaria ser analizada de forma independiente

    siguiendo sus requerimientos especficos. La implementacin de las dems

    estrategias se realizar tomando como base la estrategia piloto.

    La herramienta que se utilizar para la implementacin del datamart, luego del

    anlisis comparativo realizado en el punto 1.4, es Pentaho BI Suite versin 1.6 ya

  • 32

    que consta de licencia libre y todos los mdulos necesarios para la extraccin y

    explotacin de datos.

  • 33

    2. Captulo 2: Anlisis En este captulo se tratar de la definicin de la metodologa para implementacin

    de un proyecto de Inteligencia de negocios, adems de la determinacin de

    requerimientos y anlisis dimensional.

    2.1. Definicin de la metodologa A continuacin se explicar las dos metodologas ms utilizadas para la

    construccin del datamart:

    2.1.1. El modelo de Inmon Trata del manejo de una arquitectura de mltiples niveles en el cual el DWH

    colecciona datos de diversas fuentes, luego estos son integrados y finalmente

    distribuidos a subconjuntos denominados datamarts (enfoque Top Down).

    Estructura del Data warehouse En la figura 2.1 se muestran diferentes niveles de detalle. Hay un antiguo y actual

    nivel de detalle, un nivel de datos ligeramente sumarizados (nivel datamart) y un

    nivel de datos altamente sumarizados.

  • 34

    Fuente: The Data Warehouse Toolkit The Complete Guide to Dimensional Modeling

    Figura 2.1 Estructura del DW\

    Orientacin por temas El DWH est orientado a la divisin por temas o reas que se han definido en el

    modelo de datos del proyecto. Por ejemplo: cliente, producto, cuenta, transaccin o

    actividad.

    Diseo del Datawarehouse Granularidad

    Es el aspecto ms importante en el diseo del DWH. El mayor detalle es el ms

    bajo nivel de granularidad y el menor detalle es el ms alto nivel.

    Es el tema ms crtico en el diseo del entorno del DWH porque afecta el volumen

    de datos que residir en el DWH y el tipo de consultas que sern respondidas.

    Modelo de Datos del Data Warehouse

    Existen tres niveles de modelamiento de datos:

    - Alto nivel, llamado ERD (Entity Relationship Diagram)

    Consiste en entidades y relaciones. El nombre de la entidad est encerrada por un

    valo, las relaciones entre entidades est representado por flechas. Un ERD

    corporativo est compuesto por varios ERDs los cuales reflejan diferentes puntos

    de vistas de las personas de la corporacin.

  • 35

    Fuente: The Data Warehouse Toolkit The Complete Guide to Dimensional Modeling

    Figura 2.2. ERD

    - Nivel Medio, llamado DIS (Data Item Set)

    Luego de definir el alto nivel del modelo de datos, se establece el siguiente nivel:

    DIS. Por cada rea principal o entidad identificada en el nivel anterior, se crea un

    nivel medio para expandir los atributos.

    Fuente: The Data Warehouse Toolkit The Complete Guide to Dimensional Modeling

    Figura 2.3. Relacin entre ERD y DIS

    - Nivel Bajo, llamado Modelo Fsico (Physical Model)

    Creado a partir del nivel medio con la finalidad de extenderlo incluyendo llaves y

    caractersticas fsicas del modelo. A este punto, el modelo de datos fsicos luce

    como una serie de tablas llamadas tablas relacionadas.

    Proceso de ETL

    El DWH es cargado con los datos obtenidos en el entorno operaciones, mas antes

    dichos datos deben pasar por un complejo proceso de conversin, reformato e

    integracin para as recin ser parte del entorno del DWH. Acceso Indirecto al DWH

    Un enfoque distinto para el diseo de base de datos en el contexto de data

    warehousing es el enfoque multidimensional. Este enfoque es aplicado

    exclusivamente en datamarts no datawarehouses..

    Se deben obtener los datos del DWH para formar el datamart. En el DWH, los datos

  • 36

    son muy granulares, en cambio en el datamart son ms compactos y sumarizados.

    2.1.2. Metodologa de Ralph Kimball El modelo de Kimball deja de lado la necesidad de un data warehouse debido a que

    la mayora de usuarios desea obtener datos detallados, Kimball argumenta que es

    mejor almacenar los datos en datamarts independientes y lgicamente conectados

    usando dimensiones. Para la optimizacin de consultas y mejorar la facilidad de uso

    de datamarts, Kimball propone el modelo de datos como esquema estrella.

    Componentes del DWH

    Existen cuatro componentes importantes para la creacin del entorno del DWH. Los

    componentes se muestran en la figura 2.4, y estos son:

    - Sistemas fuentes operacionales (Operational Source Systems)

    - rea de limpieza de datos (Data Staging Area)

    - rea de presentacin de datos (Data Presentation Area)

    - Herramientas de acceso a datos (Data Access Tools)

    Operational Source Systems (OLTP)

    Son los sistemas de registro que capturan todas las transacciones del negocio. Sus

    prioridades son el procesamiento y la disponibilidad. Consultas contra estos

    sistemas son limitados.

    Data Staging Area

    rea de almacenamiento y conjunto de procesos ETL (extract- transformation-load)

    Extraccin (1er Paso): Obtener datos para el DWH, significa leer y entender los

    datos de las fuentes y luego copiar los necesarios para el DWH.

    Figura 2.4. Elementos bsicos del DWH segn Kimball

  • 37

    Transformacin (2do Paso): Existen potenciales transformaciones (corregir errores

    de escritura, conflictos de dominio, elementos perdidos, datos duplicados, asignar

    DWH keys), combinando datos de mltiples fuentes.

    Carga (3er Paso): La carga de datos en el DWH, usualmente toma la forma de

    presentar tablas dimensionales que aseguren la calidad para cargar cada datamart.

    Data Presentation Area

    rea donde los datos estn organizados, almacenados y disponibles para consultas

    de los usuarios, reportes y otras aplicaciones analticas

    Es todo lo que los usuarios ven y tocan a travs de las herramientas de acceso.

    Presenta una serie de datamarts integrados en el que cada uno presenta datos de

    un solo proceso de negocio. Se utiliza el modelamiento dimensional como tcnica

    para entregar los datos a los usuarios, aqu no se busca remover datos

    redundantes sino ms bien rapidez de acceso en las consultas. Data Access Tools

    Puede ser tan simple como un ad hoc query (consulta creada para obtener

    informacin de acuerdo a la necesidad que surja.) hasta un complejo data mining.

    Por definicin, todas las herramientas de acceso consultan los datos en el rea de

    presentacin. El uso de estas herramientas permite a los usuarios tomar decisiones

    analticas. Ejm : OLAP, MOLAP, datamart, ad hoc querys, etc.

    Pasos para el proceso de diseo dimensional

    Paso 1: Seleccin del proceso de negocio

    El primer paso es decidir qu proceso o procesos de negocio se va a modelar para

    combinar y entender los requerimientos con los datos disponibles.

    Un proceso es una actividad normal de negocio realizada en la organizacin que

    tpicamente est soportada por un sistema OLTP. Paso 2: Declarar la granularidad

    Una vez que se ha identificado el proceso de negocio se debe definir la

    granularidad. Qu nivel de detalle debera estar disponible en el modelo

    dimensional?.

    Este paso es sumamente importante ya que de l depender el modelo de datos y

  • 38

    la implementacin del datamart.

    Paso 3: Eleccin de las dimensiones

    Se deben elegir las dimensiones que se aplicarn para cada tabla de hechos, las

    dimensiones deben responder a la pregunta: Cmo los usuarios describen los

    datos que resultan del proceso de negocios?. Paso 4: Identificar los hechos

    Identificar los hechos numricos que formarn parte de la tabla de hechos. Los

    hechos son determinados por esta pregunta: Qu estamos midiendo?. Los

    usuarios estn muy interesados en el anlisis de estas medidas de la ejecucin de

    procesos de negocio.

    Todos los hechos candidatos deben ser fieles al grano definido en el paso 2. Los

    hechos que pertenecen a un grano diferente debern estar en una tabla de hechos

    separada

    2.1.3. Eleccin de la metodologa Para poder elegir la metodologa a seguir durante todo el proyecto es necesario

    revisar las diferencias y semejanzas que existen.

    A continuacin se presenta un cuadro comparativo entre la metodologa de Kimball

    e Inmon.

    Kimball Inmon Objetivo Todas las empresas necesitan almacenar, analizar e interpretar los datos

    que van generando y acumulando, para luego tomar decisiones crticas que

    les permitan maximizar la prosperidad. Para ello se necesita un sistema que

    les ayude a entender los datos y logren cumplir sus objetivos, de esta forma

    nace la idea de implementar un data warehouse.

    Diseo del Data

    Warehouse

    Utiliza el enfoque Bottom Up Utiliza el enfoque Top Down

    Enfoque Tiene un enfoque por procesos que

    son manejados por las diferentes

    reas del proceso. Trata de

    responder necesidades especficas

    segn el tema.

    Tiene un enfoque global de toda la

    empresa. No esta basado en

    requerimientos especficos.

    Tiempo de

    implementacin

    Ya que primero se implementan los

    datamarts, el tiempo de

    Debido a que se implementa por

    completo el DWH se demanda

  • 39

    del DWH implementacin es rpido. Sin

    embargo se tiene que tener cuidado

    ya que si se trabaja de forma

    independiente cada datamart el

    entorno del DWH se desintegrara

    rpidamente.

    mucho ms tiempo.

    Costos Implementar cada datamart permite

    que la solucin no presente un alto

    costo.

    Se replican grandes cantidades de

    datos por tanto los costos aumentan.

    Modelo de Datos Kimball propone usar el

    modelamiento dimensional:

    Esquema estrella. Identificacin de

    dimensiones y hechos.

    Inmon propone tres niveles en el

    modelo de datos del DWH:

    -Alto nivel, ERD (Entity Relationship

    Diagram)

    -Nivel Medio, DIS (Data Item Set)

    -Nivel Bajo, llamado Modelo Fsico

    (Physical Model)

    Sin embargo, menciona que para

    implementar los datamarts debe

    hacerse con modelamiento

    dimensional.

    La metodologa de Inmon tiene mayor alcance ya que es un enfoque global, sin

    embargo para el presente proyecto de tesis solo se requiere la construccin de un

    datamart que albergue datos acerca de las estrategias sanitarias es as que la

    metodologa de Kimball es la que mejor se adapta a estas necesidades, adems el

    tiempo y costos con los que se cuentan son limitados.

    Luego de elegir la metodologa para la construccin, se decidi seguir la siguiente

    estrategia para la ejecucin del proyecto la cual consiste en la realizacin de los

    siguientes procesos: anlisis dimensional, diseo de extraccin y diseo de

    explotacin.

    Estos procesos se presentan como resumen tomando como referencia las mejores

    prcticas recomendadas para la implantacin de soluciones de inteligencia de

    negocios, al no existir un estndar para este tipo de implantaciones. Estos son:

    Diagnstico A travs de este proceso se busca identificar la informacin necesaria para la toma

    de decisiones, es decir los requerimientos tanto funcionales como no funcionales.

  • 40

    Corresponde al entregable de la etapa de assess de la figura 2.5.

    En el proyecto, este diagnstico se realiz mediante entrevistas y revisin de

    documentos de la estrategia piloto para determinar sus requerimientos.

    Anlisis Dimensional Se detallan los elementos que contendrn el datamart de las estrategias sanitarias.

    Corresponde al entregable de la etapa de plan de la figura 2.5

    Esta etapa consisti en el anlisis de los diagramas y diccionarios de base de datos

    de los sistemas transaccionales como HIS y del manejo del programa de PANTBC

    para as identificar las dimensiones y las tablas de hechos tomando como base los

    requerimientos solicitados por la estrategia piloto.

    En esta fase se elaborar el Anexo de Anlisis (Anexo 2).

    Diseo de extraccin Se realiza la carga de datos de los sistemas transaccionales mencionados en la

    etapa anterior, archivos internos u otro tipo de fuentes externas.

    En esta fase se elaborar el Anexo de Extraccin (Anexo 3).

    Diseo de explotacin Se realiza el diseo que tendrn los reportes analticos como: filtros, grficos,

    dimensiones y tablas de hechos involucrados.

    Segn los requerimientos funcionales se elaborarn los reportes.

    En esta fase se elaborar el Anexo de Explotacin (Anexo 4).

    Implementacin Mediante de este proceso se logra la emisin de consultas y reportes que

    presenten la informacin de manera integrada a travs de distintas reas de la

    organizacin, lo cual sirva de ayuda para la toma de decisiones.

    El usuario podr acceder a los datos manipulando los cubos OLAP generados para

    obtener diferentes perspectivas de anlisis, los cuales se reflejan en los reportes

    analticos.

    En esta fase se elaborar el Anexo de Construccin (Anexo 5) que incluye las

    pruebas de los reportes analticos.

  • 41

    2.2. Identificacin de Requerimientos Esta seccin corresponde a la etapa de diagnstico de la figura 2.5.

    Los requerimientos deben ser identificados segn estrategia sanitaria nacional,

    como se mencion en el captulo 1, existen 10 estrategias y cada una merece un

    anlisis por separado.

    La captura de requerimientos se hizo a travs de entrevistas a los encargados

    principales de la estrategia a implementar tomando como direccin de salud piloto a

    la DISA I del Callao, adems de documentacin acerca de los problemas

    principales de salud.

    Los requerimientos estn asociados a las necesidades de todos los actores de la

    estrategia y se las ha asignado un nivel de prioridad con el fin de priorizar todos

    aquellos que sean los ms importantes y solucionen los problemas encontrados.

    2.2.1. Requerimientos Funcionales Requerimientos Generales

    Aunque las estrategias sanitarias demanden requerimientos distintos, presentan

    ciertos requerimientos generales:

    - Toda estrategia est regida por lneas de accin establecidas por el

    MINSA y deben ser cumplidas a cabalidad. Adems debe guiarse segn

    los lineamientos del modelo integral de salud es decir que los

    requerimientos que se indiquen para cada una de las estrategias deben

    estar orientados a lograr una adecuada gestin de prestacin de salud.

    - Para todas las estrategias se realizarn reportes que midan y evalen la

    ganancia en salud y bienestar de las personas, de las familias y

    comunidades. Comparacin entre valores de situacin inicial con

    situacin deseada y real.

    Requerimientos Estrategia Sanitaria Alimentacin y Nutricin Balanceada

    Se listan los requerimientos que el sistema debe satisfacer para cumplir con el

    objetivo de la estrategia:

    Requerimiento Funcional Prioridad Dificultad

    El sistema permitir generar un reporte en el que se 2 1

  • 42

    muestre la evolucin de nmero de casos de actividades o

    enfermedades a travs del tiempo.

    Es mostrar en el reporte Evolucin de actividades CIE 10

    en el tiempo

    El sistema permitir generar indicadores de desnutricin

    segn establecimientos de salud.

    1 2

    El sistema permitir reflejar la cantidad total de personas

    de la poblacin que padecen enfermedades relacionados a

    la alimentacin como anemia, hipotiroidismo, bocio,

    enanismo, desnutricin, retraso, sobrepeso, obesidad,

    entre otras establecidas por el CIE 10, para cada

    establecimiento de salud. (prevalencia)

    Se mostrar a travs del reporte de Prevalencia de

    Enfermedades

    1 3

    El sistema permitir comparar el estado de cada

    establecimiento en el aspecto de nutricin para as saber

    cuales son aquellos que se encuentra en riesgo o

    necesitan ms apoyo.

    1 2

    El sistema permitir controlar la entrega de alimentos (en

    unidades p.e. Kg) a los establecimientos de salud para los

    pacientes que padecen de TBC (tuberculosis).

    Se mostrar a travs del reporte de Evolucin de entrega

    de alimento en el tiempo.

    1 2

    El sistema permitir controlar la cantidad de alimentos,

    destinado a pacientes con TBC, segn estados (entregado,

    deteriorado, robado, perdido) para cada establecimientos

    de salud

    Se mostrar a travs del reporte de Estado de alimentos entregados

    1 2

    El sistema permitir el anlisis de nmero de casos de

    pacientes con TBC ingresantes al programa de PANTBC

    segn su condicin nutricional (bajo peso, normal,

    sobrepeso)

    Se mostrar a travs del reporte de Condicin de pacientes segn IMC

    1 3

    El sistema permitir la comparacin entre nmero de 1 3

  • 43

    pacientes con TBC, pacientes que ingresan al programa de

    PANTBC y pacientes estimados a ingresar al programa de

    PANTBC. Adems muestra indicadores como Atendidos

    por PANTBC / Estimados.

    Se mostrar a travs del reporte de Consolidado de

    atenciones PANTBC

    El sistema permitir el anlisis del nmero de casos de

    egresos de pacientes del programa de PANTBC segn

    condicin (recuperado, abandono, fallecido, transferido)

    Se mostrar a travs del reporte de Condicin de egresos

    de pacientes

    1 3

    El sistema permitir controlar el nmero de intervenciones

    realizadas para los pacientes con TBC como consejeras,

    entrega de canastas de alimentos, charlas educativas y

    visitas domiciliarias.

    Se mostrar a travs del reporte Actividades realizadas

    1 1

    El sistema permitir controlar el total de pacientes

    asistentes con TBC a las actividades realizadas por el

    programa de PANTBC

    Se mostrar a travs del reporte Asistencia de pacientes a

    actividades

    2 1

    Leyenda Prioridad: Calificacin Significado

    1 Importante

    2 Regular

    3 Prescindible

    Leyenda Dificultad: Calificacin Significado

    1 Fcil

    2 Regular

    3 Difcil

    La dificultad esta medida por el tiempo que se requiere tanto para el anlisis como

    para la elaboracin de la extraccin de los datos necesarios de los sistemas OLTP

    (HIS y/o PANTBC) para generar el reporte analtico.

  • 44

    2.2.2. Requerimientos no funcionales

    Cada usuario ser identificado segn estrategia sanitaria que tiene a su cargo,

    adems tendr un determinado rol y privilegios con el fin de asegurar la

    informacin.

    La seguridad del sistema es un factor crtico pues la informacin que se maneja es

    sensible es decir representa informacin acerca de la realidad de salud en la que se

    encuentran las personas y no debe ser manipulada por usuarios no autorizados.

    Como el software que se utilizar es de cdigo abierto, no se incurrir en gastos por

    licencias de software; sin embargo se requiere un servidor de aplicaciones, un

    servidor de base de datos y un dominio.

    La pgina de administracin de Pentaho, herramienta de BI, consiste en un portal

    web que se utilizar para anlisis en el datamart, es desde all que el usuario con

    suficiente privilegio generar los reportes y realizar la evaluacin de las

    estrategias.

    El uso de la herramienta es intuitivo, debe cumplir:

    - La herramienta de explotacin seleccionada debe permitir realizar las

    tcnicas de consulta multidimensional como Slicing, Dicing, Drilling, etc.

    Adems, debe permitir la creacin de reportes personalizados por el usuario

    final.

    - Exportacin de reportes a archivos de formatos estndar como archivo de

    texto (.txt) o Excel (.xls).

    - Mostrar la informacin del datamart en base a los siguientes 3 tipos:

    Reportes tradicionales (basados en columnas), Tablas pivote (Matriz de

    doble entrada) y Grficos.

    Entre otros requerimientos no funciones de la herramienta se tiene:

    - Disponibilidad: El sistema al ser de consultas y anlisis no impacta a las operaciones diarias que se realizan ya sea en la DISA como en los

    establecimientos de salud, es por ello que su disponibilidad puede ser

    menor a 24 horas los 7 das de la semana. Adems el sistema no se

  • 45

    encontrar disponible los das en los que se realice la actualizacin de datos

    del datamart.

    - Utilidad: El sistema ser apropiado para el uso de los distintos perfiles, de manera que sirvan como soporte de las labores de todas personas que

    interacten con l.

    - Escalabilidad: Las herramientas de negocios permiten cualquier tipo de consultas y reportes que ms adelante se podran solicitar.

    2.3. Anlisis de la Solucin En esta fase luego de haber identificado los requerimientos para la estrategia piloto

    se propone una solucin adecuada cuya implementacin conduzca a la solucin del

    problema.

    2.3.1. Consideraciones sobre el sistema Para el anlisis de la viabilidad del sistema se ha considerado tres factores

    importantes:

    Factor tecnolgico:

    En la DISA donde se realiz la captura de informacin cuentan con computadoras

    Pentium III y IV. Para Pentaho es necesario en caso el sistema operativo sea

    Windows que sea XP o versin superior, para Linux o Mac de preferencia deberan

    ser de las ltimas versiones, adems el equipo debe soportar JRE (Java Runtime

    Environment) y poseer por recomendacin 1GB de memoria RAM.

    Aquellos usuarios que realizarn el anlisis y toma de decisiones requerirn de

    equipo con los requerimientos sugeridos para Pentaho, pues esto traer mejoras en

    rapidez de obtencin de resultados.

    Cada estrategia sanitaria cuenta con un rea propia o compartida con otra

    estrategia sin embargo cada una tr