Ensayo OLAP

5
COMPARACION ENTRE HERRAMIENTAS OLAP PARTICIPANTE: Michel Zambrano F. Administración de Base de Datos II Año 2011

Transcript of Ensayo OLAP

Page 1: Ensayo OLAP

COMPARACION ENTRE HERRAMIENTAS OLAP

PARTICIPANTE:

Michel Zambrano F.

Administración de Base de Datos II Año 2011

Page 2: Ensayo OLAP

En el presente ensayo se expondrán un listado de factores de comparación entre diversas herramientas que permiten generar servicios OLAP, determinando sus ventajas y desventajas. Con el fin de encapsular la mayor cantidad de características individuales del universo de herramientas vamos a orientar el análisis en los dos grandes grupos que existen en el mercado: fuente libre y fuente pagada. Primeramente vamos a exponer un breve concepto de OLAP (On-Line Analytical Processing) su significado en español es procesamiento analítico en línea. Es una alternativa de solución utilizada en el campo de la llamada Business Intelligence (Inteligencia Empresarial) cuyo objetivo es agilizar la consulta de grandes cantidades de datos. Se basa en estructuras multidimensionales (Cubos OLAP) que contienen datos resumidos de Bases de datos o Sistemas Transaccionales (OLTP). Se usa en informes de negocios de ventas, marketing, informes de dirección, minería de datos y áreas afines. Tradicionalmente, los sistemas OLAP se clasifican según las siguientes categorías:

A. ROLAP. Implementación que almacena los datos en un motor relacional. Normalmente, los datos son detallados, evitando las agregaciones y las tablas se encuentran normalizadas. Los esquemas sobre los que se trabaja son estrella ó copo de nieve, aunque es posible trabajar sobre cualquier base de datos relacional. La arquitectura se compone por un servidor de banco de datos relacional y el motor OLAP se encuentra en un servidor dedicado. La principal ventaja es que permite el análisis de una enorme cantidad de datos.

B. MOLAP. Implementación que almacena los datos en una base de datos

multidimensional. Para mejorar los tiempos de respuesta, el resumen de la información son calculados por adelantado. Estos valores pre-calculados o agregaciones son la base del desempeño de este sistema.

C. HOLAP (Hybrid OLAP). Implementación que almacena datos en un motor relacional y

otros en una base de datos multidimensional. Los siguientes a veces también se utilizan, aunque no son sistemas tan generalizados: WOLAP (Web OLAP). OLAP basado u orientado para la web. DOLAP (Desktop OLAP). OLAP de escritorio. RTOLAP (Real Time OLAP). OLAP en tiempo real. SOLAP (Spatial OLAP). OLAP espacial.

Entre los factores de eficiencia para la construcción de reportes OLAP a ser evaluados tenemos: procesamiento, tiempo de construcción, presentación de resultados, costos y accesibilidad. La forma de procesamiento de cubos de datos en las herramientas de fuente pagada involucra varios elementos que interactúan entre sí. El Analysis Services de Microsoft utiliza el motor OLAP (DSO) y el servicio de tabla pivote (PTS) para lograr tener el análisis multidimensional. El Oracle OLAP está basado en un modelo de datos multidimensional; este se presenta como un modelo lógico a través de las OLAP API y OLAP DML.

Page 3: Ensayo OLAP

El procesamiento en las herramientas de fuente libre en su gran mayoría se basa en clases JAVA que implementan la interfaz HttpServlet del API de JAVA Servlet. En JSP la primera vez que se invoca una página, el motor servlet lee el archivo y genera código fuente para crear el servlet. Ente las principales características tenemos: independencia de la plataforma, menor consumo de recursos, rápidos, seguros, portables, etc. El tiempo de construcción es considerado posterior a la definición del modelo lógico. Normalmente las herramientas de fuentes pagadas proveen de una serie de asistente que ayudan a crear las medidas, dimensiones y cubos. Los reportes OLAP con Analysis Services de Microsoft pueden generarse con los componentes del Office. Con los controles Visual Basic .Net se necesita invertir poquísimo tiempo en programación de la cadena de conexión puesto que estos están pre-programados para conectarse a los cubos y acceder a las dimensiones y medidas que han sido creados con el Analysis Services. En los servicios OLAP de fuente libre se dedica más tiempo a la programación de los archivos XML que contienes los cubos, dimensiones y medidas. Adicionalmente se deben de programar los reportes o páginas que presentan la conexión y los datos. La presentación de resultados tanto en las herramientas de fuente pagada y fuente libre tienen casi la misma interfaz visual. Adicionalmente tienen lo que se necesita para manipular los reportes de una manera fácil. En lo concerniente a los costos existe una marcada diferencia porque los de fuente pagada presentan un valor por licenciamiento de uso mientras las de fuente libre no tienen costo. Por ejemplo: el Analysis Services de Microsoft tiene un costo de $20.000 aproximadamente y el Pentaho no tiene costo. Vale recalcar que las herramientas de fuente pagada tienen un soporte técnico pero las de fuente libre no tienen este beneficio y solo se limitan a los foros publicados en internet que ayudan a resolver los problemas. La accesibilidad a los reportes desarrollados por fuente pagada no es remota porque toda su funcionalidad es de manera local. A pesar que los reportes pueden tener acceso desde maquinas remotas montando los mismo en FrontPage utilizando el servidor web IIS (Internet Information Service) pero se tendrían que configurar ciertos parámetros del control ActiveX en las mismas. Los reportes desarrollados con fuente libre son accesibles vía http desde internet. Las ventajas y desventajas las vamos a determinar dentro de las siguientes características: plataforma e independencia del servidor, proceso de desarrollo abierto, ventaja de JAVA y mantenimiento. En lo concerniente a la plataforma e independencia del servidor las de fuente libre siguen la arquitectura JAVA mientras que los de fuente pagada se limitan a las arquitecturas definidas por el proveedor. Vale recalcar que los de fuente libre se pueden ejecutar en los sistemas operativos y servidores web más populares. Dentro del proceso de desarrollo abierto los de fuente libre se beneficia de la gran comunidad JAVA y los de fuente pagada solo están sujetos a los del proveedor. Los de fuente libre tienen el código disponible para posibles mejoras y adaptaciones a diversas necesidades.

Page 4: Ensayo OLAP

Las herramientas de fuente libre usan JAVA como lenguaje de script mientras que los de fuente pagada usa vbscript o jscript. Definitivamente JAVA es un lenguaje más potente y escalable que los lenguajes de script. JAVA hace el trabajo del desarrollador más fácil y ayuda a proteger el sistema contra las caídas. Los mantenimiento de los de fuente libre es mucho más fácil debido a que la tecnología es abierta y multiplataforma. Los de fuente pagada están ligados a las definidas por el proveedor. Entre la diversidad de herramientas OLAP tenemos: OLAP Reporting Tool para Excel facilita la inteligencia empresarial ayudando a la gerencia a explorar y sacar conclusiones de enormes cantidades de datos. La aplicación extiende las características OLAP internas de Excel, para hacer más fácil el trabajo con ellas, especialmente para los grupos de trabajo. Los usuarios pueden compartir fácilmente informes personalizados. Muestre un gráfico, una tabla, o combinaciones de ambas. Elija entre todos los tipos de gráfico de Excel y use la característica de gráficos múltiples para mostrar varios gráficos lado a lado, comparados por cualquier conjunto de datos. Se conecta a un archivo cubo directamente a los Servicios de Análisis de Microsoft. OlapX es una herramienta sofisticada para navegar bases de datos multidimensionales. Permite la creación de análisis interactivos, reportes y presentaciones de bases de datos de los Servicios de Análisis de Microsoft. OlapX Web es un sofisticado control ActiveX para navegar bases de datos multidimensionales en aplicaciones Web. Permite la creación de análisis interactivos, reportes y presentaciones de bases de datos de los Servicios de Análisis de Microsoft. La plataforma Open Source Pentaho Business Intelligence cubre muy amplias necesidades de Análisis de los Datos y de los Informes empresariales. Las soluciones de Pentaho están escritas en Java y tienen un ambiente de implementación también basado en Java. Eso hace que Pentaho es una solución muy flexible para cubrir una amplia gama de necesidades empresariales – tanto las típicas como las sofisticadas y especificas al negocio. Dentro de las conclusiones tenemos:

Herramientas de fuente libre no tienen costo las de fuente pagada sí.

No se necesita expertos para diseñar reportes en los de fuente pagada.

Cualquier persona puede modificar el código para adaptarla en los de fuente libre.

La de fuente pagada ofrece soporte técnico.

JAVA tiene una curva de aprendizaje más elevada.

No hay funcionalidad para importar o exportar a Excel en las de fuente libre.

Los de fuente pagada ofrecen una diversidad de productos de software para manejar ciertos reportes.

Los de fuente pagada dependen de la plataforma.

Page 5: Ensayo OLAP

Bibliografía http://posgrado.itleon.edu.mx/Buscador%20Tesis_TEST/Tesis/Sistemas/t-023.pdf http://es.wikipedia.org/wiki/OLAP http://members.fortunecity.es/lrmdl/MineriaDatosBressan.htm http://upcommons.upc.edu/pfc/bitstream/2099.1/5033/2/Annex%20A%20-%20Oracle%20BD.pdf Apuntes sobre Almacenes de Datos, Bases de Datos Multidimensionales y Herramientas OLAP (2009)