Software Libre para la Toma de Decisiones

Post on 17-Jan-2017

337 views 0 download

Transcript of Software Libre para la Toma de Decisiones

Software Libre para la Toma de DecisionesFliSoL CUCEA 2016

Inteligencia de Negocios - Business Intelligence

Sabiduría

Conocimiento

Información

Datos

Hacer lo correcto

Hacer las cosas bien

¿Por qué?¿Qué es lo mejor?

¿Cómo hacerlo?

¿Qué?

• Es obtener conocimiento a través de los datos que una organización tiene a su disposición para ayudar en la toma de decisiones.

Business Intelligence Analysis

• Análisis que pueden realizarse para la Inteligencia de Negocios:

– Análisis estadístico

– Pronósticos (Forecasting)

– Minería de datos (Data Mining)

– Optimización

– Minería de Procesos

Business Intelligence Reporting

• El análisis de datos permite generar reportes o informes con la información y conocimientos obtenidos.

• Tipos de reportes:– Informes predefinidos

– Informes a la medida (ad-hoc)

– Consultas y Cubos OLAP

– Alertas

Data Warehousing

• Los Data Warehouses concentran la información de una organización en una base de datos diseñada para el análisis y la difusión eficiente de los datos.

• Contiene todos los datos de los sistemas operacionales– Se organizan para que todos los datos relativos al mismo evento u objeto del

mundo real queden relacionados entre sí.

• La información no se modifica ni se elimina.– La información es read-only y solo accesible para consultas.

ETL - Extract, Transform and Load

ETL es la integración de los datos para poder ser analizados de una forma precisa y congruente.

En la mayoría de los casos, la información que se quiere analizar se encuentra dispersa o los datos están “sucios”, es decir, no tienen las características ideales con la forma de trabajar de nuestras herramientas de inteligencia de negocios.

Esquema de Proceso

Extracción de Datos

Este paso significa extraer datos de diversas fuentes de datos, tales como archivos XLS (Excel), archivos XML (facturas electrónicas, por ejemplo), bases de datos SQL (de nuestro ERP o sistema de planeación de recursos empresariales), bases de datos NoSQL, o simplemente de archivos TXT o puro texto.

Con la fase de extracción, se valida si los datos tienen los valores correctos o esperados.

Transformación de Datos

En este proceso, se aplica una serie de reglas o funciones a una buena parte de los datos. Una función importante de la transformación es la limpieza de los datos, que tiene por objetivo el transmitir sólo los datos adecuados.

Algunos de los procesos de transformación que se pueden aplicar son los siguientes

• Elegir sólo ciertas columnas o filas.

• Traducir valores codificados (0: masculino, 1: femenino)

• Codificar valores (Aguascalientes:1, Jalisco:14)

• Crear un Valor Calculado (ventas = cantidad * precio)

• Agregación, acumulación y resumen de los valores.

• Unir datos de diferentes fuentes y evitar duplicados

• Transposición o pivote entre columnas y filas.

• Separar una columna en diversas columnas

Carga de Datos

En esta fase se cargan los datos en el destino final que puede ser un archivo plano simple o un almacén de datos.

Se pueden aplicar las restricciones definidas en el esquema de la BD, por lo que esta fase refleja si todo se ha realizado bien.

Un uso alternativo para ETL es mover información hacia otra aplicación de forma permanente. La nueva aplicación podría utilizar un diferente proveedor de base de datos y podría tener un esquema muy diferente.

ETL usando Kettle

Algunas Herramientas Open Source

– Pentaho

– Jaspersoft

– SpagoBI

– RapidMiner

– Palo

– Eclipse BIRT Project

– Logi Analytics

Características de Pentaho

• Es una de las herramientas más populares de BI.

• Modelo de negocios basado en “Open Core”- Ofrece una versión de comunidad con las características principales de forma

“open source” y gratuita, mientras que también se ofrece otra versión empresarial con características más avanzadas.

• Pentaho tiene capacidades de integración de datos, servicios OLAP, informes, cuadros de mando, minería de datos y ETL.

Herramientas de Pentaho

Data Integration (Kettle): • Ofrece capacidades de ETL. • Diseña transformaciones y jobs de forma visual Report Designer: • Genera informes en Excel, PDF, HTML y más.Aggregation Designer: • Crea tablas agregadas y mejora rendimiento de análisis OLAP.Hadoop Shims: • Plugins para distribuciones de Hadoop.

Características de Jaspersoft

• Inició como una herramienta independiente para BI, su popularidad lo llevó a ser adquirida por Tibco, quienes tienen sus propias herramientas comerciales para BI (Spotfire).

• Su modelo de negocios también está basado en “Open Core”

• Además de ofrecer OLAP, informes y ETL, cuenta con un servidor donde se pueden almacenar los informes y realizar análisis.

Proceso en Jaspersoft

Herramientas de Jaspersoft

Jaspersoft ETL: • Ofrece transformaciones y jobs de forma visual Jaspersoft Studio: • Genera informes con integración al Servidor, incluye librería

JasperReports.JasperReports Server: • Ofrece Informes y Análisis en un Servidor autónomo y puede

servir como un concentrador de información empresarial.

Características de SpagoBI

• Es la única suite de herramientas de BI 100% Open Source.

• Su modelo de negocios está basado en Servicios y Consultoría

• Es la que ofrece mayor cantidad de herramientas de todas, incluyendo ETL, Informes, Análisis OLAP, Gráficas Interactivas, Informes Ad-Hoc, Geolocalización, Minería de Datos, Análisis de Grafos, Automatización Ofimática, soporte móvil y más.

Arquitectura de SpagoBI

Módulos de SpagoBI

SpagoBI Server: El núcleo de la suite incluyendo las herramientas de análisis.

SpagoBI Studio: Entorno de desarrollo integrado.SpagoBI Meta: Entorno de los metadatos.SpagoBI SDK: La capa de integración que permite utilizar SpagoBI

con herramientas externasSpagoBI Applications: Una colección de modelos analíticos

verticales que se desarrollan utilizando SpagoBI.

Fin de la Presentación