Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas....

42
Sistemas de Información Gerencial Tema 5: Introducción a la Inteligencia de Negocios 1 Ing. Francisco Rodríguez Novoa

Transcript of Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas....

Page 1: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

Sistemas de Información Gerencial

Tema 5: Introducción a la Inteligencia de Negocios

1

Ing. Francisco Rodríguez Novoa

Page 2: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

2

INDICE

• Introducción a la Inteligencia de Negocios

• Arquitectura de un Sistema

• Importancia IN

• Conceptos de Datawarehouse

• Ciclo de vida de un Datawarehouse

• Construcción de un Datawarehouse

Page 3: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

Introducción a la Inteligencia de Negocios

Page 4: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

Se necesita entender no solo QUÉ está pasando, sinoCUÁNDO, DÓNDE, QUIÉN Y PORQUÉ.

Solución a los requerimientos de información conOPORTUNIDAD.

Escalar, contribuir y compartir a todos los tipos deusuarios en la organización.

4

Se necesita información y conocimiento a

partir de los datos de la empresa.

1. Introducción. Inteligencia de Negocio

Page 5: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

Nace así el concepto de Inteligencia de Negocio(Business Intelligence):

No es una tecnología

Es un conjunto de sistemas de información que trabajan de forma coordinada.

Sistemas de almacenamiento de datos (datawarehouse)

Sistemas de minería de datos (data mining)

Herramientas de procesamiento analítico de datos(OLAP)

Sistemas de administración de conocimiento (KBS)

Herramientas de consulta y reporte de datos

Tableros de información (Dashboards)

5

1. Introducción. Inteligencia de Negocio

Page 6: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

“ Business Intelligence se refiere

al proceso de convertir datos en

conocimiento y conocimiento en

acciones para crear la ventaja

competitiva del negocio “.

The Data Warehousing Institute

• “Business Intelligence es unaherramienta crítica para el éxito ysobrevivencia de su organización hoyen día, no se trata solo deherramientas y tecnología, sinotambién de organización“.

• Gartner Group

“La inteligencia del negocio es

como convertir la información de

la empresa en una arma

estratégica “.

Teddy Dale

Consultor Internacional

“La información en las

organizaciones está aumentando

rápidamente, así como, las

decisiones críticas del negocio; el

problema es la actitud de las

empresas para utilizar estos datos “.

Gartner Group

Información

6

1. Introducción. Inteligencia de Negocio Definición

Page 7: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

“ Inteligencia de Negocio se refiere al proceso de convertir datos en conocimiento y conocimiento en

acciones para crear la ventaja competitiva delnegocio “

The Data Warehousing Institute

Datos Información ConocimientoVentaja Competitiva

1. Introducción. Inteligencia de Negocio Definición

7

Page 8: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

AgregarDatos

Database, Data Mart, Data Warehouse, ETL

Tools, Integration Tools

PresentarDatos

Conocimiento sobre los

datos

Toma dedecisiones

Reporting Tools, Dashboards,

Static Reports, Mobile Reporting,

Add Context to Create Information, Descriptive Statistics, data mining

Decisions are Fact-based and

Data-driven

“ Inteligencia de Negocio se refiere al proceso de convertir datos en conocimiento y conocimiento en

acciones para crear la ventaja competitiva delnegocio “

The Data Warehousing Institute

1. Introducción. Inteligencia de Negocio Definición

OLAP Cubes

8

Page 9: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

1. Introducción. Inteligencia de Negocio Uso

9

Page 10: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

Procesos de Extracción,Transformación y Carga

Data Mining(Business Analytics)

• Estadísticas

• Análisis de Tendenciasy Comportamientos

• Proyecciones

OLAP (On-Line Analytical

Processing)AnálisisMultidimensional

• Análisis de FCE• Análisis de Datos

Sumarizados

Reportes yConsultas

• Análisis del

Detalle de

Información

DataWarehouse(Data Mart)

• Modelo del Negocio

Integrado• Repositorio de Información

• MetadataDatos

Externos

Dashboards(Tableros)

10

2. Arquitectura de un Sistema

Page 11: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

Procesos de Extracción, Transformación y Carga

DataWarehouse(Data Mart)

• Modelo del Negocio Integrado• Repositorio de Información• Metadata

11

Datos Externos

2. Arquitectura de un Sistema

Data Warehouse. Proceso ETL

Page 12: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

Reportes y Consultas

•Análisis del Detalle de

Información

DataWarehouse(Data Mart)

Dashboards(Tableros)

12

2. Arquitectura de un Sistema

Tableros, reportes y consultas

Page 13: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

OLAP (On-Line Analytical Processing)Análisis

Multidimensional

• Análisis de FCE• Análisis de DatosSumarizados

DataWarehouse(Data Mart)

13

2. Arquitectura de un Sistema

Análisis multidimensional

Page 14: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

Data Mining(Business Analytics)

•Estadísticas•Análisis de Tendencias y Comportamientos• Proyecciones

DataWarehouse(Data Mart)

14

2. Arquitectura de un Sistema Business analytics (minería de datos)

Page 15: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

•Cualquierorganización grande o

pequeña, necesitaintegrar la

información de su cadena de valor, con el objetivo de analizarla,

para poder tomar decisiones y diseñar

estrategias de negocio

• eficientes.

Sistemas Operacionales y Datos Externos

Análisis de Información

Valor para el Negocio

15

3. Inteligencia de Negocio. Su aporte. Su importancia

Page 16: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

Herramienta de análisis para el conocimiento del negocio

CONOC.

DEL

NEGOCIO

Servidor

16

Base de Datos

Red

Carga

Limpieza

Transformación

Extracción Diseño

3. Inteligencia de Negocio. Su aporte. Suimportancia

Page 17: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

Considerado por'Forbes' como uno

de los siete científicos de

datos más poderosos del

mundo

3. Inteligencia de Negocio. Su aporte. Su importancia

17

Page 18: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

La información en las organizaciones está aumentando rápidamente, así como, las

decisiones críticas del negocio; el problema es la actitud de las empresas para utilizar estos datos

Comentarios

18

Page 19: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

¿Que es un Data Warehouse?

(Bodega o almacén de datos). Colección de datos orientados a un determinadonegocio. Coloca información de todas las áreas funcionales de la organizaciónen manos de quien toma las decisiones. También proporciona herramientaspara búsqueda y análisis de información.

• Es un repositorio para almacenar y analizar datos con naturaleza de variablescuantitativas y cualitativas

• Es considerado una de las partes centrales de un sistema de BI

• Permite separar los sistemas transaccionales de los informacionales en dosentornos de manera que el análisis de los datos existentes no interfiera conel procesamiento y registro de nuevos datos

4. Conceptos Básicos de DWH

Page 20: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

Data Warehouse como integrador de datos

CRMInventarios

VentasProducción

Gestión humanCompras

FilialesCartera

4. Conceptos Básicos de DWH

Page 21: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

4. Conceptos Básicos de DWH

• Los datos almacenados están orientados a un objetivo especifico,integrando la variable del tiempo para la toma de decisiones.

• Es un sistema integrados, pues agrupa a todos los sistemasoperacionales en un sistema de información con formatos ycódigos consistentes.

• El DW es variante en el tiempo porque los datos se organizan yalmacenan en jerarquías en el tiempo, lo que permite análisisretrospectivos, comparativos de estados actuales y de períodosanteriores.

Propuesta 005.Refuerce el concepto de DWH por medio del video “Benefits of a Data Warehouse”()

Page 22: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

Data Warehouse

• Es el maestro o centralizador de la

información.

• Soporta múltiples áreas del negocio

• Maneja un alto detalle de la

información

• Es un integrador de las fuentes de

información

• No es necesario el uso de un modelo

dimensional pero puede alimentar a

modelos dimensionales.

• Coordina la gestión de información

de los Datamarts

Datamart

• Es una aplicación del DWH

• Está construida para soportaruna línea de negocio.

• Ideal para “sumarizar”grandes cantidades de datos.

• Se concentra en integrar datos deuna área específica.

• Es construida usando un modelo oesquema dimesional estrella

4. Conceptos Básicos de DWH

Page 23: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

Un primer acercamiento a una arquitectura descentralizada de Datamart (DM):

Almacenes

Inventarios

Producción

Exportación

DM CRM

DM Riesgos

DMFinanciero

4. Conceptos Básicos de DWH

Page 24: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

Data Warehouse corporativo o centralizado:

Almacenes

Inventarios

Producción

Exportación

DM CRM

DM Riesgos

DMFinanciero

DWHCorporativo

4. Conceptos Básicos de DWH

Datamarts

Page 25: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

5. Ciclo de Vida de un DWH

Datos

Metodología del ciclo de vida proyectos DWH/BI de Kimball:

Tecnología

Aplicaciones

Page 26: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

La metodología del ciclo de vida de Kimball aunque fue concebido a

mediados de la década de los 80’s, fue publicada por primera vez

indicando los años 90’s; desde entonces, se ha utilizado con éxito

por miles de proyectos de DWH y BI, principalmente en sector

industrial, áreas de aplicación, empresarial y desarrollo tecnológico

(technical platform). Esta metodología se ha convertido en las

mejores prácticas en la industria en general.

A continuación se mencionan brevemente las etapas de la propuesta

de Kimball:

Planeación del Proyecto (Project Planning)Definición y alcance del proyecto de DWH, incluyendo laevaluación y justificación del proyecto.

5. Ciclo de Vida de un DWH

Page 27: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

Modelación Dimensional (Dimensional Modeling)

La definición de los requerimientos del negocio (área funcional)

determinarán los datos necesarios para hacer frente a los requisitos

analíticos de los usuarios finales.

Diseño Físico (Physical Design)

Definición de las estructuras físicas para apoyar el diseño de datos

lógico. Claramente se requiere de un diseño lógico para convertirlo

en una base de datos física, debido a que los detalles de

implementación varían ampliamente desacuerdo a la tecnología

(hardware y aplicaciones), tipo de proyecto, modelo lógico, volumen

estimado, SGDB y las herramientas de acceso; estos elementos dan

directrices en dicho diseño.

5. Ciclo de Vida de un DWH

Page 28: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

Diseño e Implementación de ETL (Data Staging Design and

Development)

Este Etapa se divide en tres elementos: Extracción, Transformación y

Carga.

El proceso de extracción expone los problemas de calidad de datos,

debido a que la calidad de los datos impactará significativamente la

credibilidad del DWH, es necesario solucionar los problemas de

calidad. Es importante tener presente dos realidades:

• Los problemas de calidad son usualmente un reflejo del pobre

diseño de datos y/o la implementación de los sistemas.

• La mayoría de estos problemas pueden ser reparados y

monitorizados para reducir el impacto sobre las aplicaciones

5. Ciclo de Vida de un DWH

Page 29: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

Estándares

Modelo Físico de Datos

Plan de indexación

Diseño y construcciónde la instancia de DB

Plan Global

Estructura Física de Almacenamiento

Monitorización

Diseño Físico

5. Ciclo de Vida de un DWH

Page 30: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

Diseño Técnico de Arquitectura (Technical Architecture Design)En esta etapa se considera la integración de múltiples tecnologías. Se

consideran tres factores: Requerimientos del negocio, ambiente

tecnológica actual y el direccionamiento técnico futuro.

Selección e Instalación de Producto (Product Selection and Installation)

Con base al diseño técnico de arquitectura, se especifica los componentes

de arquitectura tales como plataforma del hardware, herramientas de

acceso a los datos, sistema de gestión de base de datos entre otros. En

este etapa el elemento de integración toma singular importancia.

Especificación de Aplicaciones Usuario Final (End User Application

Specification) Se definen las aplicaciones de usuario, restringiendo el

acceso ad hoc al DWH. Estas aplicaciones cubren los complementes de

visualización, exploración, data mining y herramientas de BI tales como EIS

y Dashboard.

5. Ciclo de Vida de un DWH

Page 31: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

Desarrollo de Aplicaciones Usuario Final (End User Application

Development) Aborda la configuración de las herramientas de usuario final,

dependiendo de la dimensión del proyecto, estas aplicaciones demandarán

su propia arquitectura que soporte los usuarios y la integración con el

DWH.

Despliegue (Deployment)

Convergencia y funcionamiento de la tecnología, datos y aplicaciones de

usuario final desde la estación de cada unos de los analistas o estrategas

de BI. Se deben tener presente procesos de capacitación y de soporte al

usuario sobre las aplicaciones.

Mantenimiento y Crecimiento (Maintenance and Growth)

Frente al usuario final: se les debe entregar apoyo y formación.

Funcionamiento eficaz del DWH: monitorización de los procesos y

procedimientos, estas métricas serán argumento para una posible etapa de

crecimiento.

5. Ciclo de Vida de un DWH

Page 32: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

Gestión de Proyectos (Project Management)

Garantiza las actividades en el ciclo de vida de funcionamiento y sincronía,

que se enfocan en el estado de procesos de monitorización, seguimiento

de problemas y gestión de cambios; por otra parte, le corresponde

desarrollar el plan de comunicación del proyecto.

5. Ciclo de Vida de un DWH

Page 33: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

Propuesta 006.Realizar la lectura de artículo “A Holistic Approach for Managing Requirements of Data Warehouse Systems.” Eighth Americas Conference on Information Systems, Schiefer, J., List, B. & Bruckner, R.M.

La metodología del ciclo de vida de Kimball aunque fue concebido a

mediados de la década de los 80’s, fue publicada por primera vez

indicando los años 90’s; desde entonces, se ha utilizado con éxito

por miles de proyectos de DWH y BI, principalmente en sector

industrial, áreas de aplicación, empresarial y desarrollo tecnológico

(technical platform). Esta metodología se ha convertido en las

mejores prácticas en la industria en general.

5. Ciclo de Vida de un DWH

Page 34: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

Hardware

App. Almacenamiento(SGDB)

App. De extracción y manipulación de datos

Herramienta Middleware

DWHCorporativo

Hardware

Garantizar que tenga altascaracterísticas técnicas acorde a loscomplejos requerimientos de información de los usuarios.

Capacidad de potencializar (crecer)

Procesamiento paralelo:SMP (Symmetric Multiprocessing) MPP (Massively Parallel Processing) NUMA (Non-Uniform Memory Architecture)

6. Construcción de un DWH

Page 35: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

Hardware

App. Almacenamiento(SGDB)

App. De extracción y manipulación de datos

Herramienta Middleware

DWHCorporativo

SGDB

Un Sistema de Gestión de Base deDatos consiste en una colección dedatos interrelacionados y unconjunto de programas paraacceder a los mismos.

• El programa de almacenamiento(servidor) es independiente alprograma de consulta (Cliente)de los usuarios

• El objetivo soncomplejasvisualización

• Contempla

las consultasen lugar de la

un esquema dede múltiplesconcurrencia

usuarios

6. Construcción de un DWH

Page 36: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

Hardware

App. Almacenamiento(SGDB)

App. De extracción y manipulación de datos

Herramienta Middleware

DWHCorporativo

Extracción y manipulación (ETL)

Funcionalidades básicas:

• Control de la extracción de los datos y su automatización

• Acceso a diferentes tecnologías.• la arquitectura de

independiente del

Uso de metadatos

• Interfazhardware

6. Construcción de un DWH

Page 37: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

Hardware

App. Almacenamiento(SGDB)

App. De extracción y manipulación de datos

Herramienta Middleware

DWHCorporativo

Herramientas Middleware

Parveen conectividad entreentornos diferentes, para ayudar ala gestión del Data Warehouse.

Analizadores y aceleradores deconsulta: Optimizan tiempos de

Sistemasrespuesta desde los operacionales al DW.

Deben estar abiertas a todos losentonos de:• Almacenamiento de datos (OLE,

ODBC, etc.)• Bases de datos (DB2, SQL,

Oracle, MySQL, etc.)de capa

(SNAde

LU6.2,• Estándares

transporte: DECnetr, etc.

6. Construcción de un DWH

Page 38: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

Elementos a tener presente en la construcción de un DWH:

• Detectar y corregir errores (duplicados, eliminar valores sin

sentido, procesos básicos de imputación)

• Manejo de valores codificados para las variables. Es importante

tener un adecuado diccionario de datos disponible para los

usuarios.

• Reestructurar y añadir nuevos campos (enriquecer el sistema)

de acuerdo las necesidades del usuario.

• Emplear el concepto de Metadatos (datos que describen otros

datos)

• No debe soportar procesos transaccionales del negocio.

6. Construcción de un DWH

Page 39: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

6. Salidas de un DWH

Querys - Reporting

Análisis multidimensional

Dara Mining

DWHCorporativo

consultas y

Querys - Reporting

Generación dereportes. Pueden

oser informes

dinámicos.para procesos de

predefinidos Fundamentales Monitorización (Dashboard). Esposible ubicar las herramientas ymetodologías EIS (Decision SupportSystem) y CPMPerformance

(CorporateManagemnet)

dependiendo de este componente de explotación del DWH.

Page 40: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

Querys - Reporting

Análisis multidimensional

Dara Mining

DWHCorporativo

Análisis Multidimensional

Facilitan el análisis de datos pormedio de dimensiones y jerarquías,utilizando consultas rápidas ypredefinidas.

OLAP: Su objetivo es agilizar laconsulta de grandes cantidades dedatos. Utiliza estructurasmultidimensionales que contienendatos de grandes Bases de datos

6. Salidas de un DWH

Page 41: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

Querys - Reporting

Análisis multidimensional

Dara Mining

DWHCorporativo

Data Mining

Es la aplicación de modelosmatemáticos sobre la informaciónalmacenada en el DWH. Elresultado de los modelos soportela toma de decisión en el procesode BI.

Es fundamental garantizar laoptimización de los modelos y suejecución automática según la necesidad del negocio.

Data miningarquitectura

requiere de unapropia que

interconecta a los usuarios con elDWH por medio de un servidornegociador.

.

6. Salidas de un DWH

Page 42: Sistemas de Información Gerencial · diseño de datos y/o la implementación de los sistemas. •La mayoría de estos problemas pueden ser reparados y monitorizados para reducir

42

FIN