Análisis de las soluciones y herramientas tecnológicas disponibles parte 2

27
Etapas de construcción de un datawarehouse Captura o exhibición de los datos de las fuentes seleccionadas Se utilizan herramientas de extracción que soportan múltiples formatos de almacenamiento, para luego incorporarlos en el datawarehouse.

description

ANÁLISIS DE LAS SOLUCIONES Y HERRAMIENTAS TECNOLÓGICAS DISPONIBLES parte 1

Transcript of Análisis de las soluciones y herramientas tecnológicas disponibles parte 2

Page 1: Análisis  de  las  soluciones  y herramientas  tecnológicas  disponibles parte 2

Etapas de construcción de un datawarehouse

Captura o exhibición de los datos de las fuentes seleccionadas Se utilizan herramientas de extracción que soportan múltiples formatos de almacenamiento, para luego incorporarlos en el datawarehouse.

Page 2: Análisis  de  las  soluciones  y herramientas  tecnológicas  disponibles parte 2

Tratamiento, conversión y transformación de los datosDetectar y corregir errores

Eliminar duplicadosDetectar y eliminar datos sin sentidos

Analizar la consistencia en el uso de los valoresCodificar sexoUtilizar mismas unidades de medidasFormatos de fechasDirecciones

Page 3: Análisis  de  las  soluciones  y herramientas  tecnológicas  disponibles parte 2

Añadir la referencia temporal a los datos capturados

Tratamiento de la ausencia de los valoresAsignar valores por defecto a determinados campos

Eliminar campos no significativosReestructurar y añadir nuevos campos

Enriquecer los datos con mas información fundamental

Incorporar datos estadísticos de institucionesCualificar la base de datos por variables socio-

demográficos o información adicional sobre empresas.

Page 4: Análisis  de  las  soluciones  y herramientas  tecnológicas  disponibles parte 2

Normalizar determinados camposNormalización de nombre de clientesNormalización de nombre de ciudades,

países, etc.Codificar campos para facilitar su

tratamiento estadísticoConvertir direcciones en códigos de areaTraducir fechas de nacimiento en intervalos

de edadesCodificar al actividad empresarial o

profesional de los clientes

Page 5: Análisis  de  las  soluciones  y herramientas  tecnológicas  disponibles parte 2

Calculo de campos derivadosCalculo de subtotales y datos contables

Filtrado y depuración de registrosDepurar a clientes y clientes potenciales de

acuerdo con la relación que tienen ante la empresa

Page 6: Análisis  de  las  soluciones  y herramientas  tecnológicas  disponibles parte 2

Carga en el sistema gestor de datos del Datawarehouse

Page 7: Análisis  de  las  soluciones  y herramientas  tecnológicas  disponibles parte 2

Administración

- Código de pedido.- Código de cliente.- Fecha.- referencias de productos, cantidades y precios.- Importe total.

Marketing

- Identificador del cliente.- Perfil del cliente.- Historial de quejas y reclamaciones. - Solicitudes de información.

Producción

-Referencia de producto.- Stock.- Unidades producidas.- Unidades demandadas.- Coste.- Precio de venta.

Data Warehouse

Clientes. Productos. Ventas. Inventarios. Precio.

Extracción, transformació

n y carga

Page 8: Análisis  de  las  soluciones  y herramientas  tecnológicas  disponibles parte 2

Sistema Gestor de Datos en un Datawarehouse

Capacidad para recibir o enviar datos.Capacidad para gestionar varios

volúmenes de datos.Registro de metadatos que faciliten la

explotación del sistema.Registro de datos con varios niveles de

detalle.

Page 9: Análisis  de  las  soluciones  y herramientas  tecnológicas  disponibles parte 2

Utilización eficaz de gran cantidad de índices.

Optimización del espacio de almacenamiento disponible.

Interfaz con multitud de herramientas y lenguajes de consulta.

Page 10: Análisis  de  las  soluciones  y herramientas  tecnológicas  disponibles parte 2

Tipos de sistemas de gestión de base de datos.

Base de datos relacional tradicional.

Base de datos relacional con un diseño en estrella.

Base de datos multidimensional.

Page 11: Análisis  de  las  soluciones  y herramientas  tecnológicas  disponibles parte 2

Base de Datos Relacional tradicional.

Se usa para construir Datawarehouse de tamaño relativamente pequeño.

Limitación al numero de índices creados en la base de datos.

Datos no volátiles. No es posible optimizar el

almacenamiento físico de los datos.

Page 12: Análisis  de  las  soluciones  y herramientas  tecnológicas  disponibles parte 2

Base de datos relacional con un diseño en estrella.

Consiste básicamente en utilizar estructuras de datos no normalizadas.

Esto ayuda a agilizar consultas y operaciones.

Page 13: Análisis  de  las  soluciones  y herramientas  tecnológicas  disponibles parte 2

Base de Datos MultidimensionalSe almacenan los datos en cubos

multidimensionales.Ocupan gran espacio.

Page 14: Análisis  de  las  soluciones  y herramientas  tecnológicas  disponibles parte 2
Page 15: Análisis  de  las  soluciones  y herramientas  tecnológicas  disponibles parte 2

Explotación del DatawarehouseHerramientas de generación de consultas

(“Queries and Reporting”)

Análisis Multidimensional (OLAP: On Line Analytical Processing)

Herramientas de Datamining

Page 16: Análisis  de  las  soluciones  y herramientas  tecnológicas  disponibles parte 2

Herramientas de generación de consultas (“Queries and Reporting”)

Son las clásicas herramientas de generación de consultas e informes de los sistemas de base de datos.

Page 17: Análisis  de  las  soluciones  y herramientas  tecnológicas  disponibles parte 2

Análisis Multidimensional (OLAP: On Line Analytical Processing)

Son herramientas que facilitan el análisis de los datos a través de dimensiones y de jerarquías.

Page 18: Análisis  de  las  soluciones  y herramientas  tecnológicas  disponibles parte 2

Herramientas de Datamining

Son técnicas avanzadas que permiten detectar y modelizar relaciones entre datos y obtener información no evidente.

Page 19: Análisis  de  las  soluciones  y herramientas  tecnológicas  disponibles parte 2

Tecnología necesarias para los sistemas de Datawarehousing

Requieren equipos de altas prestaciones para poder manejar grandes volúmenes de datos con rapidez y eficacia.

Existen 2 tipos de arquitecturas de servidores:

SMP (Symmetric Multiprocessing)MPP (Massively Parallel)

Page 20: Análisis  de  las  soluciones  y herramientas  tecnológicas  disponibles parte 2

Arquitectura SMP ( Symmetric Multiprocessing)

Page 21: Análisis  de  las  soluciones  y herramientas  tecnológicas  disponibles parte 2

Arquitectura MPP (Massively Parallel)

Page 22: Análisis  de  las  soluciones  y herramientas  tecnológicas  disponibles parte 2

Herramientas de análisis de datos OLAP

Dimensiones: grupos conceptuales que permiten analizar o consolidad datos.

Medidas o indicadores: valores numéricos que se guardan en la base da datos.

Jerarquía de dimensiones: distintos niveles de agregación.

Page 23: Análisis  de  las  soluciones  y herramientas  tecnológicas  disponibles parte 2

Herramientas de DataminingConstituyen métodos avanzados para

explorar y modelizar relaciones en grandes volúmenes de datos.

Muestreo.Exploración.Modificación.Modelización del comportamiento.Evaluación.Presentación grafica de los resultados.

Page 24: Análisis  de  las  soluciones  y herramientas  tecnológicas  disponibles parte 2

Herramientas estadisticas Calculo de distintos parámetros

estadísticos. Técnicas bayesianas.Hipótesis. Técnicas de regresión lineal.Análisis multivariante.

Page 25: Análisis  de  las  soluciones  y herramientas  tecnológicas  disponibles parte 2

Análisis cluster: agrupación de datos para poder llevar a cabo la segmentación de clientes.

Page 26: Análisis  de  las  soluciones  y herramientas  tecnológicas  disponibles parte 2

Técnicas de inteligencia artificial Algoritmos genéticos.

Redes neuronales.

Page 27: Análisis  de  las  soluciones  y herramientas  tecnológicas  disponibles parte 2

Herramientas simbólicasArboles de decisión.Reglas de asociación.Identificación de patrones secuenciales.