Diseño de un almacen de datos

20
DISEÑO DE ALMACÉN DE DATOS

Transcript of Diseño de un almacen de datos

Page 1: Diseño de un almacen de datos

DISEÑO DE ALMACÉN DE

DATOS

Page 2: Diseño de un almacen de datos

ALMACÉN DE DATOS

Descripción de un Data Warehouse En el contexto de la informática, un almacén de datos (del inglés data warehouse) es una colección de datos orientada a un determinado ámbito (empresa, organización, etc.)

Page 3: Diseño de un almacen de datos

6. DISEÑO DE UN ALMACÉN DE DATOS

Para construir un Data Warehouse se necesitan herramientas para ayudar a la migración y a la transformación de los datos hacia el almacén. Una vez construido, se requieren medios para manejar grandes volúmenes de información. Se diseña su arquitectura dependiendo de la estructura interna de los datos del almacén y especialmente del tipo de consultas a realizar.

Page 4: Diseño de un almacen de datos

6. DISEÑO DE UN ALMACÉN DE DATOS

Para abordar un proyecto de data warehouse es necesario hacer un estudio de algunos temas generales de la organización o empresa, los cuales se describen a continuación:

Situación actual de partidaTipo y características del negocioEntorno técnicoExpectativas de los usuariosEtapas de desarrolloPrototipoPilotoPrueba del concepto tecnológico

Page 5: Diseño de un almacen de datos

6.1. ESQUEMA EN ESTRELLA

En las bases de datos usadas para data warehousing, un esquema en estrella es un modelo de datos que tiene una tabla de hechos (o tabla fact) que contiene los datos para el análisis, rodeada de las tablas de dimensiones.

Page 6: Diseño de un almacen de datos

  Ejemplo de modelo de datos en estrella

Page 7: Diseño de un almacen de datos

6.1.1. Tablas Factuales y Dimensionales

Tabla Factual: Es la tabla central que contiene los datos (hechos) sobre las diferentes combinaciones de las dimensiones.

Dimensiones: Para cada una de las dimensiones se crea una tabla, almacenado así las descripciones de las dimensiones.

Page 8: Diseño de un almacen de datos

6.1.2. Ventajas e Inconvenientes del Diseño en Estrella

VENTAJAS Crea un almacén de datos con rápidos

tiempos de respuestas. Proporciona un diseño fácil de modificar. Simula cómo “ven” los datos los usuarios

finales . Simplicidad en las consultas. (JOIN) Simplifica la navegación de los metadatos. Facilita la interacción con herramientas

frontales.

Page 9: Diseño de un almacen de datos

2.1. DIAGNÓSTICO DE LA SITUACIÓN ACTUAL

DESVENTAJASAl combinar dimensiones se tiene que

considerar distintos niveles de detalle en las distintas dimensiones.

Cuándo se quiere limitar los niveles de una dimensión se puede utilizar un campo de nivel o bien emplear el modelo “Constelación” (conjunto de estrellas), en el que además de las tablas del esquema en estrella se almacenan tablas de hechos agregadas.

Page 10: Diseño de un almacen de datos

La siguiente instrucción SQL obtendría como han sido vendidos algunos conjuntos de televisores, para cada marca y país, en el año 2006.

Page 11: Diseño de un almacen de datos

6.2. ESQUEMA EN COPO DE NIEVE

En las bases de datos utilizadas en (data warehousing), un esquema en copo de nieve es una estructura algo más compleja que el esquema en estrella. Se da cuando alguna de las dimensiones se implementa con más de una tabla de datos. finalidad es normalizar las tablas y así reducir el espacio de almacenamiento al eliminar la redundancia de datos.

Page 12: Diseño de un almacen de datos

Ejemplo de modelo de datos en copo de nieve

Page 13: Diseño de un almacen de datos

Argumentos a favor y en contra del esquema en copo de nieve

El único argumento a favor de los esquemas en copo de nieve es que al estar normalizadas las tablas de dimensiones, se evita la redundancia de datos y con ello se ahorra espacio.

Se puede usar un esquema de copo de nieve en un Data warehouse, aunque estos sean realmente grandes y complejos, pero nunca en sistemas donde el tiempo de respuesta sea un factor crítico para los usuarios.

Page 14: Diseño de un almacen de datos

CONCLUIMOS EN ESTE APARTADO.-

El esquema del copo de nieve es una variación del esquema de la estrella, ofreciendo la normalización de las tablas de la dimensión.

Page 15: Diseño de un almacen de datos

6.2. MODELO CONCEPTUAL DE ALMACÉN DE DATOS6.2.1. Metodología para el diseño de almacén

de datos de golfarelli y rizzi

Consta de siete fases:Análisis y reconciliación de las fuentes de datos.

Análisis de requisitos.Modelado conceptual.Refinamiento de la carga de trabajo y validación del esquema conceptual.

Diseño lógico.Diseño de alimentación.Diseño físico.

Page 16: Diseño de un almacen de datos

Esquema de hechos (basadoen GOLfarelli y Rizzi)

Page 17: Diseño de un almacen de datos

Tabla 1. Estereotipos de clases.

6.2.2. Perfil UML para el modelado de almacén de datos de Trujillo

Page 18: Diseño de un almacen de datos

Tabla 2. Estereotipos para atributos.

Page 19: Diseño de un almacen de datos

La figura siguiente muestra el ejemplo de un almacén de datos utilizando este perfil

de UML.

Page 20: Diseño de un almacen de datos