Juan Alvites 27/04/2015 INTRODUCCIÓN A LA INGENIERÍA DE SISTEMAS Semana 6 Alvites Huamaní Juan.

23
Juan Alvites 12/06/22 INTRODUCCIÓN A LA INGENIERÍA DE SISTEMAS Semana 6 Alvites Huamaní Juan Alvites Huamaní Juan

Transcript of Juan Alvites 27/04/2015 INTRODUCCIÓN A LA INGENIERÍA DE SISTEMAS Semana 6 Alvites Huamaní Juan.

Page 1: Juan Alvites 27/04/2015 INTRODUCCIÓN A LA INGENIERÍA DE SISTEMAS Semana 6 Alvites Huamaní Juan.

Juan Alvites

21/04/23

INTRODUCCIÓN A LA INGENIERÍA DE SISTEMAS

Semana 6

Alvites Huamaní JuanAlvites Huamaní Juan

Page 2: Juan Alvites 27/04/2015 INTRODUCCIÓN A LA INGENIERÍA DE SISTEMAS Semana 6 Alvites Huamaní Juan.

Juan Alvites

HERRAMIENTAS DE BUSINESS INTELLIGENCE - DATAWAREHOUSE

Contenido1.Introducción

2.Definición

3.Datawarehouse

4.Estructura del Datawarehouse

2

Page 3: Juan Alvites 27/04/2015 INTRODUCCIÓN A LA INGENIERÍA DE SISTEMAS Semana 6 Alvites Huamaní Juan.

Juan Alvites

1. Introducción

3

Page 4: Juan Alvites 27/04/2015 INTRODUCCIÓN A LA INGENIERÍA DE SISTEMAS Semana 6 Alvites Huamaní Juan.

Juan Alvites

2. Definición• Se entiende como herramientas de Business Intelligence

todas las aplicaciones orientadas a convertir datos en conocimiento para la organización, mediante la transformación de datos en información estructurada para su explotación directa por parte de la dirección.

4

Page 5: Juan Alvites 27/04/2015 INTRODUCCIÓN A LA INGENIERÍA DE SISTEMAS Semana 6 Alvites Huamaní Juan.

Juan Alvites

2. Definición

5

Page 6: Juan Alvites 27/04/2015 INTRODUCCIÓN A LA INGENIERÍA DE SISTEMAS Semana 6 Alvites Huamaní Juan.

Juan Alvites

3. Datawarehouse• Un Datawarehouse es un gran almacén de datos, en el

que se integran datos procedentes de varias fuentes.

• Además un Datawarehouse debe disponer de una gran capacidad de almacenamiento (gigabytes o terabytes)

6

Page 7: Juan Alvites 27/04/2015 INTRODUCCIÓN A LA INGENIERÍA DE SISTEMAS Semana 6 Alvites Huamaní Juan.

Juan Alvites

7

Definición• Datawarehouse (Almacén de datos) se define como

una colección de datos que verifican las siguientes propiedades:– Está orientado a objetos (a un tema) – Datos integrados– No volátiles– Variante en el tiempo

que surgieron como una herramienta de soporte para la toma de decisiones a nivel gerencial

Page 8: Juan Alvites 27/04/2015 INTRODUCCIÓN A LA INGENIERÍA DE SISTEMAS Semana 6 Alvites Huamaní Juan.

Juan Alvites

8

Explicación de la definición• Orientado hacia temas: los datos se almacenan y

agrupan por temas de interés.

Page 9: Juan Alvites 27/04/2015 INTRODUCCIÓN A LA INGENIERÍA DE SISTEMAS Semana 6 Alvites Huamaní Juan.

Juan Alvites

9

Explicación de la definición• Datos integrados: el almacén de datos integra

datos que provienen de varias fuentes. Partimos de una base de datos (operacional) y mediante un proceso de carga de datos hacemos el Datawarehouse. El proceso de carga es lo más complicado por problemas de codificación, medidas de los atributos… de las bases de datos.

BD

BD

BD

DW

CARGA

Page 10: Juan Alvites 27/04/2015 INTRODUCCIÓN A LA INGENIERÍA DE SISTEMAS Semana 6 Alvites Huamaní Juan.

Juan Alvites

10

Explicación de la definición

• No volátiles: son estables, una vez almacenados los datos no se modifican.

BD DWDW

SELECT

INSERT

UPDATE

DELETE

REPORTS SELECT

CARGA

Page 11: Juan Alvites 27/04/2015 INTRODUCCIÓN A LA INGENIERÍA DE SISTEMAS Semana 6 Alvites Huamaní Juan.

Juan Alvites

11

Explicación de la definición

• Variante en el tiempo: los datos contienen información sobre la fecha de los mismos, porque se hacen cargas de datos continuamente. Cuando los datos van cambiando, se actualizan los históricos y se guardan en ficheros temporales. Siempre va haber una variable tiempo.

TIEMPO

# id_tiempo

* periodo

Page 12: Juan Alvites 27/04/2015 INTRODUCCIÓN A LA INGENIERÍA DE SISTEMAS Semana 6 Alvites Huamaní Juan.

Juan Alvites

12

Características

• Podemos resumir las características de un Datawarehouse:– Trabaja con datos de negocio– Orientado a un sujeto– Almacena datos actuales orientado a un histórico

(actual + histórico)– Datos más bien resumidos (no información

detallada)

Page 13: Juan Alvites 27/04/2015 INTRODUCCIÓN A LA INGENIERÍA DE SISTEMAS Semana 6 Alvites Huamaní Juan.

Juan Alvites

13

DIFERENCIAS

BD OPERACIONAL- Datos operacionales- Orientado a

aplicaciones- Datos Actuales- Datos Detallados- Datos en continuo

cambio

DATAWAREHOUSE- Datos de negocio- Orientado al sujeto- Actuales + Histórico- Datos Resumidos- Datos Estables

Page 14: Juan Alvites 27/04/2015 INTRODUCCIÓN A LA INGENIERÍA DE SISTEMAS Semana 6 Alvites Huamaní Juan.

Juan Alvites

Almacenes y Minería de Datos 14

ARQUITECTURA DATAWAREHOUSE

GESTORCARGA

GESTOR ALMACENAMIENTO GESTOR

CONSULTAS

BDoperacional

Partimos de una BD operacional y se basa en 3 módulos

Page 15: Juan Alvites 27/04/2015 INTRODUCCIÓN A LA INGENIERÍA DE SISTEMAS Semana 6 Alvites Huamaní Juan.

Juan Alvites

15

GESTOR DE CARGA

• Permite hacer la carga. Como dificultades nos podemos encontrar:– La integración de los datos– Elección del momento de la carga– El tiempo de carga sea el mínimo posible– Buen diccionario de datos o METADATA (para evitar

cometer errores en la carga)– Diseño de procedimientos PL/SQL

Page 16: Juan Alvites 27/04/2015 INTRODUCCIÓN A LA INGENIERÍA DE SISTEMAS Semana 6 Alvites Huamaní Juan.

Juan Alvites

16

GESTOR DE ALMACENAMIENTO

• Se encarga del almacenamiento, de la estructura,…. Existe una tabla llamada FACT (Hecho) y unas tablas

llamadas dimensiones o tablas dimensionales. Entre la tabla FACT y las tablas dimensionales suele

haber relaciones 1:N Este modelo tiene forma de estrella por eso se

denomina MODELO STAR

Page 17: Juan Alvites 27/04/2015 INTRODUCCIÓN A LA INGENIERÍA DE SISTEMAS Semana 6 Alvites Huamaní Juan.

Juan Alvites

17

MODELO ESTRELLA - STAR

FACT

DIM_1

DIM_2

DIM_TIEMPO

DIM_3

# PK4

# PK1

# PK2# PK3

# PK1# PK2# PK3# PK4*campoA*campoB

Page 18: Juan Alvites 27/04/2015 INTRODUCCIÓN A LA INGENIERÍA DE SISTEMAS Semana 6 Alvites Huamaní Juan.

Juan Alvites

18

GESTOR DE CONSULTAS

• Las consultas se hacen sobre la tabla FACT. También se encarga de los perfiles, pues las consultas (reports) serán diferentes dependiendo del usuario y sus necesidades.

Page 19: Juan Alvites 27/04/2015 INTRODUCCIÓN A LA INGENIERÍA DE SISTEMAS Semana 6 Alvites Huamaní Juan.

Juan Alvites

19

Ejemplo 1:CATEGORIAS_PROF

# c_categoria* descripción* salario_min* salario_max

USUARIOS

# c_usuario* nombre* apellido1* apellido2* c_categoria* direccion

USU_OFERTAS

# c_categoria# c_oferta* salario_deseado

OFERTAS

# c_oferta* descripción* salario_min* salario_max* fx_alta

1

n

11nn

Page 20: Juan Alvites 27/04/2015 INTRODUCCIÓN A LA INGENIERÍA DE SISTEMAS Semana 6 Alvites Huamaní Juan.

Juan Alvites

20

Ejemplo 1:CATEGORIAS_PROF# c_categoria* descripción* salario_min* salario_max

USUARIOS# c_usuario* nombre* apellido1* apellido2* c_categoria* direccion

OFERTAS# c_oferta* descripción* salario_min* salario_max* fx_alta

TIEMPO# c_tiempo* descripcion

USU_OFERTAS# c_usuario# c_categoria# c_oferta* salario_deseado

Page 21: Juan Alvites 27/04/2015 INTRODUCCIÓN A LA INGENIERÍA DE SISTEMAS Semana 6 Alvites Huamaní Juan.

Juan Alvites

21

REPORTS

• ¿Cuántos usuarios se han apuntado a las ofertas de empleo del mes de enero?SELECT count(*)FROM USUARIOS_OFERTAS U, OFERTAS OWHERE U.c_oferta=o.c_ofertaAND O.fx_alta BETWEEN (’01/01/07’,`31/01/07´)

Page 22: Juan Alvites 27/04/2015 INTRODUCCIÓN A LA INGENIERÍA DE SISTEMAS Semana 6 Alvites Huamaní Juan.

Juan Alvites

Ejemplos Arquitectura de Datawarehouse

22

Page 23: Juan Alvites 27/04/2015 INTRODUCCIÓN A LA INGENIERÍA DE SISTEMAS Semana 6 Alvites Huamaní Juan.

Juan Alvites