Roll and Drill

12
Introducción El primer paso en el proceso de extracción de conocimiento apartir de datos es precisamente reconocer y reunir los datos con los que se van a trabajar. Para trabajar con la información trasnsaccional de una organización existe una tecnología relativamente reciente denominada Almacén de datos que esta deseñada para or ganizar garndes volumenes de datos de procedencia generalmente estructurada.

description

En esta expocicion se relata la utilizacion de roll y drill

Transcript of Roll and Drill

Page 1: Roll and Drill

7/18/2019 Roll and Drill

http://slidepdf.com/reader/full/roll-and-drill 1/15

Introducción

El primer paso en el proceso de extracción de conocimiento apartir de datos es precisreunir los datos con los que se van a trabajar.

Para trabajar con la información trasnsaccional de una organización existe una tecnolreciente denominada Almacén de datos que esta deseñada para organizar garndes vde procedencia generalmente estructurada.

Page 2: Roll and Drill

7/18/2019 Roll and Drill

http://slidepdf.com/reader/full/roll-and-drill 2/15

RECOPILACIÓN DE DATOS Un Data Mart adopta un esquema estrella para maximizar la performance de las consultas.

Las dimensiones son categorías descriptivas por las cuales las medidas se pueden separanálisis.

La dimensión Tiempo esta implícita en todo Data Mart

Las medidas son los datos numéricos de interés primario para el cliente

Con las medidas calculadas se pueden construir alertas

Page 3: Roll and Drill

7/18/2019 Roll and Drill

http://slidepdf.com/reader/full/roll-and-drill 3/15

Lo Básico para elaborar un Datamarts

Tener definido los requerimientos

Conocer los hechos

Los indicadores

Aperturas

Tener bien documentadas todas las deficiones

Definir bien los criterios de todas las medidas calculadas

Page 4: Roll and Drill

7/18/2019 Roll and Drill

http://slidepdf.com/reader/full/roll-and-drill 4/15

Puede parecer intuitivo organizar la información en dimensiones.

En que para cada subámbito de una organización se construya una estructura de es

La dimension que siempre aparece en los datamarts es el tiempo.

Page 5: Roll and Drill

7/18/2019 Roll and Drill

http://slidepdf.com/reader/full/roll-and-drill 5/15

Ejemplos

VENTAS   PRODUCCIÓN

CAMPAÑAPERSONAL

tiempo producto

lugar 

equipo

tiempo

proyecto

lugar 

proveedor producto

tiempo

tiempo

lugar 

producto

Page 6: Roll and Drill

7/18/2019 Roll and Drill

http://slidepdf.com/reader/full/roll-and-drill 6/15

Explotación de un almacén de datos.Operadores

Un modelo de datos se compone de unas estructuras y unos operadores sobre dichas estructura

A los operadores se les conoces como:

Operadores OLAP

Operadores de análisis de datos

Operadores de almacenes de datos

Drill  : Se trata de disgregar los datos (mayor nivel de detalle o desglose, menos sumarizaciagregación) siguiendo los caminos de una o más dimensiones.

Roll  : Se trata de agregar los datos (menor nivel de detalle o desglose, más sumarización o conslos caminos de una o más dimensiones.

Slice & Dice : Se seleccionan y se proyectan datos.

Pivo: : Se reorientan las dimensiones.

Page 7: Roll and Drill

7/18/2019 Roll and Drill

http://slidepdf.com/reader/full/roll-and-drill 7/15

Los operadores drill  , roll  , slice & dice y pivot son modificadores o refinadores de consultas ypueden aplicarse sobre una consulta realizada previamente.

Page 8: Roll and Drill

7/18/2019 Roll and Drill

http://slidepdf.com/reader/full/roll-and-drill 8/15

IMPORTE T1 T2 T3

Refrescos 150,323 233,992 410,497

Congeladas 2,190,103 1,640,239 190,440

Representación Tabula(relacional)

CATEGORÍA TRIMESTRE I

Refrescos T1 1

Refrescos T2 2

Refrescos T3 4

Refrescos T4 2

Congeladas T1 2

Congeladas T2 1

Congeladas T3 1

Congeladas T4 2

Representación Matri(multidimensional

PRODUCTO LUGAR

TIEMPO

Categoría

Gama Prov

artículo

País

Ciudad

supermercado

 Año

Trimestre

Mes Semana

Día

Hora

VENTA

Atributos:

•Importe•Cantidad•No_clientes “refrescos”,

“congeladas”

DIMENSIONES

Page 9: Roll and Drill

7/18/2019 Roll and Drill

http://slidepdf.com/reader/full/roll-and-drill 9/15

Supongamos que queremos ahora ver sólo las ventas de refrescos y desglosarlos pparticular Valencia y León) con el objetivo de ver si hay más consumo de refrescoscalurosas.

Los operadores OLAP permitirán modificar la consulta sin necesidad de realizar otraconsulta se hace en tiempo real.

Es importante que para que esto sea eficiente el almacén de datos ha de estar diseñado

para que este tipo de operaciones utilicen ciertas estructuras intermedias que permdisgregar con facilidad.

Page 10: Roll and Drill

7/18/2019 Roll and Drill

http://slidepdf.com/reader/full/roll-and-drill 10/15

Para lo anterior se utiliza el operador Drill, el cual permite entrar más a detalle en e

Page 11: Roll and Drill

7/18/2019 Roll and Drill

http://slidepdf.com/reader/full/roll-and-drill 11/15

Este es el ejemplo del operador Drill

RepresentaciónTabular 

(relacional)

CATEGORÍA TRIMESTRE IMPORTE

Refrescos T1 150,323

Refrescos T2 233,992

Refrescos T3 410,497

Refrescos T4 203,400

Congeladas T1 2,190,103

Congeladas T2 1,640,239

Congeladas T3 1,904,401

Congeladas T4 2,534,031

CATEGORÍA TRIMES-TRE

CIUDAD I

Refrescos T1 Valencia

Refrescos T1 León

Refrescos T2 Valencia

Refrescos T2 León

Refrescos T3 Valencia

Refrescos T3 León

Refrescos T4 Valencia

Refrescos T4 León

drill-across

Categoría=“refrescos”

Ciudad={“Valencia”,

“León”}

Page 12: Roll and Drill

7/18/2019 Roll and Drill

http://slidepdf.com/reader/full/roll-and-drill 12/15

Ejemplo de la representación de laoperación Roll

La operación roll  es la inversa del drill  y el objetivo es obtener información más agregada.

Por ejemplo, si quisiéramos obtener los totales de las categorías   “refrescos” y   “consimplemente debemos aplicar el operador roll-across a la consulta original, como se ocontinuación.

CATEGORÍA TRIMESTRE IMPORTE

Refrescos T1 150,323

Refrescos T2 233,992

Refrescos T3 410,497

Refrescos T4 203,400

Congeladas T1 2,190,103

Congeladas T2 1,640,239

Congeladas T3 1,904,401

Congeladas T4 2,534,031

CATEGORÍA IMPO

Refrescos 998

Congeladas 10,45

RepresentaciónTabular 

(relacional)

roll-across

un nivel por “tiempo”

Page 13: Roll and Drill

7/18/2019 Roll and Drill

http://slidepdf.com/reader/full/roll-and-drill 13/15

Notaciones “-across” y “-up”

  Drill-down  y roll-up : representan agregaciones o disgregaciones dentro de una dinicialmente en la consulta.

  Drill-across  y   roll-across : representan agregaciones o disgregaciones en otrasdefinidas inicialmente en la consulta o hacen desaparecer alguna de las dimensiones.

Los operadores pivot y slice & dice se utilizan exclusivamente cuando se hace una represal menos una representación mixta.

Page 14: Roll and Drill

7/18/2019 Roll and Drill

http://slidepdf.com/reader/full/roll-and-drill 14/15

CATEGORÍA TRIMESTRE VALENCIA LEÓN

Refrescos T1 13,267 3,589

Refrescos T2 27,392 4,278

Refrescos T3 73,042 3,780

Refrescos T4 18,391 3,629

Congelados T1 150,242 4,798

Congelados T2 173,105 3,564

Congelados T3 163,240 4,309

Congelados T4 190,573 4,812

CATEGORÍA TRIMESTRE REFRESCOS CONGE

Valencia T1 13,267

Valencia T2 27,392

Valencia T3 73,042

Valencia T4 18,391

León T1 3,589

León T2 4,278

León T3 3,780

León T4 3,629

Representación mixta

pivot

categoría x ciudad

Ejemplo de opivot  

Page 15: Roll and Drill

7/18/2019 Roll and Drill

http://slidepdf.com/reader/full/roll-and-drill 15/15

Conclusión

Los modelos para representar los datos obtenidos de los data marts uilizando los operadorede presentar información basada en dimensiones como :

Tiempo

Lugar

Producto