7/18/2019 Roll and Drill
http://slidepdf.com/reader/full/roll-and-drill 1/15
Introducción
El primer paso en el proceso de extracción de conocimiento apartir de datos es precisreunir los datos con los que se van a trabajar.
Para trabajar con la información trasnsaccional de una organización existe una tecnolreciente denominada Almacén de datos que esta deseñada para organizar garndes vde procedencia generalmente estructurada.
7/18/2019 Roll and Drill
http://slidepdf.com/reader/full/roll-and-drill 2/15
RECOPILACIÓN DE DATOS Un Data Mart adopta un esquema estrella para maximizar la performance de las consultas.
Las dimensiones son categorías descriptivas por las cuales las medidas se pueden separanálisis.
La dimensión Tiempo esta implícita en todo Data Mart
Las medidas son los datos numéricos de interés primario para el cliente
Con las medidas calculadas se pueden construir alertas
7/18/2019 Roll and Drill
http://slidepdf.com/reader/full/roll-and-drill 3/15
Lo Básico para elaborar un Datamarts
Tener definido los requerimientos
Conocer los hechos
Los indicadores
Aperturas
Tener bien documentadas todas las deficiones
Definir bien los criterios de todas las medidas calculadas
7/18/2019 Roll and Drill
http://slidepdf.com/reader/full/roll-and-drill 4/15
Puede parecer intuitivo organizar la información en dimensiones.
En que para cada subámbito de una organización se construya una estructura de es
La dimension que siempre aparece en los datamarts es el tiempo.
7/18/2019 Roll and Drill
http://slidepdf.com/reader/full/roll-and-drill 5/15
Ejemplos
VENTAS PRODUCCIÓN
CAMPAÑAPERSONAL
tiempo producto
lugar
equipo
tiempo
proyecto
lugar
proveedor producto
tiempo
tiempo
lugar
producto
7/18/2019 Roll and Drill
http://slidepdf.com/reader/full/roll-and-drill 6/15
Explotación de un almacén de datos.Operadores
Un modelo de datos se compone de unas estructuras y unos operadores sobre dichas estructura
A los operadores se les conoces como:
Operadores OLAP
Operadores de análisis de datos
Operadores de almacenes de datos
Drill : Se trata de disgregar los datos (mayor nivel de detalle o desglose, menos sumarizaciagregación) siguiendo los caminos de una o más dimensiones.
Roll : Se trata de agregar los datos (menor nivel de detalle o desglose, más sumarización o conslos caminos de una o más dimensiones.
Slice & Dice : Se seleccionan y se proyectan datos.
Pivo: : Se reorientan las dimensiones.
7/18/2019 Roll and Drill
http://slidepdf.com/reader/full/roll-and-drill 7/15
Los operadores drill , roll , slice & dice y pivot son modificadores o refinadores de consultas ypueden aplicarse sobre una consulta realizada previamente.
7/18/2019 Roll and Drill
http://slidepdf.com/reader/full/roll-and-drill 8/15
IMPORTE T1 T2 T3
Refrescos 150,323 233,992 410,497
Congeladas 2,190,103 1,640,239 190,440
Representación Tabula(relacional)
CATEGORÍA TRIMESTRE I
Refrescos T1 1
Refrescos T2 2
Refrescos T3 4
Refrescos T4 2
Congeladas T1 2
Congeladas T2 1
Congeladas T3 1
Congeladas T4 2
Representación Matri(multidimensional
PRODUCTO LUGAR
TIEMPO
Categoría
Gama Prov
artículo
País
Ciudad
supermercado
Año
Trimestre
Mes Semana
Día
Hora
VENTA
Atributos:
•Importe•Cantidad•No_clientes “refrescos”,
“congeladas”
DIMENSIONES
7/18/2019 Roll and Drill
http://slidepdf.com/reader/full/roll-and-drill 9/15
Supongamos que queremos ahora ver sólo las ventas de refrescos y desglosarlos pparticular Valencia y León) con el objetivo de ver si hay más consumo de refrescoscalurosas.
Los operadores OLAP permitirán modificar la consulta sin necesidad de realizar otraconsulta se hace en tiempo real.
Es importante que para que esto sea eficiente el almacén de datos ha de estar diseñado
para que este tipo de operaciones utilicen ciertas estructuras intermedias que permdisgregar con facilidad.
7/18/2019 Roll and Drill
http://slidepdf.com/reader/full/roll-and-drill 10/15
Para lo anterior se utiliza el operador Drill, el cual permite entrar más a detalle en e
7/18/2019 Roll and Drill
http://slidepdf.com/reader/full/roll-and-drill 11/15
Este es el ejemplo del operador Drill
RepresentaciónTabular
(relacional)
CATEGORÍA TRIMESTRE IMPORTE
Refrescos T1 150,323
Refrescos T2 233,992
Refrescos T3 410,497
Refrescos T4 203,400
Congeladas T1 2,190,103
Congeladas T2 1,640,239
Congeladas T3 1,904,401
Congeladas T4 2,534,031
CATEGORÍA TRIMES-TRE
CIUDAD I
Refrescos T1 Valencia
Refrescos T1 León
Refrescos T2 Valencia
Refrescos T2 León
Refrescos T3 Valencia
Refrescos T3 León
Refrescos T4 Valencia
Refrescos T4 León
drill-across
Categoría=“refrescos”
Ciudad={“Valencia”,
“León”}
7/18/2019 Roll and Drill
http://slidepdf.com/reader/full/roll-and-drill 12/15
Ejemplo de la representación de laoperación Roll
La operación roll es la inversa del drill y el objetivo es obtener información más agregada.
Por ejemplo, si quisiéramos obtener los totales de las categorías “refrescos” y “consimplemente debemos aplicar el operador roll-across a la consulta original, como se ocontinuación.
CATEGORÍA TRIMESTRE IMPORTE
Refrescos T1 150,323
Refrescos T2 233,992
Refrescos T3 410,497
Refrescos T4 203,400
Congeladas T1 2,190,103
Congeladas T2 1,640,239
Congeladas T3 1,904,401
Congeladas T4 2,534,031
CATEGORÍA IMPO
Refrescos 998
Congeladas 10,45
RepresentaciónTabular
(relacional)
roll-across
un nivel por “tiempo”
7/18/2019 Roll and Drill
http://slidepdf.com/reader/full/roll-and-drill 13/15
Notaciones “-across” y “-up”
Drill-down y roll-up : representan agregaciones o disgregaciones dentro de una dinicialmente en la consulta.
Drill-across y roll-across : representan agregaciones o disgregaciones en otrasdefinidas inicialmente en la consulta o hacen desaparecer alguna de las dimensiones.
Los operadores pivot y slice & dice se utilizan exclusivamente cuando se hace una represal menos una representación mixta.
7/18/2019 Roll and Drill
http://slidepdf.com/reader/full/roll-and-drill 14/15
CATEGORÍA TRIMESTRE VALENCIA LEÓN
Refrescos T1 13,267 3,589
Refrescos T2 27,392 4,278
Refrescos T3 73,042 3,780
Refrescos T4 18,391 3,629
Congelados T1 150,242 4,798
Congelados T2 173,105 3,564
Congelados T3 163,240 4,309
Congelados T4 190,573 4,812
CATEGORÍA TRIMESTRE REFRESCOS CONGE
Valencia T1 13,267
Valencia T2 27,392
Valencia T3 73,042
Valencia T4 18,391
León T1 3,589
León T2 4,278
León T3 3,780
León T4 3,629
Representación mixta
pivot
categoría x ciudad
Ejemplo de opivot
7/18/2019 Roll and Drill
http://slidepdf.com/reader/full/roll-and-drill 15/15
Conclusión
Los modelos para representar los datos obtenidos de los data marts uilizando los operadorede presentar información basada en dimensiones como :
Tiempo
Lugar
Producto
Top Related