Inteligencia denegocios versus analítica de negocios

199
1 1 Prof. Luis Joyanes Aguilar INTELIGENCIA DE NEGOCIOS (BI) Y ANALÍTICA DE NEGOCIOS (BA) Herramientas y aplicaciones: Un enfoque en R. Conferencia subida a www.slideshare.net/joyanes CENTRO DE INNOVACIÓN Y DESARROLLO TECNOLÒGICO (CIDT) 21 de agosto, 2015

Transcript of Inteligencia denegocios versus analítica de negocios

1 1

Prof. Luis Joyanes Aguilar

INTELIGENCIA DE NEGOCIOS (BI) Y ANALÍTICA DE NEGOCIOS (BA) Herramientas y aplicaciones: Un enfoque en R. Conferencia subida a www.slideshare.net/joyanes CENTRO DE INNOVACIÓN Y DESARROLLO TECNOLÒGICO (CIDT) 21 de agosto, 2015

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

TECNOLOGÍAS DE IMPACTO 2015 q 1.Cloud computing. Inteligencia de negocios en la

nube q 2. Big data. Analítica de macrodatos o grandes

volúmenes de datos. q 3. Social media. Inteligencia de negocios social q 4. Movilidad q 5. Internet de las cosas, Ciudades inteligentes,

Gamification, Drones… q 6. Tecnologías innovadoras: “llevables o ponibles,

conectables” (wearables), gafas, pulseras, relojes… inteligentes, SmartTV, resolución 4H….

Página –2–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

HYPE CYCLE DE GARTNER 2013. Agosto 2013 http://www.gartner.com/newsroom/id/2575515

Página –3–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

HYPE CYCLE DE GARTNER 2015. Agosto 2015 http://www.gartner.com/newsroom/id/3114217

Página –4–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

BUSINESS INTELLIGENCE

q “ Inteligencia de Negocio se refiere al proceso de q convertir datos en conocimiento y conocimiento en q acciones para crear la ventaja competitiva del q negocio “ The Data Warehousing Institute

Página –5–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Concepto de Inteligencia de Negocio q Business Intelligence: q No es una tecnología q Es un conjunto de sistemas de información que

trabajan de forma coordinada. q Sistemas de almacenamiento de datos (data q warehouse) q Sistemas de almacenamiento de grandes

volúmenes de datos (big data) q Sistemas de minería de datos (data mining)

Página –6–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Concepto de Inteligencia de Negocios

q Herramientas de procesamiento analítico de datos q (OLAP) q Herramientas de consulta y reporte (informes) de

datos: querying y reporting. q Tableros de control o de información (dashboards) q Cuadros de mando integrado (balanced scorecards) q Herramientas de descubrimiento de datos

q Herramientas de visualización de datos q Sistemas inteligentes de conocimiento

Página –7–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Definiciones de BI

Página –8–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Tendencias BI para 2012 (revista CIO.COM)

q http://www.cio.com.au/article/421700/top_six_bi_trends_2012/

q Mobile Business Intelligence (MBI) q BI in the Cloud q Analytics q In-memory analytics q The Agile approach to BI q Big Data

Página –9–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

TENDENCIAS 2015 EN BI DE TABLEAU

q Las 10 tendencias principales de la inteligencia de negocios para 2015 según tableau

q 1. La gerencia se transforma q Tal como el escenario de la inteligencia de negocios

cambió con la incorporación de los datos de autoservicio, también debe cambiar la gerencia. Los enfoques simples, como resguardar todos los datos empresariales o prescindir de procesos por completo, ya no funcionarán. Las organizaciones comenzarán a investigar en qué consiste la gerencia en un mundo de análisis de autoservicio.

Página –10–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

10 TENDENCIAS 2015 EN BI DE TABLEAU

q 2. La inteligencia social es una ventaja competitiva

q En 2014, las organizaciones comenzaron a analizar los datos de redes sociales seriamente. En 2015, aquellos con una ventaja competitiva comenzarán a aprovechar sus capacidades. Seguir conversaciones a gran escala en las redes sociales permitira a las empresas enterarse cuando comience a cobrar notoriedad algún tema y saber de qué hablan sus clientes. Los análisis sociales abrirán las puertas a la optimización receptiva de productos.

Página –11–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

10 TENDENCIAS 2015 EN BI DE TABLEAU

q 3. Los análisis emergen en toda la organización

q Los analistas de datos actuales suelen ser gerentes de operaciones, ejecutivos de la cadena de suministro o, incluso, vendedores. Las tecnologías nuevas, que son más fáciles de usar y proporcionan análisis basados en navegación, les permiten a las personas resolver dudas de negocios ad hoc. Las empresas que reconocen esto como una ventaja estratégica empezarán a proporcionar datos, herramientas y capacitación a sus analistas para ayudarlos a desempeñar sus tareas.

Página –12–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

10 TENDENCIAS 2015 EN BI DE TABLEAU

q 4. Las comunidades se distinguen q La integración de TI ya no es un concepto, es una

realidad. La gente usa productos que disfruta, y el software de análisis no es la excepción. Las empresas que ofrecen productos que inspiran y conceden capacidades comienzan a ver cómo prosperan la comunidades. Además, los posibles clientes verán el estado de las comunidades

q de productos como evidencia importante en mercados colmados.

Página –13–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

10 TENDENCIAS 2015 EN BI DE TABLEAU

q 5. Todo converge q Durante los últimos 10 años se produjeron muchísimas

innovaciones en el espacio de datos. Esto condujo a entornos mixtos integrados por una gran variedad de elementos, desde almacenamiento de datos hasta análisis y aplicaciones de negocios. Ya no se volvera a la era de los sistemas monolíticos. Sin embargo, las organizaciones se están cansando de los inicios de sesión múltiples y los procesos burdos para trasladar y gestionar datos. La integración veloz con interfaces simples se convertira en la norma.

Página –14–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

10 TENDENCIAS 2015 EN BI DE TABLEAU

q 6. Los análisis en la nube ya no son solo para datos en la nube

q En 2015, se registrarán los primeros usos importantes de análisis en la nube para datos locales. Hasta ahora, los análisis en la nube se usaron principalmente con datos en aplicaciones de nube.

q En 2015, las empresas comenzarán a elegir la nube cuando tenga sentido para sus casos de negocios y no solo cuando los datos se encuentren allí.

Página –15–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

10 TENDENCIAS 2015 EN BI DE TABLEAU

q 7. Las conversaciones con datos reemplazan los dashboards estáticos

q Estamos entrando en una era en la que los datos son tan interactivos que se pueden convertir en la base de una conversación. Ahora que la gente cuenta con herramientas de análisis de alta velocidad, pueden analizar datos rápidamente, combinar datos y rediseñar análisis para crear nuevas perspectivas. A raíz de estas conversaciones con datos, las organizaciones tendrán una comprensión más profunda de ellos.

Página –16–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

10 TENDENCIAS 2015 EN BI DE TABLEAU

q 8. Los datos y el periodismo se unen por completo [periodismo de datos]

q La aparición deVox y la creciente popularidad de sitios como fivethirtyeight.com obligarán a más salas de redacción a integrar análisis de datos en sus contenidos en línea. Esta tendencia se trasladará del público a las organizaciones e impulsará a las empresas que no aprovechan los análisis a modernizarse.

Página –17–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

10 TENDENCIAS 2015 EN BI DE TABLEAU

q 9. La tecnología móvil evoluciona q Los trabajadores pasan cada vez menos tiempo en sus

escritorios. Sin embargo, eso no significa que deban contar con menos información basada en datos; de hecho, necesitan más datos que nunca. Las soluciones móviles para diversos análisis existen desde hace años y, finalmente, están llegando a un nivel de evolución que permite a los trabajadores hacer análisis simples cuando están fuera de la oficina. Además, la gran demanda de tecnología móvil obligó a los proveedores a ofrecer interfaces más simples e intuitivas en todos sus productos.

Página –18–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

10 TENDENCIAS 2015 EN BI DE TABLEAU

q 10. Comienzan a aparecer los análisis inteligentes

q Los avances en el modelado gráfico e intuitivo permitirán a los usuarios profesionales usar análisis de predicción sin necesidad de extensas consultas a expertos ni secuencias de comando.A medida que los análisis de autoservicio se hagan más convencionales, las tareas como los pronósticos y las predicciones se volverán más comunes y mucho menos complicadas.

Página –19–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Cuadrante mágico de Gartner 2013, feb 2013

Página –20–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Cuadrante mágico de Gartner 2013, feb 2013

q Para la consultora una plataforma BI y Analytics de debe cubrir tres categorías de capacidades como lo son:

q  a) integración, b) entrega de información y c) análisis.

q  Kurt Schlegel, Rita L. Sallam, Daniel Yuen, Joao Tapadinhas (2013). Magic Quadrant for Business Intelligence and Analytics Platforms en http://www.gartner.com/technology/reprints.do?

id=1-1DYKLUU&ct=130206&st=sb#

Página –21–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Características de proveedoes C. M. Gartner

q 1. Integración l  Infraestructura BI l  Manejo de metadata

l  Herramientas de desarrollo

l  Colaboración

q 2. Entrega de información l  Reporting l  Cuadros de mando

l  Consultas Ad hoc

l  Integración con Microsoft Office

l  Búsqueda basada en BI l  Mobile BI

Página –22–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Características de proveedores C. M. Gartner

3. Análisis

o  Procesamiento analítico on-line (OLAP)

o  Visualización interactiva

o  Modelos predictivos y Data Mining

o  Scorecards

Página –23–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Capacidades de las plataformas BI-Analytics

Página –24–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Cuadrante mágico de Gartner 2013, feb 2013

q Descripción del Cuadrante:

q 1) las líderes son vendedores que son fuertes en la amplitud y profundidad de las capacidades de sus plataformas BI y pueden suministrar consultoría a las organizaciones de tal manera que puedan tener constante soporte en su estrategia BI. Las plataformas de los pequeños vendedores tales como Tableau, QlikTech y Tibco Spotfire adolecen de criterio y capacidad geográfica, así estrategia vertical en sus plataformas BI. Aún así son líderes debido a la fortaleza de sus mercados, capacidad de marketing y la simplicidad de sus arquitecturas,

Página –25–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Cuadrante mágico de Gartner 2013, feb 2013

q 2) Por otro lado, se tienen a las empresas retadoras, las cuales se están ubicando con éxito en el mercado a pesar de que están limitadas a casos específicos y sistemas técnicos concretos, además de deficiencias en la integración estratégica de sus productos, marketing, canales de ventas y presencia geográfica,

Página –26–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Cuadrante mágico de Gartner 2013, feb 2013

q 3) Las visionarias son vendedores que tienen una fuerte visión sobre la importancia de hacer llegar al usuario una plataforma BI-Analytics lo suficientemente abierta y flexible fácilmente integrada a los procesos de la organización, además de profundizar en áreas específicas. No obstante, presentan brechas en cuanto a la amplitud de funcionalidades que muchas veces los usuarios requieren a su paso. Su fortaleza aún así está en su vocación innovadora, 4) Las empresas enfocadas en nichos son aquellas que lo hacen bien en un segmento específico del mercado de plataformas

Página –27–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

C. M. de Gartner 2014. BI y Analytics

Página –28–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

C. M. de Gartner 2014. BI y Analytics q Jaspersoft y Pentaho, se mantienen en su cuadrante de

jugadores de nicho, desplazándose más hacia arriba y a la derecha.

q SAP, SAS, Qlikview, IBM, MicroStrategy y Microsoft se mantienen en el mismo cuadrante de líderes.

q Tableau y Tibco Spotfire, que entraron el año pasado, sigen en el cuadrante de líderes. Tableau ahora con más valoración en “integridad de la visión”.

q GoodData, que debutó el año pasado en el cuadrante de jugadores de nicho, se desplaza considerablemente hacia el centro.

q Alteryx y Panorama, se desplazan al cuadrante de visionarios.

q  Página –29–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Cuadrante mágico de Gartner de BI y analytics

q Tibco Spotfire, que entró el año 2013, se mueve hacia abajo, jugando más a Visionario que a Líder.

q GoodData, se aleja del centro y se posiciona en jugadores de nicho.

q Alteryx y Panorama, bajan en habilidad de ejecutar y permanecen en el cuadrante de Visionarios.

Página –30–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Cuadrante mágico de Gartner de BI y analytics, 2015

Página –31–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Cuadrante mágico de Gartner de BI y analytics q  Si comparamos con la del año 2014, tenemos que: q Pentaho se mantienen en su cuadrante de jugadores de

nicho, desplazándose más hacia abajo. Jaspersoft desaparece del cuadrante.

q SAP, SAS, Qlikview, IBM, MicroStrategy, Oracle y Microsoft se mantienen en el mismo cuadrante de líderes, moviendose un poco hacia abajo y a la izquierda.

q Dejando a Tableau más arriba, que se separa del resto.

Página –32–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Cuadrante Mágico para Plataformas de Business Intelligence y Analytics (2015) q Hoy como todos los años, Gartner libera el Cuadrante

Mágico para Plataformas de Business Intelligence y Analytics, que en inglés es conocido como Magic Quadrant for Business Intelligence and Analytics Platforms. Recordar que desde el año 2013, este cuadrante incluye la palabra “Analytics”.

Página –33–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Cuadrante mágico de Gartner 2015 de plataformas de analítica avanzada

Página –34–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Cuadrante mágico de Gartner de Plataformas de Analítica avanzada 2014

Página –35–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Cuadrante mágico de Gartner de Plataformas de Analítica avanzada q Las plataformas de analítica avanzada siempre han sido

herramientas construídas para estadisticos y científicos de datos. Pero en su reporte más reciente Gartner observó que estas herramientas van “dirigidas cada vez más a analistas de negocios y ‘científicos de datos ciudadanos'”. Así, las clasificaciones de Gartner en sus bien conocidas categorías de “totalidad de visión” y “capacidad de ejecución” ahora se mueven tanto en “facilidad de uso” como en ofrecer numerosos y novedosos algoritmos analíticos.

Página –36–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Magic Quadrant para Plataformas de Analítica Avanzada

q No es sorpresa que el de este año esté encabezado por SAS, el líder perenne de esta categoría. Pero restando fuerza a las fortalezas de SAS, incluyendo “la pila [analítica] más amplia de la industria”, altas calificaciones de productos y “un alto nivel de lealtad de los clientes”, Gartner advirtió que la “complejidad de la curva de aprendizaje para los productos de SAS es una inquietud para usuarios no expertos”.

Página –37–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Cuadrante mágico de Gartner de Plataformas de Analítica avanzada q El cuadrante de “Líderes” de Gartner incluye a SAS, IBM,

Knime y RapidMiner por segundo año consecutivo. El mayor cambio en el cuadrante de “Visionarios” tiene a Microsoft, Alteryx y Alpine Data Labs ascendiendo puestos y a la derecha.

q La salida de Microsoft de la clasificación de “jugador de nicho” del 2014 está vinculada al lanzamiento del servicio Azure Machine Learning (Azure ML), que el proveedor hiciera el año pasado.

Página –38–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Cuadrante mágico de Gartner de Plataformas de Analítica avanzada q Aunque el servicio aún se encontraba en fase beta

durante la reseña de Gartner, Azure ML promete “una integración a fondo con R”, el popular lenguaje analítico predictivo, y “soluciones de un ecosistema completo de terceros” que dan soporte a Azure, según indicó Gartner. La firma de analistas no se vio impresionada con la actualización 2014 de Microsoft SQL Server Analysis Services que, como sus predecesores, carece de “amplitud, profundidad y facilidad de uso en comparación con soluciones de los Líderes”.

Página –39–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Cuadrante mágico de Gartner de Plataformas de Analítica avanzada q De acuerdo con el reporte, “Gartner define la analítica

avanzada como el análisis de todo tipo de datos usando métodos cuantitativos sofisticados (por ejemplo, estadística, minería de datos descriptivos y predictivos, simulación y optimización) para producir conocimientos que los enfoques tradicionales de inteligencia de negocio (BI) – como consultas y reportes – es poco probable que descubran”.

Página –40–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Cuadrante mágico de Gartner de Plataformas de Analítica avanzada q Recientes iniciativas de analítica avanzada de SAS

aprovechan dos tendencias entre los clientes: un creciente deseo por acercar la analítica a los datos, y una creciente mayor demanda de analítica avanzada que no requiera científicos de datos entrenados. Para abordar lo primero, SAS ha trasladado su procesamiento en la gran infraestructura de datos distribuidos de Hadoop para varios productos, incluyendo SAS Visual Analytics, y SAS In-Memory Statistics para Hadoop. Y a medida que la demanda de habilidades científicas de datos supera la oferta, las empresas buscan la analítica suficientemente simple para profesionales de negocios. Con interfaces altamente gráficas, de point-and-click, SAS Visual Analytics y SAS Visual Statistics abordan esta necesidad.

Página –41–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Definición de business intelligence y BA

q Inteligencia de negocios abarca una variedad de herramientas y métodos que pueden ayudar a las organizaciones para tomar mejores decisiones analizando sus datos.

q Analítica de datos cae bajo la influencia de BI Los big data si se utilizan con el propósito de analítica tambien caen bajo el paraguas de BI.

Página –42–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Business Analytics según SAP

q Business Analytics es “la práctica iterativa, la exploración metódica de datos en una empresa u organización con énfasis en el análisis estadístico…para la toma de decisiones basada en los datos“. Y luego definen a Business Intelligence como “las aplicaciones y tecnologías para la recolección, almacenamiento, análisis y acceso a los datos para ayudar a una empresa u organización a tomar mejores decisiones de negocios“.

q Business Analytics hace un uso extensivo de los datos, análisis estadístico, modelos explicativos y predictivos para impulsar la toma de decisiones. En cambio, Business Intelligence está más ligada a la generación de los datos e información para apoyar el mismo proceso

Página –43–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

BI versus BA q Business Intelligence q ¿Qué sucedió ? q ¿Cúando ? q ¿Quién ? q ¿Cuántos ?

q Business analytics q ¿Por qué sucedió ? q ¿Ocurrirá otra vez ? q ¿Qué pasaría si cambiamos X ? q ¿Qué otras cosas dicen los datos, que nunca se nos

ocurrió preguntar?

Página –44–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

BI versus BA q Son métodos y herramientas conectadas entre sí.

La BI proporciona un medio de “amasar” datos para encontrar información, principalmente, a traves de consultas y preguntas, informes y procesamiento analítico en línea.

q Mientras que la analítica de negocio toma ventaja de los datos estadísticos y cuantigativos para el modelado predicitivo y exploratorio.

q La situación actual es el volumen considerable de información no estructurada que exige herramientas de analítica diferentes.

Página –45–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

BUSINESS INTELLIGENCE versus BUSINESS ANALYTICS (Analytics)

q Business Analytics (Analytics) es un

subconjunto de BI basada en estadística, analítica predictiva y optimización.

q BA, proporciona la información necesaria

para tomar una actitud proactiva en la gestión del futuro de su negocio.

Página –46–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Analítica: tipos de de analítica

q  Analítica descriptiva ¿Qué ha pasado? q  Analítica de diagnóstico ¿porqué ha

sucedido, ocurrió? q  Analítica predictiva ¿qué sucederá? q  Analítica prescriptiva ¿Cómo podemos hace

qué suceda?

Página –47–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

BUSINESS INTELLIGENCE q  Business Intelligence se refiere al proceso de convertir datos

en conocimiento y conocimiento en acciones para crear la ventaja competitiva del negocio “. The Data Warehousing Institute

Página –48–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Componentes (Herramientas) de un sistema de BI… diferentes modelos

q Datawarehouse 2.0 (manipulación de datos no estructurados y almacenes de datos tradicionales)

q Business Inteligence 2.0 l Herramientas avanzadas de la Web l Web 2.0

ü Herramientas Web 2.0 y Web Semántica ü Herramientas colaborativas, Groupware y

Workflow,… l Manipulación de datos no estructurados l …

Página –49–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Componentes principales de BI

q Los componentes principales de un sistema de BI son:

q Data Warehouse (con los datos fuente) q Analítica de Negocios (colección de

herramientas para manipulación, minado y análisis de los datos en los almacenes de datos)

q Business Performance Management (BPM, monitorización y análisis del desempeño –rendimiento)

q Interfaz de usuario (tales como “dashboard”… tableros de mando o cuadros electrónicos)

Página –50–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Herramientas de BI q Reporting (KPIs, métricas) q Sistemas de Monitoreo/Alertas q Cuadros de Mando, tableros de control,

tableros de información (Dashboards) q Cuadros de mando integral,. Scorecards q OLAP (Cubos, Slice & Dice, Drilling) q Consultas Adhoc / Querys q Herramientas de visualización q Herramientas de descubimiento q …

Página –51–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

RETOS DE BI EN 2015 y ANALYTICS

q BI en la nube q BI móvil q Analítica predictiva q Analítica de sentimientos q Big data q BI social q BI colaborativo q BI “en memoria” y “NoSQL” q BI embebido … las apps de software como servicio

soportan cada días más funcionalidades de BI

Página –52–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Chapter 3 53

Proceso del ciclo de vida de los datos

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Página –54– Página –54–

Arquitectura de alto nivel de BI

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

ARQUITECTURA DE UN SISTEMA DE BI

Página –55–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

PROCESO ETL

Página –56–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

PROCESO ETL

Página –57–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Análisis multidimensional

Página –58–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Business analytics (minería de datos)

Página –59–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Página –60–

COMPONENTES DE UN SISTEMA DE BI

q DATA WAREHOUSING (Almacén de datos) l  Flujo de datos desde los sistemas operacionales (p.e. CRM, ERP)

a un DW que es una base de datos especial o depósito de datos que han sido preparados para aplicaciones de toma de decisiones, en el rango de informes y consultas simples (reporting y quering) a optimizaciones complejas

l  El DW se construye con metodologías, principalmente metadatos y ETL

l  Los data mars , son depósitos o repositorios de un tema específico o departamental (p.e. marketing)

l  Los almacenes de datos y sus variantes son el elemento fundamental de cualquier sistema de BI. Los DW incluyen datos actuales e históricos de modo que puedan ser utilizados para proporcionar apoyo a decisiones en tiempo real

Página –60–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

ESTRUCTURA Y COMPONENTES DE UN SISTEMA DE BI q ANALÍTICA DE NEGOCIOS (OLAP, online analytical

processing). Herramientas de software que permiten a los usuarios crear informes y consultas bajo demanda y gestionar análisis de datos.

q Existen muchas herramientas de software para los usuarios para crear bajo demanda, informes, consultas y análisis de datos. P.e. los usuarios pueden analizar diferentes dimensiones y tendencias de los datos.

q Los usuarios de negocios pueden utilizar herramientas de análisis de tendencias y gráficos para identificar el desempeño del negocio.

Página –61–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Página –62–

ESTRUCTURA Y COMPONENTES DE UN SISTEMA DE BI

q OLAP l  Los usuarios pueden analizar diferentes

dimensiones de datos multidimensionales, tales como series de tiempo y vistas de análisis de tendencias

l  Los usuarios pueden identificar tendencias de rendimientos o prestaciones

l Para manejar un BA (Analítica de negocios) se necesita software de interactividad que se denomina middleware para acceder al DW. Es considerado infraestructura y es una interfaz del usuario del sistema

Página –62–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

ESTRUCTURA Y COMPONENTES DE UN SISTEMA DE BI q Los usuarios finales pueden trabajar con una gran variedad

de herramientas y técnicas de BI: q Reporting y Queries. Informes estáticos y dinámicos, todos

los tipos de consultas, descubrimiento de información, vistas multidimensionales,…

q Analítica avanzada. Modelos estadísticos, financieros, matemáticos, … que se usan en el análisis de datos y de información.

q Minería datos, de texto y Web. La DM es el proceso de búsqueda de relaciones desconocidas o no evidentes, o información en grandes bases de datos y almacenes de datos, utilizando herramientas inteligentes, tales como computación neuronal o métodos estadísticos avanzados.

Página –63–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Página –64–

ESTRUCTURA Y COMPONENTES DE UN SISTEMA DE BI

q Minería de datos (data minig) l  Es una clase de análisis de información de una base de datos que

examina patrones ocultos en un grupo de datos que se pueden utilizar para predecir comportamientos futuros

l  El término se utiliza principalmente para describir el software que presenta datos de nuevas maneras ya que no sólo cambia la presentación sino que realmente descubre relaciones desconocidas con anterioridad entre los datos- Este conocimiento se aplica a conseguir objetivos específicos del negocio

l  Estas herramientas se utilizan para reemplazar la inteligencia humana explorando (minando) en grandes masas de datoss para descubrir nuevas correlaciones , patrones y tendencias utilizando tecnologías de reconocimiento de patrones y estadística avanzada

Página –64–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Página –65–

ESTRUCTURA Y COMPONENTES DE UN SISTEMA DE BI

q BPM (Business Performance Management) l  El componente se basa en la metodología de los cuadros de mando

integral (balanced scorecard) que es un marco de trabajo para definir, implementar y gestiona la estrategia de negocios de una empresa enlazando objetivos con medidas basadas en datos objetivos.

l  Es un método para enlazar métricas de alto nivel, tales como información financiera creada por el CFO (Chief Financial Officer).BPM utiliza reporting y queries del análisis de datos de BI.

l  El objetivo de BPM es optimizar el rendimiento o prestaciones (desempeño) globales de una organización

l  BPM incluye normalmente dashboards (tableros) que proporcionan una visión de las prestaciones corporativas con presentaciones gráficas, similares a los cuadros de mando de los automóviles

Página –65–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

ESTRUCTURA Y COMPONENTES DE UN SISTEMA DE BI q INTERFACES DE USUARIO: Tableros de mando

(dashboard) y otras herramientas de comunicación (broadcasting).

q Los cuadros o tableros de mando organizan y presentan información de un modo que sea más fácil de leer. Presenta medidas del desempeño corporativo (KPI, Key Performance Indicators) , tendencias y excepciones.

q Véase busineesobject.com. Se presentan gráficos, cartas, diagramas y tablas que muestrran el desempeño vreal vs métricas deseadas para visualizar el estado real de la organización. Otras herramientas son portales corporativos, herramientas de visualización,etc.

Página –66–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Componentes principales de BI q El entorno de almacenamiento de datos

(data warehousing) es, principalmente, responsabilidad de la plantilla técnica, mientras que el entorno analítico (también conocido como analítica de negocios) es el campo de los usuarios del negocio.

q Cualquier usuario se puede conectar al sistema vía una interfaz de usuario – p.e un navegador- y los directivos ejecutivos utilizan los componentes de BPM y tableros de mando (dashboard)

Página –67–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Interfaces de usuario q Los dashboards son interfaces de usuario

interactivo. Herramientas de visualización. Existen muchas herramientas de visualización que van en el rango desde presentaciones en cubos multidimensionales hasta herramientas de realidad virtual.

q Cuadros de mando (scorecards). Cuadros de mando integral (balanced scorecards)

q Tecnologías tales como GIS (Sistemas de Información Geográfica) se utilizan en visualización .

Página –68–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Los beneficios de los sistemas de BI

q Los directores, ejecutivos, …. (managers) necesitan la información correcta en el momento correcto y en el lugar correcto para trabajar de modo eficiente y más inteligente. Es el mantra de los enfoques modernos d BI.

q Los principales beneficios de BI residen en el hecho de proporcionar información precisa cuando se necesita, incluyendo una visión en tiempo real de los detalles del desempeño corporativo.

q Esta información es decisiva para todo tipo de decisiones, planificación estratégicos y la supervivencia de la empresa.

Página –69–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Valor del negocio de aplicaciones analíticas de BI (Teradata)

q Aplicaciones analíticas Segmentación de clientes Propensión para comprar Rentabilidad del cliente Detección de fraudes Desgaste/descontento de los clientes Optimización del canal

Página –70–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Valor del negocio de aplicaciones analíticas de BI (Teradata) q Temas importantes del negocio

l  ¿Qué segmentos de mercados pueden afectar negativamente a mis clientes y cuales son sus características?

l  ¿Qué clientes son más idóneos para responder a mi promoción?

l  ¿Cómo puedo detectar las transacciones propensas al fraude?

l  ¿Qué clientes corren el riesgo de abandonar nuestra empresa?

l  ¿Cuál es el mejor canal para llegara mis clientes en cada segment?

Página –71–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Valor del negocio de aplicaciones analíticas de BI (Teradata) q Valor de negocio

l Personalizar relaciones con los clientes para comprobar la satisfacción y retención del cliente

l  Incrementar la fidelidad del cliente. Incrementar rentabilidad de la campaña centrándose en aquellos clientes más propensos a comprar.

l Detectar fraudes y tomar acciones inmediatas para minimizar los costes.

l Prevenir pérdidas de clientes de alto valor y evitar también a los clientes de bajo valor

l  Interactuar con los clientes basados en sus preferencias y en la necesidad de gestionar costes

Página –72–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Beneficios importantes q Ahorro de tiempos q Mejorar las estrategias de negocios q Mejora en las tomas de decisiones tácticas q Más procesos eficientes q Ahorro de costes q Mejora de relaciones entre clientes y socios q Informes más precisos y más rápidos q Mejora en la toma de decisiones q Mejora en los servicios de clientes q Aumento de ingresos.

Página –73–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Herramientas y aplicaciones de BI

q Microsoft: q Power BI q Power Query q Power Pivot q Power Map

q IBM q IBM SPSS Modeler (técnicas de modelado predictivo/

modelado para la segmentación y perfilado con herramientas de IBM/pronósticos y tendencias )

Página –74–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Herramientas de Bi

q SAS q SAS Enterprise Miner (modelado predictivo) q Segmentación y perfilado q Reglas de asociación q Pronosticos y tendencias q Modelos automáticos y evaluación de modelos

Página –75–

76 76

Prof. Luis Joyanes Aguilar

UNIVERSIDAD TECNOLÓGICA DE PEREIRA Bases de datos NoSQL y en memoria (in-memory) Pereira, 21 agosto de 2015

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Categorías de bases de datos ƒ q  Distintos tipos de bases de datos, para distintos tipos de necesidades. q  Bases de datos transaccionales/relacionales: para almacenar

información crítica del negocio, con origen en las aplicaciones de siempre (CRM, ERP, sistemas legacy, …)

q NoSQL: para capturar de manera segura y escalable, grandes volúmenes de información continua generados por eventos.

q In-memory: Procesamiento completo en memoria máquina q  Analíticas: para permitir a múltiples usuarios contestar rápidamente

preguntas de negocio que requieran de grandes volúmenes de información.

q  Hadoop (HDFS & Hive): para almacenar y procesar grandes volúmenes de información estructurada o semi-estructurada.

q  Big Data

Página –77–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Bases de datos

q In-Memory (en-memoria) l SAP Hana l Oracle l IBM solidDB l Microsoft

q Relacional l  Sistemas RDBMS (SGBDR). Oracle, IBM, Microsoft… l  Transeferencia de datos entre Hadoop y bases de datos

relacionales

q Legacy (jerárquicas, en red… primeras relacionales…)

Página –78–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

BASES DE DATOS NoSQL, conceptos generales •  NoSQL – es un término utilizado para describir un

subconjunto de bases de datos que difiere de las bases de datos tradicionales (RDBMS). Entre otras: –  No tienen schemas, no permiten JOINs, no intentan

garantizar ACID y escalan horizontalmente

•  El término fue acuñado en 1998 por Carlo Strozzi y resucitado en 2009 por Eric Evans – El propio Evans sugiere mejor referirse a

esta familia de BBDD como de nueva generación, enfocadas a “Big Data”

Página –79–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

BASES DE DATOS NoSQL, conceptos generales q NoSQL – "not only SQL” – es una categoría

general de sistemas de gestión de bases de datos que difiere de modelo relacionales clásicos (RDBMS) en diferente aspectos: l  Estos datastores no requieren esquemas de

información fijas l  Evitan las operaciones JOIN y escalan horizontalmente

q De hecho, tanto las bases de datos NoSQL como las relacionales son tipos de Almacenamiento Estructurado

Página –80–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

BASES DE DATOS NoSQL, conceptos generales q La principal diferencia radica en cómo se

guardan los datos : l  En una RDBMS tendríamos que partir la información en

diferentes tablas y luego usar un lenguaje de programación en la parte servidor para transformar estos datos en objetos de la vida real.

l  En NoSQL, simplemente se guardan los datos: ü NoSQL es libre de schemas, no se diseñan las

tablas y su estructura por adelantado

q  NoSQL no es una herramienta universal l  Si los datos son relacionales, quedarse con la RDBMS sería

la opción correcta

Página –81–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

RDBMS vs. NoSQL q Las bases de datos relacionales tradicionales nos

permiten definir la estructura de un esquema que demanda reglas rígidas y garantizan ACID: l  Atomicity l  Consistency l  Isolation l  Durability

q Las aplicaciones web modernas presentan desafíos muy distintos a las que presentan los sistemas empresariales tradicionales (e.j. sistemas bancarios):

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

RDBMS vs. NoSQL

l Datos a escala web l Alta frecuencia de lecturas y escrituras l Cambios de esquema de datos frecuentes l Las aplicaciones sociales (no bancarias) no

necesitan el mismo nivel de ACID

q Algunas de las opciones de NoSQL actualmente disponibles son: Cassandra, MongoDB, Jackrabbit , CouchDB, BigTable y Dynamo

Página –83–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

¿Por qué necesitamos NoSQL? q Las BBDD relacionales ofrecen bajo

rendimiento ante ciertas aplicaciones intensivas de datos: l Indexación de un gran número de documentos l Servir páginas en sites de mucho tráfico l Envío de datos de streaming

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

¿Por qué necesitamos NoSQL?

q Las RDBMS están optimizadas para pequeñas pero frecuentes transacciones de lectura/escritura o largas transacciones con pocos acceso de escritura.

q NoSQL puede dar servicio a grandes cargas de lectura/escritura: l Digg mantiene 3 TB de green badges

(marcadores que indican las historias votadas por otros en una red social)

l  Facebook que tiene que realizar búsqueda en bandejas de mensajes de más de 50 TB

Página –85–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Arquitectura de las BBDD NoSQL q A menudo ofrecen sólo garantías de consistencia

débiles, como por ejemplo eventual consistency, o transacciones restringidas a elementos de datos simples

q Emplean una arquitectura distribuida, donde los datos se guardan de modo redundante en distintos servidores, a menudo usando tablas hash distribuidas

q Suelen ofrecer estructuras de datos sencillas como arrays asociativos o almacenes de pares clave-valor

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

¿Qué tipo de BBDD elijo? q Algunas respuestas pueden encontrarse en:

l  35+ Use Cases For Choosing Your Next NoSQL Database ü http://highscalability.com/blog/

2011/6/20/35-use-cases-for-choosing-your-next-nosql-database.html

l  Five Reasons to Use NoSQL ü http://facility9.com/2010/09/five-reasons-

to-use-nosql/

q Las más populares son: Cassandra, CouchDB, MongoDB, Riak, Neo4j

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

BASES DE DATOS RELACIONALES (RECORDATORIO) q La mayoría de las bases de datos cumplen con las

propiedades ACID (atomicity, consistency, isolation, durability). Estas propiedades garantizan un comportamiento de las base de datos relacionales y el mejor de los argumentos para su utilización.

Página –88–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

BASES DE DATOS RELACIONALES (ACID)

Página –89–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

NoSQL or not NoSQL? q  Los principales problemas de NoSQL son:

l  Su complejidad: ü  Instalación ü  Consultas (comprender bien MapReduce) ü  Los modelos de datos usados

l  Su falta de madurez

q  ¿Dónde usarlas? l  Datos sociales l  Procesado de datos (Hadoop) l  Búsqueda (Lucene) l  Caching (Memcache) l  Data Warehousing

q  ¿Qué problema quieres resolver? l  Transacciones l  Grandes volúmenes de datos (Exabytes) l  Estructura de los datos

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

BASES DE DATOS NoSQL

q Las bases de datos no-relacionales son comúnmente llamadas bases de datos NoSQL ya que la gran mayoría de ellas comparte el hecho de no utilizar el lenguaje SQL para realizar las consultas

q Es una definición controvertida, aunque la definición más aceptada es “Not only SQL”.

q Una de las características de las bases de datos no relacionales es que la mayoría de ellas no utilizan esquemas de datos rígidos como las bases de datos relacionales. Esto hace que estas bases de datos también se les llame “Schema-less” o “Schema-free (“almacenamiento des-estructurado”).

Página –91–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

TIPOS DE BBDD NoSQL q Tipos y clasificación de bases de datos NoSQL q Existen unos 150 tipos de bases de datos NoSQL con

diferente arquitectura de datos (basado en documento, en clave/valor, en objetos, en grafos, en columnas, etc). Entre las más conocidas destacan Cassandra, Hadoop, MongoDB, CouchDB o Redis. Gigantes como Oracle también disponen de una implementación NoSQL .

Página –92–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Taxonomía de Bases de datos NoSQL q Los principales tipos de BBDD de acuerdo con su

implementación son los siguientes:

q – Almacenes de Clave-Valor q – Almacenes de Familia de Columnas

(columnares) q – Almacenes de documentos (orientadas a

documentos) q – Almacenes de Grafos (orientadas a

grafos) q - Otras …Cachés de memoria

Página –93–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

TIPOS DE BBDD NoSQL

Página –94–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

TIPOS DE BBDD NoSQL

Página –95–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Integración con Big Data. FUENTE: datalytics.com

Página –96–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Integración con Big Data. FUENTE: datalytics.com

Página –97–

98 98

IINT

Prof. Luis Joyanes Aguilar

Analítica de datos (Analytics-Business Analytics)

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Analítica avanzada q Gartner defines advanced analytics as, "the analysis of all

kinds of data using sophisticated quantitative methods (for example, statistics, descriptive and predictive data mining, simulation and optimization) to produce insights that traditional approaches to business intelligence (BI) — such as query and reporting — are unlikely to discover."

Página –99–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

PROCESO DE ANALÍTICA

q Almacén y minería de datos q Considerado por muchas compañías como la fuente

primaria de su información estructurada, data warehouse es una colección de datos históricos, que incluyen la copia de las transacciones de datos específicamente estructurados para la consulta y el análisis. Tal como lo indica su nombre, es el almacén de los datos estructurados.

q Una vez que esa información está guardada y organizada en el data warehouse, se usa el data mining para explorarla y clasificarla, en busca de patrones

Página –100–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

PROCESO DE ANALÍTICA

q “Data mining es un conjunto de técnicas de extracción de datos, para detectar patrones de comportamiento a través de algoritmos matemáticos”,

q Adicionalmente, sobre la minería de datos se puede ejecutar un conjunto de técnicas para realizar análisis predictivos y de tendencias; este método se conoce como analítica de datos (data analytics).

Página –101–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

ANALÍTICA DE DATOS

q El Análisis de Datos (Data Analysis, o DA) es la ciencia que examina datos en bruto con el propósito de sacar conclusiones sobre la información.

q  El análisis de datos se usa en varias industrias para permitir que las compañías y las organizaciones tomen mejores decisiones empresariales y también es usado en las ciencias para verificar o reprobar modelos o teorías existentes.

q 

Página –102–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

ANALÍTICA DE DATOS

q El análisis de datos se usa para describirlo todo, desde el procesamiento analítico en línea (OLAP, por sus siglas en inglés) hasta el análisis CRM en centros de llamadas. Los bancos y las compañías de tarjetas de crédito, por ejemplo, analizan los retiros y los patrones de gasto para prevenir el fraude o robo de identidad. Las compañías de comercio electrónico (Ecommerce) examinan el tráfico en el sitio web o los patrones de navegación para determinar qué clientes son más o menos propensos a comprar un cierto producto o servicio, basándose en compras previas o patrones de visualización.

Página –103–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

ANALÍTICA DE DATOS

q El análisis de datos moderno normalmente usa tableros de información que se basan en flujos de datos en tiempo real. El llamado análisis en tiempo real implica análisis e informes dinámicos basados en los datos que introducidos en un sistema un minuto antes del tiempo actual de uso.

q El análisis de 'grandes datos' es el proceso de examinar grandes cantidades de datos de una variedad de tipos (big data) para descubrir patrones ocultos, correlaciones desconocidas y otra información útil. Tal información puede proporcionar ventajas competitivas a través de organizaciones rivales y resultar en beneficios para el negocio, tales como el marketing más efectivo y mayores ingresos.

Página –104–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

ANALÍTICA DE DATOS

q El objetivo principal del análisis de datos grandes es ayudar a las empresas a tomar mejores decisiones de negocios al permitir a los científicos y otros usuarios de datos analizar grandes volúmenes de datos transaccionales, así como otras fuentes de datos que puedan haber quedado sin explotar por la inteligencia de negocio convencional (BI) programas.

q Estas fuentes de datos pueden incluir registros del servidor web y datos de seguimiento de clics en internet, informes de actividades sociales, medios de comunicación, teléfonos móviles registros detallados de llamadas y la información captada por los sensores.

Página –105–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

ANALÍTICA DE DATOS

q What Is Data Analytics? q Data analytics (DA) involves processes and activities

designed to obtain and evaluate data to extract useful information. The results of DA may be used to identify areas of key risk, fraud, errors or misuse; improve business efficiencies; verify process effectiveness; and influence business decisions.

q There are many issues to consider when starting a new DA program, including maximizing the return on investment (ROI), complying with project budgets, managing false positives, and ensuring the protection and confidentiality of the source data and results.

Página –106–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

ANÁLISIS DE DATOS MULTIDIMENSIONAL

q Una vez que los datos han sido capturados y organizados en data warehouses y data marts, se quedan disponibles para análisis futuros utilizando herramientas de inteligencia de negocios

q Las herramientas de inteligencia de negocios incluyen software para consulta y reportes (informes) en bases de datos, herramientas para análisis de datos multidimensional (procesamiento analítico en línea) y herramientas para minería de datos.

Página –107–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

PANEL DE INTELIGENCIA DE NEGOCIOS

q Un panel de BI es una herramienta de visualización de datos que muestra el estado actual de las métricas e indicadores claves de rendimiento (KPIs) para una empresa. Los paneles consolidan y ordenan números, métricas y a veces hasta marcadores de rendimiento en una sola pantalla. Pueden ser hechos para una función específica y mostrar las mediciones que se desean mostrar para un solo punto de vista o departamento. La característica esencial de un panel de BI es que el producto incluye una interfaz personalizable y la habilidad de extraer datos en tiempo real de múltiples fuentes.

Página –108–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

PANEL DE INTELIGENCIA DE NEGOCIOS

q Oracle y Microsoft están entre los proveedores de paneles de inteligencia empresarial. Los paneles de BI pueden también ser creados por otras aplicaciones empresariales, como Excel. Los paneles de BI son llamados también a veces paneles empresariales.

q El análisis de datos no es algo nuevo. Desde hace años, las empresas tratan de aprovechar la información que reciben de sus usuarios, canales, proveedores, etc. con el fin de tomar mejores decisiones de negocios. Sin embargo, la cantidad, calidad, formato y fuentes de la información se han ido transformando en los últimos años, y las herramientas para analizarla se han ido adaptando a estos cambios.

Página –109–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

BI vs BAD Difference between ‘Business Intelligence’ and ‘Business

Analytics’ and not many in the industry understand that.

Monitoring and tracking metrics/KPIs in the form of reports/dashboards is ‘Business Intelligence’, but making meaningful sense of these metrics, co-relating them with

other factors that influence them, understanding the trends and using statistical algorithms to predict

outcomes is where the bang for the buck is…and that is ‘Business Analytics’

By - smartdatacollective.com

Página –110–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Intelligence vs. Analytics Traditional BI

ü Standard reports and dashboards ü Ad hoc reports – Current performance ü Query Drill down ü Cube analysis – Slice and dice ü Alerts Vs.

Business Analytics ü Statistical Analysis ü Forecasting ü Predictive modeling ü Optimization

Página –111–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Analytics

Página –112–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Inteligencia de negocio analítica Analytics (Business Analytics). It uses algorithms to search for patterns and explanations. It looks at historical data to predict future activity for better business decision making. “Organisations using analytics are more than twice as likely to substantially outperform their competitive peers” MIT Sloan Management report and IBM Institute for Business Value (http://sloanreview.mit.edu/reports/analytics-advantage/).  n  The three biggest trends surrounding analytics the industry is

likely to see are: Optimisation—the combination of business rules for optimised decision management; consumable analytics—the visual presentation of increasingly complex data; and new data analytics—the analysis of new types of data, such as social media, location information, etc.

q  http://www.cio.com.au/article/421700/top_six_bi_trends_2012/

Página –113–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Inteligencia de negocio analítica

Analytics (Business Analytics) q El análisis descriptivo responde a las preguntas

¿qué pasó y por qué sucedió?

q El análisis predictivo responde a la pregunta ¿qué va a pasar?.

q Análisis perceptivo responde a la pregunta ¿por qué va a pasar? q Sugiere opciones de decisión acerca de la manera

de aprovechar una oportunidad de futuro o mitigar un riesgo futuro y muestra las consecuencias de cada decisión.

Página –114–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Inteligencia de negocio analítica

Analytics (Business Analytics)  El análisis predictivo responde a la pregunta ¿qué va a pasar?. Centraremos en el “análisis predictivo” los próximos temas

Página –115–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Inteligencia de negocio analítica

Una solución de Inteligencia de Negocio completa permite: 1.  Observar: ¿qué está ocurriendo? 2.  Comprender: ¿por qué ocurre?

3.  Predecir: ¿qué ocurriría?

4.  Colaborar: ¿qué debería hacer el equipo?

5.  Decidir: ¿qué camino se debe seguir? Las soluciones actuales integran múltiples tecnologías

Página –116–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

ANALÍTICA DE NEGOCIOS (Analytics)

q Analítica descriptiva (Descriptive analytics): Logra un profundo conocimiento a partir de datos históricos con informes, cuadros de mando, agrupación, etc.

q Analítica predictiva (Predictive analytics): Diseño y uso de modelos predictivos a partir de técnicas de aprendizaje automática/minería de datos.

q Analítica prescriptiva/perceptiva (Prescriptive analytics): Sugiere opciones de decisión acerca de la manera de aprovechar una oportunidad de futuro o mitigar un riesgo futuro y muestra las consecuencias de cada decisión.

q Analítica de diagnóstico (de descubrimiento). ¿Porqué ha sucedido?

Página –117–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Business Analytics (Analytics)

q Es un término comercial, definido por diferentes proveedores de soluciones de inteligencia de negocios y de sistemas de información para referirse a las herramientas y técnicas para analizar y entender los datos.

q Se compone de herramientas de procesamiento analítico en línea (OLAP), herramientas estadísticas, minería de datos, etc.

q La analítica de negocios implica el uso de modelos y datos para mejora el desempeño de una organización o su posición competitiva. En analítica de negocios el foco está en el uso de modelos incluso aunque estén profundamente internos al sistemas.

Página –118–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Business Analytics (Analytics)

q Los modelos analíticos se utilizan para realizar análisis de datos. Incluyen modelos estadísticos, modelos de gestión científica, algoritmos de minería de datos, modelos financieros, etc.

q A veces se integran con otros modelos, tales como modelos de planificación estratégica.

q Los modelos de analítica de negocios (incluyendo analítica predictiva) abarcar numerosos modelos analíticos.

Página –119–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Business Analytics (Analytics)

q Se necesita entender no solo QUÉ está pasando, sino CUÁNDO, DÓNDE, QUIÉN Y PORQUÉ.

q Solución a los requerimientos de información con OPORTUNIDAD

q Escalar, contribuir y compartir a todos los tipos de usuarios en la organización

q Se necesita información y conocimiento a partir de

los datos de la empresa.

Página –120–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

ANALÍTICA DE DATOS (Analytics)

q El análisis descriptivo responde a las preguntas ¿qué pasó y por qué sucedió?

q El análisis predictivo responde a la pregunta ¿qué va a pasar?.

q Análisis perceptivo responde a la pregunta ¿por qué va a pasar? Sugiere opciones de decisión acerca de la manera de aprovechar una oportunidad de futuro o mitigar un riesgo futuro y muestra las consecuencias de cada decisión

Página –121–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Analítica predictiva q El término analítica predictiva describe el método de

analítica de negocios de predicción o previsión de problemas y oportunidades en lugar de simplemente de emitir informes (reportes) a medida que se producen.

q La analítica predictiva utiliza predicciones avanzadas y modelos de simulación.

q Forecasting (predicción) es la predicción del futro. Esta forma de analítica predictiva es esencial para la construcción y manipulación de modelos, ya que cuando una decisión se implementa los resultados normalmente ocurren en el futuro

Página –122–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Analítica predictiva

q La analítica predictiva utiliza técnicas de minería de datos, datos históricos y suposiciones sobre futuras condiciones para predecir resultados de eventos, tales como la probabilidad de que un cliente responderá a una oferta o compra de un producto específico.

Página –123–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Analítica en memoria (big data)

q In-memory Analytics Las herramientas de “analítica en memoria” permiten la consulta y el análisis de los datos desde la RAM del computador, lo que se traduce en una simple y rápida exploración de datos y aplicaciones analíticas (no se utiliza el almacenamiento físico en disco).

Página –124–

125 125

Prof. Luis Joyanes Aguilar

UNIVERSIDAD TECNOLÓGICA DE PEREIRA Analítica social Pereira, 21 agosto de 2015

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Problemas en la medición social q 1. Medición externa.

q En analítica web estamos acostumbrados a medir y analizar los datos que obtenemos de nuestro sitio web, sin embargo cuando hablamos de medición social, la medición se produce en plataformas de terceros y dependemos de la información que éstos nos faciliten. En muchos casos implementar la huella de herramientas de analítica web no está permitido o no es materialmente posible (por ejemplo el caso de Twitter) o imposible (como ocurre en el caso de foros o blogs de terceros).

Página –126–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Problemas en la medición social

q 2.Dispersión de la información. q Hablamos de plataformas diferentes, donde nos

encontramos con métricas diferentes y en las que los contenidos generados por los usuarios tienen un formato diferente y por tanto no se cuantifican de la misma forma. No podemos decir que un “RT” en Twitter sea lo mismo que un “share” en Facebook y que un “repin” en Pinterest… ¿O sí? Es común ver que muchas veces por hacer el dato más manejable se asume que son lo mismo.

Página –127–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Problemas en la medición social q 3. Dependemos de la semántica. q La tecnología usada por la mayoría de herramientas está

basada en la indexación de palabras claves, por lo que encontramos limitaciones en la identificación de subjetividades en el lenguaje como la ironía o los dobles sentidos. En general, las herramientas que identifican el sentimiento entenderían un gracias, como el del tweet de ejemplo, como positivo, cuando realmente podría significar todo lo contrario.

Página –128–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Problemas en la medición social q 4.Fuera de control. q Las personas son las que tienen la última palabra y serán

ellas las que decidan dónde, cuándo y de qué manera se crean o se comparten los contenidos. Al final, aunque a nosotros nos resulte más fácil medir la actividad en el blog, y por mucho que queramos concentrar ahí nuestra comunidad, si ésta prefiere volcar sus opiniones en Facebook o en cualquier otro foro, tendremos que adaptarnos a esa plataforma, tanto en relación a la información que nos proporcione como de los mecanismos para poder disponer de ella.

Página –129–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Problemas en la medición social q Algunas de estas plataformas cuentan con API abierta,

por lo que no sólo dependemos de la información que pongan a disposición nuestra, sino también de las condiciones de uso de esta. Un ejemplo de ello lo hemos tenido recientemente con Twitter, quien siempre ha puesto a disposición de desarrolladores su API, sin embargo, los términos de uso de esta han ido pasando de menos o más restrictivos con el paso del tiempo.

Página –130–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Problemas en la medición social q 5.Falta de estandarización. q Aunque existen tímidos intentos (como la Teoría de las

4Rs del IAB) por la estandarización de métricas e insights, lo cierto es que todavía no existe unanimidad en el sector. De la misma forma que cuando hablamos en el ámbito de la medición web de la métrica visitas, se entiende de forma general el concepto al que se hace referencia, a pesar de que existan diferencias en la medición dependiendo de con qué herramienta se realice, no ocurre lo mismo cuando hablamos de alcance en medios sociales. Por ejemplo, el alcance tal como lo entiende Facebook no es el mismo que podríamos calcular en Twitter, en un blog o en un foro.

Página –131–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

¿Qué es Social Analytics? q Definition - What does Social Media Analytics

(SMA) mean? q Social media analytics (SMA) refers to the approach of

collecting data from social media sites and blogs and evaluating that data to make business decisions. This process goes beyond the usual monitoring or a basic analysis of retweets or "likes" to develop an in-depth idea of the social consumer

q Social media is a good medium to understand real-time consumer choices, intentions and sentiments. The most prevalent application of social media analytics is to get to know the customer base on a more emotional level to help better target customer service and marketing.

Página –132–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

¿Qué es Social Analytics?

q Analytics is a powerful tool for discovering customer sentiment from millions of online sources. Businesses are using the power of social media to gain a better understanding of their markets

Página –133–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

¿Qué es Social Analytics?

q Social media analytics* q Measuring + Analyzing + Interpreting

interactions and associations between people, topics and ideas. Social media analytics is a powerful tool for uncovering customer sentiment dispersed across countless online sources. The analytics allow marketers to identify sentiment and identify trends in order to accommodate the customer better

q *Wikipedia

Página –134–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Analítica Social

q Fases del proceso de Analítica Social de empresas de Social Media (Social Business):

q Descubrir q Analizar q Participar q Facilitar q Gestionar

Página –135–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Analítica Social (Social Analytics) q Es la disciplina que ayuda a las compañías a

analizar, calcular y explicar el rendimiento de las iniciativas de Social Media (Medios sociales) en el contexto de objetivos empresariales específicos.

q El análisis social es un método para que las empresas entiendan los efectos de sus esfuerzos en Social Media.

q El análisis social (es una disciplina empresarial) le capacita con datos necesarias para tomar decisiones fundadas.

Página –136–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Analítica Social (Social Analytics) q Las tecnologías de análisis para Social Media cambian y evoluciona rápidamente. Asegúrese de desarrollar los requisitos empresariales clave y de tomarse su tiempo para encontrar proveedores que cumplan sus necesidades, porque cambiar de proveedor puede resultar costos

q Las métricas para Social Media deben tener significado que se revelará presentando las métricas en el contexto de lo que representan y de lo que significan para su organización.

Página –137–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Analítica Social (Social Analytics) q Tipos de métricas importantes para el éxito

de cualquier programa de análisis.

q Métricas fundamentales q Métricas de valor empresarial q Métricas de resultados (PKI) q Métricas de recuento

Página –138–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

SOCIALIZAR LA EMPRESA

q Incorporar los Social Media a la empresa de forma global.

q Las inversiones en 2011-2012 y siguientes han ido creciendo y seguirán creciendo.

q Las personas que gestionan los Medios Sociales necesitan buscar proactivamente y hablar con los departamentos de recursos humanos y los equipos de servicio al cliente cpra que tengan lugar las conexiones

Página –139–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

SOCIALIZAR LA EMPRESA

q Los pasos para la socialización de la empresa son:

q Escuchar q Colaborar q Comprometerse q Facilitar q Aprender q Se requieren métricas que signifiquen

algo para la empresa.

Página –140–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

SOCIALIZAR LA EMPRESA q Métricas de Social media idóneas para

directivos. q Ingresos. Los esfuerzos de Social Media realizados

tienen impactos en los ingresos y el balance final de su organización. Los analistas deben identificar actividades que logren ingresos. Hacer un cuadro de actividades para Social Media

q Participación en el mercado. Evaluar la oportunidad en el mercado. Considerar la inteligencia competitiva.

q Satisfacción. Conseguir que los clientes estén satisfechos.. Conseguir un índice de satisfacción.

Página –141–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Tecnologías de Medios Sociales q Herramientas de descubrimiento (búsqueda social). Casos

de Bing y Google. Casos de buscadores Facebook y Twitter

q Tecnologías de análisis (analítica social). Analíticas social es la disciplina que ayuda a las compañías a medir, evaluar y explicar el resultado de las iniciativas sociales en el contexto de objetivos específicos del negocio.

q Plataformas de participación (participación/flujo de trabajo)

q Herramientas de alojamiento y facilitación (plataformas sociales)

q Soluciones de gestión social q TECNOLOGÍAS A UTILIZAR

Página –142–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Tecnologías de Medios Sociales

q Elección del proveedor de analítica social l  Configurar la herramienta de analítica social l  Trabajar con métricas l  Utilizar filtros de análisis l  Utilizar las funciones más importantes l  Introducir y extraer datos de las herramientas l  Evaluar las necesidades l  Seleccionar un proveedor de analítica social: trucos y consejos l  Solicitar una demostración l  Considerar la configuración, la formación y la asistencia l  Formular las preguntas adecuadas l  Consideraciones a largo plazo

Página –143–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Análisis del tráfico de redes sociales

q Análisis de la actividad en Facebook. En Google Analytics no se puede registrar la actividad que se produce dentro de la página de Facebook de la empresa u organización, sin embargo, esta rede social incluye una sección de estadísticas (Me gusta, alcance, personas hablando de e…) que son de gran ayuda.

q Los datos son generales, no se pueden segmentar y el periodo de tiempo a analizar no puede exceder de 89 días

q Las estadísticas proporcionan información sobre:

Página –144–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Análisis del tráfico de redes sociales

q Perfil de los visitantes o usuarios a los que se ha llegado: sexo, edad, país, ciudad e idioma.

q Procedencia de las visitas q Frecuencia de las visitas q Visitas q Visitantes únicos q Alcance o usuarios a los que se llega q Número de interacciones de los usuarios

Página –145–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

MÉTRICAS DE SOCIAL MEDIA PARA líderes empresariales, DEPARTAMENTOS LEGALES Y PERSONAL de RR. HH.

Métricas para ejecutivos Impacto de ingresos Participación en el mercado Satisfacción

Métricas para abogados Métricas para profesionales de recursos humanos:

Infracciones de la política; Avisos de conducta; reclutamiento social

Página –146–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

MÉTRICAS PARA SOCIAL MEDIA, Ventas, Servicios, CRM Social

q Métricas para ventas l Referencias sociales l Clientes potenciales sociales l Coste por cliente potencial social l Porcentaje de clientes potenciales cualificados l Porcentaje de clientes potenciales cerrados l Cliente potencial para contactos cercanos l Valor del cliente social l Porcentaje de ganancia social

Página –147–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

MÉTRICAS PARA SOCIAL MEDIA, Ventas, Servicios, CRM Social

q Métricas para servicio al cliente l Consultas sociales l Consultas por categoría l Tasa de resolución l Tiempo de resolución l Porcentaje de clientes satisfechos l Ingresos por consulta de servicio l Ahorro de coste por consulta l Tasa de renovación por clientes sociales

Página –148–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

MÉTRICAS PARA CRM Social q Clientes de porcentaje social q Canales más eficaces q Tasa de respuesta de campaña de CRM q Tasa de conversión de campaña de CRM q Defensores activos q Influencia de defensores q Impacto de defensores q Intensidad de la lealtad q Valor del cliente por segmento q Valor de la vida del cliente social

Página –149–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

MÉTRICAS PARA RELACIONES PÚBLICAS Y PARA MARKETING

q Menciones sociales q Participación de una marca en el mercado q Alcance de la conversión q Citas de prensa influyentes q Citas de prensa perjudiciales q Tiempo de repuesta de desastre de RP q Porcentaje de recuperación de desastre q Menciones de la persona de influencia q Clientes potenciales / referencias de RP q ------------- q Visibilidad, conciencia de marca, efectividad de la campaña,

opinión de la marca, etc.

Página –150–

151 151

Prof. Luis Joyanes Aguilar

UNIVERSIDAD TECNOLÓGICA DE PEREIRA lenguaje R Pereira, 21 agosto de 2015

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

REFERENCIAS DE R*

1. Garderener, Mark. The Statical Programming Language. Wiley/Wrox, 2012.

2.  Toomey, Dam. R for Data Science, Birmingham: Packt Publishing, 2015 (diciembre 2014)

3.  Prajapati, Vignesh. Big Data Analytic with R y Hadoop. Birmingham: Packt Publishing, 2013.

4. Gerrard, Paul y Radia, Johnson. Mastering Scientifc Computing. Birmingham: Packt Publishing, 2015.

Página –152–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Ranking IEEE. The 2015 Top Ten, julio 2015

Programming Languages

Página –153–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Lenguaje R*

q R is more than just a computer program; it is a statistical programming environment and language.

q R is free and open source and is therefore available to everyone with a computer. It is very powerful and flexible, but it is also unlike most of the computer programs you are likely used to. You have to type commands directly into the program to make it work for you. Because of this, and its complexity, R can be hard to get a grip on.

q Es intérprete-interpretado

Página –154–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

INSTALACIÓN DE R 1.  INSTALACIÓN DE R www.r-project.org /clic en CRAN mirror (selección SO)… Ayuda, tutoriales… http://cran.r-project.org. http:// cran.r-project.org, click on Download R for Linux, and then click on ubuntu to get the most up-to-date instructions to install R on Ubuntu. To install R on Windows, click on Download R for Windows, and then click on base for the download link and installation instructions. For Mac OS users, click on Download R for (Mac) OS X for the download links and installation instructions. Página –155–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

INSTALACIÓN DE RStudio q To download RStudio, which is an

integrated development environment that provides a powerful user interface that makes learning R easier and fun. The main limitation of RStudio is that it has difficulty loading very large datasets.

Página –156–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

INSTALACIÓN DE RStudio You may also want to download RStudio, which is an integrated development environment that provides a powerful user interface that makes learning R easier and fun. The main limitation of RStudio is that it has difficulty loading very large datasets. 5. INSTALACIÓN DE RStudio www.rstudio.com/ide/download/desktop RStudio is a set of integrated tools designed to help you be more productive with R. It includes a console, syntax-highlighting editor that supports direct code execution, as well as tools for plotting, history, debugging and workspace management

Página –157–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Lenguaje R*

q R is more than just a program that does statistics. It is a sophisticated computer language and environment for statistical computing and graphics. R is available from the R-Project for Statistical Computing website

q  (www.r-project.org), and following is some of its introductory material

Página –158–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Lenguaje R* q R is an open-source (GPL) statistical environment modeled

after S and S-Plus. The S language was developed in the late 1980s at AT&T labs. The R project was started by Robert Gentleman and Ross Ihaka (hence the name, R) of the Statistics Department of the University of Auckland in 1995.

q It has quickly gained a widespread audience. It is currently maintained by the R core-development team, a hard-working, international team of volunteer developers. The R project webpage is the main site for information on R. At this site are directions for obtaining the software, accompanying packages, and other sources of documentation.

Página –159–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Lenguaje R*

q R is a powerful statistical program but it is first and foremost a programming language.

q Many routines have been written for R by people all over the world and made freely available from the R project website as “packages.”

q However, the basic installation (for Linux, Windows or Mac) contains a powerful set of tools for most purposes.

Página –160–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Lenguaje R*

q Because R is a computer language, it functions slightly differently from most of the programs that users are familiar with. You have to type in commands, which are evaluated by the program and then executed.

Página –161–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Lenguaje R*

q R can deal with a huge variety of mathematical and statistical tasks, and many users find that the basic installation of the program does everything they need.

q  However, many specialized routines have been written by other users and these libraries of additional tools are available from the R web- site. If you need to undertake a particular type of analysis, there is a very good chance that someone before you also wanted to do that very thing and has written a package that you can download to allow you to do it.

Página –162–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Lenguaje R*

q R is open source, which means that it is continually being reviewed and improved. R runs on most computers—installations are available for Windows, Macintosh, and Linux. It also has good interoperability, so if you work on one computer and switch to another you can take your work with you.

q R handles complex statistical approaches as easily as more simple ones. Therefore once you know the basics of the R language, you can tackle complex analyses as easily as simple ones (as usual it is the interpretation of results that can be the really hard bit).

Página –163–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Lenguaje R*

q R is an open source software package to perform statistical analysis on data. R is a programming language used by data scientist statisticians and others who need to make statistical analysis of data and glean key insights from data using mechanisms, such as regression, clustering, classification, and text analysis.

q R is registered under GNU (General Public License). It was developed by Ross Ihaka and Robert Gentleman at the University of Auckland, New Zealand, which is currently handled by the R Development Core Team. It can be considered as a different implementation of S, developed by Johan Chambers at Bell Labs. There are some important differences, but a lot of the code written in S can be unaltered using the R interpreter engine.

Página –164–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Lenguaje R* q  R provides a wide variety of statistical, machine learning (linear and

nonlinear modeling, classic statistical tests, time-series analysis, classification, clustering) and graphical techniques, and is highly extensible. R has various built-in as well as extended functions for statistical, machine learning, and visualization tasks such as:

q Data extraction q Data cleaning q Data loading q Data transformation q Statistical analysis q Predictive modeling q Data visualization

Página –165–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Lenguaje R*

q R is one of the most popular open source statistical analysis packages available on the market today.

q It is crossplatform, has a very wide community support, and a large and ever-growing user community who are adding new packages every day. With its growing list of packages, R can now connect with other data stores, such as MySQL, SQLite, MongoDB, and Hadoop for data storage activities.

Página –166–

167 167

Prof. Luis Joyanes Aguilar

UNIVERSIDAD TECNOLÓGICA DE PEREIRA BIBLIOGRAFÍA y REFERENCIAS Pereira, 21 agosto de 2015

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

COMPUTACIÓN EN LA NUBE (JOYANES)

Página –168–

169 169

ESTADO DEL ARTE DE CLOUD COMPUTING

Prof. Luis Joyanes Aguilar

COMPUTACIÓN EN LA NUBE La nueva era de la computación

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Página –170–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

BIG DATA (JOYANES)

Página –171–

172

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Página –173– Página –173–

BIBLIOGRAFÍA BÁSICA

q JOYANES, Luis (2014). Curso de Inteligencia de negocios. Campus virtual UPSAM, Madrid.

q JOYANES, Luis (2015). Inteligencia de negocios. Un enfoque móvil, en la nube y en big data. Barcelona: Marcombo; México DF: Alfaomega

q TURBAN, Efraim, SHARDA, Ramesh, DELEN, Dursun Decision Support and Business Intelligence Systems. Ninth edition. New Jersey: Pearson/Prentice-Hall

q JOYANES, Luis (2013). Big Data. El análisis de los grandes volúmenes de datos. Barcelona: Marcombo; México DF: Alfaomega.

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

REFERENCIAS DE R*

1.  Garderener, Mark. The Statical Programming Language. Wiley/Wrox, 2012.

2.  Toomey, Dam. R for Data Science, Birmingham: Packt Publishing, 2015 (diciembre 2014)

3.  Prajapati, Vignesh. Big Data Analytic with R y Hadoop. Birmingham: Packt Publishing, 2013.

4.  Gerrard, Paul y Radia, Johnson. Mastering Scientifc Computing. Birmingham: Packt Publishing, 2013.

Página –174–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

REFERENCIAS WEB

q Mobile  BI  is  on  the  move.    h#p://www.informa0on-­‐management.com/news/mobile-­‐bi-­‐infrastructure-­‐data-­‐quality-­‐adop0on-­‐cio-­‐gartner-­‐10022807-­‐1.html    q LITEBI:  Business  Intelligence  in  the  Cloud.    http://www.youtube.com/watch?v=5hxtZsyx_6w

q La  inteligencia  de  negocio  y  su  potencial  en  Redes  Sociales    http://www.youtube.com/watch?v=yAgJjcVEwlo

q Observatorio  de  Redes  Sociales  2012.    http://tcanalysis.com/blog/posts/infografia-4-c2-aa-oleada-observatorio-de-redes-sociales q  Informe de Gartner sobre Big Data (Gartner 2013) http://www.gartner.com/technology/topics/big-data.jsp q   

Página –175–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Referencias Web

q Teradata.com q Datawarehouse.com q Bitpipe.com q Teradatauniversitynetwork.com q www.wiley.com/college/turban q www.teradatastudentnerwork.com q Teradata Magazine, Volume 6, number 2 q DM Review q MIS Quaterly q Journal of Data Warehousing q IBM Systems Journal

Página –176–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Directorio de BI

q Business Intelligence Product Directory http://media.techtarget.com/searchDataManagement/downloads/SDMBIDirectory2009.pdf

q The Data Warehousing Institute www.tdwi.org

q Teradata University Network www.teradata.universitynetwork.com

q Bex Systems (bez.com) q IT Tiilbox Business Intelligence Knowledge Base

(businessintelligence.itttoolbox.com)

Página –177–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Directorio de BI

q Datawarehousing.com (datawarehusing.com) q Business Intelligence and Data Warehousing

Insight Portal) (datawarehousingonline.com) q DM Review (demreview.com) q DSS Resources (dssresources.com) q AISWorldNet (isworld.com) q Teradata Magazine (teradatamagazine.com) q Teradata University Network

(teradatastudentnetwork)

Página –178–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Página –179– Página –179–

Recursos académicos

q The Teradata University Network (TUN) Connection l  teradataybuniversitynetwork.com

q Página web de Efraim Turban l  prenhall.com/turban

q Harvard Business School Case Collection l  hbsp.harvard.edu/b01/en/academic/

edu_home.jhtml

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Página –180– Página –180–

Revistas y periódicos

q Decision Support Systems q CIO Insight (cioinsight.com) q Technology Evaluation (technologyevaluation.com) q Baseline Magazine (baselinemag.com) q Business Intelligence Journal (tdwi.org) q Advisor (advisor.com) q Oracle Magazine (oracle.com) q IBM Systems Journal (ibm.com) q Intelligence Enterprise (intelligenceenterprise.com) q Business 2.0 (business20.com)

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Periódicos y revistas

q CIO (cio.com) ; CIO Insights (cioinsights.com) q Computerworld (computerworld.com) q Decision Support Systems (elservier.com) q eWeek (eweek.com); InforWeek (iinfoweek.com) q InfoWorld (infoworld.com)

Internet Week (internetweek.com) q Management Information Systems Quaterly (MIS Quaterly)

(misq.org). q Technology Evaluation (technologyevaluation.com) q Intelligent Enterprise (intelligententerpise.com) q AIIM (takingaiim.com)

Página –181–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

REFERENCIAS WEB

q Mobile  BI  is  on  the  move.    h#p://www.informa0on-­‐management.com/news/mobile-­‐bi-­‐infrastructure-­‐data-­‐quality-­‐adop0on-­‐cio-­‐gartner-­‐10022807-­‐1.html    q LITEBI:  Business  Intelligence  in  the  Cloud.    h#p://www.youtube.com/watch?v=5hxtZsyx_6w    

q La  inteligencia  de  negocio  y  su  potencial  en  Redes  Sociales    h#p://www.youtube.com/watch?v=yAgJjcVEwlo    

q Observatorio  de  Redes  Sociales  2012.    h#p://tcanalysis.com/blog/posts/infografia-­‐4-­‐c2-­‐aa-­‐oleada-­‐observatorio-­‐de-­‐redes-­‐sociales    

Página –182–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Página –183– Página –183–

BIBLIOGRAFÍA BÁSICA

q JOYANES, Luis (2014). Curso de Inteligencia de negocios. Campus virtual UPSAM, Madrid.

q JOYANES, Luis (2015). Inteligencia de negocios. Un enfoque móvil, en la nube, big data e Internet de las cosas. Barcelona: Marcombo; México DF: Alfaomega

q TURBAN, Efraim, SHARDA, Ramesh, DELEN, Dursun Decision Support and Business Intelligence Systems. Ninth edition. New Jersey: Pearson/Prentice-Hall

q JOYANES, Luis (2013). Big Data. El análisis de los grandes volúmenes de datos. Barcelona: Marcombo; México DF: Alfaomega.

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Página –184–

MUCHAS GRACIAS Portal tecnológico y de conocimiento

(Ed.McGraw-Hill) www.mhe.es/joyanes

www.joyanes.es [email protected] /.es

www.alfaomega.com.mx @luisjoyanes

www.facebook.com/joyanesluis gissic.wordpress.com

UNIVERSIDAD PONTIFICIA DE SALAMANCA

185 185

Prof. Luis Joyanes Aguilar

UNIVERSIDAD TECNOLÓGICA DE PEREIRA Apéndice Herramientas de analítica social Pereira, 21 agosto de 2015

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Herramientas de analítica social

q Análisis de la competencia y oportunidades. q Google Trends q Google Insights for Search q DoubleClick Ad Planner q Compete q Reputación online q SocialMention q Brandwatch q Radian6 q UberVU q Google Alerts

Página –186–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Herramientas de analítica social

q Twitter q TweetReach q TwitterCounter q Klout q SocialBro q Twitalyzer

Página –187–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Herramientas de tiempo real insights de Google q Google Trends q Google Insights for Search q DoubleClick Ad Planner q AdWords Keyword Tool q Correlate q What do you love? q Google Blog Search q Youtube Trends Dashboard q YouTube Comment Search q Google Search (More Tools)

Página –188–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Herramientas para Facebook

q Open Facebook Search. Buscador q Facebook Grader (facebook.grader.com). Monitorización

de influencia. Ayuda a medir el poder, la autoridad y el alcance de un usuario en Facebook.

q FamGager (fangager.com). Monitorización de comunidad. Servicio que analiza cualquier página en Facebook y ofrece información de valor sobre las visitas, me gustas, comentarios y usuarios más activos dentro del último, mes, semana o dia.

q Facebook Lexicon (facebook.com/lexicom) q Herramienta de seguimiento de tendencias a través de

conceptos clave que muestra el número de conversaciones disponibles,.

Página –189–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Herramientas para Facebook

q It´s Trending (itstrending.com) q Se trata de un servicio que permite conocer los detalles

del contenido más compartido en Facebook. En su página principal ofrece diferentes columnas que incluyen los temas candentes y varias opciones para conocer lo más compartido según diferentes temáticas.

q Social Page Evaluator (evaluator.vitrue.com). Efectúa una estimación del ROI generado por una página web. Ideal para obtener un análisis aproximado de previsiones o proyecciones basadas en un determinado proyecto social donde intervenga una página en Facebook

q Conversocial (profiler.conversocial.com). Realiza comparativas de los seguidores y la actividad de una página Facebook

Página –190–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Herramientas para Twitter

q Twitter Analyzer (twitteranalyzer.com). Datos, estadísticas

q Hastags (hastags.com).. Evolución de un hastag en un peridodo de tiempo

q Xefer (xefer.com/twitter). Datos estadísticos de modo gráfico (diferencia entre tweets, reweets y conversaciones

q Topsy (Analytics.topsy.com). Analiza menciones de términos o dominio

q Trendsmap (trendsmap.com). Analisis de temas y tendencias

q Twitter Search (search.twitter.com). Buscador

Página –191–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Herramientas para Twitter

q Locafollow (locafollow.com). Buscador por nombre, ubicación, biografía…

q Tweepz (tweepz.com). Buscador de términos (nombre, ubicación)

q Klout (klout.com). Analiza la influencia del usuario de una cuenta Twitter.

q Follow Friday (followfriday.com). Sitio basado en las recomendaciones que se hacen a través de Twitter mediante #FF o #FollowFriday

q Soy Follower (soyfollower.com). Directorio temático, directorio de cuentas de Twitter que las clasifica por la temática en que se especializan sus contenidos habituales,.

Página –192–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Herramientas para Twitter

q Formulists (formulists.com). Generar listas que guardará en nuestra propia cuenta de acuerdo a unos parámetros que previamente le indiquemos.

q TwitterGrader( twittergrader.com) q Medición de influencias. Mide el nivel de influencia que

tiene un usario en twitter según tres párametros: fuerza, alcance y autoridad.

q Trendistic (trendistic.com) q Monitorización. Herramienta especializada en analizar

tendencias en Twitter sobre temas concretos. Basta con introducir la palabra o frase en la casilla de búsqueda y pulsar el botón Show Trends.

Página –193–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Herramientas de analítica web

q Twitter q TweetReach q TwitterCounter q Klout q SocialBro q Twitalyzer

Página –194–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Herramientas de tiempo real insights de Google q Google Trends q Google Insights for Search q DoubleClick Ad Planner q AdWords Keyword Tool q Correlate q What do you love? q Google Blog Search q Youtube Trends Dashboard q YouTube Comment Search q Google Search (More Tools)

Página –195–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

http://www.atinternet.com/es/producto/social-analytics/ q Monitorización de redes sociales q Mida y gestione su reputación online q El boca a boca (buzz) repercute en la estrategia de

marketing, ya sea como causa o consecuencia. Monitorizar el marketing viral es un desafío clave par alas compañías para controlar y mejorar como es percibida su marca online.

q BuzzWatcher mide en tiempo real la actividad en todos los soportes web 2.0 (blogs, redes so-ciales, plataformas de intercambio de vídeos y microblogging, flujos RSS…).

Página –196–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Caso de estudio de Social Analytics

q Principales características q  Monitorización completa de su ámbito de

influencia •  Mida la visibilidad y el impacto de sus

conversaciones •  Herramientas de productividad y colaboración •  Segmentación al vuelo: combine filtros de búsqueda

(monitorización, keywords, canales y categorías de contenido del lenguaje) para centrar sus análisis en una precisa selección de los datos.

Página –197–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

Caso de estudio de Social Analytics

•  Análisis semántico: descubra los diferentes conceptos asociados, emociones y tendencias de distintas conversaciones para anticiparse mejor y determinar la forma de pensar y expectativas de su área de influencia.

•  Informes/exportaciones: benefíciese de la fuerza y flexibilidad del creador de informes (Report Builder) para crear informes, establecer su frecuencia o formato.

Página –198–

© Luis Joyanes Aguilar Pereira, Colombia 21 de agosto de, 2015

BIBLIOGRAFÍA

q John Lovett (2011). Social Media. Métricas y análisis. Madrid: Anaya.

q John Lovett (2011). Social Media Metrics Secrets. Indianapolis: Wiley

Página –199–