B&SConsulting Analytics

30
Construyendo soluciones analíticas para su empresa Jorge Rodríguez M. 942150982 / RPM: #0025095 [email protected]

Transcript of B&SConsulting Analytics

Page 1: B&SConsulting Analytics

Construyendo soluciones analíticas para su

empresa Jorge Rodríguez M.

942150982 / RPM: #0025095

[email protected]

Page 2: B&SConsulting Analytics

Contenido

1. Situación actual

2. Data Mining

3. Metodología

4. Aplicaciones

5. Anexos

Page 3: B&SConsulting Analytics

Situación actual

Page 4: B&SConsulting Analytics

¿Cómo se hace esto?

Page 5: B&SConsulting Analytics

¿Se siente así?

Page 6: B&SConsulting Analytics

El fin del cliente como medio

Page 7: B&SConsulting Analytics

El comienzo del cliente con poder

Page 8: B&SConsulting Analytics

Evolución de una estrategia centrada en el cliente

Page 9: B&SConsulting Analytics

Tendencias y perturbaciones en el análisis predictivo

Page 10: B&SConsulting Analytics

Contenido

1. Situación actual

2. Data Mining

3. Metodología

4. Aplicaciones

5. Anexos

Page 11: B&SConsulting Analytics

Data Mining - ¿Por qué se necesita?

Contribuye a las decisiones tácticas

y estratégicas

Permite a los usuarios dar prioridad a

decisiones y acciones

Proporciona poderes de

decisión a los usuarios del

negocio

Ahorra grandes cantidades de dinero a una

empresa y abre nuevas

oportunidades de negocio

Resulta un buen punto de encuentro

entre los investigadores y las

personas de negocio

Permite que relaciones no descubiertas e

identificadas sean expresadas como

reglas de negocio o modelos

predictivos

Permite explorar, visualizar y

comprender los datos e identificar

patrones, relaciones y

dependencias que impactan en los

resultados finales de la cuenta de

resultados

Es tiempo de análisis…

“El que no aplique nuevos remedios debe esperar

nuevos males, porque el tiempo es el máximo

innovador.”

Sir Francis Bacon

Page 12: B&SConsulting Analytics

Valor del Data Mining

Page 13: B&SConsulting Analytics

Data Mining – Plataforma Analítica

Objetivos de Negocios

Plataforma Integral de Apoyo a la Toma de Decisiones

Incrementa

r

Base de

Clientes

ETL Data Stage

Oracle

Extracción

Transformación

Carga

Datos

Tangible a

Tecnología

Tangible al

Negocio Técnicas

Analíticas

Manejo y

Optimización

de Campañas

Retención

Análisis y

Optimización

de Canales

Incrementa

r

Avg. Ticket

Cliente

Valioso

Reducción

de Costos de

Campañas

Incrementa

r

Lealtad

BI BO

Micro Strategy

QlikView

Estructura

Presentación

Distribución

Información

Analytics SAS Miner

IBM SPSS

Rapid Miner

Optimización

Pronósticos

Análisis estadístico

Conocimiento

Cada solución cubre las expectativas

Segmentación

Perfil y Valor

Cross Sell y

Up Sell

Page 14: B&SConsulting Analytics

Data Mining – Software

Page 15: B&SConsulting Analytics

Data Mining – Open Source

Orange es una suite de software para minería de base de datos y aprendizaje automático basado en componentes que cuenta con un fácil y potente, rápido y versátil front-end de programación visual para el análisis exploratorio de datos y visualización, y librerias para Python y secuencias de comando. Contiene un completo juego de componentes para preprocesamiento de datos, característica de puntuación y filtrado, modelado, evaluación del modelo, y técnicas de exploración. Está escrito en C++ y Python, y su interfaz gráfica de usuario se basa en la plataforma cruzada del framework Qt.

RapidMiner, antes llamado YALE (Sin embargo, otro ambiente de aprendizaje), es un ambiente de experimentos en aprendizaje automático y minería de datos que se utiliza para tareas de minería de datos tanto en investigación como en el mundo real. Permite a los experimentos componerse de un gran número de operadores anidables arbitrariamente, que se detallan en archivos XML y se hacen con la interfaz gráfica de usuario de RapidMiner. RapidMiner ofrece más de 500 operadores para todos los principales procedimientos de máquina de aprendizaje, y también combina esquemas de aprendizaje y evaluadores de atributos del entorno de aprendizaje Weka. Está disponible como una herramienta stand-alone para el análisis de datos y como motor para minería de datos que puede integrarse en tus propios productos.

Escrito en Java, Weka (Entorno Waikato para el Análisis del Conocimiento) es una conocida suite de software para máquinas de aprendizaje que soporta varias tareas típicas de minería de datos, especialmente pre procesamiento de datos, agrupamiento, clasificación, regresión, visualización y características de selección. Sus técnicas se basan en la hipótesis de que los datos están disponibles en un único archivo plano o relación, donde cada punto marcado es etiquetado por un número fijo de atributos. WEKA proporciona acceso a bases de datos SQL utilizando conectividad de bases de datos Java y puede procesar el resultado devuelto como una consulta de base de datos. Su interfaz de usuario principal es el Explorer, pero la misma funcionalidad puede ser accedida desde la línea de comandos o a través de la interfaz de flujo de conocimientos basada en componentes.

Diseñado para los científicos, ingenieros y estudiantes, jHepWork es un framework para análisis de datos libre y de código abierto que fue creado como un intento de hacer un entorno de análisis de datos usando paquetes de código abierto con una interfaz de usuario comprensible y para crear una herramienta competitiva a los programas comerciales. Esto se hace especialmente para las ploteos científicos interactivos en 2D y 3D y contiene bibliotecas científicas numéricas implementadas en Java para funciones matemáticas, números aleatorios, y otros algoritmos de minería de datos. jHepWork se basa en Jython un lenguaje de programación de alto nivel, pero codificación en Java también puede ser usada para llamar librerías jHepWork numéricas y gráficas.

KNIME (Konstanz Information Miner) es una plataforma de código abierto de fácil uso y comprensible para integración de datos, procesamiento, análisis, y exploración. Ofrece a los usuarios la capacidad de crear de forma visual flujos o tuberías de datos, ejecutar selectivamente algunos o todos los pasos de análisis, y luego estudiar los resultados, modelos y vistas interactivas. KNIME está escrito en Java y está basado en Eclipse y hace uso de sus métodos de extensión para soportar plugins proporcionando así una funcionalidad adicional. A través de plugins, los usuarios pueden añadir módulos de texto, imagen, procesamiento de series de tiempo y la integración de varios proyectos de código abierto, tales como el lenguaje de programación R, WEKA, el kit de desarrollo de Química y LIBSVM.

Page 16: B&SConsulting Analytics

Contenido

1. Situación actual

2. Data Mining

3. Metodología

4. Aplicaciones

5. Anexos

Page 17: B&SConsulting Analytics

Data Mining – Metodología CRISP-DM

Conocimiento del negocio

Conocimiento de la información

Preparación de los datos

Modelamiento

Evaluación

Despliegue

Page 18: B&SConsulting Analytics

Ciclo de vida del cliente

Page 19: B&SConsulting Analytics

¿Qué datos analizar?

Page 20: B&SConsulting Analytics

Contenido

1. Situación actual

2. Data Mining

3. Metodología

4. Aplicaciones

5. Anexos

Page 21: B&SConsulting Analytics

Data Mining - Aplicaciones

Segmentación

Clientes

Ventas

Cruzadas

Optimización

Campañas

Detección y

Prevención

Fraudes

Pérdida

Esperada

Predicción

Portafolio

Inteligencia

Comercial

Cliente

Preferente Modelos

Retención

Clientes

Series de

Tiempo

Inteligencia

Operacional

Inteligencia

Riesgos

Inteligencia

Financiera Lavado de

Dinero

Análisis

Competencia

Análisis

Flujos de

Caja

Simulación de

Inversiones

Pronósticos de

Demanda

Agencia

Operativa

Cobranza

Temprana

Scoring de

Cobranzas

Cobranza

Media-Tardía

Análisis

Desempeño

Ciclo de

Vida

Predictores de

Riesgo

Page 22: B&SConsulting Analytics

Adquisición rentable

Page 23: B&SConsulting Analytics

Desarrollo de relaciones

Page 24: B&SConsulting Analytics

Gestión de la retención del cliente

Page 25: B&SConsulting Analytics

Segmentación y estrategias de recobro

Page 26: B&SConsulting Analytics

Segmentación de clientes

Page 27: B&SConsulting Analytics

Contenido

1. Situación actual

2. Data Mining

3. Metodología

4. Aplicaciones

5. Anexos

Page 28: B&SConsulting Analytics

Modelo de maduración del BI

Prenatal:

Reportes creados

por IT.

manualmente.

Esfuerzo en la

obtención de

datos.

Incentiva a la

generación de

planillas en Excel.

Infancia:

Spreadmarts creados

por analistas de

negocios.

Visión fragmentada:

falta de integridad,

nomenclatura,

distintas reglas de

negocio.

Ventaja para el

usuario final: fácil

creación, comodidad,

control de los datos.

Etapa Crítica: El Golfo

Etapa crítica donde esta la mayoría de

las organizaciones.

Múltiples y fragmentadas visiones

como resultado de distintas fuentes de

datos.

Falta de control en la calidad de datos.

Falta de adopción por parte de los

usuarios.

Niñez:

Se reconoce la

necesidad de

centralizar la

información y

distribuirla de manera

periódica.

Se desarrollan

repositorios con

distintos fines

(reporting, analíticos).

Los analistas tienen

herramientas que le

permiten solamente

analizar y

comprender

información para los

procesos que

gestionan.

Adolescencia:

Unificación de

criterios a nivel del

negocio.

Creación de un

repositorio de datos a

nivel de la empresa

(Data Warehouse)

Reporting más

complejo:

dashboards, análisis

de campañas,

métricas integradas.

Se puede acceder a

información de toda

la organización.

Adultez:

Integración de

proyectos de BI en un

único Enterprise Data

Warehouse.

Construcción de la

visión única del

negocio.

Procesos de BI

críticos como los

procesos

transaccionales.

Aparición de nuevos

e inesperados usos

de los sistemas de

explotación.

Sabiduría:

Provisión de servicios

de inteligencia en

nichos antes

impensados.

Servicios de

información analítica

para clientes finales.

Motores de inferencia

online, web mining.

Etapa Crítica: El Abismo

Pérdida de flexibilidad.

Volumen inmanejable de reportes,

malas prácticas de auto-service.

Propiedad. Peligro de retorno al

manejo de información por silos.

Percepción sobredimensionada de

tareas de integración de datos, pocos

medios de explotación.

Para pasar esta etapa…

Lograr cambiar la visión que tiene la

organización respecto de la solución

de BI, dejando de pensar que es sólo

una herramienta de reporting.

Eliminar los spreadmarts.

Definir claramente las

responsabilidades de entrega de datos

y servicios ofrecidos.

Para pasar esta etapa:

Análisis de uso, eliminación de lo inútil,

reportes parametrizables.

Análisis de necesidades según perfiles

de usuarios.

Adoptar BI como un recurso crítico,

parte del negocio y no un servicio más

de IT.

Page 29: B&SConsulting Analytics

Enlaces importantes

1. http://rapid-i.com/

2. http://orange.biolab.si/

3. http://www.knime.org/

4. http://www.cs.waikato.ac.nz/ml/weka/

5. http://jwork.org/jhepwork/

6. http://voyagememoirs.com/pharmine/2008/05/18/summary/

7. http://www.kdnuggets.com/polls/2010/data-mining-analytics-tools.html

8. http://www.springerlink.com/content/b7437372g47wh517/

9. http://blog.samibadawi.com/2010/04/r-rapidminer-statistica-ssas-or-

weka.html

Page 30: B&SConsulting Analytics

“El requisito del éxito es la prontitud en las decisiones”

Sir Francis Bacon