B&SConsulting Analytics

Post on 26-Dec-2015

12 views 2 download

Transcript of B&SConsulting Analytics

Construyendo soluciones analíticas para su

empresa Jorge Rodríguez M.

942150982 / RPM: #0025095

jrodriguez@bs-sac.com

Contenido

1. Situación actual

2. Data Mining

3. Metodología

4. Aplicaciones

5. Anexos

Situación actual

¿Cómo se hace esto?

¿Se siente así?

El fin del cliente como medio

El comienzo del cliente con poder

Evolución de una estrategia centrada en el cliente

Tendencias y perturbaciones en el análisis predictivo

Contenido

1. Situación actual

2. Data Mining

3. Metodología

4. Aplicaciones

5. Anexos

Data Mining - ¿Por qué se necesita?

Contribuye a las decisiones tácticas

y estratégicas

Permite a los usuarios dar prioridad a

decisiones y acciones

Proporciona poderes de

decisión a los usuarios del

negocio

Ahorra grandes cantidades de dinero a una

empresa y abre nuevas

oportunidades de negocio

Resulta un buen punto de encuentro

entre los investigadores y las

personas de negocio

Permite que relaciones no descubiertas e

identificadas sean expresadas como

reglas de negocio o modelos

predictivos

Permite explorar, visualizar y

comprender los datos e identificar

patrones, relaciones y

dependencias que impactan en los

resultados finales de la cuenta de

resultados

Es tiempo de análisis…

“El que no aplique nuevos remedios debe esperar

nuevos males, porque el tiempo es el máximo

innovador.”

Sir Francis Bacon

Valor del Data Mining

Data Mining – Plataforma Analítica

Objetivos de Negocios

Plataforma Integral de Apoyo a la Toma de Decisiones

Incrementa

r

Base de

Clientes

ETL Data Stage

Oracle

Extracción

Transformación

Carga

Datos

Tangible a

Tecnología

Tangible al

Negocio Técnicas

Analíticas

Manejo y

Optimización

de Campañas

Retención

Análisis y

Optimización

de Canales

Incrementa

r

Avg. Ticket

Cliente

Valioso

Reducción

de Costos de

Campañas

Incrementa

r

Lealtad

BI BO

Micro Strategy

QlikView

Estructura

Presentación

Distribución

Información

Analytics SAS Miner

IBM SPSS

Rapid Miner

Optimización

Pronósticos

Análisis estadístico

Conocimiento

Cada solución cubre las expectativas

Segmentación

Perfil y Valor

Cross Sell y

Up Sell

Data Mining – Software

Data Mining – Open Source

Orange es una suite de software para minería de base de datos y aprendizaje automático basado en componentes que cuenta con un fácil y potente, rápido y versátil front-end de programación visual para el análisis exploratorio de datos y visualización, y librerias para Python y secuencias de comando. Contiene un completo juego de componentes para preprocesamiento de datos, característica de puntuación y filtrado, modelado, evaluación del modelo, y técnicas de exploración. Está escrito en C++ y Python, y su interfaz gráfica de usuario se basa en la plataforma cruzada del framework Qt.

RapidMiner, antes llamado YALE (Sin embargo, otro ambiente de aprendizaje), es un ambiente de experimentos en aprendizaje automático y minería de datos que se utiliza para tareas de minería de datos tanto en investigación como en el mundo real. Permite a los experimentos componerse de un gran número de operadores anidables arbitrariamente, que se detallan en archivos XML y se hacen con la interfaz gráfica de usuario de RapidMiner. RapidMiner ofrece más de 500 operadores para todos los principales procedimientos de máquina de aprendizaje, y también combina esquemas de aprendizaje y evaluadores de atributos del entorno de aprendizaje Weka. Está disponible como una herramienta stand-alone para el análisis de datos y como motor para minería de datos que puede integrarse en tus propios productos.

Escrito en Java, Weka (Entorno Waikato para el Análisis del Conocimiento) es una conocida suite de software para máquinas de aprendizaje que soporta varias tareas típicas de minería de datos, especialmente pre procesamiento de datos, agrupamiento, clasificación, regresión, visualización y características de selección. Sus técnicas se basan en la hipótesis de que los datos están disponibles en un único archivo plano o relación, donde cada punto marcado es etiquetado por un número fijo de atributos. WEKA proporciona acceso a bases de datos SQL utilizando conectividad de bases de datos Java y puede procesar el resultado devuelto como una consulta de base de datos. Su interfaz de usuario principal es el Explorer, pero la misma funcionalidad puede ser accedida desde la línea de comandos o a través de la interfaz de flujo de conocimientos basada en componentes.

Diseñado para los científicos, ingenieros y estudiantes, jHepWork es un framework para análisis de datos libre y de código abierto que fue creado como un intento de hacer un entorno de análisis de datos usando paquetes de código abierto con una interfaz de usuario comprensible y para crear una herramienta competitiva a los programas comerciales. Esto se hace especialmente para las ploteos científicos interactivos en 2D y 3D y contiene bibliotecas científicas numéricas implementadas en Java para funciones matemáticas, números aleatorios, y otros algoritmos de minería de datos. jHepWork se basa en Jython un lenguaje de programación de alto nivel, pero codificación en Java también puede ser usada para llamar librerías jHepWork numéricas y gráficas.

KNIME (Konstanz Information Miner) es una plataforma de código abierto de fácil uso y comprensible para integración de datos, procesamiento, análisis, y exploración. Ofrece a los usuarios la capacidad de crear de forma visual flujos o tuberías de datos, ejecutar selectivamente algunos o todos los pasos de análisis, y luego estudiar los resultados, modelos y vistas interactivas. KNIME está escrito en Java y está basado en Eclipse y hace uso de sus métodos de extensión para soportar plugins proporcionando así una funcionalidad adicional. A través de plugins, los usuarios pueden añadir módulos de texto, imagen, procesamiento de series de tiempo y la integración de varios proyectos de código abierto, tales como el lenguaje de programación R, WEKA, el kit de desarrollo de Química y LIBSVM.

Contenido

1. Situación actual

2. Data Mining

3. Metodología

4. Aplicaciones

5. Anexos

Data Mining – Metodología CRISP-DM

Conocimiento del negocio

Conocimiento de la información

Preparación de los datos

Modelamiento

Evaluación

Despliegue

Ciclo de vida del cliente

¿Qué datos analizar?

Contenido

1. Situación actual

2. Data Mining

3. Metodología

4. Aplicaciones

5. Anexos

Data Mining - Aplicaciones

Segmentación

Clientes

Ventas

Cruzadas

Optimización

Campañas

Detección y

Prevención

Fraudes

Pérdida

Esperada

Predicción

Portafolio

Inteligencia

Comercial

Cliente

Preferente Modelos

Retención

Clientes

Series de

Tiempo

Inteligencia

Operacional

Inteligencia

Riesgos

Inteligencia

Financiera Lavado de

Dinero

Análisis

Competencia

Análisis

Flujos de

Caja

Simulación de

Inversiones

Pronósticos de

Demanda

Agencia

Operativa

Cobranza

Temprana

Scoring de

Cobranzas

Cobranza

Media-Tardía

Análisis

Desempeño

Ciclo de

Vida

Predictores de

Riesgo

Adquisición rentable

Desarrollo de relaciones

Gestión de la retención del cliente

Segmentación y estrategias de recobro

Segmentación de clientes

Contenido

1. Situación actual

2. Data Mining

3. Metodología

4. Aplicaciones

5. Anexos

Modelo de maduración del BI

Prenatal:

Reportes creados

por IT.

manualmente.

Esfuerzo en la

obtención de

datos.

Incentiva a la

generación de

planillas en Excel.

Infancia:

Spreadmarts creados

por analistas de

negocios.

Visión fragmentada:

falta de integridad,

nomenclatura,

distintas reglas de

negocio.

Ventaja para el

usuario final: fácil

creación, comodidad,

control de los datos.

Etapa Crítica: El Golfo

Etapa crítica donde esta la mayoría de

las organizaciones.

Múltiples y fragmentadas visiones

como resultado de distintas fuentes de

datos.

Falta de control en la calidad de datos.

Falta de adopción por parte de los

usuarios.

Niñez:

Se reconoce la

necesidad de

centralizar la

información y

distribuirla de manera

periódica.

Se desarrollan

repositorios con

distintos fines

(reporting, analíticos).

Los analistas tienen

herramientas que le

permiten solamente

analizar y

comprender

información para los

procesos que

gestionan.

Adolescencia:

Unificación de

criterios a nivel del

negocio.

Creación de un

repositorio de datos a

nivel de la empresa

(Data Warehouse)

Reporting más

complejo:

dashboards, análisis

de campañas,

métricas integradas.

Se puede acceder a

información de toda

la organización.

Adultez:

Integración de

proyectos de BI en un

único Enterprise Data

Warehouse.

Construcción de la

visión única del

negocio.

Procesos de BI

críticos como los

procesos

transaccionales.

Aparición de nuevos

e inesperados usos

de los sistemas de

explotación.

Sabiduría:

Provisión de servicios

de inteligencia en

nichos antes

impensados.

Servicios de

información analítica

para clientes finales.

Motores de inferencia

online, web mining.

Etapa Crítica: El Abismo

Pérdida de flexibilidad.

Volumen inmanejable de reportes,

malas prácticas de auto-service.

Propiedad. Peligro de retorno al

manejo de información por silos.

Percepción sobredimensionada de

tareas de integración de datos, pocos

medios de explotación.

Para pasar esta etapa…

Lograr cambiar la visión que tiene la

organización respecto de la solución

de BI, dejando de pensar que es sólo

una herramienta de reporting.

Eliminar los spreadmarts.

Definir claramente las

responsabilidades de entrega de datos

y servicios ofrecidos.

Para pasar esta etapa:

Análisis de uso, eliminación de lo inútil,

reportes parametrizables.

Análisis de necesidades según perfiles

de usuarios.

Adoptar BI como un recurso crítico,

parte del negocio y no un servicio más

de IT.

Enlaces importantes

1. http://rapid-i.com/

2. http://orange.biolab.si/

3. http://www.knime.org/

4. http://www.cs.waikato.ac.nz/ml/weka/

5. http://jwork.org/jhepwork/

6. http://voyagememoirs.com/pharmine/2008/05/18/summary/

7. http://www.kdnuggets.com/polls/2010/data-mining-analytics-tools.html

8. http://www.springerlink.com/content/b7437372g47wh517/

9. http://blog.samibadawi.com/2010/04/r-rapidminer-statistica-ssas-or-

weka.html

“El requisito del éxito es la prontitud en las decisiones”

Sir Francis Bacon