MBA Jonny Chambi
Lima, Perú - 2013
Web Mining Conocimiento en la Web
El sitio web de: una empresa, profesional o cualquier organización es un canal de marketing, ventas, promoción, imagen, etc. En cualquier caso, interactúa de una u otra forma con todas las áreas del negocio, con objetivos, estrategias, resultados y retornos de inversión que pueden ser medidos y cuantificados.
¿Qué es la Web?
Web
Marketing Venta Promoción Imagen
El análisis web: es un conjunto de técnicas relacionadas con el análisis de datos, relativos a un sitio web con el objetivo de entender su tráfico como punto de partida para optimizar diversos aspectos del mismo.
¿Que es el Análisis Web?
Lo que no se mide, no se controla, lo que no se controla,
no se mejora
¿De que sitio proceden? ¿Qué hacen en el sitio? ¿Por qué paginas
navegan?
¿Durante cuánto tiempo?
¿Cuántas veces revisitan el sitio?
¿De qué país son?
¿Qué tipo de conexión de internet tienen?
¿En qué paso de un proceso de venta
desisten?
¿Cómo se capturan todos los movimientos en mi sitio
Web?
En que nos Ayuda
Responder preguntas acerca de los visitantes:
KPI
1. Volumen de visitas
2. Volumen de visitantes
3. Volumen de páginas vistas
4. Porcentaje de Rebote
5. Porcentaje de crecimiento de tráfico en el periodo
6. Porcentaje de crecimiento de páginas vistas en el periodo
7. Porcentaje de nuevos visitantes
8. Porcentaje de tráfico desde buscadores
9. Porcentaje de crecimiento de tráfico directo en el periodo
10. Porcentaje de crecimiento de tráfico desde otros orígenes
10 KPI’s Más Importantes
Analizadores de ficheros de logs
• Son programas que analizan los ‘logs’ de los servidores proporcionando información sobre “quién”, “cuándo” y “cómo” los visita.
Etiquetado de páginas
• Este método, está basado en la incorporación de un script a cada una de las páginas de un sitio. Cada vez que una página es visitada, este script se comunica con una base de datos a la que comunica la impresión de la página junto con, potencialmente, datos adicionales procedentes de las cookies.
Herramientas de Medición
Herramientas de Medición
Google Analytics
• Es la más conocida, una de las más completas y además su uso es gratuito. Al igual que con la mayoría, para que funcione hay que insertar un código javascript generado por Google en la programación el sitio web.
Piwik
• Se trata de la herramienta de analítica web de software libre por excelencia. La interfaz es muy sencilla y cuenta con prácticamente todas las funcionalidades que provee la solución de Google. Una ventaja es que los datos que se tiene es a tiempo real.
Yahoo! Web Analytics
• Es la respuesta de Yahoo a la herramienta de Google. Tiene tres principales diferencias respecto a la a la primera:
• 1.- Guarda el historial de datos permanente.
• 2.-Ofrece información a tiempo real.
• 3.- Extrae datos socio- demográficos.
Omniture
Es una herramienta de analítica web de pago y está orientada para ser usada con webs más grandes y complejas. Es la más recomendable si manejas un gran volumen de información, quieres segmentar a grandes niveles o cruzar muchos datos o variables. Por mencionar algunas diferencias, Omniture te permite trabajar directamente desde el Excel
¿Como Funciona?
Usuario
Sitio Web • Navegación
• Descarga
• Comentarios
• Compras
Script de Seguimiento
Base de Datos
• Es interesante saber cuanto tráfico tiene una web que no es nuestra, ya sea por motivos de competencia o por curiosidad, estas herramientas nos permite averiguar cuanto trafico tiene una web ajena, y permiten conocer de manera aproximada el número de visitas, aunque generalmente se equivocan.
Aquí algunas herramientas:
• www.Alexa.com y
• http://www.google.com/trends/
Tráfico de la Competencia
0
20
40
60
80
100
120
11/2
0/2
01
1
12/4
/20
11
12/1
8/2
01
1
1/1/
20
12
1/1
5/2
01
2
1/2
9/2
01
2
2/1
2/2
01
2
2/2
6/2
01
2
3/1
1/2
01
2
3/2
5/2
01
2
4/8/
20
12
4/2
2/2
01
2
5/6/
20
12
5/2
0/2
01
2
6/3/
20
12
6/1
7/2
01
2
7/1/
20
12
7/15
/20
12
7/2
9/2
01
2
8/1
2/2
01
2
8/2
6/2
01
2
9/9/
20
12
9/23
/20
12
10/7
/20
12
10/2
1/2
01
2
11/4
/20
12
11/1
8/2
01
2
nike
adidas
umbro
reebok
Perú: Páginas Web más visitadas
Visitas Diarias
Fuente: Alexa.com y estimación propia
Visitas Diarias
Fuente: Alexa.com y estimación propia
Perú: Páginas Web más visitadas
Web analytics a la pagina www.dataminingperu.com en la fecha de 8 octubre a 08 de noviembre 2012
Métricas: www.dataminingperu.com
INDICADORES CANTIDADES
Visitas 2272
Acciones 9562
Porcentaje de rebote 0.4
Acciones por visita 4.2
Promedio de duración de las visitas (en minutos) 4.4
Visitante que ha vuelto 802
Acciones por un visitante que ha vuelto 3642
Porcentaje de rebote por un visitante que ha vuelto 35%
Promedio. Acciones por visitante que ha vuelto 4.5
Promedio. Duración de la visita de los Visitantes que han Vuelto (en minutos) 5.4
Páginas vistas 8961
Descargas 492
Links de salida 101
Searches 4
Unique Keywords 4
Páginas vistas únicas 6819
Descargas Únicas 451
Links de salida Únicos 90
Conversiones 492
Visitas con conversiones 312
Métricas: Web Analytics
Web analytics a la pagina www.dataminingperu.com en la fecha de 8 setiembre a 17 de febrero 2013
El Web Mining se construye sobre el Web Analytics
Los datos Web tienen un valor latente mucho mayor del que puede extraerse sólo mediante el análisis convencional
Análisis predictivo en las acciones online.
Web Mining
Tecnología Utilizada
Piwik
• Script de Almacenamiento de datos.
Google Analytics
• Herramientas esencial de web analytics
RapidMiner
• Software más utilizado de Minería de Datos
Mysql
• Gestor de Base de datos más Utilizado
Proceso de Web Mining
1. Instalación
2. Reporting
3. Análisis Ad-Hoc
4. Web Mining
Fases del Modelo
Comprensión del Negocio
Comprensión de los Datos
Preparación de los Datos
Modelado Evaluación Desarrollo
Fases del Proyecto de Minería de datos
18
Segmentación: Aplicación en Rapid Miner
Conexión a la Fuente de Datos
Aplicación: Segmentación
… los segmentos:
Training 30% Buscador 37%
Nuevo 19% Full User 13%
Lo que se viene…
24
Gracias!
Conocimiento en la Web
Web Mining
Top Related