¿En que consiste la API de datos Innovachallenge? por Juan Carlos Plaza

14
API InnovaChallenge

description

Presentamos la API pública de BBVA que ofrece estadísticas agregadas de consumo por zona geográfica, periodo temporal y categoría de comercio, accesibles a través de una API de servicios REST.

Transcript of ¿En que consiste la API de datos Innovachallenge? por Juan Carlos Plaza

Page 1: ¿En que consiste la API de datos Innovachallenge? por Juan Carlos Plaza

API InnovaChallenge

Page 2: ¿En que consiste la API de datos Innovachallenge? por Juan Carlos Plaza

API Innova Challenge

¿En qué consiste la API de Datos de Innova Challenge?

La API de Datos Innova Challenge ofrece estadísticas agregadas de consumo por zona geográfica, periodo temporal y categoría de comercio, accesibles a través de una API de servicios REST.

Page 3: ¿En que consiste la API de datos Innovachallenge? por Juan Carlos Plaza

API Innova Challenge

¿De dónde se obtienen los datos? (1/2)

Las estadísticas que expone la API de Datos de Innova Challenge se han obtenido a partir del procesamiento Big Data de un Dataset de transacciones con tarjetas BBVA anonimizadas y agregadas.

Contexto:• Provincias de Madrid y Barcelona.• Profundidad temporal: Nov’12 – Abr’13.• Diferenciadas por sector / categoría de comercio.

En total, en esta muestra se han considerado:• Más de 30 millones de transacciones.• Más de 2 millones de tarjetas.• Más de 200.000 comercios.

BBVA tiene visibilidad sobre el 15-20% de la actividad comercial con tarjeta.

Page 4: ¿En que consiste la API de datos Innovachallenge? por Juan Carlos Plaza

API Innova Challenge

¿De dónde se obtienen los datos? (2/2)

Cada transacción tiene asociados una serie de parámetros que describen el contexto de la compra:

• Importe de la transacción.• Momento de la compra (timestamp).• Localización del comercio (coordenadas).• Categoría del comercio.• Segmento demográfico del poseedor de la tarjeta.• Código postal de procedencia del comprador.

Estos datos procesados y agregados alimentan los servicios de la API, a través de la cual podemos conocer estadísticas muy relevantes de la actividad comercial en una zona geográfica, para un determinado sector, en un periodo temporal concreto y para un segmento dado de clientes.

Page 5: ¿En que consiste la API de datos Innovachallenge? por Juan Carlos Plaza

La API de InnovaChallenge ofrece estadísticas sobre zonas a dos niveles:

-Códigos postales (en las provincias de Madrid y Barcelona).

-Celdas zoom=2 (450x550m) (en las provincias de Madrid y Barcelona).

• Estas celdas tienen una amplitud de media centésima en coordenadas decimales (en paralelos y meridianos). Los centros de las celdas tienen coordenadas cuyo tercer dígito es 0 o 5.

Ej: (40.415, -3.705), (40.420, -3.705), (40.415, -3.710), (40.420, -3.710)

• Para solicitar una celda, basta con especificar un punto contenido en ella.

Estadísticas: Granularidad espacial

API Innova Challenge

Page 6: ¿En que consiste la API de datos Innovachallenge? por Juan Carlos Plaza

-Rango temporal: de Nov’12 a Abr’13

-Estadísticas agregadas por semanas y meses.

• Por convenio, se considera como la semana 1 del año a aquélla que tiene más de 4 días dentro de ese año.

• Para solicitar las estadísticas de una semana o mes concreto, basta con indicar un día que pertenezca a ese periodo.

Estadísticas: Granularidad temporal

API Innova Challenge

41

40

42

43

44

Page 7: ¿En que consiste la API de datos Innovachallenge? por Juan Carlos Plaza

-En la API Innova Challenge se han definido 16 categorías de comercio:

• Viajes• Alimentación• Hipermercados• Hoteles• Inmobiliaria• Automoción• Bares y restaurantes• Cuidado personal

Estadísticas: Categorías de comercio

• Deportes y juguetes• Tecnología• Hogar• Contenidos• Moda• Ocio• Salud• Transporte

-Existen así mismo estadísticas para el agregado de todas las categorías.

API Innova Challenge

Page 8: ¿En que consiste la API de datos Innovachallenge? por Juan Carlos Plaza

Servicios de estadísticas disponibles

Categorías

Agrupaciones temporales

Zonas

API Innova Challenge

Las estadísticas de los servicios están siempre referidas a una zona, una categoría de comercio y una agrupación temporal.

Page 9: ¿En que consiste la API de datos Innovachallenge? por Juan Carlos Plaza

Servicio 1: Estadísticas de segmentos

Dada una zona, una categoría de comercio y una agrupación temporal, devuelve:

-Gasto medio-Número de transacciones-Número de tarjetas distintas que las han realizado

particularizados para 14 segmentos demográficos y un segmento de tarjetas de empresa.

Permite conocer cómo consume cada uno de los segmentos de clientes.

Restricción: no devuelve estadísticas basadas en menos de 3 tarjetas por segmento o menos de 5 comercios de una misma categoría.

API Innova Challenge

Servicios de estadísticas disponibles

Page 10: ¿En que consiste la API de datos Innovachallenge? por Juan Carlos Plaza

API Innova Challenge

Servicios de estadísticas disponibles

Servicio 2: Patrones de consumo

Dada una zona, una categoría de comercio y un mes determinado, devuelve:

-Gasto medio, mínimo, máximo, desviación y moda.-Número de transacciones.-Número de tarjetas distintas que las han realizado.

para cada hora del día y cada día de la semana. (patrones acumulados a lo largo del mes).

Permite extraer perfiles típicos de consumo.

Restricción: no devuelve estadísticas basadas en menos de 3 tarjetas o menos de 5 comercios de una misma categoría.

Page 11: ¿En que consiste la API de datos Innovachallenge? por Juan Carlos Plaza

API Innova Challenge

Servicios de estadísticas disponibles

Servicio 3: CPs de procedencia de clientes

Dada una zona, una categoría de comercio y una agrupación temporal determinada, devuelve la lista de los 100 CPs de mayor procedencia de clientes que compran en esa zona, ordenados por:

-Gasto agregado total.-Número de transacciones.-Número de tarjetas distintas que las han realizado.

así como los valores de estas estadísticas.

Permite conocer el área de influencia de los comercios de una determinada zona.

Restricción: no devuelve estadísticas basadas en menos de 3 tarjetas por CP o menos de 5 comercios por categoría.

Page 12: ¿En que consiste la API de datos Innovachallenge? por Juan Carlos Plaza

API Innova Challenge

Servicio de información

Servicio de información de categorías

Este servicio de información detalla el árbol de categorías de comercio que se pueden especificar en los servicios de la API, su identificador específico y su descripción literal en castellano e inglés.

Su función es la de servir de apoyo al desarrollo de aplicaciones.

Page 13: ¿En que consiste la API de datos Innovachallenge? por Juan Carlos Plaza

API Innova Challenge

¿Cómo acceder a la API?

Los datos están accesibles a través de una API REST con los tres servicios de datos y el servicio de información.

Para obtener la autorización para utilizarla es necesario registrarse en el BBVA Developer Center:

http://developer.bbva.com

Una vez registrada la aplicación, el Developer Center facilita un app_key y app_secret que permiten autenticarse como participante para consumir los servicios.

Page 14: ¿En que consiste la API de datos Innovachallenge? por Juan Carlos Plaza

Gracias