Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

42
Visualización de Datos con R y Neo4j Rubén Tejera Cordero Christian López Falcón

Transcript of Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

Page 1: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

Visualización de Datos con R y Neo4j

Rubén Tejera Cordero

Christian López Falcón

Page 2: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

¿QUÉ ES R?

- Lenguaje de programación con un enfoque estadístico.

- Uno de los lenguajes más utilizados en investigación por la comunidad

estadística

- Apareció en 1993, se basa en el lenguaje S desarrollado a finales de 1970.

- Software Libre, se distribuye bajo licencia GNU GPL

- Proyecto colaborativo y abierto que los usuarios pueden publicar paquetes.

- El repositorio oficial supera la cifra de 2000 paquetes.

Page 5: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

BASES DE DATOS ORIENTADA A GRAFOSVENTAJAS

- Rendimiento- Agilidad- Flexibilidad y escalabilidad- Ayudan a encontrar relaciones entre los datos.

DESVENTAJAS

- Requiere un cambio conceptual para los desarrolladores

Page 6: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

¿Que es NEO4j?

- Base de Datos Orientada a Grafos(BDOG)

- Lanzada por Neo Techonology, una startup sueca, en 2010.

- Dos tipos de licencia:AGPL y una Licencia Comercial

- Empresas que la usan: eBay, Walmart, Telenor, UBS, Cisco, HP,Lufthansa

Page 7: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

Características del Neo4j- No se define ningún esquema. Cada nodo o relación puede tener una

estructura de datos diferente, lo que favorece la escalabilidad.

- Transacciones ACID (Atomicidad, Consistencia, Aislamiento y Durabilidad)

- Límites:

- 34000 millones de nodos

- 34000 millones de relaciones entre esos datos

- 68000 millones de propiedades

- 32000 tipos de relaciones

Page 8: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

Posibles Aplicaciones para Neo4j- Búsqueda de enormes cadenas de conexión

- Análisis y búsqueda de patrones

- Soluciones tipo Red Social

- Sistemas de Recomendación

- Mapas Topográficos, para averiguar el camino más corto entre dos puntos.

Page 9: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

Rendimiento de Neo4jVolker Pacher, desarrollador de eBay y cliente de Neo4j, dice:

“Nuestra solución Neo4j es literalmente mil veces más rápida que la solución anterior MySQL, con búsquedas que requieren entre 10 y 100 veces menos código”.

https://bbvaopen4u.com/es/actualidad/neo4j-que-es-y-para-que-sirve-una-base-de-datos-orientada-grafos

Page 10: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

CypherLas consultas de la base de datos se realizan con Cypher.

- Es un lenguaje bastante intuitivo y fácil de entender. - Para representar las relaciones se utilizan flechas y para representar los

nodos, paréntesis, consiguiendo así que el lenguaje sea muy gráfico.

Reference Card de Cypher

Page 11: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero
Page 12: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

EJEMPLO DE TWITTER

Page 13: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

VISTA GENERAL DEL PROYECTO

ShinyFramework

para construir

webs usando R

ShinyDashboardPaquete para Shiny para la creación de

paneles

RNeo4jDriver de

Neo4j para R

visNetworkPaquete

para R para visualizar

redes

RLenguaje de

Programación

RStudioEntorno de

Desarrollo Integrado (IDE) para R

Neo4jBase de Datos Orientada

a Grafos

Page 14: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

Datos del Patronato de Turismo

de Gran Canaria

http://www.grancanaria.com/patronato_turismo/Listados-de-establecimientos.26171.0.html

Page 15: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

Listado de Restaurantes y Bares-Cafeterías de Gran Canaria

Page 16: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

Datos Tratados y Pasados a .csv

Page 17: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

Arrancamos la BBDD Neo4j

Page 18: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

Importación del archivo .csv al Neo4j

Establec

Isla Municip.

Localid.Pertenece a la localidad de

Pertenece al municipio de

Pertenece a la isla de

MODELO DE DATOS

Page 19: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

Ejemplo de Datos Creados

Page 20: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

CONSULTAS CON CYPHER

Page 21: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero
Page 22: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero
Page 23: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero
Page 24: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero
Page 25: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero
Page 26: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero
Page 27: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero
Page 28: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero
Page 29: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

Exportación de Datos a Json

Page 30: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

TEJEDA

Page 31: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

AGÜIMES

Page 32: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

MOYA

Page 33: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

SAN BARTOLOMÉ DE TIRAJANA

Page 34: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

MOGÁN

Page 35: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

TELDE

Page 36: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

LAS PALMAS DE G.C.

Page 37: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

Arrancamos el RStudio con el proyecto creado

Page 38: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

Web Resultante del Proyecto con Diseño Responsive

Page 39: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

Representación Datos en Forma de Tabla

Page 40: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

Representación de los Datos en Forma de Nodos

Page 41: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

Datos Generales de la Consulta

Page 42: Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

Gráficas según el Municipio