Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

Post on 12-Apr-2017

37 views 1 download

Transcript of Visualización de Datos con R y Neo4j , Rubén Tejera Cordero

Visualización de Datos con R y Neo4j

Rubén Tejera Cordero

Christian López Falcón

¿QUÉ ES R?

- Lenguaje de programación con un enfoque estadístico.

- Uno de los lenguajes más utilizados en investigación por la comunidad

estadística

- Apareció en 1993, se basa en el lenguaje S desarrollado a finales de 1970.

- Software Libre, se distribuye bajo licencia GNU GPL

- Proyecto colaborativo y abierto que los usuarios pueden publicar paquetes.

- El repositorio oficial supera la cifra de 2000 paquetes.

BASES DE DATOS ORIENTADA A GRAFOSVENTAJAS

- Rendimiento- Agilidad- Flexibilidad y escalabilidad- Ayudan a encontrar relaciones entre los datos.

DESVENTAJAS

- Requiere un cambio conceptual para los desarrolladores

¿Que es NEO4j?

- Base de Datos Orientada a Grafos(BDOG)

- Lanzada por Neo Techonology, una startup sueca, en 2010.

- Dos tipos de licencia:AGPL y una Licencia Comercial

- Empresas que la usan: eBay, Walmart, Telenor, UBS, Cisco, HP,Lufthansa

Características del Neo4j- No se define ningún esquema. Cada nodo o relación puede tener una

estructura de datos diferente, lo que favorece la escalabilidad.

- Transacciones ACID (Atomicidad, Consistencia, Aislamiento y Durabilidad)

- Límites:

- 34000 millones de nodos

- 34000 millones de relaciones entre esos datos

- 68000 millones de propiedades

- 32000 tipos de relaciones

Posibles Aplicaciones para Neo4j- Búsqueda de enormes cadenas de conexión

- Análisis y búsqueda de patrones

- Soluciones tipo Red Social

- Sistemas de Recomendación

- Mapas Topográficos, para averiguar el camino más corto entre dos puntos.

Rendimiento de Neo4jVolker Pacher, desarrollador de eBay y cliente de Neo4j, dice:

“Nuestra solución Neo4j es literalmente mil veces más rápida que la solución anterior MySQL, con búsquedas que requieren entre 10 y 100 veces menos código”.

https://bbvaopen4u.com/es/actualidad/neo4j-que-es-y-para-que-sirve-una-base-de-datos-orientada-grafos

CypherLas consultas de la base de datos se realizan con Cypher.

- Es un lenguaje bastante intuitivo y fácil de entender. - Para representar las relaciones se utilizan flechas y para representar los

nodos, paréntesis, consiguiendo así que el lenguaje sea muy gráfico.

Reference Card de Cypher

EJEMPLO DE TWITTER

VISTA GENERAL DEL PROYECTO

ShinyFramework

para construir

webs usando R

ShinyDashboardPaquete para Shiny para la creación de

paneles

RNeo4jDriver de

Neo4j para R

visNetworkPaquete

para R para visualizar

redes

RLenguaje de

Programación

RStudioEntorno de

Desarrollo Integrado (IDE) para R

Neo4jBase de Datos Orientada

a Grafos

Datos del Patronato de Turismo

de Gran Canaria

http://www.grancanaria.com/patronato_turismo/Listados-de-establecimientos.26171.0.html

Listado de Restaurantes y Bares-Cafeterías de Gran Canaria

Datos Tratados y Pasados a .csv

Arrancamos la BBDD Neo4j

Importación del archivo .csv al Neo4j

Establec

Isla Municip.

Localid.Pertenece a la localidad de

Pertenece al municipio de

Pertenece a la isla de

MODELO DE DATOS

Ejemplo de Datos Creados

CONSULTAS CON CYPHER

Exportación de Datos a Json

TEJEDA

AGÜIMES

MOYA

SAN BARTOLOMÉ DE TIRAJANA

MOGÁN

TELDE

LAS PALMAS DE G.C.

Arrancamos el RStudio con el proyecto creado

Web Resultante del Proyecto con Diseño Responsive

Representación Datos en Forma de Tabla

Representación de los Datos en Forma de Nodos

Datos Generales de la Consulta

Gráficas según el Municipio