Herramientas de procesado y visualización

34
Recopilación de herramientas de procesamiento y visualización de datos Madrid, Junio 2013

Transcript of Herramientas de procesado y visualización

Page 1: Herramientas de procesado y visualización

Recopilación de herramientasde procesamiento y visualización

de datos

Madrid, Junio 2013

Page 2: Herramientas de procesado y visualización

ContenidosContenidos...............................................................................................................................2

1 Introducción.............................................................................................................................3

2 Características de las herramientas..........................................................................................4

2.1 Herramientas de procesamiento.....................................................................................4

A.Herramientas de depuración...............................................................................................4

B.Herramientas de conversión................................................................................................6

2.2 Herramientas de análisis estadístico................................................................................6

2.3 Servicios de visualización.................................................................................................6

C. Aplicaciones de visualización genéricos...............................................................................7

D.Wizards, librerías, API........................................................................................................11

E. Herramientas de visualización geoespacial.......................................................................17

F. Herramientas de visualización de datos temporales..........................................................19

2.4 Herramientas para el análisis de redes..........................................................................20

3 Comparativa...........................................................................................................................22

4 Conclusiones finales...............................................................................................................24

document.docx 2

Page 3: Herramientas de procesado y visualización

1 IntroducciónEn los últimos años se ha producido una enorme proliferación de datos en bruto, que deben

ser procesados y preparados en una forma comprensible para el usuario final.

Todos estos datos en bruto suelen ser difíciles de entender, de ahí que se hayan desarrollado

distintas herramientas de visualización que faciliten su interpretación.

Sin embargo, este tipo de herramientas, por impactante que puedan ser sus resultados, no so-

luciona los problemas que puede generar una baja calidad de los datos fuente. De ello se de-

duce la importancia de trabajar adecuadamente con los datos, antes de proceder a su trata-

miento gráfico. El esquema clásico de tratamiento de datos, previo a la ejecución de cualquier

análisis, establece que hay que prestar atención a las técnicas de adquisición de los datos, y lle -

var a cabo un estudio de los datos obtenidos para asegurar que representan adecuadamente

al universo de discurso. Una vez asegurados ambos, se puede proceder a someter al conjunto

en cuestión a análisis (exploratorio, cualitativo…), y obtener los resultados y la visualización

que mejor se ajuste a los resultados obtenidos, y a la información que se quiere transmitir.

El presente documento incluye una recopilación de las mejores herramientas de procesamien-

to, análisis y visualización de datos gratuitas que se ofrecen actualmente en el mercado.

document.docx 3

Page 4: Herramientas de procesado y visualización

2 Características de las herramientas Para crear un buen análisis y visualización de datos, lo más importante es conocer y entender

las herramientas disponibles y su correcta aplicación en los campos relacionados.

Existen muchas herramientas para ayudar a transformar los datos en gráficos, pero éstas

pueden conllevar un alto coste.

A continuación se presenta una selección de las mejores herramientas de tratamiento y

visualización de datos gratuitas, agrupadas en base a su uso y aplicación principales.

2.1 Herramientas de procesamientoLas tres herramientas que se muestran a continuación han sido diseñadas para ayudar en la

depuración y transformación de los datos a analizar.

A. Herramientas de depuración

2.1.1 DataWrangler

TIPO. Aplicación Web

TECNOLOGÍA. HTML

LICENCIA. De uso libre

ENLACES.

Sitio web. http://vis.stanford.edu/wrangler/

Trabajo de investigación. http://vis.stanford.edu/papers/wrangler

Aplicación web interactiva para la limpieza y transformación de datos. Wrangler combina la

manipulación directa de los datos visualizados con la inferencia automática de las

transformaciones de datos relevantes, lo que permite a los analistas la exploración repetida del

espacio de operaciones aplicable y prever sus efectos.

Aprovecha los tipos de datos semánticos (localizaciones geográficas, fechas, códigos de

clasificación) para ayudar a la validación y conversión de tipos.

2.1.2 Google Refine

TIPO. Aplicación de escritorio

TECNOLOGÍA. Java

document.docx 4

Page 5: Herramientas de procesado y visualización

LICENCIA. BSD

ENLACES.

Sitio web. http://code.google.com/p/google-refine/

Documentación para usuarios. http://code.google.com/p/google-refine/wiki/Docu-

mentationForUsers

Documentación para desarrolladores. http://code.google.com/p/google-refine/

wiki/DocumentationForDevelopers

Herramienta gratuita diseñada con los objetivos de ayudar a entender la estructura y calidad

de los datos, y permitir corregir determinados tipos de errores comunes a ellos.

Admite un amplio abanico de formatos: TSV, CSV, *SV, Excel (.xls y .xlsx), JSON, XML, RDF como

XML, y documentos Google Data. La fuente de datos puede ser de 4 tipos: a partir de fichero

local, desde una URL (puede importar datos de una tabla de una web, de un xml,...),

directamente desde clipboard o enlazando un documento de Google Docs. Una vez tratados los

datos se pueden volver a exportar para su uso fuera de Google Refine en los formatos TSV (Tab

separated values), CSV (Comma separated values), Excel y HTML table.

Google Refine tiene tres aspectos a destacar:

Limpieza de datos. Permite cambiar contenido de celdas y unificar campos, de forma

manual o ayudado por el propio programa (el sistema es capaz de sugerir optimizacio-

nes).

Transformación de datos. A través de las instrucciones que se pueden usar mediante el

lenguaje GREL propio de Google Refine. Permite dividir columnas, crear nuevas colum-

nas según el valor de otra columna, tomar parte del contenido de una columna para

crear otra nueva,...

Creación de nuevos campos de datos. Mediante servicios externos para poder dispo-

ner de datos nuevos a partir de datos ya existentes; o haciendo uso de Freebase (base

de datos libre colaborativa) para hacer una conciliación de datos.

document.docx 5

Page 6: Herramientas de procesado y visualización

B. Herramientas de conversión

2.1.3 Mr. Data Converter

TIPO. Biblioteca

TECNOLOGÍA. JavaScript

LICENCIA. MIT

ENLACES.

Sitio web. http://shancarter.com/data_converter/

Repositorio GitHub. https://github.com/shancarter/Mr-Data-Converter

Aplicación web que convierte los datos de Excel en uno de varios formatos web amigables,

incluyendo HTML, JSON y XML.

2.2 Herramientas de análisis estadísticoHerramientas para la combinación de representaciones gráficas de los datos junto con un

análisis numérico robusto.

2.2.1 The R Project for Statistical Computing

TIPO. Lenguaje de programación

TECNOLOGÍA. R

LICENCIA. GPL

ENLACES.

Sitio web. http://www.r-project.org/

R es un lenguaje y entorno de programación para gráficos y computación estadísticos, de

distribución libre y de código abierto.

Lenguaje basado en comandos, lo que permite crear gráficos a medida, y no sólo d elos tipos

de gráficos estandarizados, sino de nuevos gráficos adecuados al conjunto de datos y al

problema tratado.

2.3 Servicios de visualizaciónA continuación se describen algunas de las herramientas de visualización gratuitas clasificadas

de acuerdo a sus características tecnológicas

document.docx 6

Page 7: Herramientas de procesado y visualización

A. Aplicaciones de visualización genéricos

Herramientas que ofrecen diversas opciones de visualización. Aunque algunas siguen

apostando por las tablas y gráficos convencionales, muchas otras abogan por ofrecer nuevas

opciones tales como diagramas de árbol y nubes de palabras.

2.3.1 Google Fusion Tables

TIPO. Aplicación Web y API

TECNOLOGÍA. JavaScript, Flash

LICENCIA. De uso libre

ENLACES.

Sitio web. http://www.google.com/fusiontables/

Galería de imágenes. https://sites.google.com/site/fusiontablestalks/stories/

Documentación de la API. https://developers.google.com/fusiontables/

Aplicación web que permite organizar, gestionar, colaborar, visualizar y publicar datos en la web

de una manera sencilla.

Gestiona grandes colecciones de datos que deben estar normalizados y guardados en un

archivo Excel, .ods, .csv o .kml.

Permite visualizar los datos mediante gráficos circulares, gráficos de barras, diagramas de

dispersión y líneas de tiempo; así como mapas geográficos basados en Google Maps.

2.3.2 Tableau Public

TIPO. Aplicación de escritorio

TECNOLOGÍA. Windows, JavaScript

LICENCIA. De uso libre

ENLACES.

Sitio web. http://www.tableausoftware.com/public/

Galería. http://www.tableausoftware.com/public/gallery

Herramienta gratuita de visualización de datos mediante gráficos que combina algunos

elementos tradicionales de las herramientas de business intelligence como puedan ser el

document.docx 7

Page 8: Herramientas de procesado y visualización

modelo de organización de variables mediante el uso de dimensiones y medidas o la conexión

con otros sistemas de gestión de información como las bases de datos o las hojas de cálculo

con el uso de un interfaz gráfico atractivo, eficiente y rápido.

Algunas de las características más relevantes de esta herramienta son:

Detección de datos rápida y fácil. Permite trabajar con bases de datos y hojas de cálcu-

lo de cualquier tamaño. Acepta formatos como Excel, Access, y formatos de texto.

Trabaja con una gran variedad de gráficos: fiebres, barras, barras apiladas, tartas, ta-

blas, mapas con polígonos, líneas o puntos, etc.

Publicación de gráficos interactivos.

Combinación de diversas fuentes de datos en una sola vista.

Los datos son públicos.

Descarga de datos en crudo desde las mismas visualizaciones.

2.3.3 Many eyes

TIPO. Aplicación Web

TECNOLOGÍA. Java, Flash

LICENCIA. De uso libre

ENLACES.

Sitio web. http://www-958.ibm.com/software/data/cognos/manyeyes

Aplicación web para crear, compartir y discutir la representación gráfica de los datos de usuario

cargados.

Esta herramienta de visualización de datos gratuita ha sido puesta a disposición de los usuarios

por parte de la empresa IBM.

Many Eyes permite compartir las visualizaciones creadas fomentando las conversaciones

alrededor de una visualización y proponiendo otros enfoques a partir de los mismos datos. Se

trata de una herramienta de uso público, es decir, que todos los datos y visualizaciones que se

realicen estarán a disposición del resto de usuarios; no se puede usar de forma privada.

document.docx 8

Page 9: Herramientas de procesado y visualización

Permite realizar gran cantidad de tipos de visualizaciones:

Relaciones entre puntos (Scatterplot, matriz de gráficos y diagramas de red).

Comparar valores (gráficos de barras, histogramas y gráficos de burbuja).

Traceo de cambios de tendencia en el tiempo (gráficos de líneas, barras y barras por

categorías).

Ver partes de totales (gráficos de queso, mapas de secciones simples y con compara-

ciones).

Analizadores de texto (árbol de conceptos, nube de etiquetas, relaciones de frase y ge-

nerador de nubes de palabras).

Gráficos geográficos (gráficos sobre mapas).

Uno de los ejemplos más famosos donde se puede ver el potencial de esta herramienta es el

discurso de Obama sobre el trabajo en forma de árbol y nube de palabras (http://www-

958.ibm.com/software/data/cognos/manyeyes/visualizations/word-tree-for-president-

obamas-job).

2.3.4 CartoDB

TIPO. Aplicación Web

TECNOLOGÍA. JavaScript, base de datos Open Source PostgreSQL y su extensión

geoespacial PostGIS.

LICENCIA. Comercial

ENLACES.

Sitio web. http://www.cartodb.com

Tutoriales. http://vimeo.com/channels/cartodb

Blog CartoDB. http://blog.cartodb.com/

Blog Vizzuality. http://blog.vizzuality.com/

Repositorio GitHub. https://github.com/Vizzuality

Base de datos geoespacial en la nube, que funciona con los servicios web de Amazon por

detrás, permitiendo la escalabilidad, la flexibilidad y la elasticidad de sus servicios. Es un

proyecto Open Source que también se ofrece como un servicio bajo demanda.

La finalidad de CartoDB es facilitar la creación de aplicaciones geolocalizadas y la creación de

document.docx 9

Page 10: Herramientas de procesado y visualización

mapas. Permite diseñar y desarrollar mapas en tiempo real que funcionan en todas las

plataformas web y móviles.

Entre sus características podemos destacar:

Diseño de mapas: Para sus capas de datos, es posible utilizar CartoCSS para editar fá-

cilmente el formato y la apariencia con la que se generan.

Integración con otros servicios cartográficos (Google Maps, MapBox): CartoDB produ-

ce las capas de datos, y para la capa de mapa utiliza GoogleMaps y, desde la versión

2.0 MapBox. Estos mapas incluyen las funciones básicas de zoom, desplazamiento,

etc.

Integración con otras librerías: CartoDB cuenta ya con varias librerías a su alrededor

que permiten extender su uso o integrar otros servicios.

Geocodificación: Es posible obtener información geográfica a partir de otros elemen-

tos distintos de las coordenadas.

Capacidad de importar datos fácilmente: CartoDB permite introducir datos directa-

mente en las tablas a partir de su panel, añadir datos vía SQL o lectura desde URLs,

pero también se pueden importar colecciones de datos directamente en múltiples for-

matos.

Realizar peticiones SQL con componentes espaciales: Gracias al uso de PostGIS, Carto-

DB permite consultar y combinar conjuntos de datos utilizando los datos geoespacia-

les para realizar la combinación.

Tablas públicas y privadas: Como corresponde a un servicio cloud, CartoDB permite di-

ferenciar entre un uso de las tablas público, o un uso privado.

Está orientado a desarrolladores sin experiencia en sistemas de información geoespacial, con

una interfaz muy amigable.

Entre sus clientes se cuentan diversas instituciones tales como ONU, Google, la NASA, la

Universidad de Oxford, de Yale, entre otros.

2.3.5 GeoCommons

TIPO. Aplicación Web y API

TECNOLOGÍA. JavaScript, Ruby

document.docx 10

Page 11: Herramientas de procesado y visualización

LICENCIA. Varios (http://geocommons.com/help/Open_Source)

ENLACES.

Sitio web. http://geocommons.com/

Documentación de la API. http://geocommons.com/api/

Plataforma geoespacial de gestión de datos, visualización, creación de mapas y análisis

espacial.

Admite la carga de datos desde distintos tipos de fuentes de datos: hojas de cálculo, archivos

KML, shape, servidores de bases de datos con soporte espacial, servicios OGC como WMS y

TMS, o del repositorio público de la plataforma.

Las técnicas de representación cartográficas que permite son mapas de coropletas, de símbolos

proporcionales clasificados en intervalos y color aplicado a simbología puntual. También

destacan las funcionalidades de animación temporal. Los mapas se pueden exportar a formato

KML y los datos a formato KML, hoja de cálculo o shape, entre otros, e incrustar en una página

web.

B. Wizards, librerías, APIAmplia gama de librerías y APIs disponibles para ayudar al desarrollador a crear sus propias

visualizaciones.

2.3.6 Google Chart Tools

TIPO. Biblioteca

TECNOLOGÍA. JavaScript

LICENCIA. De uso libre

ENLACES.

Sitio web. https://developers.google.com/chart/

Galería de imágenes. https://google-developers.appspot.com/chart/interactive/

docs/gallery/

Código. https://code.google.com/apis/ajax/playground/?type=visualization/

Documentación de la API. https://google-developers.appspot.com/chart/interacti-

ve/docs/reference

Herramienta de Google Developers que permite la creación de gráficas en forma de imágenes

document.docx 11

Page 12: Herramientas de procesado y visualización

PNG. Su funcionamiento se basa en peticiones http a una determinada url

(http://chart.apis.google.com).

Es de uso gratuito pero con ciertas limitaciones. Inicialmente, su uso estaba limitado a 50.000

peticiones por url y día, pero, actualmente este límite se sitúa en 250.000. Para evitar esta

limitación, almacenar las imágenes generadas en un servidor propio a modo de cache de

imágenes.

Dispone de una gran variedad de tipos de gráficas, los cuales vienen dados como clases de

JavaScript. Una de las ventajas que tienen este sistema de generación de gráficas es que no se

necesita instalar ningún componente en nuestro entorno o servidor, por lo que se puede

generar cada gráfica “al vuelo”.

2.3.7 JavaScript InfoVis Toolkit

TIPO. Conjunto de herramientas

TECNOLOGÍA. JavaScript, Phyton

LICENCIA. MIT

ENLACES.

Sitio web. http://thejit.org/

Repositorio GitHub. https://github.com/philogb/jit

Grupo de Google. https://groups.google.com/forum/?fromgroups#!forum/javas-

cript-information-visualization-toolkit

Biblioteca de JavaScript que proporciona herramientas para crear visualizaciones de datos

interactivas en aplicaciones web (mapas estratégicos, árboles jerárquicos, mapas relacionales,

etc.). Debido a su gran diversidad de representaciones, se adapta a cualquier necesidad del

desarrollador.

Algunas de las características más relevantes de esta librería son:

Posee diferentes tipos de representaciones de datos.

Permite interactuar con los datos en tiempo real.

Compatible con la mayoría de navegadores.

Recurso Open Source de fácil integración en desarrollos web.

Extensible.

document.docx 12

Page 13: Herramientas de procesado y visualización

Permite combinar las visualizaciones para crear nuevas formas de visualización.

Gran velocidad de proceso para estructuras complejas.

Desde el punto de vista técnico, la representación de los datos a mostrar viene marcada por

una estructura JSON (JavaScript Object Notation) un formato ligero de intercambio de datos, el

cual se basa en dos estructuras: una colección de pares de nombre/valor (objeto, registro,

estructura, diccionario, tabla hash, etc.) y una lista ordenada de valores (vectores, listas o

secuencias), estas son estructuras universales y permite a todos los lenguajes de programación

adaptarse con facilidad.

Los casos de uso o posibilidades de esta librería son innumerables:

Desarrollo en entornos BI (Business Intelligence).

Representación de organigramas.

Mapas estratégicos en cuadros de mando (Balanced Scorecard).

Mapas estadísticos de datos.

Mapas relacionales.

2.3.8 D3.js

TIPO. Biblioteca

TECNOLOGÍA. JavaScript

LICENCIA. BSD (permite el uso del código fuente en software no libre)

ENLACES.

Sitio web. http://d3js.org/

Repositorio GitHub. https://github.com/mbostock/d3

Galería. https://github.com/mbostock/d3/wiki/Gallery

Tutoriales. https://github.com/mbostock/d3/wiki/Tutorials

Librería de JavaScript que permite crear visualizaciones complejas y gráficos interactivos.

Básicamente, la librería permite manipular documentos basados en datos usando estándares

abiertos de la web; y los navegadores pueden crear visualizaciones complejas sin depender de

un software propietario. Sus desarrollos son abiertos y pueden ser reimplementados por otros

desarrolladores. Sus posibilidades son tan amplias como la geometría misma (burbujas,

document.docx 13

Page 14: Herramientas de procesado y visualización

diagramas Chrod, links de nodos,…)

D3 permite enlazar datos al DOM (Modelo en Objetos para la Representación de Documentos)

y aplicar transformaciones. Por ejemplo, generar una tabla HTML a partir de una serie de

números. O bien utilizar los mismos datos para crear un gráfico interactivo SVG con

transiciones e interacción.

Ejemplos.

“Caminos a la Casa Blanca” (http://elections.nytimes.com/2012/results/president/sce-

narios)

“Tamaño de la industria manufacturera china” (http://www.nytimes.com/interactive/

2013/04/08/business/global/asia-map.html)

“Aumento de las fuerzas de vigilancia en la frontera entre EEUU y México” (http://

www.nytimes.com/interactive/2013/03/01/world/americas/border-graphic.html)

“Conexiones entre los contendientes a los premios Oscars” (http://

www.nytimes.com/interactive/2013/02/20/movies/among-the-oscar-contenders-a-

host-of-connections.html)

2.3.9 Protovis

TIPO. Librería

document.docx 14

Page 15: Herramientas de procesado y visualización

TECNOLOGÍA. JavaScript

LICENCIA. BSD

ENLACES.

Sitio web. http://mbostock.github.com/protovis/

Repositorio GitHub. https://github.com/mbostock/protovis

Librería gráfica JavaScript orientada a la realización de visualizaciones.

Proporciona al desarrollador un gran conjunto de componentes y herramientas, y otorga la

posibilidad de personalizar las visualizaciones con un control detallado.

Algunas de las características más relevantes de esta librería son:

Versatilidad prácticamente ilimitada. Se basa en el framework de la gramática de los

gráficos.

Configuración de gráficos sencillo, basado en el método de encadenamiento.

Enfocada a los gráficos estadísticos, su método de desarrollo permite, además, su uso

para visualizaciones más bien estructuradas y basadas en los datos.

Incorpora algunas funciones estadísticas como preparación de los datos.

El principal inconvenientes que presenta es que Protovis es una biblioteca pesada (pesa más

de 700 Kb), pensada para Intranets o conexiones rápidas.

2.3.10Recline.js

TIPO. Biblioteca

TECNOLOGÍA. JavaScript

LICENCIA. MIT

ENLACES.

Sitio web. http://reclinejs.com/

Repositorio GitHub. https://github.com/okfn/recline/

Biblioteca para el desarrollo de aplicaciones basadas en HTML y JavaScript. Diseñada para la

integración, por lo que es fácil de integrar en otros sitios web y aplicaciones. Orientada a

desarrolladores sin grandes conocimientos de programación, que utiliza una interfaz sencilla

document.docx 15

Page 16: Herramientas de procesado y visualización

para la vista (y edición) de datos. Las visualizaciones se ofrecen en modo gráfico, mapa y líneas

de tiempo.

Recline funciona sobre Backbone, esta estructura provee un excelente soporte para la

construcción de aplicaciones que manejan importantes cargas de datos, utilizando modelos

para la gestión de la información y vistas para mostrarlas. Además, resulta fácilmente

extensible a través de nuevos Backends que permiten conectar una base de datos o capa de

almacenamiento.

Esta biblioteca cuenta con muchas funciones para la manipulación de bases de datos, incluida

su carga, consulta y manipulación. Consta de soporte para cargar datos de archivos CSV, Excel,

Google Docs, ElasticSearch, CouchDB y DataHub entre otros.

Provista de mecanismos de limpieza y actualización de datos mediante un sencillo script.

La biblioteca Recline consiste en tres módulos:

Modelo. Definición de la estructura de los datos, (por ejemplo: definición del dataset a

utilizar según origen y tipo de datos).

Backend. Conexión de los datos mediante el API de Recline.js directamente con el ori-

gen de datos, que puede ser una base de datos, un archivo separado con comas, etc.

Vistas. Muestra de la información obtenida y gestión en las dos instancias anteriores.

document.docx 16

Page 17: Herramientas de procesado y visualización

C. Herramientas de visualización geoespacialHerramientas para la representación de datos geográficos.

2.3.11OpenHeatMap

TIPO. Aplicación Web y API

TECNOLOGÍA. JavaScript

LICENCIA. GPL 3

ENLACES.

Sitio web. http://www.openheatmap.com/

Repositorio GitHub. https://github.com/petewarden/openheatmap/wiki

Aplicación web capaz de convertir datos estadísticos de hojas de cálculo en mapas térmicos.

Su funcionamiento es sencillo y soporta diferentes formatos de archivos como fuente: Excel,

CVS o documentos vinculados desde Google Docs.

Los ficheros deben tener un formato concreto con una columna que indique la dirección o

posición geográfica de cada uno de los datos para poder posicionarlos.

OpenHeatMap permite compartir los mapas a través del correo o redes sociales, o también

embeberlo en una página web.

2.3.12OpenLayers

TIPO. API

TECNOLOGÍA. JavaScript

LICENCIA. BSD

document.docx 17

Page 18: Herramientas de procesado y visualización

ENLACES.

Sitio web. http://www.openlayers.org/

Documentación. http://trac.openlayers.org/wiki/Documentation

Biblioteca de JavaScript de código abierto que permite la inclusión de un componente tipo

mapa en cualquier página web, con georeferencias.

Es una librería del lado del cliente, un visor de mapas en javascript, por lo que la descarga de

estos se realiza directamente desde el navegador a través de Ajax. No genera tráfico en el

servidor, los mapas se descargan directamente del servidor de mapas.

OpenLayers permite sobreponer distintas capas sobre una básica, añadir indicadores o puntos

en el mapa con leyendas, así como polígonos y proporciona su propio API para dibujarlos de

una manera sencilla.

Incorpora un set de controles básicos y una toolbar de controles avanzados y permite incluir los

controles necesarios haciendo uso del API.

2.3.13OpenStreetMap

TIPO. Aplicación Web y API

TECNOLOGÍA. Ruby, PostgreSQL,

LICENCIA. CC BY-SA

ENLACES.

Sitio web. http://www.openstreetmap.org/

Proyecto colaborativo de creación de mapas libres y editables.

Los mapas se crean utilizando información geográfica capturada con dispositivos GPS móviles,

ortofotografías y otras fuentes libres. Esta cartografía, tanto las imágenes creadas como los

datos vectoriales almacenados en su base de datos, se distribuye bajo licencia abierta Open

Database License (ODbL).

Los usuarios registrados pueden subir sus trazas desde el GPS y crear y corregir datos

vectoriales mediante herramientas de edición creadas por la comunidad OpenStreetMap.

OpenStreetMap utiliza una estructura de datos topológica. Los datos se almacenan en el datum

document.docx 18

Page 19: Herramientas de procesado y visualización

WGS84 lat/lon (EPSG:4326) de proyección de Mercator. Los elementos básicos de la cartografía

OSM son:

Los nodos (nodes). Puntos que recogen una posición geográfica dada.

Las vías (ways). Lista ordenada de nodos que representa una polilínea o polígono

(cuando una polilínea empieza y finaliza en el mismo punto).

Las relaciones (relations). Grupos de nodos, caminos y otras relaciones a las que se

pueden asignar determinadas propiedades comunes. Por ejemplo, todas aquellas vías

que forman parte del Camino de Santiago.

Las etiquetas (tags). Se pueden asignar a nodos, caminos o relaciones y constan de una

clave (key) y de un valor (value). Por ejemplo: highway=trunk

Los atributos de los datos siguen un modelo más elaborado que las folcsonomías de indexación

social. La ontología de las características del mapa (principalmente el significado de las

etiquetas) se mantiene mediante una wiki.

D. Herramientas de visualización de datos temporalesHerramientas para el análisis de datos en los que el tiempo es una componente importante.

2.3.14TimeFlow

TIPO. Aplicación de escritorio

TECNOLOGÍA. Java Script

LICENCIA. Libre

ENLACES.

Sitio web.

Repositorio GitHub. https://github.com/FlowingMedia/TimeFlow/wiki

Herramienta de visualización para datos temporales. La versión actual es “alfa”, por lo que

puede contener errores.

Esta herramienta ayuda a analizar los datos temporales a través de cinco vistas diferentes:

Vista Línea de Tiempo.

Vista Calendario.

Vista Diagrama de barras.

Vista Tabla.

document.docx 19

Page 20: Herramientas de procesado y visualización

Vista Lista.

2.4 Herramientas para el análisis de redesEste tipo de herramientas resulta de interés en el análisis de las redes sociales, en referencia a

la disciplina de encontrar conexiones entre las personas en base a varios conjuntos de datos.

Es necesario entender las teorías estadísticas del análisis de nodos de redes para usar esta

categoría de software.

2.4.1 Gephi

TIPO. Aplicación de escritorio

TECNOLOGÍA. Windows, Linux, MacOS X, Java

LICENCIA. CDDL, GPL3

ENLACES.

Sitio web. http://gephi.org/

Documentación. http://wiki.gephi.org/index.php/Main_Page/

Plataforma de exploración y visualización interactiva para todo tipo de redes y grafos

complejos, dinámicos y jerárquicos.

Permite visualizar la relación entre datos y su evolución, agrupando conjuntos, definiendo

jerarquías, exportando e importando tablas…

Tiene la particularidad que permite manejar grafos grandes, redes de hasta 50.000 nodos y un

millón de aristas.

2.4.2 NodeXL

TIPO. Aplicación de escritorio

TECNOLOGÍA. Microsoft

LICENCIA. Microsoft Public License (Ms-PL)

ENLACES.

Sitio web. http://nodexl.codeplex.com/

document.docx 20

Page 21: Herramientas de procesado y visualización

Potente herramienta de análisis y representación de grafos que trabaja con Excel. Trabaja

mostrando gráficos de red a partir de una lista dada de conexiones, ayudando en el análisis y

descubrimiento de patrones y relaciones en los datos.

Algunas de las características más relevantes de esta herramienta son:

Importación y exportación flexible. Importación de datos desde múltiples fuentes.

Conexiones directas a las redes sociales. Optimizada para analizar medios sociales en

línea; incluyendo conexiones incorporadas para hacer query en las API de Twitter, Fli -

ckr y YouTube.

Diseño flexible.

Combinación de enlaces duplicados.

Cálculo de métricas y análisis de redes.

Inserción de imágenes de subgrafos de redes.

Automatización de tareas.

document.docx 21

Page 22: Herramientas de procesado y visualización

3 Comparativa

A continuación se incluye un cuadro resumen en el que se presenta una comparativa con las

herramientas de visualización analizadas en el presente documento.

Herramienta CategoríaVisualización multipropósito

Tipo Tecnología Licencia PlataformaAlmacenamiento de datos

PublicaciónWeb?

DataWrangler Depuración de datos

No Aplicación Web

HTML Libre Navegador Servidor externo No

Google Refine Depuración de datos

No Aplicación de escritorio

Java BSD Navegador Local No

Mr. Data Converter

Conversor de datos

No Biblioteca JavaScript MIT Navegador Local No

The R Project for Statistical Computing

Análisis estadístico

Si Lenguaje de programa-ción

R GPL Linux, Mac OS X, Unix, Windows XP

Local No

Google Fusion Tables

Aplicación/ Servicio de visualización

Si Aplicación Web y API

JavaScript, Flash

Libre Navegador Servidor externo Si

Tableau Public Aplicación/ Servicio de visualización

Si Aplicación de escritorio

Windows, JavaScript

Libre Windows Servidor público externo

Si

Many eyes Aplicación/ Servicio de visualización

Si Aplicación Web

Java, Flash Libre Navegador Servidor público externo

Si

CartoDB Aplicación/ Servicio de visualización

Si Aplicación Web

JavaScript, PostgreSQL

Comer-cial

Navegador Servidor externo Si

GeoCommons Aplicación/ Servicio de visualización

Si Aplicación Web y API

JavaScript, Ruby

Varios Navegador Servidor local o externo

Si

Google Chart Tools

Librería y servicio de visualización

Si Bibioteca JavaScript Libre Editor de código y navegador

Servidor local o externo

Si

JavaScript InfoVis Toolkit

Librería Si Conjunto de herramien-tas

JavaScript, Phyton

MIT Editor de código y navegador

Servidor local o externo

Si

D3.js Librería Si Biblioteca JavaScript BSD Editor de código y navegador

Servidor local o externo

Si

Protovis Librería Si Biblioteca JavaScript BSD Editor de código

Local No

Recline.js Librería Si Biblioteca JavaScript MIT Editor de código

Servidor local o externo

No

OpenHeatMap GIS No Aplicación Web y API

JavaScript GPL 3 Navegador Servidor externo Si

document.docx 22

Page 23: Herramientas de procesado y visualización

OpenLayers GIS No API JavaScript BSD Editor de código y navegador

Servidor externo Si

OpenStreetMap GIS No Aplicación Web y API

Ruby, PostgreSQL

CC BY-SA

Navegador o equipos de escritorio que ejecutan Java

Servidor local o externo

Si

TimeFlow Análisis de datos temporales

No Aplicación de escritorio

JavaScript Libre Equipos de escritorio que ejecutan Java

Local No

Gephi Análisis de redes

No Aplicación de escritorio

Windows, Linux, MacOS X, Java

CDDL, GPL3

Equipos de escritorio que ejecutan Java

Local Como imagen

NodeXL Análisis de redes

No Aplicación de escritorio

Microsoft Microsoft Public License (MS-PL)

Excel 2007 y 2010 en Windows

Local Como imagen

document.docx 23

Page 24: Herramientas de procesado y visualización

4 Conclusiones finales

Como conclusión general, ante la gran cantidad y diversidad de herramientas de visualización

gratuitas existentes en el mercado se puede inferir que estamos ante un periodo de gran

proliferación de datos en bruto, en el que existe un creciente interés por encontrar la manera

más adecuada de presentar esta información de manera atractiva, clara, concisa y

comprensible para el usuario final.

Herramientas de visualización de datos e información hay muchas. A continuación se presentan

las que se consideran más recomendables en base a las capacidades aportadas y al nivel de

experiencia requerido.

En la categoría de aplicaciones Web, destacan:

o Google Fusion Tables.

Herramienta excelente para los principiantes o para aquellas personas que no

saben de programación. De todas formas, para los usuarios más avanzados

existe una API que permite producir gráficas o mapas a partir de información.

Una de las ventajas de esta aplicación es la diversidad de representaciones de

datos que se ofrecen a disposición del usuario. Además, ofrece una creación de

gráficos o mapas relativamente rápida, incluyendo funciones GIS para analizar

datos por geografías. El servicio automáticamente establece direcciones de

códigos geográficos, lo cual es útil cuando se intenta colocar muchos puntos en

un mapa.

Google permite designar los datos como privados o no listados o públicos, a

pesar de que los datos aún residen en los servidores de Google, lo cual se

convierte en un inconveniente, teniendo en cuenta el problema de la

privacidad de los datos.

o CartoDB.

Servicio Open Source dirigido a cualquier usuario, independientemente del

nivel técnico que tenga, con una interfaz muy amigable.

Destaca su activo grupo de desarrolladores que aporta gran cantidad de

documentación y ejemplos. El carácter abierto de su API hace que

document.docx 24

Page 25: Herramientas de procesado y visualización

continuamente se están desarrollando nuevas integraciones y aumentando las

capacidades de la herramienta, con nuevas librerías.

Entre sus clientes se cuentan diversas instituciones tales como ONU, Google, la

NASA, la Universidad de Oxford, de Yale, entre otros.

El empleo de librerías y APIs permiten al desarrollador crear visualizaciones a medida,

según las necesidades del proyecto.

o Google Chart Tools.

Esta API tiene dos modos de funcionamiento, los gráficos estáticos mediante

imágenes (más sencilla) y gráficas interactivas (más potente).

La generación de gráficos estáticos mediante imágenes es fácil de usar,

obteniendo los gráficos mediante una petición a los servidores de Google, y

ofrece gran variedad de tipos de gráficas y opciones. Presenta la herramienta

Live Chart Playground, que permite generar urls de gráficas para incrustar en

nuestro código html, así como previsualizar las modificaciones en los

parámetros en tiempo real. Además, no es necesario instalar ningún

componente en nuestro entorno o servidor, generando las gráficas “al vuelo”.

El modo de generación de gráficas interactivas, mediante una librería

JavaScript, es más completo y permite generar gráficos funcionales. El

problema radica en que, como ocurre con otras librerías de JavaScript, se hace

necesaria la programación de código.

Es de uso gratuito pero con ciertas limitaciones de peticiones por url y día,

actualmente este límite se sitúa en 250.000.

o Recline.js.

Esta librería resulta sencilla de usar por aquellos usuarios que no tengan

grandes conocimientos de programación.

Es considerada una biblioteca versátil debido a su modularidad. Esto significa

que sólo vas a utilizar aquellos módulos que necesites para construir tu

aplicación.

Otra de sus ventajas, es que sus vistas pueden ser embebidas en otras

document.docx 25

Page 26: Herramientas de procesado y visualización

aplicaciones, exactamente como han hecho para CKAN y el DataHub.

Entre las herramientas disponibles para la representación de datos geográficos, se des-

taca:

o OpenLayers.

Librería muy potente que requiere profundizar en conocimientos de GIS. La

gran ventaja es que no requiere el uso de licencias como Google maps.

Resulta una opción interesante para aquellos usuarios que están

acostumbrados a programar en JavaScript y prefieren no usar una plataforma

comercial como Google o Bing. Es totalmente compatible con tecnologías

propietarias además de cumplir con los estándares WMS y WFS.

Permite un enorme abanico de posibilidades: importar marcas en formato

KML, marcar polígonos con islas, posicionar marcas con el parseo de rss,

integración con jQuery Mobile, añadir animaciones a los polígonos para

representar, por ejemplo, una trayectoria,...

document.docx 26