Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

48
UNIVERSIDAD PERUANA DE CIENCIAS APLICADAS ENTREGA DE SERVICIO DE TI EN UNA SOLUCIÓN DE “BIG DATA” PARA ANALIZAR Y PREDECIR EL COMPORTAMIENTO DEL TRÁFICO EN LA CIUDAD DE LIMA Monografía que como parte del curso de Seminario de investigación para Ingeniería Presentan los alumnos Omar Bugosen Abi-Gosen Christian Tejada Ruiz

description

Entrega de Servicio de TI en una solución Big Data para analizar y predecir el comportamiento del tráfico en la ciudad de Lima

Transcript of Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

Page 1: Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

UNIVERSIDAD PERUANA DE CIENCIAS APLICADAS

ENTREGA DE SERVICIO DE TI EN UNA SOLUCIÓN DE “BIG DATA” PARA ANALIZAR Y PREDECIR EL COMPORTAMIENTO DEL TRÁFICO EN LA

CIUDAD DE LIMA

Monografía que como parte del curso de Seminario de investigación para Ingeniería

Presentan los alumnos

Omar Bugosen Abi-Gosen

Christian Tejada Ruiz

Noviembre 2013

Page 2: Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

A Dios.

Page 3: Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

RESUMEN

El tema de esta monografía trata sobre la entrega de servicio de TI en una solución de Big

Data para analizar y predecir el comportamiento del tráfico en la ciudad de Lima. Con ello

en mente, la hipótesis plantea que la implementación de la gestión de servicio para Big

Data permite el análisis y predicción del comportamiento del tráfico mediante la excelencia

en la entrega de servicio para "Big Data", el tratamiento de la información con herramientas

de inteligencia de negocios y mediante el uso de información desde diferentes dispositivos.

En el primer capítulo se explican los conceptos de Big Data y de entrega de servicio de TI,

así como los de componentes lógicos y físicos involucrados con la entrega de servicio de TI

para Big Data. En el segundo capítulo abordamos el tema del análisis del tratamiento de

información de Big Data mediante el uso de herramientas de inteligencia de negocios y se

explica el uso del servicio de “Big Data” desde diversos dispositivos para analizar y

predecir el comportamiento del tráfico. Así, se concluye que el tratamiento de información

con una solución de Big Data provee un servicio para el análisis y predicción del tráfico de

la ciudad de Lima, para poder aliviar dicho inconveniente en la capital del Perú.

Page 4: Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

ÍNDICE

Introducción VII

Capítulo 1. Entrega de servicio TI para una solución Big Data 8

1.1 Concepto de Solución de Big Data 8

1.1.1 Definición y ventajas de Big Data 9

1.1.2 Consideraciones en el uso de Big Data 9

1.2 Componentes físicos y lógicos de Big Data 10

1.2.1 El componente físico o infraestructura de una solución Big Data 10

1.2.2 El aspecto lógico de una solución Big Data: las fuentes y el tratamiento de datos 10

1.3 Concepto de entrega de servicio de TI 12

1.3.1 Definición y tipos de servicio de TI 12

1.3.2 Organización dentro de la entrega de servicio de TI 13

1.4 Modelo de negocio de entrega de servicio de TI para Big Data 13

1.4.1 Determinación del costeo según el modelo de negocio 14

1.4.2 Valor económico en el análisis de tendencias 14

1.5 Fundamentos de una solución de Big Data 15

1.5.1 Los 7 pasos necesarios para explotar el potencial de una solución de Big Data 15

1.5.2 Inteligencia en un entorno Big Data 16

Capítulo 2. Tratamiento de información y uso de servicio Big Data 18

Page 5: Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

2.1 Análisis de información de las herramientas de inteligencia de negocios 18

2.1.1 Servicio de entrega de información de Big Data 19

2.1.2 Soluciones de Inteligencia de Negocios para tráfico y accidentes 21

2.2 Uso del servicio de Big Data mediante dispositivos móviles y computadoras 22

2.2.1 Características de Big Data en móviles 22

2.2.2 Información y equipos inteligentes 24

2.2.3 Pago mediante teléfonos móviles 25

Conclusiones 27

Bibliografía 31

Page 6: Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

INTRODUCCIÓN

El panorama que observamos en el mundo está plagado de fenómenos nuevos y, de hecho,

otros no tan nuevos. Es de importancia mencionar que la sociedad contemporánea se

encuentra inmersa en una diversidad de medios de comunicación que, sin duda alguna,

facilitan la vida a las personas. El funcionamiento de nuestra sociedad está estrechamente

relacionado con el uso de tecnologías, las que naturalmente van evolucionando con el

transcurrir del tiempo. Las diversas tecnologías que existen se vuelven mucho más

atractivas cuando, valga la plétora de palabras, tienen aplicaciones interesantes en la vida

cotidiana de las personas. Uno de los tantos problemas que atraviesa nuestra sociedad

limeña, el tráfico, urge de soluciones efectivas. Una manera de evitar el excesivo tráfico

vehicular es mediante el análisis de este, ya sea para la elección de alguna vía alterna o para

la determinación de las causas del congestionamiento que se observa día a día. La

propuesta de análisis se basa en la entrega de servicio de TI para una solución de Big Data

para analizar y predecir el comportamiento del tráfico en nuestra ciudad: Lima. ¿Quién no

ha llegado tarde al trabajo por culpa del tráfico? ¿De quién es el agrado estar tanto tiempo

en un aburridísimo embotellamiento? Es muy probable que los lectores sufran una catarsis

con el simple hecho de imaginarse esas situaciones y, además, es más probable aún que

urjan de soluciones innovadoras y efectivas en costo y tiempo.

VI

Page 7: Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

VII

Page 8: Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

CAPÍTULO 1

ENTREGA DE SERVICIO DE TI PARA UNA SOLUCIÓN BIG DATA

La solución de Big Data propone el adecuado tratamiento de grandes cantidades de

información mediante herramientas de tecnología para el análisis y predicción del tránsito

vehicular. Ya sea mediante el uso de recursos de software o tangibles, la propuesta se

enfoca en utilizar los recursos de la mejor manera para generar información de interés para

cualquier agente interesado en el proyecto. Mitigar el tráfico no es tarea sencilla y, para

ello, se requiere el uso de tecnologías adecuadas.

El presente capítulo tiene como objetivo definir y explicar el concepto y las ventajas de una

solución Big Data para aportar soluciones de interés para el tráfico, el cual más bien se

parece cada vez más a un mal que se propaga por toda la ciudad.

1.1 Concepto de Solución de Big Data

El término Big Data está referido a sistemas que manipulan grandes cantidades de

información. En ese sentido, conjuntos grandes de datos (como lo son los factores que

influyen en la generación del tráfico) requieren ser procesados de manera adecuada, con

tecnologías y técnicas pertinentes y, claro está, en un tiempo oportuno.

1.1.1 Definición y ventajas de Big Data

8

Page 9: Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

Big Data es considerado como un conjunto grande de datos caracterizados por su gran

volumen y variedad, que son generados con rapidez y con un nivel de certeza relativo. De

manera más formal, se define formalmente a nuestro concepto de interés:

“Big Data [son las] técnicas de análisis para procesar grandes cantidades de información relativamente extensas (de terabytes hasta exabytes1) y complejas (…) y que requieren del soporte de almacenamiento avanzado y especializado, así como de tecnologías de gestión, análisis y visualización.” (Ping Fung 2013)

Con lo mencionado por el autor, se considera que esta abundante cantidad de información

requiere de equipos tecnológicos especializados para poder ser analizados. Los datos serán

extraídos de formas particulares que serán luego explicadas, así como serán almacenados y

tratados con herramientas relacionadas entre sí.

1.1.2 Consideraciones en el uso de Big Data

Es claro que a mayores volúmenes de datos, las necesidades de tratamiento de estos van a

ser especiales. Big Data representa la cambiante necesidad de procesar muchos datos con

soluciones tecnológicas innovadoras.2 Así, se redondea la idea al considerar a Big Data

como un conjunto de tecnologías y prácticas emergentes destinadas a coleccionar, procesar,

descubrir y almacenar grandes volúmenes de data de manera rápida y con eficiencia en

temas de costos. La compatibilidad entre las herramientas a utilizar es importante, ya que

en las fases de recolección, procesamiento y análisis será vital que las aplicaciones trabajen

de manera conjunta para lograr resultados coherentes.

1 Un terabyte equivale a 1012 bytes y un exabyte equivale a 1018 bytes. Referencia2 Cfr. Dyche 2012

9

Page 10: Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

Con el concepto definido, resultará más sencillo entender en subcapítulos posteriores los

componentes lógicos y físicos, además de las aplicaciones de esta tecnología para fines de

nuestro interés.

1.2 Componentes físicos y lógicos de Big Data

Como es natural en cualquier solución tecnológica de cierta complejidad, Big Data se

integra tanto por componentes lógicos como físicos. Los componentes lógicos son aquellos

en los que se basa Big Data para el tratamiento y análisis de la información, como

herramientas de software y sistemas operativos. Por su parte, los componentes físicos son

constituidos por equipos y recursos tangibles para el tratamiento y análisis de la

información, ya sean servidores, discos duros, equipos de cómputo, etc.

1.2.1 El componente físico o infraestructura de una solución Big Data

Como se expuso líneas arriba, una solución Big Data consta de componentes lógicos y

físicos que, si bien han sido definidos por separado, se complementan entre sí y trabajan en

conjunto. En este sentido, se sugiere tener la solución de Big Data sobre clústeres de

computadoras; es decir, sobre conjuntos de computadoras relacionadas entre sí que

funcionan como si fueran una sola.3 La idea de utilizar clústeres funciona bien, ya que así

se provee una infraestructura dinámica y flexible frente a los cambios que pudiesen surgir

en el tiempo. Así, esto será de utilidad para separar las aplicaciones de base de datos,

sistemas de archivos, herramientas de análisis de datos, etc. Estas aplicaciones constituyen

el aspecto lógico de la solución Big Data, a detallar a continuación.

1.2.2 El aspecto lógico de una solución Big Data: las fuentes y el tratamiento de datos

3 Cfr. Cisco 2013

10

Page 11: Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

Los datos que pueden alimentar a una solución Big Data y, por ende, funcionar como

materia prima para su tratamiento, se encuentran en todos lados. En un documento de

investigación de Big Data para entornos empresariales, se enumera algunos ejemplos: el

constante monitoreo de la salud de los pacientes para tratar enfermedades crónicas, la

permanente evaluación de datos provenientes de sensores instalados en automóviles para

detectar patrones de uso y evitar accidentes, la detección de potenciales clientes que puedan

ser identificados por el uso de dispositivos móviles y que estén cerca de una tienda, etc.4 Es

razonable concluir que los datos de velocidades promedio de los autos en una vía dada, de

la fecha y hora del día y hasta del clima son válidos para su tratamiento y análisis si lo que

se desea es estudiar el comportamiento del tráfico.

Para fines prácticos sobre el tratamiento de una gran cantidad de datos, se propone dividir

el tratamiento de estos en la recolección, organización y análisis de la data.5 Para ello, en el

componente lógico, se formula el uso de su sistema de base de datos NoSQL para la fase de

recolección y almacenamiento de grandes cantidades de información. Con dicha aplicación,

se asegura que los datos se almacenarán en una estructura simple y dinámica que permitirá

flexibilizar el tratamiento de la información para evitar incurrir en costosos cambios de ser

necesaria alguna modificación6. Para la organización, se sugiere la tecnología Hadoop,

sistema de archivos que permite una carga rápida de datos en la base de datos. Para el

análisis, se sugieren soluciones gratuitas que permitan el análisis estadístico de datos y la

minería de datos.7 Esta distribución de aplicaciones y componentes es adecuada para el

proyecto, ya que las computadoras podrán tomar decisiones sobre cómo acomodar los

4 Cfr. Oracle 2012: 45 Cfr. Oracle 2012: 56 Cfr. Oracle 2012: 57 La minería de datos se refiere al proceso de detectar patrones en grandes volúmenes de datos.

11

Page 12: Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

distintos elementos relacionados a los datos tomados del tráfico y, de esa manera, arrojar

resultados en tiempos adecuados en comparación si no se usase la tecnología para

descentralizar la carga de trabajo sobre los grandes volúmenes de datos a tratar. El

diagrama de despliegue de la solución tanto lógica como física se muestra en la Figura 1.

Figura 1: Solución de Big Data Oracle integrada

Fuente: Oracle 2013

Así, y como cierre a la explicación de los componentes lógico y físico, podremos ahora

definir el concepto de entrega de servicio de TI.

1.3 Concepto de entrega de servicio de TI

1.3.1 Definición y tipos de servicio de TI

12

Page 13: Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

Definimos a la entrega de servicio de TI como un conjunto de principios, estándares,

políticas y procesos que se usan para diseñar, desplegar y operar tecnologías por parte de un

proveedor con experiencia en el contexto de negocio de TI.

La entrega de servicio de TI en una organización puede consistir en proveer diversos

servicios como servicios de servidores, almacenamiento, networking8, seguridad,

recuperación de desastres, control de activos, gestión de servicios y aplicaciones de TI.9

1.3.2 Organización dentro de la entrega de servicio de TI

Es de importancia decidir cómo es que se van a formar los grupos de trabajo. La entrega de

servicio de TI puede ser realizada de varias formas, como se menciona a continuación:

“La entrega de servicio de TI es realizada por equipos de trabajo, que bien pueden ser trabajadores contratados, contratistas, proveedores en los que se terceriza el trabajo, o una mezcla de los mencionados”. (Ping Fung 2013: 2)

Con conceptos claros sobre la entrega de servicio de TI y de una solución Big Data,

podemos presentar y explicar ya un bosquejo de modelo de negocio que relacione la

entrega de servicio con la solución tecnológica para grandes bases de datos.

1.4 Modelo de negocio de entrega de servicio de TI para Big Data

A partir de la automatización de la recolección, organización y análisis de datos, se pueden

idear interesantes modelos de negocio para ser ofrecidos al cliente. Como ejemplo,

podemos recolectar fotos de las placas de autos que circulen por una avenida determinada a

una hora dada, para descubrir información que está detrás de la placa del auto capturado.

Así, podremos obtener la marca y modelo del auto, así como identificar a su propietario.

8 El término networking se refiere a la integración de dos o más redes de computadoras.9 Cfr. Ping Fung 2013: 2

13

Page 14: Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

Con esta información, se podría indagar en bases de datos relacionadas para determinar el

nivel socioeconómico de la persona y, así, determinar (luego de detectar patrones en la

avenida tratada) la publicidad a colocar en la ruta, por ejemplo. Sin embargo, nuestra

materia de estudio no es el análisis del poder adquisitivo de los conductores, sino el tráfico

que se genera en dicha avenida en circunstancias especiales.

De esta forma, el negocio toma un giro algo distinto: se registrará el número de autos que

circulan por una vía dada, en una fecha y hora específica. Con esta información, además del

clima y de otros factores como la proporción de transporte público, se podrán tratar los

datos recolectados para generar estadísticos e incluso predecir cómo serán las condiciones

del tráfico en el futuro.

1.4.1 Determinación del costeo según el modelo de negocio

La entrega de servicio de TI para Big Data puede ser útil para muchas personas (en el caso

del tráfico, por ejemplo, para la Municipalidad de Lima) y, además, será preciso vender

dicho servicio como corresponda. Para calcular los costos, se sugiere diferentes modelos de

negocio, como la distribución prorrateada de costos, fijación de precios a mano alzada,

precios escalera, precios por unidad multiplicada por cantidad, etc.10 Como ejemplo, podría

cobrarse más al cliente mientras el análisis sea más preciso; por ejemplo, cuando una mayor

cantidad de datos haya sido analizada y procesada de manera adecuada con herramientas de

Inteligencia de Negocios, a detallar en el próximo subcapítulo.

1.4.2 Valor económico en el análisis de tendencias

Como se mencionó líneas arriba, es propicio considerar muchos datos que pudiesen en el

tráfico vehicular de Lima (y, de hecho, lo hacen). Así, se indica que factores como el clima,

las noticias y otros aspectos coyunturales (como partidos de fútbol) que afecten el tráfico

10 Cfr. Ping Fung 2013: 8

14

Page 15: Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

podrán y serán recogidos de diversas fuentes digitales de data y así nos proveerán de

análisis más precisos que redunden en nuevas fuentes de valor económico para el modelo

de negocio.11

Asimismo, y como corolario del párrafo anterior, la recolección, organización y análisis de

la data mencionada permitirá tomar decisiones mejor informadas. Ahora bien, conocemos

el mecanismo del modelo de negocio y su interacción con la solución de Big Data, pero

ahora profundizaremos en el análisis de dicha interacción entre la data y su tratamiento con

herramientas de inteligencia de negocios.

1.5 Fundamentos de una solución de Big Data

En esta sección se explicarán los fundamentos de una solución de Big Data mediante la

Inteligencia de Negocios (BI, Business Intelligence, por sus siglas en inglés).

1.5.1 Los 7 pasos necesarios para explotar el potencial de una solución de Big Data

Para explotar el potencial de una solución de Big Data, los pasos necesarios son: 1)

recolectar, 2) procesar, 3) gestionar, 4) medir, 5) consumir, 6) almacenar y 7) gobernar. 12

Ahora detallaremos cada paso a continuación:

Recolectar

La data se recolecta desde distintas fuentes, como fue explicado anteriormente. Luego, se

distribuye en otros nodos (como se explicó en la solución basada en clústeres), donde a su

vez un subconjunto de la data es procesada para descentralizar la carga de trabajo.

Procesar

La data se procesa y depura para ser más fácil de entender para los analistas. Luego, será

utilizada para ser analizada por otras herramientas, como por ejemplo de Inteligencia de

Negocios. 11 Cfr. Oracle 2013: 1512 Cfr. Dyche 2012

15

Page 16: Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

Gestionar

Toda la data que fue obtenida de diversas fuentes se limpia y homogeniza bajo estándares

de seguridad pertinentes.

Medir

Se deberá medir que porcentaje de la data es útil para ser utilizada de manera concomitante

con otros datos para su análisis e interpretación.

Consumir

Los requerimientos de consumo de data deberán estar supeditados a los resultados que se

hayan obtenido de manera histórica; es decir, si una fuente arrojó data de valor en el

pasado, entonces será adecuado volver a utilizar dicha fuente.

Almacenar

Se deberá contar con soluciones de almacenamiento para corto y largo plazo.

Gobernar

El gobierno de data está referido a las políticas que manejan todos los 6 pasos anteriores

aquí descritos.

1.5.2 Inteligencia en un entorno Big Data

Según Sokol y Ames, doctores que colaboraron en una investigación realizada por IBM:

“La inteligencia de negocios se asegura con la extracción de características, contextualización y conocimiento de la situación, modelado predictivo y análisis de los datos” (IBM Redbooks 2013)

La extracción de características se refiere a la extracción de información de forma

estructurada de una fuente. En lo que a contextualización y conocimiento de la situación

refiere, no siempre más datos significan mayor inteligencia; los datos deben estar en un

16

Page 17: Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

contexto dado y deberemos saber de qué tratan y qué podemos obtener de ellos. El

modelado predictivo tiene que ver con la predicción de eventos basada en data histórica

relacionada. Finalmente, el análisis de los datos tiene que ver con analizar cada dato que se

extraiga, buscar su relación con los demás y acomodarlo para que pueda proveer

información.

En resumen, las nuevas tecnologías de BI permitirán analizar grandes y variados volúmenes

de datos con costos razonables. Esto es de especial interés para el proyecto, pues el parque

automotor se hace cada vez más grande, y conviene ser cautos con la data a tratar para

arrojar resultados coherentes y en tiempos adecuados.

CAPÍTULO 2

17

Page 18: Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

TRATAMIENTO DE INFORMACIÓN Y USO DE SERVICIO BIG DATA

2.1 Análisis de información de las herramientas de inteligencia de negocios

Los datos obtenidos y procesados con el servicio Big Data, de la manera que se expuso en

el capítulo anterior, nos sirvió como referencia para entender la importancia que tienen los

datos en una aplicación práctica dada, como es el caso del tránsito vehicular. Ahora bien, en

tiempos de innovación, se propone la creación y uso de una plataforma integrada de

inteligencia de negocios y de Big Data13. La razón de esto tiene que ver con que la

integración entre ambas tecnologías nos va a asegurar una fuente de datos confiables, lo

que a su vez redundará en sistemas con las mismas características. Para la integración de

datos estructurados y no estructurados se deben combinar soluciones de tecnología que

permitan el depósito de ambos tipos de datos; en ese sentido, IBM refiere:

“En la capa de almacenamiento de depósito de datos, Netezza es una gran opción para su sistema de base de datos de MPP. Este sistema está equipado para los datos estructurados, pero cuando usa Hadoop o Cassandra para datos sin estructura o semiestructurados es posible crear una plataforma integrada de BI y analítica de big data” (IBM Developer Works 2013)

De esta manera, se asegura que la solución Big Data cuente con datos estructurados y datos

que no lo son, como objetos sin estructura uniforme, ya sea texto, audio, video, datos de

sensores, fotopapeletas14, información sobre el clima, placas de los autos, publicaciones en

redes sociales, señales de GPS de teléfonos móviles, etc.

13 Cfr. IBM Developer Works 201314 Las fotopapeletas son multas aplicadas a los vehículos por transitar a velocidades no permitidas.

18

Page 19: Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

El análisis de toda la información relativa a los puntos mencionados líneas arriba nos

ayudará a indagar sobre problemas del tráfico e incluso se podrían mitigar riesgos, pues se

cuenta con diversas fuentes de información relevante en comparación a las bases de datos

típicas o relacionales que sólo contemplan datos estructurados, como texto o cadenas de

caracteres que no ayudan mucho. Esto significa que, claramente, nos encontramos al frente

de una oportunidad para realizar análisis de mayor complejidad, ya que contamos con más

fuentes de información de calidad que, al interpretarlas de manera inteligente, podremos

sacarles provecho.

2.1.1 Servicio de entrega de información de Big Data

Un servicio de entrega de información Big Data especializado provee información de

tráfico, data histórica sobre rutas determinadas, mapas con el volumen de tráfico en un

momento dado, velocidades de los autos, condiciones de la carretera y otros tipos de

información sobre el tráfico que se haya registrado antes o incluso que se esté registrando

en el presente.15

La figura 2 nos muestra un despliegue asociado a una solución Big Data, donde se puede

apreciar la manera en la que se obtienen los datos desde diversas fuentes, tales como

dispositivos móviles de conductores o peatones, información de servicios telemáticos que

registren el número de autos que circulan por un lugar en una hora dada y a una velocidad

determinada o incluso de otras fuentes como lo son redes sociales.

Figura 2: Diagrama de una solución Big Data

15 Cfr. Green Car Congress 2013

19

Page 20: Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

Fuente: Green Car Congress 2013

Los vehículos que cuenten con equipos de telemática; es decir, que envíen mensajes con

información sobre el vehículo (marca, modelo, velocidad, equipamiento) constituyen

información valiosa en la medida que, además de aplacar el tráfico, puede reflejar el nivel

socioeconómico de la persona que lo conduce. Una gran cantidad de vehículos que fluyan

por una avenida dada y que tengan características de pertenecer a gente de clase media,

podrán alimentar la idea de colocar publicidad relacionada a su estilo de vida en lugares

aledaños. Otra forma de usar la información de marca y modelo es, si por ejemplo, se

identifican muchos camiones grandes que circulan por una ruta determinada. Esto

propiciará tomar medidas en cuanto a desvíos, planes de reordenamiento del tránsito o

incluso podría hacer pensar al gobierno en la construcción de nuevas carreteras. Datos del

tipo estructurado como marca, modelo, velocidad son tan útiles como los datos no

estructurados, y no deberá subestimarse la capacidad de aporte de cada uno de estos.

2.1.2 Soluciones de Inteligencia de Negocios para tráfico y accidentes

20

Page 21: Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

La información obtenida por los medios ya descritos es de suma utilidad para gobiernos y

empresas que, al contar con dicha información, podrían ayudar a aliviar el tráfico e incluso

conocer la ubicación de lugares seguros o de asistencia médica en caso de desastres

naturales.

Todos los datos obtenidos deben ser aprovechados al máximo; por ejemplo, conocer qué

porcentaje de autos que cuente con sistema de ABS16 permite manejar ese dato para luego

establecer una relación entre dicha métrica medida en una ruta y compararla con la tasa de

accidentes en ese mismo camino; por otro lado, se puede conocer si los conductores de

vehículos que transiten por un lugar en el que haya ocurrido un siniestro cuentan con un

Smartphone, lo que ayudaría a indicarles por medio de una aplicación los lugares de

evacuación más cercanos, así como equipos de rescate que pudiesen estar disponibles. Otro

dato de interés (del tipo no estructurado) para aliviar el tráfico serían las imágenes de los

lugares con más tráfico que sean compartidas por conductores que cuenten con un

Smartphone o Tablet, de manera que los potenciales interesados (la municipalidad, por

ejemplo) puedan enviar refuerzos como policías de tránsito para aliviar la carga vehicular.

Es claro que el procesamiento de los datos antes de ser utilizados es de suma importancia.

Por ese motivo, los datos se cargan en una solución de inteligencia de negocios, de manera

que se filtren para que sean utilizados únicamente los datos que serán luego información

con integridad, oportunidad y disponibilidad pertinentes.

16 Sistema Antibloqueo de Frenos (o ABS por sus siglas en inglés), que sirve para impedir el bloqueo de las llantas en una frenada fuerte, lo que podría causar accidentes al perderse estabilidad. Referencia

21

Page 22: Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

En conclusión a este punto, la información debidamente recogida por una solución de Big

Data y tratada con herramientas de inteligencia de negocios mejora la calidad de vida de las

personas y alivia accidentes por los motivos ya expuestos.

2.2 Uso del servicio de Big Data mediante dispositivos móviles y computadoras

2.2.1 Características de Big Data en móviles

El servicio de entrega que se detalló da cuenta de la forma en la que por medio de

información recibida en grandes cantidades y por distintos usuarios, se logra alimentar el

servicio de información Big Data con el propósito de aliviar el tráfico o de asistir zonas en

las que haya ocurrido algún tipo de siniestro. En la figura 3 se muestra la aplicación móvil

de Twitter, en la que se aprecia cómo los usuarios colaboran informando sobre las zonas de

mayor tráfico. En este caso, los tweets17constituyen un dato del tipo no estructurado y son

relativamente nuevos para ser tratados en una base de datos con una solución de

inteligencia de negocios.

Este tipo de información resulta útil pues es obtenido en tiempo real y se puede procesar

para tomar acciones de inmediato, como aliviar el tránsito; o bien a mediano o largo plazo,

para proponer soluciones, arreglar las pistas, colocar semáforos donde sea propicio o tomar

otras medidas como las que se propusieron en el punto previo.

Figura 3: Aplicación móvil que informa sobre el estado del tráfico

17 Un tweet es un mensaje corto y de cualquier tipo que se publica en la red social Twitter. Referencia

22

Page 23: Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

Fuente: Twitter 2013

Es bastante común que la gente opine sobre temas sociales y políticos; entonces, ¿por qué

no aprovechar lo que la gente opine sobre el tráfico vehicular? Los tweets en mención

logran funcionar como una encuesta que se realiza de manera permanente con la finalidad

de conocer los sitios con mayor congestión de vehículos en la ciudad. Estos mensajes de

corta extensión también informan sobre accidentes vehiculares, temblores, sugerencias de

atajos y otros consejos que pueden ser de gran ayuda a los ansiosos conductores de la

ciudad. Además de ser consumida esta información por otros conductores, también forman

parte de un gran conjunto de datos no estructurados que podrán ser tratados por el servicio

de información de Big Data para procesarse con herramientas de inteligencia de negocios.

23

Page 24: Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

2.2.2 Información y equipos inteligentes

Un tipo de información que muchas veces la gente ignora está relacionada con las obras en

las autopistas o eventos como conciertos o ferias que se van a llevar a cabo.18

Circunstancias eventuales como esta generan mucho tráfico por la gran afluencia que

dichos eventos suelen tener. Un servicio de información que se alimente de fuentes que

indiquen la mayor cantidad de causas que provoquen congestión vehicular es preciso para

el diagnóstico y alivio de esta.

Otros datos del tipo no estructurado también son de gran utilidad cuando son captados por

el servicio de información de Big Data. Hay ciertos tipos de data que pueden o no ser

obtenidos por colaboración de los usuarios: el volumen del tráfico puede ser captado por

cámaras de seguridad; sin embargo, algunos detalles o datos son mejor interpretados

cuando una persona describe algún fenómeno en especial que pudiese estar ocurriendo y

generando tráfico.

Sea cual fuere el motivo del tráfico, la idea de la inteligencia de negocios radica en utilizar

técnicas y herramientas de minería de datos para detectar patrones que permitan explicar y

hasta predecir el comportamiento del tráfico, ya sea para evaluar cuando habrá mayor o

menor congestión, o para obtener información nueva e interesante para los clientes de la

solución. El gobierno funciona como cliente en la medida que consumiría información

obtenida por medios innovadores y con un tratamiento inteligente de la data recolectada.

Por otro lado, diversas empresas que anuncien en la vía pública también funcionarían como

clientes, siempre y cuando se logre brindar una información objetiva y suficiente sobre las

características de conductores que circulen por una vía determinada de la ciudad: sucede

18 Cfr. Siemens AG 2013: 6

24

Page 25: Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

que todos los conductores son potenciales clientes de algún bien o servicio que se ofrezca

en carteles, y con mayor razón si es que el producto en promoción coincide con sus

preferencias.

2.2.3 Pago mediante teléfonos móviles

La tendencia en cobro de tarifas de peaje está orientada al uso de tarjetas recargables o

incluso de los teléfonos móviles, con lo que se agilizaría el proceso de pagar el peaje y se

evitarían costos derivados de la recaudación de dicho gravamen.19 Lo mismo ocurre con los

estacionamientos: un sistema de cobro automático evitaría colas a la entrada y salida de

locales de aparcamiento de autos.

Lo importante en la posibilidad de la proliferación de estas tecnologías es que se tiende a

reducir tiempos de espera y costos de recursos humanos, a la vez que se realizan esfuerzos

constantes para llevar a cabo una reingeniería de todos los procesos de una empresa a fin de

hacer al negocio más eficiente y cómodo para los usuarios. Podrán considerarse además

otras formas de cobrar de manera más rápida el peaje o los estacionamientos. Dado que el

uso de dispositivos móviles con acceso a datos es cada vez más difundido, se podría tomar

el número de teléfono como otra entrada en la tabla de la base de datos asociada a un

automóvil o conductor, para así relacionar el pago de servicios con una persona.

Adicionalmente, podrá estudiarse cuál fue el estacionamiento más usado, por cuánto

tiempo, cuántas veces se paga el peaje por semana, etc. Otra forma de realizar la cobranza

podría ser con la utilización de sistemas de reconocimiento de placas; las que, obviamente,

estarán almacenadas en una base de datos para poder corroborar si es que están o no

afiliadas a los servicios de pago adelantado de peajes o estacionamientos.

19 Cfr. Siemens AG 2013: 6

25

Page 26: Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

En conclusión, los dispositivos móviles brindan la posibilidad de enviar información al

servicio de Big Data y, por otro lado, permiten también el acceso a la información con

mayor rapidez. Finalmente, observamos que el uso de estas tecnologías mejoran los

procesos cotidianos que generan tráfico, como lo es el pago del peaje.

26

Page 27: Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

CONCLUSIONES

Grandes cantidades de información requieren ser tratadas de manera especial con

herramientas de tecnología apropiadas, como lo es Big Data.

En la implementación de una solución Big Data, es preciso escoger adecuadamente

los recursos lógicos y físicos que serán utilizados. En el aspecto físico, es

recomendable utilizar clústeres de computadoras (o conjunto integrado de equipos

de cómputo) de manera que la carga de trabajo sea distribuida y se pueda procesar

la información en tiempos adecuados. En el aspecto lógico, se recomienda el uso de

la base de datos de Oracle NoSQL, en la medida que esta ofrece estructuras simples

y dinámicas que son flexibles frente a cambios. Otras tecnologías sugeridas son

Hadoop, eficiente gestor de sistemas de archivos y otras soluciones que permiten el

análisis estadístico de datos y la minería de estos (o el descubrimiento de patrones

en conjuntos de datos).

La entrega de servicio de Big Data es de utilidad para muchos agentes interesados,

de manera que el proyecto puede funcionar como idea de negocio para clientes

como municipalidades o empresas privadas interesadas en el análisis del tráfico

vehicular y factores relacionados a este.

27

Page 28: Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

Una solución de Big Data se vale de siete pasos fundamentales en el tratamiento de

la información, que son: recolectar, procesar, gestionar, medir, consumir, almacenar

y gobernar.

En soluciones de Big Data, es propicio contextualizar los datos a tratar, así como

tener conocimiento de los mismos, ya que de esa manera se podrán tomar decisiones

mejor informadas sobre la información que se quiere obtener de los datos

recolectados.

Un servicio de entrega de información de Big Data logra captar información de

diversas fuentes para almacenarlas y tratarlas según sea conveniente. Todas las

fuentes deben ser consideradas como importantes, y toda información del pasado y

del presente se podrá utilizar para analizar el tráfico y predecirlo en un futuro.

La información obtenida en el servicio de Big Data sirve para analizar el

equipamiento de seguridad de automóviles y relacionarlo con las tasas de

accidentes, también para obtener la ubicación de accidentes y enviar ayuda, así

como los usuarios podrán enviar tweets o imágenes de las zonas con tráfico para

aliviarlo de inmediato, proponer soluciones a mediano o largo plazo (en forma de

propuestas del gobierno) e incluso para estudiar las causas de la congestión

vehicular.

28

Page 29: Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

La información obtenida por cada usuario por el servicio Big Data para ser

procesada y utilizada funciona como una encuesta, ya que cada vehículo representa

una incidencia sobre los lugares con más tráfico.

La información obtenida por el servicio Big Data deberá ser oportunamente

procesada por herramientas de inteligencia de negocios, con la finalidad de detectar

patrones en el comportamiento del tráfico y poder proponer soluciones. Causas

como obras en las vías y la realización de eventos de gran escala pueden generar

congestión vehicular.

El cobro tradicional de peajes y otros procesos cotidianos a estudiar son causantes

de tráfico vehicular, por lo que es recomendable utilizar tecnologías como el cobro

automático de las tarifas por medio de equipos relacionados con teléfonos

inteligentes o tarjetas recargables.

En conclusión, diversas fuentes colaboran con la obtención de información para la

identificación de las causas del tráfico; las que podrán ser tratadas por el gobierno si

así se decide. Dicha información estará compuesta por datos tanto estructurados

como no estructurados, pudiendo componerse por tweets, imágenes, monitoreo del

tráfico o videos. Cada reporte independiente de los conductores será analizado con

herramientas adecuadas de inteligencia de negocios, de manera que se puedan

detectar patrones para la posterior propuesta de soluciones. En conclusión, diversos

fenómenos o eventualidades pueden ser las causas de la congestión vehicular que se

observa a diario, por lo que será propicio atender cada incidencia con la importancia

29

Page 30: Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

que se merece para poder proponer soluciones basadas en tecnología como el uso de

servicios telemáticos o una comunicación que facilite la identificación de las causas,

a fin de evitarlas o mitigar el efecto de las mismas.

30

Page 31: Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

BIBLIOGRAFÍA

CISCO (2013) Cisco UCS with StackIQ Solution: Deliver Big Infrastructure for Big Data (consulta: 25 de setiembre) (http://www.cisco.com/en/US/solutions/collateral/ns340/ns517/ns224/ns944/whitepaper_c07-727919.html)

DYCHE, Jill (2012) The seven steps of big data delivery (consulta: 25 de setiembre de 2013) (http://www.sas.com/news/sascom/big-data-delivery.html)

GREEN CAR CONGRESS (2013) Toyota to launch new “Big Data Traffic Information Service” in Japan (consulta: 25 de setiembre) (http://www.greencarcongress.com/2013/05/tmc-201230529.html)

IBM Developer Works (2013) Analítica de inteligencia de negocios de Big Data (consulta: 30 de octubre) (http://www.ibm.com/developerworks/ssa/library/ba-big-data-bi/)

IBM Redbooks (2013) Analytics in a Big Data Environment (consulta: 25 de setiembre) (http://www.redbooks.ibm.com/redpapers/pdfs/redp4877.pdf)

IBM The Big Data Hub (2013) Sitio web oficial de IBM, contiene información sobre Big Data y enlaces de interés (consulta: 25 de setiembre) (http://www.ibmbigdatahub.com/whitepapers)

LARSON, Eric (2013) 5 Big Data Projects That Could impact Your Life (consulta: 25 de setiembre) (http://mashable.com/2013/07/17/big-data-projects/)

ORACLE (2013) Oracle: Big data for the Enterprise (consulta: 25 de setiembre) (http://www.oracle.com/us/products/database/big-data-for-enterprise-519135.pdf)

PING FUNG, Han (2013) Using Big Data Analytics in Information Tchnology (IT) Service Delivery (consulta: 25 de setiembre)

31

Page 32: Seminario de Investigación Académica II - Omar Bugosen & Christian Tejada

(http://www.academia.edu/3567945/Using_Big_Data_Analytics_in_Information_Technology_IT_Service_Delivery)

SIEMENS AG (2013) “Soluciones inteligentes para el tráfico de hoy y del mañana” (consulta: 25 de setiembre) (https://www.swe.siemens.com/spain/web/es/industry/mobility/Documents/traffic.pdf)

TWITTER (2013) “Tráfico RPP” (consulta: 31 de octubre) (https://twitter.com/traficorpp)

32