UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor:...

95
UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE INGENIER ´ IA, CIENCIAS F ´ ISICAS Y MATEM ´ ATICA CARRERA DE INGENIER ´ IA INFORM ´ ATICA DISE ˜ NO E IMPLEMENTACI ´ ON DE UN MODELO DE INTENCI ´ ON DE VOTO EN EL PROCESO DE ELECCIONES PRESIDENCIALES 2017 TRABAJO DE GRADUACI ´ ON PREVIO A LA OBTENCI ´ ON DEL T ´ ITULO DE INGENIERO INFORM ´ ATICO AUTOR: LUIS FELIPE TORRES LUZ ´ ON TUTOR: ING. JEFFERSON TARCISIO BELTR ´ AN MORALES QUITO - 01 DE NOVIEMBRE 2016

Transcript of UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor:...

Page 1: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

UNIVERSIDAD CENTRAL DEL ECUADOR

FACULTAD DE INGENIERIA, CIENCIAS FISICAS Y MATEMATICA

CARRERA DE INGENIERIA INFORMATICA

DISENO E IMPLEMENTACION DE UN MODELO DE INTENCION DE VOTO EN EL

PROCESO DE ELECCIONES PRESIDENCIALES 2017

TRABAJO DE GRADUACION PREVIO A LA OBTENCION DEL TITULO DE

INGENIERO INFORMATICO

AUTOR: LUIS FELIPE TORRES LUZON

TUTOR: ING. JEFFERSON TARCISIO BELTRAN MORALES

QUITO - 01 DE NOVIEMBRE

2016

Page 2: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

AUTORIZACION DE LA AUTORIA INTELECTUAL

Yo, TORRES LUZON LUIS FELIPE en calidad de autor del trabajo de titulacion, modalidad

proyecto integrador: “Diseno e implementacion de un modelo de intencion de voto en el

proceso de elecciones presidenciales 2017”, autorizo a la Universidad Central del Ecuador

hacer uso de todos los contenidos que me pertenecen o parte de los que contiene esta obra, con

fines estrictamente academicos o de investigacion.

Los derechos que como autor me corresponden, con excepcion de la presente autorizacion,

seguiran vigentes a mi favor, de conformidad con lo establecido en los artıculos 5, 6, 8; 19 y

demas pertinentes de la Ley de Propiedad Intelectual y su Reglamento.

Asimismo, autorizo a la Universidad Central del Ecuador para que realice la digitalizacion

y publicacion de este trabajo de investigacion en el repositorio virtual, de conformidad a lo

dispuesto en el Art. 144 de la Ley Organica de Educacion Superior.

En la ciudad de Quito, al 01 dıa del mes de noviembre de 2016.

Luis Felipe Torres Luzon

CC. 1718122706

Telefono: 0991911389

lucho [email protected]

ii

Page 3: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

CERTIFICACION DEL TUTOR

Yo, Jefferson Tarcisio Beltran Morales en calidad de tutor del trabajo de titulacion: Diseno e

implementacion de un modelo de intencion de voto en el proceso de elecciones presidencia-

les 2017, elaborado por la estudiante Torres Luzon Luis Felipe de la Carrera de Informatica,

Facultad de Ingenierıa Ciencias Fısicas y Matematica de la Universidad Central del Ecuador,

considero que el mismo reune los requisitos y meritos necesarios en el campo metodologico y

en el campo epistemologico, para ser sometidos a la evaluacion por parte del jurado examinador

que se designe, por lo que lo APRUEBO, a fin de que el proyecto integrador sea habilitado para

continuar con el proceso de titulacion determinado por la Universidad Central del Ecuador.

Telefono: 0998014043

[email protected]

iii

Page 4: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

INFORME DE LOS REVISORES

iv

Page 5: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

v

Page 6: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

DEDICATORIA

A mis padres

Mercy Luzon y Luis Torres

Page 7: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

AGRADECIMIENTOS

Yo agradezco a mis padres que han dado todo el esfuerzo para que yo ahora este culminando

esta etapa de mi vida.

A la Universidad Central del Ecuador, facultad de Ingenierıa Ciencias Fısicas y Matematica,

alma master de la ciencia que me formo como Ingeniero Informatico.

A mi tutor Ing. Jefferson Beltran por su vision crıtica, por sus conocimientos, su rectitud como

docente, por los consejos que me ayudo para el desarrollo de este proyecto integrador.

De igual manera al docente universitario, guıa academico e impulsador de buenas practicas pro-

fesionales y actitudes frente a la vida y la sociedad ecuatoriana.

A mi grupo Scout por ensenarme a ser un hombre responsable y fiel a mis principios ensenando-

me que la palabra imposible no existe, “Todo cuanto de mi dependa”.

Como olvidarme de mis companeros y amigos que compartimos buenos y malos momentos

demostrando que la verdadera amistad existe.

Gracias ...

vii

Page 8: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

CONTENIDO

pag.

AUTORIZACION DE LA AUTORIA INTELECTUAL ii

CERTIFICACION DEL TUTOR iii

INFORME DE LOS REVISORES iv

DEDICATORIA vi

AGRADECIMIENTOS vii

LISTA DE CONTENIDO viii

LISTA DE TABLAS xi

LISTA DE FIGURAS xii

LISTA DE ANEXOS xiii

GLOSARIO xiv

RESUMEN xvi

ABSTRACT xvii

INTRODUCCION 1

1 MARCO TEORICO 3

1.1 Redes Sociales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.1.1 Redes sociales en la actualidad . . . . . . . . . . . . . . . . . . . . . . 3

1.1.2 Reglas en la Red . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.1.3 Polıtica en Redes Sociales . . . . . . . . . . . . . . . . . . . . . . . . 5

viii

Page 9: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

1.1.4 Twitter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.1.5 APIs de Twitter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.2 Procesamiento de lenguaje natural . . . . . . . . . . . . . . . . . . . . . . . . 7

1.2.1 Problematica del procesamiento del lenguaje natural . . . . . . . . . . 8

1.3 Minerıa de opinion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.4 Polaridad de opinion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.5 Funciones para la estimacion de sentimientos . . . . . . . . . . . . . . . . . . 11

1.5.1 classify polarity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.5.2 score.sentiment . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.6 Analisis factorial de correspondencias . . . . . . . . . . . . . . . . . . . . . . 12

2 METODOLOGIA DE DESARROLLO 14

2.1 Metodologıas para Minerıa de Datos . . . . . . . . . . . . . . . . . . . . . . . 14

2.2 CRISP-DM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2.3 Fase de Comprension del Negocio . . . . . . . . . . . . . . . . . . . . . . . . 25

2.3.1 Objetivos del negocio . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.3.2 Valoracion de la situacion . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.3.3 Definicion de objetivos de Minerıa de Datos . . . . . . . . . . . . . . . 26

2.3.4 Plan de proyecto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2.4 Fase de Comprension de los datos . . . . . . . . . . . . . . . . . . . . . . . . 29

2.4.1 Recoleccion de datos iniciales . . . . . . . . . . . . . . . . . . . . . . 29

2.4.2 Datos para el modelo de popularidad . . . . . . . . . . . . . . . . . . . 30

2.4.3 Exploracion de los datos . . . . . . . . . . . . . . . . . . . . . . . . . 30

2.4.4 Verificacion de la calidad de los datos . . . . . . . . . . . . . . . . . . 31

2.5 Fase de Preparacion de los datos . . . . . . . . . . . . . . . . . . . . . . . . . 32

2.5.1 Seleccion de los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

2.5.2 Limpieza de los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

2.5.3 Construccion de nuevos datos . . . . . . . . . . . . . . . . . . . . . . 35

2.5.4 Integracion de los datos . . . . . . . . . . . . . . . . . . . . . . . . . . 36

2.6 Fase de Modelado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

2.6.1 Generacion de plan de pruebas . . . . . . . . . . . . . . . . . . . . . . 37

ix

Page 10: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

2.6.2 Generacion del Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . 39

2.6.3 Evaluacion del Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . 41

2.7 Fase de Implementacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

2.7.1 Plan de Implementacion . . . . . . . . . . . . . . . . . . . . . . . . . 42

2.7.2 Mantenimiento y Monitorizacion . . . . . . . . . . . . . . . . . . . . . 43

3 RESULTADOS 44

3.1 Modulo de Popularidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

3.2 Modulo Candidatos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

3.3 Modulo de Seleccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

3.4 Modulo Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

3.5 Modulo Tuiteros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

3.6 Modulo Palabras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

3.7 Modulo Mapa Tuitero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

4 CONCLUSIONES 59

5 RECOMENDACIONES 61

6 BIBLIOGRAFIA 62

7 ANEXOS 65

x

Page 11: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

LISTA DE TABLAS

pag.

1 Problemas y soluciones en la limpieza de datos . . . . . . . . . . . . . . . . . 20

2 Plan de proyecto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

3 Cuentas de Twitter de precandidatos . . . . . . . . . . . . . . . . . . . . . . . 29

4 Descripcion de los Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

5 Datos obtenidos con TwitteR. . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

6 Dimensiones geograficas del mapa de Ecuador . . . . . . . . . . . . . . . . . 34

7 data.frame del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

8 Matriz de confusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

9 Parametros de score.sentiment . . . . . . . . . . . . . . . . . . . . . . . . . . 40

10 Modelo de popularidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

11 Matriz de confusion para evaluacion . . . . . . . . . . . . . . . . . . . . . . . 42

12 Resultados de evaluacion del modelo . . . . . . . . . . . . . . . . . . . . . . . 42

13 Cuentas de Twitter y acronimo de precandidatos . . . . . . . . . . . . . . . . 44

14 Numero de seguidores de precandidatos agosto 2016 . . . . . . . . . . . . . . 45

15 Numero de tuiteros que han comentado por precandidato en diferentes fechas . 47

16 Numero de comentarios (+, -, N) por precandidato en diferentes fechas . . . . . 52

17 Tuiteros que comentan con mayor frecuencia por precandidato . . . . . . . . . 53

18 Palabras positivas y negativas con mayor frecuencia en los precandidatos . . . . 56

xi

Page 12: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

LISTA DE FIGURAS

pag.

1 Esquema general para detectar la polaridad de las opiniones . . . . . . . . . . . 11

2 Proceso KDD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

3 Modelo de proceso CRISP-DM . . . . . . . . . . . . . . . . . . . . . . . . . . 15

4 Fases de la metodologıa SEMMA . . . . . . . . . . . . . . . . . . . . . . . . 16

5 Variables P3TQ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

6 Fase de Comprension del negocio . . . . . . . . . . . . . . . . . . . . . . . . . 18

7 Fase de Comprension de los datos . . . . . . . . . . . . . . . . . . . . . . . . 19

8 Fase de Preparacion de los datos . . . . . . . . . . . . . . . . . . . . . . . . . 21

9 Fase de Modelado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

10 Fase de Evaluacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

11 Fase de Distribucion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

12 Tabla de localizacion despues de la limpieza . . . . . . . . . . . . . . . . . . . 34

13 Tuitero y resultado de sus comentarios . . . . . . . . . . . . . . . . . . . . . . 35

14 Tabla de localizacion por tuitero . . . . . . . . . . . . . . . . . . . . . . . . . 36

15 Frecuencia de palabras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

16 Tuitero y polaridad de sus comentarios . . . . . . . . . . . . . . . . . . . . . . 41

17 Tuits de evaluacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

18 Grafica de seguidores en Twitter . . . . . . . . . . . . . . . . . . . . . . . . . 45

19 Comparacion de numero de tuiteros que comentan . . . . . . . . . . . . . . . 46

20 AFC de precandidatos Fecha 1 . . . . . . . . . . . . . . . . . . . . . . . . . . 48

21 AFC de precandidatos Fecha 2 . . . . . . . . . . . . . . . . . . . . . . . . . . 48

22 Modulo de seleccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

23 Comparacion de comentarios por precandidato N◦1 . . . . . . . . . . . . . . . 50

24 Comparacion de comentarios por precandidato N◦2 . . . . . . . . . . . . . . . 51

25 Modulo de Tuiteros frecuentes . . . . . . . . . . . . . . . . . . . . . . . . . . 52

xii

Page 13: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

26 Modulo Palabras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

27 Modulo Mapa Tuitero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

LISTA DE ANEXOS

pag.

Anexo A: Diccionario de palabras Positivas y Negativas . . . . . . . . . . . . . . . . . . 65

xiii

Page 14: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

GLOSARIO

@: se usa para indicar nombres de usuario en los Tweets, por ejemplo: ”¡Hola, @twitter!”. Los

usuarios utilizan tu @nombredeusuario para mencionarte en Tweets, enviarte mensajes o

proporcionar un vınculo a tu perfil.

@nombredeusuario: el nombre de usuario es lo que te identifica en Twitter y va siempre

directamente precedido por el sımbolo @. Por ejemplo, el nombre de usuario de Katy

Perry es @katyperry.

#: consulta etiqueta

ETIQUETA: es cualquier palabra o frase precedida directamente por el sımbolo #. Cuando

hagas clic en una etiqueta, veras todos los demas Tweets que incluyen esa palabra clave

o tema.

RETWEET, RT: se denomina Retweet a un Tweet que reenvıas a tus seguidores. Generalmen-

te se usan para compartir noticias y demas contenido interesante publicado en Twitter, y

siempre mantienen su atribucion original.

RETWITTEAR: se refiere al acto de compartir el Tweet de otro usuario con todos tus segui-

dores haciendo clic en el boton Retwittear.

SEGUIDOR: se trata de otro usuario de Twitter que te sigue para ver tus Tweets en su crono-

logıa de Inicio.

SEGUIDORES: este numero indica cuantas personas te siguen y a cuantas personas sigues.

Las cifras aparecen en tu perfil de Twitter.

SEGUIR: la suscripcion a una cuenta de Twitter se denomina ”seguimiento”. De este modo,

podras ver sus nuevos Tweets apenas se publiquen. Cualquier usuario de Twitter puede

seguir o dejar de seguir a otros en cualquier momento, con la excepcion de las cuentas

bloqueadas.

xiv

Page 15: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

TWEET: tambien llamado tuit tiene un lımite de 140 caracteres y puede contener vınculos,

fotos y videos.

xv

Page 16: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

RESUMEN

TEMA: “DISENO E IMPLEMENTACION DE UN MODELO DE INTENCION DE VOTO

EN EL PROCESO DE ELECCIONES PRESIDENCIALES 2017”.

Autor: Luis Felipe Torres Luzon

Tutor: Jefferson Tarcisio Beltran Morales

Este proyecto tiene como finalidad crear un modelo para medir la popularidad de un candidato

en las elecciones presidenciales de Ecuador para el ano 2017, utilizando Twitter como la red

social para el analisis.

En el desarrollo de este proyecto como paso primario es la eleccion de personalidades polıticas

mas sonadas del paıs en el mes de mayo de 2016, por cada uno de ellos se extrae los tuits don-

de los mencionan, consecutivamente someterlos a la limpieza de su texto para poder emplear

minerıa de opinion mediante un metodo supervisado, sirviendose de la funcion score.sentiment

de R para determinar la polaridad de cada tuit, ası generar el modelo de popularidad a traves de

la clasificacion de opiniones generadas por un tuitero. Con los datos obtenidos del modelo se

realiza varios analisis que muestran graficamente la aceptacion que tiene cada precandidato.

Este proyecto sigue la metodologıa CRISP-DM para proyectos de Minerıa de datos y la utiliza-

cion de R como lenguaje de programacion que tiene un enfoque estadıstico siendo muy popular

en el campo de la Minerıa de datos, ademas de la visualizacion de resultados mediante la li-

brerıa Shiny que permite realizar aplicaciones web.

PALABRAS CLAVE: RED SOCIAL TWITTER / METODOLOGIA CRISP-DM /

MINERIA DE OPINION / LENGUAJE DE PROGRAMACION R / FUNCION

SCORE.SENTIMENT / SHINY PAQUETE DE R

xvi

Page 17: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

ABSTRACT

TOPIC: “DESIGN AND IMPLEMENTATION OF A VOTING INTENTION MODEL FOR

THE PRESIDENTIAL ELECTIONS OF 2017”.

Author: Luis Felipe Torres Luzon

Tutor: Jefferson Tarcisio Beltran Morales

The purpose of this Project is to create a model to measure the popularity of a candidate in

the presidential elections to be held in Ecuador in 2017, using Twitter as the social media for

the analysis. The first step for the development of this project was to choose the most relevant

political personalities in the country during May 2016. Tweets related to each one of them

were extracted in order to clean them up and be able to establish their opinions of the users

through the score.sentiment function of R, so the trend of each tweet could be determined, and

generating therefore the popularity model classifying the general opinions generated by a user

of Twitter. With the data obtained several analysis are performed, which graphically show the

acceptance each candidate has. This project follows the methodology CRISP-DM for projects

of Data Mining, and the use of R as a programming language, which has a statistic approach and

is very popular in Data Mining; also, the library Shiny, which allows to make web applications,

was used to visualize the results.

KEY WORDS: SOCIAL NETWORK TWITTER / CRISP-DM METHODOLOGY / DATA

MINING / PROGRAMMING LANGUAGE R / FUNCTION SCORE.SENTIMENT / SHINY

PACKAGE OF R

xvii

Page 18: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

INTRODUCCION

En la actualidad las redes sociales forman una interaccion social permanente que involucra a

personas, grupos y organizaciones; conectados por diferentes tipos de relaciones tales como

gustos, aficiones, polıtica, etc., que proporcionan informacion para la toma de decisiones.

Polıticos estan tomando en serio las publicaciones en diferentes redes sociales para enterarse de

su popularidad y ası realizar adecuadamente sus acciones de campana.

La falta de un Analizador de Sentimientos que permita catalogar opiniones mediante tecnicas

de minerıa de datos en redes sociales que se considera costoso y trabajoso, hace que necesiten

herramientas de minerıa de texto que permita alcanzar resultados sobre la opinion de una per-

sona hacia un polıtico.

Profundizar en Twitter por la brevedad de sus mensajes, facilidad de publicacion y ademas

de la simplicidad de extraccion de informacion, nos hace inclinarnos por tratar de conocer el

contexto de cada tuit por personalidad polıtica.

El objetivo principal es crear un modelo que permita medir la popularidad de un polıtico utili-

zando Twitter como la red social para el analisis. El interes de hacer un modelo es comprender

de que manera los tuiteros escriben hacia una personalidad polıtica y conocer su popularidad a

traves del valor de cada tuit que puede ser positivo, negativo o neutral.

Al analizar los tuits se emplea minerıa de opinion para clasificar su polaridad con aproxima-

ciones supervisadas al necesitar a priori un diccionario de palabras positivas y negativas.

Se aprovecha el lenguaje de programacion R para: extraccion, limpieza y procesamiento del

modelo por cada polıtico, ademas de la utilizacion de la librerıa ShinyR con la finalidad de

crear una aplicacion web para la presentacion de resultados.

Las limitaciones al momento de extraer la informacion de un tuitero estan sujetas a Twitter

1

Page 19: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

y para las coordenadas geograficas por Google Maps. Como una limitacion al analizar el lexico

de los tuits se encuentra las reglas gramaticales que tiene el idioma espanol. La aplicacion no

contara con un analisis en lınea, se propone en proyectos futuros la realizacion de ella.

Para abordar la tematica, este proyecto de titulacion se estructuro en tres capıtulos:

En el capıtulo I contiene los fundamentos teoricos que sustenta este proyecto, se conocera la

importancia de las redes sociales en el ambiente polıtico. Se adentrara en el ambiente de minerıa

de opinion y sus diferentes funciones que proporciona R para realizar este tipo de analisis.

En el capıtulo II se encuentra la descripcion del modelo de popularidad, ademas de la meto-

dologıa de minerıa de datos a utilizar en el proceso de desarrollo del proyecto definiendo los

objetivos y el plan de proyecto.

En el capıtulo III los resultados expuestos en una aplicacion web que tiene como modulos

al analisis de cada agente polıtico como: frecuencia de palabras positivas y negativas, tuite-

ros frecuentes y mapa de tuiteros. Se encuentra graficas comparando a todos los precandidatos

segun: numero de seguidores, numero de tuiteros que comentan y la relacion entre los niveles

de opinion mediante analisis factorial de correspondencia (AFC).

Para finalizar se presenta las conclusiones y recomendaciones de acuerdo a los resultados obte-

nidos en el proceso.

2

Page 20: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

1. MARCO TEORICO

El presente trabajo analiza la construccion de un modelo que permita medir la popularidad de

un polıtico utilizando Twitter. En este sentido, es conveniente explicar algunos conceptos. En

primer termino, el abordaje de las redes sociales en la actualidad y el porque de la utilizacion

de twitter en este proyecto. Se necesita comprender la problematica del lenguaje espanol para

el procesamiento de lenguaje natural en los tuits, para emplear minerıa de opinion o tambien

llamado analisis de sentimiento que ayudara averiguar que tipo de polaridad tiene cada tuit

empleando un tipo de aproximacion. Al tener muestras diferentes, producto del resultado de

la polaridad de cada tuit para diferentes polıticos se determino realizar el analisis factorial de

correspondencia (AFC), se resumira su funcionamiento y como ayudo al momento de evaluar a

cada actor polıtico.

1.1. Redes Sociales

Freeman et al. (1992) afirman.“Una red social consiste, en esencia, de dos elementos: una po-

blacion de actores y por lo menos una relacion que sea medible, definida para cada par de

actores”. Los actores pueden ser entidades sociales en cualquier nivel de agregacion (personas

u otros organismos individuales, o colectividades, como unidades familiares, organizaciones o

paıses). Las relaciones pueden comprender cualquier accion, actividad, transaccion, obligacion,

sentimiento u otro tipo de conexiones entre pares, o entre subgrupos de actores. (Schmidt, 2002)

1.1.1. Redes sociales en la actualidad

“Con las redes sociales ahora todos podemos ser reporteros callejeros, denunciantes, trolls y

hasta estrellas en Internet”(AMERICATV, 2009 May 21).

La importancia de las redes sociales en la actualidad es indiscutible, al darles la herramienta de

la expresion a las personas para que puedan comunicarse de manera inmediata y dar dominio a

sus opiniones y contenidos. Esto convierte a la red social en un potente instrumento social. Su

funcionalidad y presencia tiene una repercusion en la sociedad, su impacto, global como local,

se incrementa y desarrolla a cada minuto, que dan lugar a cambios trascendentales para grupos

e individuos.

3

Page 21: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

Segun Alcazar (2016) del blog de Formacion General, las redes sociales mas utilizadas en Ecua-

dor (actualizacion al 6 de enero 2016) son: YouTube, Facebook, Ask y Twitter.

YouTube encargado de subir y compartir videos, Facebook basada en compartir actualizacio-

nes de estado, enlaces y contenido multimedia, ASK permite hacer preguntas en anonimato y

por otro lado se encuentra Twitter compartiendo mensajes de 140 caracteres donde los usuarios

estan en una especie de chat universal.

1.1.2. Reglas en la Red

Christakis et al. (2010) propone algunas reglas en la red que explican por que los vınculos

pueden hacer que el todo sea mayor que la suma de las partes. Las reglas que sugiere son:

Somos nosotros quienes damos forma a nuestra red Depende de nosotros con que persona

queremos relacionarnos, si son familia, conocidos, partidarios, proveedores, etc. Depende

de nosotros que lugar queremos que ocupemos en ellas.

Nuestra red nos da forma a nosotros Nuestro lugar en la red nos afecta, el numero de con-

tactos de nuestros amigos y de nuestra familia tambien es relevante, somos susceptibles a

las influencias de la red.

Nuestros amigos nos influyen Aquello que fluye por las conexiones tambien es crucial, las

redes sociales transportan todo tipo de cosas de una persona a otra. Lo normal es que toda

persona mantenga muchos vınculos directos con una gran variedad de gente incluida la

familia, vecinos, amigos hasta partidos polıticos y cada uno de estos vınculos nos ofrece

oportunidades de influir y de recibir influencias.

Los amigos de los amigos de nuestros amigos tambien nos influyen Resulta que las perso-

nas no solo copian a sus amigos, sino que tambien copian a los amigos de sus amigos y a

los amigos de los amigos de sus amigos.

La red tiene vida propia Las redes sociales pueden tener propiedades y funciones que sus

miembros ni controlan ni perciben.

4

Page 22: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

1.1.3. Polıtica en Redes Sociales

Muchas de las personalidades publicas tienen su blog1, pagina web2, canal en YouTube3, su

fanpage4 en las redes sociales mas utilizadas, esto permite que esten conectados con su gente,

ademas de ser participativos interactuando o brindando una opinion en breves segundos en sus

cuentas. Un ejemplo de esto es el polıtico Guillermo Lasso que tiene actividad en diferentes

sitios y de manera actualizada en cada una de ellas:

Canal de YouTube: https://www.youtube.com/user/LassoGuillermo

Fanpag Facebook:https://www.facebook.com/LassoGuillermo

Twitter: https://twitter.com/LassoGuillermo

Blog: http://guillermolasso.ec/blog

Pagina Web: http://guillermolasso.ec/

Tener presencia en las redes sociales es importante y mas aun si son en epocas de elecciones,

los polıticos aumentan sus movimientos en sus cuentas de Facebook y Twitter sobre todo en

la ultima donde el debate polıtico es mas profundo por las caracterısticas de su red. Segun

Domınguez (2009) no hay que ponderar la importancia de una figura polıtica segun la cantidad

de seguidores que tenga en una red social. Esta herramienta es util solamente si se usa como

medio de comunicacion alternativo, no como una encuesta de afiliacion ciudadana.

Para Trivinho (2011) la visibilidad en los medios se caracteriza cada vez mas por la interme-

diacion, en que rapidamente texto, imagenes y sonidos pasan de un contexto local a otro y en

la circularidad de tiempo real: la escena publica de masas se transformo en escenario publi-

co interactivo. Con esto, cada usuario de una red social puede dar sus comentarios e interactuar

con personalidades polıticas dando a conocer su punto de vista de lo que ocurre en la actualidad.

1generalmente de caracter personal, con una estructura cronologica que se actualiza.2documento o informacion electronica capaz de contener texto, contenido multimedia, programas, enlaces, y

muchas otras cosas que puede ser accedida mediante un navegador.3pagina principal para una cuenta de YouTube, se muestra los videos publicos que han subido.4es visible para todos, no esta condicionada a la incorporacion del usuario en tu relacion de amigos. La pagina

estara visible para todo el que acceda a ella a traves de un simple me gusta.

5

Page 23: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

Al tener varias redes sociales en la actualidad, se elige Twitter para el desarrollo de este pro-

yecto, al ser una red donde el debate polıtico es mas profundo por la caracterıstica de sus tuits

(texto de 140 caracteres) donde todos se encuentran en un chat virtual, ademas de la facilidad

de extraccion de datos que proporciona Twitter.

1.1.4. Twitter

Twitter es la red social favorita de todos los usuarios de medios de comunicacion y de los co-

municadores en sentido general. Es un medio sumamente veloz, agil y versatil al cual puedes

sacarle muchısimo provecho en todo el sentido de la palabra. Twitter recibe un estimado de 250

millones de visitas al mes. (Comohackear, 2016)

Twitter proporciona diferentes formas para la extraccion de sus datos, a continuacion, se men-

ciona las diferentes maneras que se puede utilizar con la intervencion de sus APIs.

1.1.5. APIs de Twitter

Una API (siglas de ’Application Programming Interface’) es un conjunto de reglas (codigo) y

especificaciones que las aplicaciones pueden seguir para comunicarse entre ellas: sirviendo de

interfaz entre programas diferentes de la misma manera en que la interfaz de usuario facilita la

interaccion humano-software. (TICbeat, 2014)

Como Twitter no puede ser la excepcion esta nos permite que cualquiera pueda crear aplicacio-

nes que comunique con el servicio de Twitter.

Twitter tiene tres tipos de APIs: REST API, Search API y Streaming API que son para las

diferentes necesidades que se los requiera.

REST API ofrece a los desarrolladores el acceso al core de los datos de Twitter. Todas las

operaciones que se pueden hacer vıa web son posibles realizarlas desde el API. Soporta

los formatos: xml, json, rss, atom

Search API suministra los tweets con una profundidad en el tiempo de 7 dıas que se ajustan

a la query solicitada. Es posible filtrar por, cliente utilizado, lenguaje y localizacion. No

requiere autenticacion y los tweets se obtienen en formato json o atom.

6

Page 24: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

Streaming API Se establece una conexion permanente por usuario con los servidores de Twit-

ter y mediante una peticion http se recibe un flujo continuo de tweets en formato json.

Para el blog (Barriblog, 2010) Las APIs de Twitter tienen algunas limitaciones, en el Streaming

API el flujo es continuo y la velocidad de recepcion de tweets tuvo fluctuaciones que dependie-

ron del ancho de banda de los dos extremos de la conexion y la sobrecarga de los servidores de

Twitter. En el Search API y en el REST API existio una limitacion de 150 peticiones a la hora

por usuario o por IP si la llamada no estuvo autenticada.

“Tenga en cuenta que el ındice de busqueda tiene un lımite de siete dıas. En otras palabras, no

hay tweets que se pueden encontrar para una fecha mas de una semana”(Twitter, 2016).

1.2. Procesamiento de lenguaje natural

Cortez et al. (2009) dice que una de las tareas fundamentales de la Inteligencia Artificial (IA) es

la manipulacion de lenguajes naturales usando herramientas de computacion, en esta, los len-

guajes de programacion juegan un papel importante, ya que forman el enlace necesario entre los

lenguajes naturales y su manipulacion por una maquina. El PLN consiste en la utilizacion de un

lenguaje natural para comunicarnos con la computadora, debiendo esta entender las oraciones

que le sean proporcionadas, el uso de estos lenguajes naturales, facilita el desarrollo de progra-

mas que realicen tareas relacionadas con el lenguaje o bien, desarrollar modelos que ayuden a

comprender los mecanismos humanos relacionados con el lenguaje. El uso del lenguaje natural

(LN) en la comunicacion hombre-maquina presenta a la vez una ventaja y un obstaculo con

respecto a otros medios de comunicacion.

Para ventaja de la persona, no tiene que trabajar en aprender el medio de comunicacion a dife-

rencia de otros medios de interaccion como las interfaces graficas o los lenguajes de comando.

Su uso todavıa presenta limitaciones pues la computadora tiene una limitada comprension del

lenguaje. Realmente, lo que constituye en ventaja para la comunicacion humana se convier-

te en problema en el tratamiento computacional, ya que implican conocimiento y procesos de

razonamiento.

7

Page 25: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

1.2.1. Problematica del procesamiento del lenguaje natural

Al analizar los diferentes textos que generan usuarios en Twitter, se llega a la dificultad de pro-

cesar el lenguaje espanol por sus complejas leyes gramaticales. Vallez y Pedraza (2007) muestra

algunos problemas que se tiene al procesar el lenguaje natural.

A nivel morfologico una misma palabra puede adoptar diferentes variaciones y roles morfo-

sintacticos en funcion del contexto en el que aparece, ocasionando problemas de ambiguedad.

Ejemplo: “Los candidatos presidenciales apuntaron a la conformacion de sus binomios, co-

mo parte importante dentro de su agenda, apuntaron sus posibles nombres en los registros de

CNE.”

La palabra apuntar es ambigua morfologicamente ya que puede ser un verbo transitivo, utiliza-

do para indicar algo o puede ser utilizado indicando que se escribio algo.

A nivel sintactico, centrado en el estudio de las relaciones establecidas entre las palabras para

formar unidades superiores, sintagmas y frases, se produce ambiguedad a consecuencia de la

posibilidad de asociar a una frase mas de una estructura sintactica. Por otro lado, esta variacion

supone la posibilidad de expresar lo mismo, pero cambiando el orden de la estructura sintactica

de la frase.

Ejemplo: “La ministra de la Salud se pronuncio contra el uso del tabaco en el Congreso de

Diputados.”

La interpretacion de la dependencia de los dos, otorga diferentes significados a la frase: (i) La

ministra de Salud se pronuncio contra el uso del tabaco ante el Congreso de Diputados expo-

niendoles el tema o, (ii) La ministra de Salud se pronuncio contra el uso del tabaco por parte de

los miembros que conforman el Congreso de Diputados.

A nivel semantico, donde se estudia el significado de una palabra y el de una frase a partir

de los significados de cada una de las palabras que la componen. La ambiguedad se produce

porque una palabra puede tener uno o varios sentidos, es el caso conocido como polisemia.

Ejemplo: “El candidato presidencial es noble.”

El termino noble puede tener dos significados en esta frase, (i) tıtulo nobiliario y (ii) persona

8

Page 26: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

de buen corazon. La interpretacion de esa frase va mas alla del analisis de los componentes que

forman la frase, se realiza a partir del contexto en que es formulada.

Hay que tener en cuenta la variacion lexica que hace referencia a la posibilidad de utilizar

terminos distintos a la hora de representar un mismo significado, es decir el fenomeno conocido

como sinonimia.

Ejemplo: “Coche / Vehıculo / Automovil.”

A nivel pragmatico, basado en la relacion del lenguaje con el contexto en que es utilizado, en

muchos casos no puede realizarse una interpretacion literal y automatizada de los terminos uti-

lizados.

En determinadas circunstancias, el sentido de las palabras que forman una frase tiene que inter-

pretarse a un nivel superior recurriendo al contexto en que es formulada la frase.

Ejemplo: “Se morıa de risa.”

En esta frase no puede interpretarse literalmente el verbo morirse si no que debe entenderse en

un sentido figurado.

Otra cuestion de gran importancia es la ambiguedad provocada por la anafora, es decir, por

la presencia en la oracion de pronombres y adverbios que hacen referencia a algo mencionado

con anterioridad.

Ejemplo: “El ministro indico las propuestas sobre el tema”

La interpretacion de esta frase tiene diferentes incognitas ocasionadas por la utilizacion de pro-

nombres y adverbios: ¿a quien?, ¿Que propuestas?, ¿sobre que tema? Por tanto, para otorgar un

significado a esta frase debe recurrirse nuevamente al contexto en que es formulada.

Con todos los ejemplos expuestos queda patente la complejidad del lenguaje y que su trata-

miento automatico no resulta facil.

9

Page 27: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

1.3. Minerıa de opinion

Para Cortizo (2011) cuando hablamos de Minerıa de Opiniones (tambien llamado Analisis del

Sentimiento) nos estamos refiriendo a una serie de aplicaciones de tecnicas del procesamiento

del lenguaje natural y minerıa de textos, que tienen como objetivo la extraccion de informacion

a partir de contenidos generados por los usuarios, como puedan ser comentarios en blogs, re-

views de productos, etc. Con este tipo de tecnologıas podemos ser capaces de extraer un valor

tangible y directo, como pueda ser “positivo” / “negativo”, a partir de un comentario textual.

Regularmente los procesos de minerıa de opinion se dividen en tres fases: Representacion de

los datos, Normalizacion de los datos y Clasificacion.

Encontramos dos tipos de tareas relacionadas con la Minerıa de Opiniones:

Polaridad de una opinion: Determinar si una opinion es positiva o negativa. Se obtiene

un valor numerico dentro de un rango determinado, que de una forma senalada trate de

obtener un rating objetivo asociado a una opinion.

Basado en caracterısticas: Consta de dos etapas: detector de subjetividad y detector de

polaridad. La primera el porcentaje de textos clasificados como subjetivos y la segunda

respecto al porcentaje de texto clasificados como positivos o negativos. Las dos etapas

dependen a una entidad y de una revision humana.

Para el minado de opinion de mensajes con longitud similar a los tuits la clasificacion que

mejor se acopla es la tarea supervisada ası lo expone (Pang y Lee, 2008). Lo que se necesita

para esta tarea es un diccionario de palabras positivas y negativas en espanol que se obtiene de

diccionarios online. Todo este proceso se desarrolla en R por sus diferentes librerıa y funciones

en el ambito de la minerıa de datos.

1.4. Polaridad de opinion

Para Amores et al. (2015) una de las principales tareas de la minerıa de opinion es la clasifica-

cion de la polaridad de la opinion, que consiste en determinar si la opinion es positiva o negativa

con respecto a la entidad a la que se este refiriendo. En la figura 1 se muestra los pasos para

evaluar una opinion.

Cada termino tiene polaridad cuando esta porta informacion subjetiva, bien sea positiva o nega-

10

Page 28: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

Figura 1. Esquema general para detectar la polaridad de las opiniones (Amores et al., 2015)

tiva. Para poder resolver la polaridad de un texto podemos utilizar dos metodos: el aprendizaje

automatizado supervisado y la aproximacion no supervisada (Orientacion semantica).

Las aproximaciones supervisadas para la clasificacion de la polaridad de las opiniones son de-

pendientes del dominio de conocimiento, ya que necesitan de datos etiquetados a priori con la

polaridad. En cambio, las aproximaciones no supervisadas generalmente pueden ser aplicadas

a cualquier dominio de conocimiento.

1.5. Funciones para la estimacion de sentimientos

Existen varias tecnicas al momento de estimar un texto y su posible valencia (positiva, negativa o

neutra). Al utilizar R para el desarrollo se encuentran diferentes funciones que nos ayuda para la

minerıa de opinion es este caso se encuentran dos funciones: classify polarity y score.sentiment.

1.5.1. classify polarity

Utiliza un marco probabilıstico, tiene sus fundamentos en el Teorema de Bayes para calcular

la probabilidad de una clase (positiva, negativa). Es una tecnica de clasificacion y prediccion

supervisada, entre sus ventajas esta que su implementacion es muy facil y obtiene buenos resul-

tados de clasificacion en la mayorıa de los casos.

El modelo de probabilidad para un clasificador es:

p(C|F1, ..., Fn) (1)

11

Page 29: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

Donde C representa un valor positivo (+) o negativo (−) y F1, F2, ..., Fn factores que representa

las palabras de un tuit. Donde se busca establecer la probabilidad a priori de que un tuit sea

positivo o negativo.

1.5.2. score.sentiment

Es una funcion muy simple que asigna una puntuacion simplemente contando el numero de

ocurrencias de positivos y negativos en un tuit comparando con un diccionario de palabras.

La formula del score:

score = sum(PalabrasPositivas)− sum(PalabrasNegativas) (2)

El exito de esta funcion es tener la mayor cantidad de palabras positivas y negativas, existen al-

gunos diccionarios ya cargados con estas palabras uno de ellos es MPQA que se puede obtener

desde http://mpqa.cs.pitt.edu/corpora/mpqa corpus/

Al optar por una funcion de los planteados se decide tomar el score.sentiment ya que en pruebas

realizadas con la funcion classify polarity un tuit que se encuentre vacıo o no encuentra ningu-

na palabra en el diccionario el valor de la opinion siempre sera positivo y esto afectara en el

analisis al comparar con las opiniones negativas.

1.6. Analisis factorial de correspondencias

Al tener varias muestras por cada polıtico se encuentra problemas al querer compararlos a to-

dos, ya que tiene diferentes tamanos, por esa razon se estudia un metodo multivariante para la

ayuda del analisis.

El analisis factorial de correspondencias (AFC) esta especialmente disenado para evaluar las

interacciones entre categorıas de variables cualitativas. El analisis parte de la tabla de contin-

gencia y considera la matriz n x p dado por:

en filas las categorıas A1, A2, ..., An

en columnas las categorıas B1, B2, ..., Bp

12

Page 30: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

en una celda de la matriz de contingencia, es el elemento kij que representa el numero de

casos de la categorıa i presente junto con la categorıa j.

Los marginales de fila, columna y total se definen como:

ki =

p∑j=1

kij el total de la fila i

kj =n∑

i=1

kij el total de la columna j

k =∑i

∑j

kij el total de la poblacion

Partiendo de k en AFC (simples en el caso de que la matriz sea 2x2 o multiples en el caso

general).

El metodo evalua la distancia entre filas y columnas.

d2(i, i′) =

p∑j=1

1

fj

(fijfi−

fi′jfi′

)2

(3)

donde f j =kik

de igual forma

d2(j, j′) =

n∑i=1

1

fi

(fijfj−

fij′

fj′

)2

(4)

donde f i =kik

Las cuales buscan establecer la similitud entre categorıa de la variable A o B para luego pro-

yectar la distancia en el plano factorial.

Para el caso de estudio se pretende visualizar la relacion entre los niveles de opinion (+,−, N)

en los diversos agentes polıticos considerados.

13

Page 31: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

2. METODOLOGIA DE DESARROLLO

En este proyecto integrador se desarrolla una metodologıa para el desarrollo de proyectos en

Minerıa de Datos, puesto que el estudio, es el analisis de contenido de Twitter hacia una perso-

na involucrado en la polıtica.

2.1. Metodologıas para Minerıa de Datos

En minerıa de datos existen algunas metodologıas que permite hacer del proyecto mejor orga-

nizado, a continuacion, se vera algunas de ellas.

KDD La tecnologıa KDD esta basada en un bien definido proceso KDD de multiples pasos, pa-

ra el descubrimiento de conocimiento en grandes colecciones de datos. El proceso KDD

es iterativo por naturaleza, y depende de la interaccion para la toma de decisiones, de

manera dinamica.(Nigro et al., 2004)

Segun (Moine, 2013) KDD es un proceso iterativo e interactivo. Iterativo ya que la salida

de alguna de las fases puede retroceder a pasos anteriores y porque a menudo son nece-

sarias varias iteraciones para extraer conocimiento de alta calidad. Es interactivo porque

el usuario, o mas generalmente un experto en el dominio del problema, debe ayudar a la

preparacion de los datos y validacion del conocimiento extraıdo.

El modelo de proceso KDD se resume en las siguientes cinco fases de la figura (2)

Figura 2. Proceso KDD (Gonzalez, 2016)

CRISP-DM (CRoss Industry Standard Process for Data Mining) fue presentada en el ano 1999

por las empresas SPSS, Daimer Chrysler y NCR. Es una metodologıa abierta, no esta li-

gada a ningun producto comercial, y fue construida en base a la experiencia de sus crea-

14

Page 32: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

dores, es decir desde un enfoque practico.

La metodologıa esta estructurada en un proceso jerarquico, compuesto por tareas descrip-

tas en cuatro niveles diferentes de abstraccion, que van desde lo general a lo especıfico.

CRISP-DM, propone en el nivel mas alto seis fases para el proceso de minerıa de datos

Figura(3) : entendimiento del negocio, entendimiento de los datos, preparacion de los da-

tos, modelado, evaluacion e implementacion. La sucesion de fases, no es necesariamente

rıgida. Cada una de estas fases generales se compone de un conjunto de tareas en las que

Figura 3. Modelo de proceso CRISP-DM (Wirth y Hipp, 2000)

se definen las salidas o entregables que se generan. Si bien la metodologıa no especifica

detalladamente como llevar a cabo cada tarea, los consejos de la seccion “Guıa de Usua-

rioresultan de mucha utilidad y orientacion al momento de ejecutarlas.(Moine, 2013)

SEMMA Creada por SAS Institute, fue propuesta especialmente para trabajar con el software

SAS Enterprise Miner. Si bien en la comunidad cientıfica se conoce a SEMMA como una

metodologıa, en el sitio de la empresa SAS se aclara que este no es el objetivo de la mis-

ma, sino mas bien la propuesta de una organizacion logica de las tareas mas importantes

del proceso de minerıa de datos.

SEMMA establece un conjunto de cinco fases para llevar a cabo el proceso de minerıa Fi-

gura 4: Sample (Muestreo), Explore (Exploracion), Modify (Modificacion), Model (Mo-

15

Page 33: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

delado) y Assess (Evaluacion). Esta especialmente enfocada al desarrollo del modelo de

minerıa, y quedan fuera de su alcance otros aspectos del proyecto como el conocimiento

del problema en estudio o la planificacion de la implementacion.

SAS Enterprise Miner organiza sus herramientas (llamadas ?nodos?) en base a las distin-

tas fases que componen la metodologıa. Es decir, el software proporciona un conjunto de

herramientas especiales para la etapa de muestreo, otras para la etapa de exploracion, y

ası sucesivamente. Al igual que en KDD, SEMMA no proporciona una guıa de activida-

Figura 4. Fases de la metodologıa SEMMA (Britos, 2008)

des especıficas a realizar en cada una de sus etapas. Por este motivo existe una discusion

en la literatura acerca de si SEMMA deberıa ser considerada una metodologıa.(Moine,

2013)

Catalyst Pyle recomienda que el proceso de minerıa de datos siempre deberıa colaborar con

una situacion organizacional, como un problema u oportunidad. Recomienda no trabajar

directamente con los datos sino establecer de antemano la problematica que se aborda, el

personal involucrado y las expectativas y necesidades de los usuarios. Este punto resulta

de gran importancia para justificar la realizacion del proyecto, ya que difıcilmente una

organizacion compre una herramienta si no sabe la funcion que cumplira.

Para proyectos donde el problema u oportunidad de negocio no esta definido, se reco-

mienda comenzar analizando las relaciones P3TQ - Product (Producto), Place (Lugar),

Price (Precio), Time (Tiempo) y Quantity (Cantidad) - que existen en la cadena de valor

organizacional. Las relaciones P3TQ se refieren a tener el producto correcto, en el lugar

adecuado, en el momento adecuado, en la cantidad correcta y con el precio correcto.

16

Page 34: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

Figura 5. Variables P3TQ (Mendez y Rodrıguez, 2009)

Para este proyecto se utilizo la metodologıa CRISP-DM por ser la mas utilizada (Moine, 2013)

y la que se acopla a las necesidades del presente proyecto.

2.2. CRISP-DM

Basada en el Manual CRISP-DM de IBM SPSS Modeler IBM (2012).

CRISP-DM, que son las siglas de Cross-Industry Standard Process for Data Mining, es un

metodo probado para orientar sus trabajos de minerıa de datos.

Como metodologıa, incluye descripciones de las fases normales de un proyecto, las tareas

necesarias en cada fase.

Como modelo de proceso, CRISP-DM ofrece un resumen del ciclo vital de minerıa de

datos.

En la grafica 3 se observa el ciclo vital del modelo que contiene seis fases con flechas que indi-

can las dependencias mas importantes y frecuentes entre fases. La secuencia de las fases no es

estricta. De hecho, la mayorıa de los proyectos avanzan y retroceden entre fases si es necesario.

A continuacion se describe las fases de la metodologıa.

Fase de Comprension del negocio

Debe dedicar tiempo a explorar las expectativas de su organizacion con respecto a la minerıa

17

Page 35: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

de datos. Intente implicar a la mayor cantidad de personas que sea posible en estas discusiones

y documente los resultados. El paso final de la fase de CRISP-DM trata de como producir un

plan de proyecto utilizando la informacion que se contiene en esta documentacion.

Determinacion de los objetivos comerciales, su primera tarea es obtener la maxima infor-

macion posible de los objetivos comerciales de la minerıa de datos.

Valoracion de la situacion, inventario de recursos, requerimientos, supuestos, termino-

logıas propias del negocio

Determinacion de los objetivos de minerıa de datos, cuando trabaje con analistas comer-

ciales y de datos para definir una solucion tecnica al problema comercial, recuerde que

los objetivos deben ser concretos

Produccion de un plan de proyecto, en este punto, ya esta listo para producir un plan para

el proyecto de minerıa de datos. Las cuestiones que haya planteado hasta el momento y

los objetivos comerciales y de minerıa de datos que haya formulado formaran la base de

este plan.

Figura 6. Fase de Comprension del negocio (Wirth y Hipp, 2000)

Fase de Comprension de los datos

La fase de comprension de datos de CRISP-DM implica estudiar mas de cerca los datos dispo-

nibles de minerıa. Este paso es esencial para evitar problemas inesperados durante la siguiente

18

Page 36: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

fase (preparacion de datos) que suele ser la fase mas larga de un proyecto.La comprension de

datos implica acceder a los datos y explorarlos con la ayuda de tablas y graficos que se pueden

organizar.

Recopilacion de datos iniciale, provienen de diferentes fuentes.

Descripcion de los datos, existen muchas formas de describir datos, pero la mayorıa de

datos se centra en la cantidad y calidad de los datos; la cantidad de datos disponible y el

estado de los datos.

Exploracion de datos, explorar los datos con las tablas, graficos y otras herramientas

de visualizacion disponibles. Estos analisis pueden ayudarle a describir los objetivos de

minerıa de datos generados durante la fase de comprension comercial.

Verificacion de calidad de datos, los datos no suelen ser perfectos. De hecho, la mayorıa

de los datos contienen errores de codificacion, valores perdidos u otro tipo de incohe-

rencias que hacen que los analisis resulten difıciles en algunas ocasiones. Una forma de

evitar posibles problemas es realizar un analisis de calidad de los datos disponibles antes

de proceder al modelado.

Figura 7. Fase de Comprension de los datos (Wirth y Hipp, 2000)

Fase Preparacion de datos

La preparacion de datos es uno de los aspectos mas importantes y con frecuencia que mas

19

Page 37: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

tiempo exigen en la minerıa de datos. De hecho, se estima que la preparacion de datos suele

llevar el 50-70 % del tiempo y esfuerzo de un proyecto. Dedicar los esfuerzos adecuados a las

primeras fases de comprension comercial y comprension de datos puede reducir al mınimo los

gastos indirectos relacionados, pero aun debera dedicar una buena cantidad de esfuerzo para

preparar y empaquetar los datos para la minerıa.

Seleccion de datos, en funcion de la recopilacion de datos inicial realizada en la fase

CRISP-DM anterior, ahora puede comenzar a seleccionar los datos relevantes a sus obje-

tivos de minerıa de datos.

Limpieza de datos, la limpieza de datos implica observar mas de cerca los problemas en

los datos que ha seleccionado incluir en el analisis. En la tabla 1 se observa los tipos de

problemas.

Construccion de nuevos datos, con frecuencia, necesitara construir nuevos datos.

Integracion de datos, no es raro disponer de varios orıgenes de datos para el mismo con-

junto de cuestiones comerciales.

Formato de datos, como paso final antes de la construccion del modelo, es muy util com-

probar si algunas tecnicas requieren aplicar un formato concreto o la clasificacion de los

datos.

Tabla 1

Problemas y soluciones en la limpieza de datos

Problema de datos Solucion posibleDatos perdidos Excluya las filas o caracterısticas. O cumplimentelas con un

valor estimado.Errores de datos Utilice recursos logicos para descubrir errores manuales y

corrıjalos, o, excluya las caracterısticas.Incoherencias de codificacion Decida un esquema de codificacion simple y convierta y

sustituya los valores.Metadatos ausentes oerroneos

Examine manualmente los campos sospechosos y comprue-be el significado correcto.

Problemas que se pueden encontrar en los datos con sus soluciones posibles.

20

Page 38: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

Figura 8. Fase de Preparacion de los datos (Wirth y Hipp, 2000)

Fase Modelado

Este es el punto donde todo el duro trabajo anterior comienza a tener sentido. Los datos que ha

preparado se incorporan a las herramientas y los resultados comenzaran a arrojar algo de luz al

problema planteado en Comprension del negocio.

El modelado se suele ejecutar en multiples iteraciones. Normalmente, los analistas de datos eje-

cutan varios modelos utilizando los parametros por defecto y ajustan los parametros o vuelven

a la fase de preparacion de datos para las manipulaciones necesarias por su modelo. Es extrano

que las cuestiones relativas a la minerıa datos de una empresa se solucionen satisfactoriamente

con un modelo y ejecucion unicos.

Seleccion de tecnicas de modelado, aunque pueda tener algunos conocimientos acerca de

los tipos de modelado que sean los mas adecuados para las necesidades de su organiza-

cion, es el momento de tomar la decision de los tipos de modelado que se van a utilizar.

Generacion de un diseno de comprobacion, como paso final antes de generar el modelo,

debe volver a tener en cuenta como se comprobaran los resultados del modelo.

Generacion de los modelos, en este punto, debe tener la preparacion suficiente para ge-

21

Page 39: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

nerar los modelos que haya considerado. Tomese el tiempo necesario para experimentar

con diferentes modelos antes de llegar a conclusiones definitivas. La mayorıa de analistas

de datos suelen generar varios modelos y comparar los resultados antes de aplicarlos o

integrarlos.

Evaluacion del modelo, para cada modelo que se va a considerar, es una buena idea crear

un metodo de valoracion basado en los criterios generados en su plan de pruebas. En este

punto puede anadir el modelo generado a la ruta y utilizar graficos de evaluacion o nodos

de analisis para analizar la efectividad de los resultados. Tambien debe tener en cuenta

si los resultados tienen un sentido logico o si son demasiado simples para sus objetivos

comerciales.

Figura 9. Fase de Modelado (Wirth y Hipp, 2000)

Fase Evaluacion

En este punto, habra completado la mayor parte de su proyecto de minerıa de datos. Tambien

habra determinado, en la fase de modelado, que los modelos son tecnicamente correctos y efec-

tivos en funcion de los criterios de rendimiento de minerıa de datos que ha definido previamente.

Sin embargo, antes de continuar, debe evaluar los resultados de sus esfuerzos utilizando los cri-

terios de rendimiento comercial establecidos en el inicio del proyecto. Es la clave para asegurar

que su organizacion pueda utilizar los resultados que ha obtenido.

Evaluacion de los resultados, en esta etapa, formalizara su evaluacion en funcion de si

22

Page 40: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

los resultados del proyecto cumplen los criterios del rendimiento comercial. Este paso

requiere una clara comprension de los objetivos comerciales, por lo que debe estar seguro

de incluir factores de toma de decisiones en la evaluacion del proyecto.

En primer lugar, debe registrar su evaluacion, indicando si los resultados de minerıa de

datos cumplen sus criterios de rendimiento comercial.

Proceso de revision, las metodologıas eficaces suelen incluir tiempo para reflexionar so-

bre los aciertos y errores del proceso que se acaba de completar. La minerıa de datos no

es muy diferente. Una parte fundamental de CRISP-DM es aprender de su propia expe-

riencia para que sus proyectos de minerıa de datos sean mas efectivos.

En primer lugar, debe resumir las actividades y decisiones de cada fase, incluyendo pasos

de preparacion de datos, generacion de modelos, etc.

Determinacion de los pasos siguientes, continuar con la fase de desarrollo o volver y

refinar o sustituir los modelos.

Figura 10. Fase de Evaluacion (Wirth y Hipp, 2000)

Fase Distribucion

La distribucion es el proceso que consiste en utilizar sus nuevos conocimientos para imple-

mentar las mejoras en su organizacion.Ademas, la distribucion puede significar que utilice los

conocimientos adquiridos en minerıa de datos para aplicar modificaciones en su organizacion.

Planificacion de distribucion, aunque pueda estar ansioso por compartir el fruto de sus

esfuerzos en minerıa de datos, dedique un tiempo a planificar una distribucion completa

y precisa de los resultados.

23

Page 41: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

Planificacion del control y del mantenimient, en una distribucion e integracion completa

de los resultados de modelado, su trabajo de minerıa de datos puede ser continuado.

Creacion de un informe final, la escritura de un informe final no solo resuelve los cabos

sueltos de la documentacion previa, sino que tambien se puede utilizar para comunicar

los resultados. Aunque pueda parecer una tarea sencilla, es importante presentar los re-

sultados a las diferentes personas relacionadas con los resultados. Se pueden incluir a

los administradores tecnicos, que son responsables de la aplicacion de los resultados de

modelado, ası como el departamento de marketing y gestion, encargado de tomar las de-

cisiones en funcion de los resultados obtenidos.

Revision final del proyecto , Es el paso final del metodo CRISP-DM y le ofrece una opor-

tunidad de formular sus impresiones finales e incorporar los conocimientos adquiridos

durante el proceso de minerıa de datos.

Debe realizar una breve entrevista con las personas implicadas en el proceso de minerıa

de datos.

Figura 11. Fase de Distribucion (Wirth y Hipp, 2000)

24

Page 42: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

2.3. Fase de Comprension del Negocio

2.3.1. Objetivos del negocio

Disenar e implementar un modelo que permita conocer de que manera se esta hablando de los

actores polıticos en un tiempo determinado aplicando minerıa de opinion, permitiendo analizar

las opiniones en los contenidos generados en la red social Twitter, utilizando algoritmos enfo-

cadas a la minerıa de datos para dividir las opiniones vertidas, y ası dar criterios de aceptacion.

La idea es encontrar un mecanismo de estudio polıtico para precandidatos presidenciales que

deseen conocer de que manera se esta hablando de ellos.

Criterios de exito

Modelo para el analisis de opinion sobre un candidato presidencial.

El porcentaje de asertividad que exista en la calificacion de polaridad dentro del analisis de

sentimientos.

2.3.2. Valoracion de la situacion

Al aproximarse las elecciones presidenciales, los jefes de campana necesitan conocer de que ma-

nera estan comentando los tuiteros de su candidato, ademas de saber en que lugares deben en-

focarse para realizar sus diferentes campanas, dando mas enfasis en lugares donde la opinion es

negativa.

Recursos y Requisitos

Para este proyecto se utilizo diferentes recursos:

Software para estadıstica y Minerıa de Datos: Excel, R, RStudio.

Librerıa para conexion entre R y Twitter: TwitteR.

Librerıa para autentificacion con Twitter: ROAuth.

Librerıas para graficas estadısticas: ggplot, network3D, wordcloud.

Librerıas para consultas de base de datos: sqldf.

25

Page 43: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

Librerıa de conexion con Google Maps: ggmap.

Librerıa para implementacion Web: ShinyR.

Librerıa para implementacion de mapas: leaflet.

Librerıa para analisis factorial de correspondencias: ca.

Cuentas de precandidatos presidenciales en Twitter.

Tuits generados por los usuarios obtenidos vıa Streamming.

Equipos Computacionales.

2.3.3. Definicion de objetivos de Minerıa de Datos

Objetivo General

Analizar las opiniones generados en Twitter utilizando herramientas de minerıa de opinion y

realizando un modelo que permita identificar los comentarios positivos, negativos y neutros por

cada precandidato para conocer su popularidad.

Objetivos Especıficos

Seleccion de actores polıticos renombrados, Se escogera a los actores polıticos mas renom-

brados en la actualidad.

Extraer los tuits que mencionen a candidatos presidenciales, Extraer los tuits donde se en-

cuentren mencionados precandidatos presidenciales, teniendo en cuenta las limitaciones

que nos proporciona el API de Twitter.

Limpieza semantica de los comentarios, Realizar la limpieza semanticamente por cada co-

mentario.

Analizar sentimientos y opiniones, Con los datos obtenidos se procedera a clasificar senti-

mientos: positivos, negativos o neutros asociados a cada precandidato presidencial con el

algoritmo de score.sentiment.

26

Page 44: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

Extraccion de la localizacion de Tuiteros, Extraer la longitud y latitud de cada tuitero para

plasmarlo en el mapa del Ecuador.

Analisis de Frecuencia de Palabras, Se analizara la frecuencia de palabras en los comentarios

positivos y negativos.

Comparacion de precandidatos, Con los datos obtenidos de cada precandidato se realizara una

comparacion entre ellos utilizando analisis factorial de correspondencias (AFC).

Presentacion de resultados en una aplicacion web, El resultado del modelo se presenta en

una aplicacion web que se realiza en ShinyR.

2.3.4. Plan de proyecto

Se utilizo el siguiente plan de proyecto:

Tabla 2

Plan de proyecto

Fases Tecnicas

Comprension del negocio

Objetivo del Negocio

Criterios de exito.

Valoracion de la Situacion.

Recursos y Requisitos.

Definicion de los Objetivos de Minerıa de Datos.

• Objetivo General.

• Objetivos Especıficos.

Comprension de los datos

Recoleccion de datos iniciales.

Descripcion de los datos.

Exploracion de los datos (Tuits).

Calidad de los datos.

(continuacion)

27

Page 45: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

Tabla 2

Plan de proyecto

Fases Tecnicas

Preparacion de los Datos

Seleccion de los datos.

Limpieza de datos.

• Seleccion de tuits que hablen de los candidatos.

• Obtencion del tuitero.

• Limpieza de los tuits.

• Formacion de diccionarios de palabras positivas y negati-

vas.

Estructuracion de los datos.

Integracion de los datos.

Modelado

Seleccion del Modelado

• Analisis de Sentimientos.

Generacion de Plan de Pruebas.

• Indicadores de precision.

• Indicadores de Asertividad.

Generacion del Modelo.

Modelo de popularidad.

• Analisis de Sentimientos.

Evaluacion del Modelo.

Implementacion

Plan de Implementacion.

Mantenimiento y Monitorizacion.

Plan de proyecto con sus diferentes tecnicas que se aplicara para tener un orden en el proyecto.

28

Page 46: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

2.4. Fase de Comprension de los datos

2.4.1. Recoleccion de datos iniciales

Los datos fueron extraıdos desde la API de Twitter con la herramienta RStudio empleando la

librerıa TwitterR que permite tener una conexion directa con la red social.

Se tuvo que elegir los precandidatos presidenciales mas sonados en el ambiente polıtico de

Ecuador.

Tabla 3

Cuentas de Twitter de precandidatos

Precandidato Cuenta de TwitterAlberto Acosta @AlbertoAcostaECynthia Viteri @CynthiaViteri6Dalo Bucaran @daloes10Gabriela Rivadeneira @GabrielaEsPaisJaime Nebot @CynthiaViteri6Jorge Glas @JorgeGlasGuillermo Lasso @LassoGuillermoLenin Hurtado @lenhurtadoLenin Moreno @LeninMorenoPAISRafael Correa @MashiRafaelMauricio Rodas @MauricioRodasECRamiro Gonzalez @RamiroGonzalezJ

Cuentas de Twitter que utilizan los precandidatos en la actualidad

Se obtuvo 12 precandidatos presidenciales, de los cuales se extrajo todos los tuits donde se

mencionen aquellos personajes.

En este proyecto se realizo dos partes de extraccion de los tuits que fue en dos fechas diferentes

para poder ser comparado los tipos de comentarios de cada precandidato.

Como dato importante se podrıa decir que el punto de equilibrio entre estas dos fechas serıa el

Terremoto en Ecuador el 16 de abril de 2016.

Se obtuvo la informacion de cada tuit para poder realizar el analisis, entre la informacion que

utilizamos se encuentra:

Nombre registrado en Twitter del usuario que realiza la publicacion.

29

Page 47: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

Texto del tuit.

Datos de la ubicacion geografica (longitud y latitud) del tuitero.

Se debe tener en cuenta las limitaciones que nos proporciona el API de Twitter al momento de

extraccion de los tuits.

2.4.2. Datos para el modelo de popularidad

Tabla 4

Descripcion de los Datos

Variable Descripcion ContenidoUsuario Persona que nombra a un personaje

polıtico, realiza algun tipo de publi-cacion en la red social Twitter

Nombre con el que se encuen-tra registrado el usuario en laRed Social Twitter.

Tweet Publicacion o actualizacion de esta-do realizado por una persona.

Mensaje cuyo lımite de exten-sion son 140 caracteres.

Latitud Distancia angular entre la lıneaecuatorial y un punto determinadode la tierra. Segun en el hemisferioen el que se situe el punto puede sernorte o sur.

Latitud desde donde ha sidodetectado el tuitero .

Longitud Distancia angular entre un puntodado de la superficie terrestre y elmeridiano de Greenwich, medida alo largo del paralelo en el que se en-cuentra dicho punto.

Longitud desde donde ha sidodetectada el tuitero

Datos extraidos de Twitter que se utilizo para generar el modelo de popularidad.

2.4.3. Exploracion de los datos

Para este proyecto se necesito conocer en que se compone un tuit y toda la informacion que se

puede obtener de el.

En la estructura de un tuit encontramos:

Foto de perfil que la persona que tuitea.

Nombre de quien publica el tuit.

30

Page 48: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

Nombre de usuario (@usuario).

Texto del tuit.

Fecha y hora exacta de publicacion del tuit.

Opcion para marcar el tuit como favorito.

Opcion para eliminar el tuit.

Opcion para responder al tuit.

Al extraer el contenido de un tuit con la librerıa twitteR, nos proporciono los siguientes datos.

Tabla 5

Datos obtenidos con TwitteR.

Nombre Variable Tipo de Variable Descripcionx int Contador de tuitstext Factor Texto del tuitfavorited logical reconocimiento hacia un tuit.created Factor Fecha de creacion del tuitid num Id del usuario del tuitscreenName Factor Nombre del usuarioretweetCount int Cuantas veces se ha re tuitea-

do un tuitlongitude num Longitud de donde se

realizo el tuitlatitude num Latitud de donde se realizo el

tuit

Tipos de datos que proporciona Twitter obtenidos con la librerıa TwitteR de R.

2.4.4. Verificacion de la calidad de los datos

La informacion que se necesito de los tuits para el analisis de sentimientos fue el texto y nombre

del usuario. Al obtener la longitud y latitud se tuvo que proceder a un trato especial ya que

algunos usuarios de la red social no tienen registrado su lugar de residencia.

31

Page 49: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

2.5. Fase de Preparacion de los datos

2.5.1. Seleccion de los datos

Se realizo la busqueda de todos lo tuits que se menciona a un precandidato presidencial por su

cuenta de twitter, tomando en cuenta las limitaciones de la API de twitter que permite extraer

hasta una semana maximo.

Para cada precandidato se tuvo un maximo de 100000 tuits.

Los tuits extraıdos fueron de dos fechas diferentes para realizar la comparacion de actividad de

cada precandidato en la red social.

Fecha 1: 2016-03-26 / 2016-04-04

Fecha 2: 2016-06-06 / 2016-06-15

Para poder graficar el mapa de tuiteros se necesito las coordenadas geograficas (longitud y

latitud) de cada tuitero por cada precandidato.

2.5.2. Limpieza de los datos

La limpieza de los datos es una de las etapas mas importantes de este proyecto para obtener

mejores resultados al ejecutar el modelo.

Tratado de los tuits

Al momento de la extraccion de los tuits se encontro varios problemas para analizarlos poste-

riormente, por tal razon se ve la necesidad de realizar la siguiente limpieza en un tuit:

Remover el RT de los retweet.

Convertir todo el texto a minusculas.

Eliminar el @ y lo que tiene a continuacion

Remover signos de puntuacion.

Eliminar numeros.

Remover los links.

Eliminar las Tabulaciones.

32

Page 50: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

Quitar los espacios en blanco del inicio del texto.

Quitar los espacios en blanco del final del texto.

Remover textos iguales.

Eliminar tildes.

A continuacion, se presenta un tuit y el resultado del tratamiento de el.

Tuit antes de la limpieza: “RT @RamiroGonzalez: Sin estar de acuerdo, seguimos apoyan-

do.Nuestro compromiso es con los ecuatorianos. # GabrielDiaz # EcuadorRenace http...”

Tuit despues de la limpieza: “sin estar de acuerdo seguimos apoyando nuestro compromiso es

con los ecuatorianos gabrieldiaz ecuadorrenace”

En este proyecto se creo una funcion llamada limpieza.texto el cual tuvo todas las caracterısti-

cas planteadas anteriormente para la limpieza del tuit.

Tratado de la localizacion

Al extraer la longitud y latitud del tuitero se tiene la dificultad de que algunos usuarios de esta

red social no tienen registrados su ubicacion, por lo que su localizacion tomara el valor de “NA”.

Al realizar su respectivo analisis por precandidato se notaba que no habıa una cantidad consi-

derable de tuiteros fuera del paıs, por esa razon los tuiteros de lugares distintos de Ecuador se

removieron para tener una mejor apreciacion al realizar el mapa de tuits.

Para obtener las dimensiones (longitud y latitud) del territorio ecuatoriano se decidio apoyarse

en el paquete ggmap de R.

33

Page 51: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

Tabla 6

Dimensiones geograficas del mapa de Ecuador

DimensionLongitud Maxima −75,24961Longitud Mınima −91,65415Latitud Maxima 1,455371Latitud Mınima −4,990625

Dimensiones del territorio ecuatoriano obtenidos del paquete ggmap de R.

Para la limpieza de la localizacion del tuitero se realizo:

Eliminacion de tuitero que no tienen localizacion.

Mantener las dimensiones que se encuentran dentro de la Tabla 6.

Figura 12. Tabla de localizacion despues de la limpieza

Diccionario de palabras Positivas y Negativas

Al momento de realizar el analisis de sentimientos conociendo su polaridad para clasificar los

comentarios negativos, neutrales y positivos es necesario tener un diccionario de palabras positi-

vas y negativas que es obtenido de MPQA (Multi-Perspective Question Answering), disponible

bajo los terminos de la Licencia Publica General de GNU, el cual nos proporciona 2718 palabras

en categorıa positiva y 4912 en categorıa negativas en idioma ingles que posteriormente fueron

34

Page 52: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

traducidas al idioma espanol obteniendo un diccionario de 7630 palabras que sera expuestas en

el ANEXO A.

2.5.3. Construccion de nuevos datos

Se necesito construir nuevos datos tras la derivacion de atributos y la generacion de nuevos re-

gistros.

Tipo de comentario por tuitero

Teniendo los tuits limpios se procedio a realizar el analisis de sentimiento, obteniendo un valor

de positivo (1), negativo (0) y neutral(2) por cada tuit, agrupando los mensajes por tuitero se

creo una nueva variable llamada “votofinal” el cual fue el resultado de los comentarios del

tuitero.

Figura 13. Tuitero y resultado de sus comentarios

Localizacion por tuitero

Teniendo los tuiteros y su tipo de comentarios hacia un precandidato se realizo la busqueda

y union con su diferente localizacion para graficar en el mapa las personas que comentan de

forma positiva y negativa.

35

Page 53: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

Figura 14. Tabla de localizacion por tuitero

Diccionario de palabras positivas y negativas

Transformacion de ingles a espanol, de igual manera todas las palabras a minusculas para hacer

la comparacion con cada tuit.

Frecuencia de palabras

Con los tuits extraıdos de cada candidato se realizo el conteo de palabras de tuits positivos

y negativos, para eso se necesito construir una matriz con la frecuencia de las palabras mas

utilizadas.

Figura 15. Frecuencia de palabras

2.5.4. Integracion de los datos

La integracion de los datos se realizo en una estructura denominada data.frame

36

Page 54: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

Tabla 7

data.frame del modelo

Data.frame DescripcionDf Datos obtenidos de la extraccion

por precandidatoResultados Tuitero con su tipo de comentarioubicacionTweetero Tuitero, tipo de comentario, longi-

tud y latitudDataAnalisis Tweet, tuitero y su tipo de comenta-

riodm Frecuencia de palabras.TablaFrecuenciass Tuitero que ha realizado mas tuits.

Tuitero, frecuencia y tipo de co-mentario.

Descripcion de cada data.frame utilizados para el modelo de popularidad.

2.6. Fase de Modelado

La tecnica de minerıa de datos se aplico al analisis de sentimientos en la polaridad de sus

publicaciones que se lo realiza mediante una clasificacion Score el cual estara definido como

Score = #palabraspositivas−#palabrasnegativas, que permite realizar una comparacion

de los tuits con el diccionario de datos. La funcion score en R se llama score.sentiment.

2.6.1. Generacion de plan de pruebas

El tamano del conjunto de datos para la prueba sera los tuits recolectados de un precandidato

presidencial para evaluar el desempeno del modelo.

Para evaluar el modelo se utilizo La Matriz de Confusion que contiene informacion acerca de las

predicciones realizadas por un metodo o Sistema de Clasificacion, comparando para el conjunto

de individuos en de la tabla de aprendizaje o de testing, la prediccion dada, versus la clase a la

que estos realmente pertenecen.(Rodriguez, 2015)

37

Page 55: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

Tabla 8

Matriz de confusion (Rodriguez, 2015)

PrediccionNegativo Positivo

Valor RealNegativo a bPositivo c d

Los indicadores que se utilizaran para el modelo seran:

Precision Global: La precision global mide el total de opiniones positivas que son correctas

mas el total de opiniones negativas que son correctas y esta dado por la division la suma

entre el resto de parametros como Verdadero Positivos, Falsos Negativos, Falsos Positivos

y Verdaderos Negativos.

PG =a+ d

a+ b+ c+ d(5)

Precision Positiva (PP): Es la proporcion de casos positivos que fueron identificados correc-

tamente, tal como se calcula usando la ecuacion:

PP =d

c+ d(6)

Precision Negativa (PN): Es la proporcion de casos negativos que fueron identificados correc-

tamente, tal como se calcula usando la ecuacion:

PN =a

a+ b(7)

Falsos Positivos (FP): Es la proporcion de casos negativos que fueron clasificados incorrecta-

38

Page 56: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

mente como positivos, tal como se calcula utilizando la ecuacion:

FP =b

a+ b(8)

Falsos Negativos (FN): Es la proporcion de casos positivos que fueron clasificados incorrec-

tamente como negativos, tal como se calcula utilizando la ecuacion:

FN =c

c+ d(9)

Asertividad Positiva (AP): Indica la proporcion de buena prediccion para los positivos, tal

como se calcula utilizando la ecuacion:

AN =d

b+ d(10)

Asertividad Negativa (AN): Indica la proporcion de buena prediccion para los negativos, tal

como se calcula utilizando la ecuacion:

AP =a

a+ c(11)

2.6.2. Generacion del Modelo

Se analizo la polaridad de cada tuit con los datos transformados y limpios para ser evaluados

con la funcion score.sentiment, cuya funcionalidad comparo el texto del tuit con el diccionario

de palabras positivas y negativas el cual dara una calificacion para definir una publicacion.

39

Page 57: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

Tabla 9

Parametros de score.sentiment

Score PublicacionScore > 1 PositivoScore < 0 NegativoScore =0 Neutral

Parametros que se sigio para dar una valoracion a la publicacion.

Al tener la polaridad de cada texto se procedio a dar un valor a los tuits, positivos (1), negativos

(0) y neutros (2). Un tuitero puede tener varios tuits y en cada uno de ellos depende de su estado

de animo para realizar diferentes publicaciones en la red social. Se le asigno al tuitero el tipo

de comentario que tenga mas peso, si tiene los tres tipos de comentarios se le asigna como

comentario neutro.

Tabla 10

Modelo de popularidadCandidato Tuitero Texto/Tuit Polaridad Intencion Latitud Longitud

X

Tuitero 1t1 +

N LaT1 LoT1t2 -tn N

Tuitero 2t1 -

- LaT2 LoT2t2 -tn N

Tuitero nt1 +

+ LaTn LoTnt2 -tn +

Y

Tuitero 1t1 N

N LaT1 LoT1t2 Ntn +

Tuitero 2t1 +

+ LaT2 LoT2t2 +tn +

Tuitero nt1 -

- LaTn LoTnt2 -tn +

Parametros para el desarrollo del modelo.

Al obtener la intencion de agrado de cada tuitero que puede ser positivo, negativo o neutral hacia

40

Page 58: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

un precandidato presidencial se puede obtener el nivel de popularidad por la cantidad de tuiteros

que comentan de manera positiva, con estos datos se realizo varios analisis para profundizar la

actividad que tiene cada polıtico en Twitter.

Figura 16. Tuitero y polaridad de sus comentarios

2.6.3. Evaluacion del Modelo

Garcıa (2016). “La evaluacion del modelo empezo con el calculo de los criterios, precision y

sensibilidad que se basan en la comparacion entre los resultados del modelo con los resultados

reales determinados por el usuario”(p.17).

Se obtuvo una muestra de todos los tuits del precandidato Ramiro Gonzalez que contaba con

396 tuits para poder evaluar el desempeno del algoritmo y establecer los indicadores sobre la

matriz de confusion.

Figura 17. Tuits de evaluacion

41

Page 59: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

Al momento de analizarlo en el algoritmo y compararlo con los resultados anteriores en la

matriz de confusion se obtuvo los siguientes resultados.

Tabla 11

Matriz de confusion para evaluacion

RealModelo

Neutro Positivo NegativoNeutro 71 13 13Positivo 24 126 62Negativo 5 30 52

Valores obtenidos de la evaluacion.

Los resultados de la matriz de confusion son:

Tabla 12

Resultados de evaluacion del modelo

Indicador PorcentajePrecision Global 62.88 %Precision Positiva 59.43 %Precision Negativa 59.77 %Precision Neutral 73.19 %Asertividad Positiva 74.55 %Asertividad Negativa 40.94 %Asertividad Neutral 71.00 %

Resultados obtenidos de la matriz de confusion.

La precision del modelo es del 62.88 % que es aceptable pero podrıa mejorar dependiendo de

la calidad del texto y aumentando palabras al diccionario de palabras.

2.7. Fase de Implementacion

2.7.1. Plan de Implementacion

Con los resultados y datos que se obtiene del tuit y del usuario de Twitter se implemento una

aplicacion donde se visualice todo lo obtenido con ayuda de la librerıa de ShinyR de R que

42

Page 60: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

permite crear facilmente aplicaciones web interactivas que ayuda a interactuar con los datos sin

necesidad de manipular el codigo.

2.7.2. Mantenimiento y Monitorizacion

La aplicacion necesitara estar en mantenimiento los meses que necesite un precandidato para

conocer su popularidad, de igual manera se tendra que monitorizar para saber en que ha cam-

biado segun los comentarios obtenidos.

Fases Futuras

Para trabajos futuros se analizara la relacion que tiene un tuitero con otros precandidatos dife-

rente al que lo tuiteo para formar grupos de interes polıtico.

Se analizara tuiteros que tuitean fuera de las dimensiones del paıs.

43

Page 61: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

3. RESULTADOS

Los resultados se presentan en la aplicacion desarrollada en ShinyR en diferentes modulos para

su mejor entendimiento.

Tabla 13

Cuentas de Twitter y acronimo de precandidatos

Precandidato Nombre en Twitter AcronimoAlberto Acosta @AlbertoAcostaE AACynthia Viteri @CynthiaViteri6 CVDalo Bucaram @daloes10 DBGabriela Rivadeneira @GabrielaEsPais GRJaime Nebot @jaimenebotsaadi GRJorge Glas @JorgeGlas JNGuillermo Lasso @LassoGuillermo GLLenin Hurtado @LeninHurtado LHLenin Moreno @LeninMorenoPAIS LMRafael Correa @MashiRafael RCMauricio Rodas @MauricioRodasEC MRRamiro Gonzalez @RamiroGonzalezJ RG

Descripcion de cada precandidato segun su cuenta de Twitter y su respectivo acronimo para facilitar ladescripcion de graficas.

3.1. Modulo de Popularidad

En el modulo de popularidad se encuentran dos graficas para conocer la popularidad que tiene

un precandidato.

Grafica Seguidores

Esta grafica representa el numero de seguidores que tiene un precandidato, datos obtenidos de

Twitter del mes de agosto del 2016.

44

Page 62: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

Figura 18. Grafica de seguidores en Twitter

Como se observa en el grafico 18 el que tiene mayor numero de seguidores es el precandidato

Rafael Correa y les lleva una gran diferencia al segundo precandidato que es Jaime Nebot. En

los dos ultimos puestos se encuentran Lenin Moreno Y Lenin Hurtado.

Se concluye que el Ec. Rafael Correa es el mas popular de todos los precandidatos en la red

social Twitter.

Tabla 14

Numero de seguidores de precandidatos agosto 2016

Precandidato SeguidoresAlberto Acosta 68.096Cynthia Viteri 90.291Dalo Bucaram 324.058Gabriela Rivadeneira 190.961Jaime Nebot 698.594Jorge Glas 246.530Guillermo Lasso 238.814Lenin Hurtado 2.744Lenin Moreno 9.303Rafael Correa 2.844.155Mauricio Rodas 386.937Ramiro Gonzalez 168.319

Seguidores obtenedios de Twitter del mes de agosto de 2016.

45

Page 63: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

Grafica Tuiteros

Esta grafica representa el numero de tuiteros que han comentado sobre el precandidato presi-

dencial en las dos fechas senaladas anteriormente para conocer su actividad en la red social

Twitter.

Figura 19. Comparacion de numero de tuiteros que comentan

Para un jefe de campana lo importante es que su candidato se encuentre presente en los co-

mentarios que vierten en Twitter y que siempre este en constante crecimiento. Al observar la

grafica 19, no todos los precandidatos crecieron en publicaciones de tuiteros, como es el caso de

Ramiro Gonzalez, Alberto Acosta, Dalo Bucaram, Mauricio Rodas, Jaime Nebot y Jorge Glas.

Para estos precandidatos se tendrıa que mejorar sus actividades en sus diferentes cuentas.

46

Page 64: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

Tabla 15

Numero de tuiteros que han comentado por precandidato en diferentes fechas

Precandidato Fecha1 Fecha2Alberto Acosta 829 850Cynthia Viteri 454 919Dalo Bucaram 526 672Gabriela Rivadeneira 2689 3996Jaime Nebot 3734 3393Jorge Glas 5014 3312Guillermo Lasso 2777 4578Lenin Hurtado 52 101Lenin Moreno 1069 1946Rafael Correa 10143 16360Mauricio Rodas 2507 2120Ramiro Gonzalez 205 168

Informacion obtenida de las dos fechas de cada precandiidato.

3.2. Modulo Candidatos

En este modulo se encuentra la comparacion de todos los precandidatos en las dos fechas pro-

puestas.

Al comparar los precandidatos se tenıa el problema de que cada uno de ellos tenıa diferentes

muestras por lo que se realizo un analisis factorial de correspondencias (AFC) que asigna un

peso proporcional a su importancia en el total. De esta forma se evita que al trabajar con perfiles

se privilegie a las clases de efectivos pequenos.

En la figura 20 se evidencia que los precandidatos que tienen tuiteros que comentan de me-

jor manera son: Rafael Correa, Jaime Nebot, Gabriela Rivadeneira y junto a ellos se proyectan

Dalo Bucaram, Cynthia Viteri y Ramiro Gonzalez.

En el caso de tuiteros que comentan de manera neutral estan los precandidatos: Lenin Moreno,

Jorge Glas, Lenin Hurtado y Alberto Acosta.

Por el lado de los tuiteros negativos se encuentra Mauricio Rodas y Guillermo Lasso.

47

Page 65: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

Figura 20. AFC de precandidatos Fecha 1

En la fecha 2 se encontro que los precandidatos que tienen tuiteros que comentan de mejor

manera son: Rafael Correa, Gabriela Rivadeneira, Mauricio Rodas y junto a ellos se proyectan

Dalo Bucaram, Cynthia Viteri, Ramiro Gonzalez y Lenin Hurtado.

Por los tuiteros neutrales estan los precandidatos: Jaime Nebot, Lenin Moreno y Jorge Glas.

En los tuiteros negativos se encuentra Guillermo Lasso y Alberto Acosta.

Figura 21. AFC de precandidatos Fecha 2

Al comparar las dos fechas se observo que algunos candidatos se mantienen constantes en el

apego de sus tuiteros como: Rafael Correa y Gabriela Rivadeneira.

48

Page 66: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

Por otro lado, un precandidato que mejoro fue Mauricio Rodas que en la fecha 1 estaba con

mas tuiteros negativos y para la fecha 2 aparecio con mayor cantidad de tuiteros positivos, al

contrario de el esta el precandidato Jaime Nebot que en la Fecha 1 estuvo con tuiteros positivos

y en la fecha 2 se encontro que tuiteaban mas personas de manera negativa.

En las dos fechas se encuentran constantes los candidatos: Lenin Moreno y Jorge Glas, con

mayor cantidad de tuiteros que comentan de manera neutral.

Al momento de proyectarse hacia tuiteros positivos se encontraron los precandidatos: Cynthia

Viteri, Dalo Bucaram, Ramiro Gonzalez y Lenin Hurtado.

Para el precandidato Guillermo Lasso en las dos fechas se situo en el cuadrante de los tuiteros

que comentanban negativamente.

Los datos que se utilizo para este analisis se encuentran en la Tabla 16

3.3. Modulo de Seleccion

En este modulo se encuentran todos los precandidatos para ser seleccionados y mostrar los

diferentes analisis de cada uno de ellos. Cada precandidato tendra:

Modulo Comentarios

Modulo Tuiteros

Modulo Conteo de Palabras

Modulo Mapa Tuitero

Figura 22. Modulo de seleccion

49

Page 67: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

En la figura 22 se encuentran los precandidatos mas sonados en el paıs para una posible candi-

datura presidencial en el Ecuador para el ano 2017.

3.4. Modulo Comentarios

En este modulo se muestra la cantidad de tuiteros con sus comentarios positivos, negativos y

neutrales comparadas en las dos fechas antes expuestas.

(a) Alberto Acosta (b) Cynthia Viteri

(c) Dalo Bucaram (d) Gabriela Rivadeneira

(e) Jaime Nebot (f) Jorge Glas

Figura 23. Comparacion de comentarios por precandidato N◦1

50

Page 68: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

(a) Guillermo Lasso (b) Lenin Hurtado

(c) Lenin Moreno (d) Rafael Correa

(e) Mauricio Rodas (f) Ramiro Gonzalez

Figura 24. Comparacion de comentarios por precandidato N◦2

Al revisar los comentarios de todos los precandidatos se puede observar que la mayorıa de ellos

tiene mayor cantidad de tuiteros que hablan positivamente y como segundo lugar comentarios

neutrales dejando por debajo a los tuiteros que comentan negativamente.

Un caso diferente es el del precandidato Jorge Glas en donde la fecha 1 tiene una gran cantidad

de tuiteros que comentan neutralmente y para la fecha 2 incrementan la cantidad de tuiteros con

comentarios positivos.

Las gaficas obtenidas son resultado de la tabla 16

51

Page 69: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

Tabla 16

Numero de comentarios (+, -, N) por precandidato en diferentes fechas

Candidato Fecha1 Fecha2Positivo Negativo Neutral Positivo Negativo Neutral

Alberto Acosta 331 172 326 440 219 191Cynthia Viteri 266 39 149 559 173 187Dalo Bucaram 511 148 197 519 21 132Gabriela Rivadeneira 1580 369 740 2203 634 1159Jaime Nebot 2270 488 976 1808 730 855Jorge Glas 2208 402 2404 2047 449 816Guillermo Lasso 1476 482 819 2177 1078 1323Lenin Hurtado 24 6 22 76 16 9Lenin Moreno 466 75 528 1054 278 614Rafael Correa 6040 1283 2820 9248 2932 4180Mauricio Rodas 1292 623 592 1222 333 565Ramiro Gonzalez 134 26 45 107 34 27

Resultados obtenidos de cada precandidato en las diferentes fechas por tipo de comentario.

3.5. Modulo Tuiteros

Figura 25. Modulo de Tuiteros frecuentes

Este modulo muestra los tuiteros que mas han comentado hacia un precandidato.

En la tabla 17 encontraremos de cada precandidato los tuiteros que con mayor frecuencia co-

mentan, cabe senalar que son los que mayor frecuencia han comentado independientemente si

son positivos o negativos por esa razon hay precandidatos que no tienen tuiteros que comenten

52

Page 70: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

negativamente por que los que tienen mayor frecuencia son tuiteros positivos. De igual manera

los precandidatos que tienen pocos usuarios no tienen tuiteros que comenten con gran frecuen-

cia.

Tabla 17

Tuiteros que comentan con mayor frecuencia por precandidato

Precandidato Tuiteros Positivos Tuiteros Negativos

Alberto Acosta

carlosabel2010, moebius16,

cahuasquimanuel, patriciave-

dova, covco

aponcev1, can3liux, fevillavi-

cencio, kimontare, pconstitst-

cugat

Cynthia Viteri

cynthiajava, jorgeluisn78,

sukzuniga, jeanninecruzz,

palcuel

hernanmatrecisa, ximearcos,

blancaguiga, haropatec, jalil-

jalilja

Dalo Bucaran

rossygomeza, andrestoro111,

delacruzgabrie6, guseguigu-

ren, robertoddgamar2

jmondagron, damianmosque-

ra4, guiller8velez, montaner-

silvio, albertosaenz20

Gabriela

Rivadeneira

casaannewyork, canpastaza,

canimbabura, casaancanar,

casaanespana

Jaime Nebot

cdlabellavista, parischi-

quitoo, mariachvzcresp1,

mariobu07740570

pabloricaurte73, transportee-

nec, ost ec, gabicaza, juane-

loayza49

Jorge Glas

otonielaguino, jorgeluisan-

chun

giovannyendo, cedenoandra-

dem, jimmyxlucero, andres-

montesd14, viviguevarav

(continuacion)

53

Page 71: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

Tabla 17

Tuiteros que comentan con mayor frecuencia por precandidato

Precandidato Tuiteros Positivos Tuiteros Negativos

Guillermo Lasso

centralximena, guzmetmin,

joseloandrade

cueva tapia, daanalfa,

creo guayas, ingcristianpaz,

freddy6518227

Lenin Hurtado

benaleur geovanni atari, rpae3, galo-

mindiola, ramiroopcion, car-

lamaldonadop

Lenin Moreno

boblen1972, frankgreychirib,

leninmorenopais, thelo-

nelywlker, gabriela1834578

jofreromero, saidocta-

viohan1, marcocastro o,

ajaib40, cf203e4e5b3c464

Rafael Correa

jofreromero, marcocastro o,

ajaib40, cf203e4e5b3c464,

leninmorenopais

Mauricio Rodas

antoniocostale5 cpdiazg69, calistoelena,

mcjm53, magdalenanemalc,

maggieligg

Ramiro Gonzalez

gozosoandradev, gabyerazob francis aletor, 34 zurita,

isa chiriboga, andre duenas8,

majoramirez85

Tuiteros por cada precandidatos que tuitean con mayor frecuencia.

Al obtener los tuiteros con mayor frecuencia se pudo observar que los precandidatos Rafael

Correa y Gabriela Rivadeneira tienen usuarios que comentan de manera positiva con mayor fre-

cuencia por esa razon no muestra un tuitero que comente de manera negativa.

54

Page 72: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

Los precandidatos Rafael Correa y Lenin Moreno tienen varios tuiteros en comun, esto significa

que los tuiteros estan comentando en forma conjunta refiriendose a estos personajes, es prede-

cible ya que son dos polıticos de la misma bancada.

Este modulo serıa de gran importancia para cada precandidato para conocer a profundidad a las

personas que estan comentando de mala manera y ası saber en que pueden mejorar. Tzu (2006)

“Conoce a tu enemigo y conocete a ti mismo y podras pelear en cien batallas sin un desastre.”

3.6. Modulo Palabras

Este modulo muestra las palabras que mas se repiten en los tuits positivos como negativos hacia

un precandidato.

Figura 26. Modulo Palabras

55

Page 73: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

Tabla 18

Palabras positivas y negativas con mayor frecuencia en los precandidatos

Precandidato Palabras Positivas Palabras Negativas

Alberto Acosta

moratoriaminera, correa, mi-

nerıa, paıs, socialismo

moratoriaminera, correa, go-

bierno, crudo, ptroleo

Cynthia Viteri

loja, animales, alcalde, favor,

nebot

sancion, retweeted, imperio

Dalo Bucaran

dalo, fuerzaecuador, candida-

to, manabi, presidente

gobierno, candidato, pueblo,

fuerzaecuador, odio

Gabriela

Rivadeneira

contigodeley, presidenta,

foroeconomicoparlatino,

pais, mujeres

foroeconomicoparlatino, con-

tigodeley, gabrielaenazuay,

presidente, leycannabismedi-

cinal

Jaime Nebot

alcalde, guayaquil, metrovıa,

nebot, paıs

gestion, riesgo, mala, guaya-

quilprotesta, nebotmala

Jorge Glas

gracias, patria, manabi, presi-

dente, pueblo

presidente, vicepresidente,

reconstruccion, reunion,

manta

Guillermo Lasso

dinero, lasso, paıs, presidente,

yocreoenlasso

paıs, dinero, feriado, banca-

rio, presidemte

(continuacion)

56

Page 74: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

Tabla 18

Palabras positivas y negativas con mayor frecuencia en los precandidatos

Precandidato Palabras Positivas Palabras Negativas

Lenin Hurtado

exrector, ces, alianza, armas,

vıa

educacion,armas, falta, men-

talidad, nieguen

Lenin Moreno

dicapacidad, lenıonu, perso-

nas, derechos, inclusion

discapacidad, personas,

lenınonu, retweeted, mundial

Rafael Correa

conversatoriosmedios, en-

lace, dinero, electronico,

presidente

conversatoriosmedios, dine-

ro, enlace, presidente, gracias

Mauricio Rodas

alcalde, quito, responderodas,

quitocables, barrios

quito, alcalde, responderodas,

falta, quitocables

Ramiro Gonzalez

ecuatorianos, crisis, partido,

polıtica

traidor, derecha, paıs, ecuato-

rianos, polıtica

Palabras con mayor frecuencia ya sea en los comentarios positivos y negativos de cada precandidato.

En la mayorıa de casos las mismas palabras se repiten en los dos casos de varios precandidatos

esto denota que hay personas que hablan de manera positiva o negativa de un tema en comun.

El caso en particular que llamo la atencion es la del precandidato Jorge Glas en donde las

palabras positivas fueron “gracias, patria, manabı, presidente, pueblo” en donde tienen relacion

con lo sucedido en el ultimo terremoto de Ecuador.

57

Page 75: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

3.7. Modulo Mapa Tuitero

En este modulo se encontro la localizacion de los tuiteros que se plasmo en un mapa de Ecuador

incluido su Region Insular. Se podra observar los puntos de tuiteros que se expresan de manera

positiva al igual que los negativos. Para realizar el grafico se utilizo la librerıa “leaflet” que nos

permite visualizar mapas interactivamente.

Figura 27. Modulo Mapa Tuitero

Al momento de observar los tuiteros en el mapa de los diferentes precandidatos se pudo cons-

tatar que la mayorıa de ciudades en los que estan activos son: Quito, Guayaquil y Riobamba.

En la region donde menos personas tuitean es el Oriente.

El mapa tuitero sirve para cada candidato que desee conocer de donde estan escribiendo de

manera positiva o negativa para que tengan referencia hacia donde tienen que ir con mayor cla-

ridad para sus propuestas, de igual manera conocer en que lugar no hay actividad de personas

que tuitean hacia ellos.

58

Page 76: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

4. CONCLUSIONES

Este proyecto no se trata de prediccion electoral se torna muy complejo decir por quien va

a votar una persona y mas aun si son en las redes sociales por la complejidad que existe

en el idioma espanol, por el sesgo que se encuentra al momento de realizar un analisis

de este tipo, estimar el grado y la ausencia de participacion es difıcil y ademas hay que

considerar que la red social Twitter no es la mas usada por los ecuatorianos.

El analisis de opinion es central en este proyecto constituye una herramienta importante

al momento de saber que piensa una persona por medio de lo que escribe, pero como dice

Boyd (2010) acerca de Big Data y ciencias sociales donde dice:

“Big Data ofrece nuevas oportunidades para entender la practica social. No obstante, la siguiente afirmacion

debe comenzar con un “pero”. Y ese “pero” es simple: tan solo porque veas trazas de datos eso no significa

que siempre entiendas la intencion o la logica cultural tras ellas. Y solo porque tengas un gran N eso no

significa que sea representativo o generalizable.”

Al utilizar una metodologıa como CRISP-DM se puede tener un proceso sistematico de

todas las partes que intervienen en el proceso de Minerıa de Datos para obtener los mejo-

res resultados.

Se analizo las opiniones generadas en twitter con un modelo supervisado con la funcion

score.sentiment con una precision global del 62.88 % que permitio dar un valor al tipo de

comentario por su polaridad.

Al realizar la limpieza de los comentarios vertidos en twitter se obtuvo muchos problemas

por el idioma espanol por sus dificultades gramaticales como:

• Gran cantidad de artıculos.

• Describir el genero de personas, animales cosas.

• El uso de sus adjetivos tiene varias estructuras.

• Los demostrativos son muchos.

• La conjugacion de verbos

59

Page 77: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

• Los tiempos.

Se extrajo la localizacion de los tuiteros por cada precandidato para ubicar los puntos

positivos y negativos en el mapa de tuits. Al conocer estos resultados serıa muy bueno

que los precandidatos busquen de que manera llegar a estas zonas para que tengan un

protagonismo positivo.

Al comparar los precandidatos se tuvo el problema del tamano de muestras por cada uno

de ellos por lo que se decidio realizar un analisis factorial de correspondencias que nos

permitio asignar un peso proporcional a su importancia en el total y ası evitar que se

privilegie a los precandidatps de muestras pequenas.

Al comparar todos los candidatos se pudo constatar que Rafael Correa es el mas popu-

lar en Twitter teniendo mayor numero de seguidores y mayor numero de personas que

tuitean.

El proyecto es dedicado a las personalidades polıticas que deseen conocer de que manera

esta su popularidad y ası poder tomar decisiones adecuadas para el crecimiento en Twitter

de una manera positiva para sus campanas electorales.

60

Page 78: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

5. RECOMENDACIONES

Para efectos comparativos se recomienda el diccionario de este estudio y el diccionario

de LIWC (Linguistic Inquiry and Word Count) que tiene un costo.

Para analisis de popularidad y analisis de sentimientos se recomienda el uso de sco-

re.sentiment por ser de libre, confiable, de facil manipulacion y adaptacion.

Pongo a disposicion el modelo para cualquier interesado que quiera conocer la populari-

dad de un precandidato presidencial para las elecciones presidenciales en Ecuador para el

ano 2017.

Realizar procesos en paralelo, para la optimizacion de tiempo de procesamiento en per-

sonalidades con gran actividad en la red social Twitter.

61

Page 79: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

6. BIBLIOGRAFIA

[1] ALCAZAR J. (2016). Ranking Paginas Web Ecuador. Recuperado el 16/10/2016 de: http:

//blog.formaciongerencial.com/2015/01/26/ranking-paginas-web-ecuador/

[2] AMERICATV (2009, May 21). ¿Cuanto poder e influencia tienen las redes sociales en

la actualidad?. Recuperado el 08/06/2016 de: http://www.americatv.com.pe/tec/clips/

cuanto-poder-influencia-tienen-redes-sociales-actualidad-noticia-25846

[3] AMORES, M., ARCO, L. y ARTILES, M. (2015). Deteccion no supervisada de la pola-

ridad de opiniones en espanol Unsupervised polarity detection of Spanish opinions

[4] BARRIBLOG (2010). ¿Lo que siempre quiso saber del API de Twitter y nunca se atre-

vio a preguntar? Recuperado el 09/06/2016 de: http://www.barriblog.com/2010/07/lo-que-

siempre-quiso-saber-del-api-de-twitter-y-nunca-se-atrevio-a-preguntar//

[5] BOYD, D. (2010). Big Data: Opportunities for Computational and Social Sciences. Abril,

17:2010.

[6] BRITOS, P.V. (2008). Procesos de explotacion de informacion basados en sistemas inteli-

gentes. Tesis doctoral, Facultad de Informatica.

[7] CHRISTAKIS, N.A et al (2010). Conectados: el sorprendente poder de las redes sociales

y como nos afectan. Numero 302.30285 C4Y. Taurus Madrid.

[8] COMOHACKEAR (2016). Las 10 redes sociales mas populares del mundo en 2016. Recu-

perado el 22/06/2016 de: http://www.como-hackear.com/redes-sociales-populares-mundo-

2016/

[9] CORTEZ, A., VEGA, H. y PARIONA, j. (2009). Procesamiento del lenguaje natural.

2. Recuperado el 15/06/2016 de: http://sisbib.unmsm.edu.pe/bibvirtual/publicaciones/

risi/2009 n2/v6n2/a06v6n2.pdf

62

Page 80: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

[10] CORTIZO, J. (2011). Minerıa de Opiniones, o Analisis del Sentimiento. Recuperado el

22/06/2016 de: http://www.baquia.com/emprendedores/2011-05-13-mineria-de-opiniones-

o-analisis-del-sentimiento

[11] DOMINGUEZ, D.C. (2009). Democracia 2.0: La polıtica se introduce en las redes socia-

les/Democracy 2.0: politics inside social networks. Pensar la publicidad, 3(2):31.

[12] FREEMAN, L.C., WHITE, D.R. Y ROMNEY, A.K. (1992). Research methods in social

network analysis. Transaction Publishers

[13] GARCIA, E. (2016). Tecnicas de minerıa de datos (pagina 1). Monografias.com. Recupe-

rado el 24/06/2016 de: http://www.monografias.com/trabajos55/mineria-de-datos/mineria-

de-datos.shtml

[14] IBM (2012). Manual CRISP-DM de IBM SPSS Modeler. IBM SPSS

[15] MENDEZ, P. y RODRIGUEZ, A. (2009). Herramienta de estudio de viabilidad para pro-

yectos que utilizan la metodologıa P3TQ. Universidad de Buenos Aires, Buenos Aires,

Argentina.

[16] MOINE, J.M. (2013). Metodologıas para el descubrimiento de conocimiento en bases de

datos: un estudio comparativo. Tesis doctoral, Facultad de Informatica.

[17] NIGRO, O., XODO, D., CORTI, G. y TERREN, D. (2004). KDD (Knowledge Discovery

in Databases): Un proceso centrado en el usuario. En VI Workshop de Investigadores en

Ciencias de la Computacion

[18] PANG, B. and LEE, L. (2008). Opinion mining and sentiment analysis. Foundations and

trends in information retrieval, 2(1-2):1-135.

[19] RODRIGUEZ, O. (2015). Aprendizaje Supervisado K - Vecinos mas cercano Knn-Method.

Recuperado el 24/07/2016 de: http://www.oldemarrodriguez.com/yahoo site admin/assets/

docs/Presentaci%C3%B3n - KNN.20085205.pdf

[20] SCHMIDT, S. (2002). Analisis de redes: aplicaciones en ciencias sociales. Unam.

63

Page 81: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

[21] TICbeat (2014). ¿Que es una API y para que sirve? Recuperado el 09/06/2016 de: http:

//www.ticbeat.com/tecnologias/que-es-una-api-para-que-sirve/

[22] TRIVINHO, E.R. (2011). Visibilidad mediatica, melancolia do unico e violencia invisıvel

na cibercultura. MATRIZes, 4(2):111-125.

[23] TWITTER (2016). Centro de Ayuda. Recuperado el 08/06/2016 de: https://support.twitter.

com/articles/352810

[24] TZU SUN. (2006). El arte de la guerra, volumen 54. Edaf.

[25] VALLEZ, M. y PEDRAZA, R. (2007). El Procesamiento del Lenguaje Natural en la Re-

cuperacion de Informacion Textual y areas afines. Hipertext. net.

[26] WIRTH, R. y HIPP, J. (2000). CRISP-DM: Towards a standard process model for data

mining. En Proceedings of the 4th international conference on the practical applications of

knowledge discovery and data mining, pp.29-39. Citeseer.

64

Page 82: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

7. ANEXOS

Anexo A: Diccionario de palabras Positivas y Negativas

Diccionario palabras positivas

acatar capacidad poder abundar absolver absorbente absorcion abundancia abundante acceder

a acentuar aceptar aceptable aceptacion accesible adhesion aclamacion aclamacion espaldarazo

acomodar alojamiento acompanamiento realizar logro accord conformidad explicable acumu-

larse exactitud preciso accurateness lograr logro reconocimiento familiarizar conocido absol-

ver absolucion real realidad firme adaptabilidad adaptable adaptacion adaptado adepto com-

petencia adecuado adherencia adherente adhesion adhesivo adjunto ajustar ajustable ajuste ad-

mirable admiracion admirar admirador admitir entrada adorable adorar adornar adorno habil

diestramente adulacion adelanto ventaja ventajoso adviento aventurero aventurero aconsejable

abogacıa afabilidad afable afecto carinoso afiliado afiliacion afinidad afirmar afirmacion afir-

mativo afijo afluencia afluente a flote agregar agregacion agil agilidad agradable acuerdo ayuda

vigilancia posarse viva lealtad aliviar alianza aliado aliados permitir admisible tolerancia se-

ducir aliado todopoderoso altruista asombro asombroso mejorar docil amenidad amabilidad

amable amistoso amnistıa aventura amorosa amplio amplificar ampliamente entretener diver-

sion angel angelical ungir apocalipsis recurso apaciguar adjuntar aplaudir aplausos nombrar

apreciable apreciar apreciacion agradecido aprehender enfoque caso aprobacion aprobar ap-

to aptitud arbitro arbitrar arbitraje ardiente surgido aristocracia aristocrata aristocratico arresto

art atribuir aspiracion aspirar asentir afirmacion activo assist assist asistencia asistente asocia-

do asociacion garantıa asegurar ciertamente asombrar astuto atletico adjunto archivo alcanzar

logro asistir asistencia atento atraer atraccion atractivo atractivo armonizar audible aumentar

aumento propicio autentico autenticidad autoritario autoridad autonomo disponibilidad avido

premio consciente conciencia volver columna vertebral partidario apoyo bola balsamico bautis-

mo bautizar negociar basico faro hermoso embellecer belleza convenir a propio ofrecer amistad

favor amado benefactor benefico beneficioso beneficiario beneficio benevolencia benevolente

benigno legar mejor otorgar prometer en matrimonio esponsales mejor mejor inocente bendi-

ga felicidad feliz alegre florecer flor consejo audacia reforzar hermoso prima auge boost sin

65

Page 83: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

lımites abundante inteligente valiente valentıa sosten de la familia brillante brillo brillantez bri-

llante fraternidad fraternal boyante comprar signatura calm calma sincero candor capacidad

capaz capitalizar fascinacion cuidado despreocupado cuidadoso caress casual incesante cele-

brar celebracion celebridad ceremonial mordimiento campeon campeonato carisma caritativo

caridad casto animar alegre alegre querubın elegante caballerosidad caballerıa elegido amigo

civil civilidad civilizacion civilize aclarar claridad clasico limpieza limpiar claro claridad inteli-

gente cercanıa influencia cooperacion engatusar mimar coexistencia convincente conocimiento

competente coherente cohesion cohorte coincidente colaborar colaboracion colega colosal vuel-

ve comedia gentil comestible comfort comodo comic comico conmemorar conmemoracion co-

mienzo elogiar recomendable elogio conmensurar comision compromiso grande comun sentido

comun comunal comuna comunicar comunicar comunicativo comunion comunidad companero

companerismo empresa compasion compasivo compatible compensar compensacion compe-

tencia competencia competente complemento complemento complementario completo com-

pleto lo completo terminacion conformidad cumplido calma comprender comprension exhaus-

tivo compromiso concesion concluyente concurrir condonar conducente confederacion conferir

confidente confiar confianza confidente agradable felicitar enhorabuena congratulatorio congre-

garse conjuncion conjurar conectar conquistar conquistador conquista conciencia concienzudo

consenso consentimiento consentimiento conservar considere considere considerado examen

consignar consistencia consistente consola consolidar constancia constructivo consultar consul-

ta consumar contacto contacto contenido contenido contenido contentamiento continuidad con-

tribuir contribuir contribucion contribuyente convocar conviccion convencer cooperar coope-

racion cooperativa coordinar coordinacion cordial correcto correccion consejo el abogado el

abogado valor valiente cortes cortesıa cortes pacto acogedor crear creativo creatividad cartas

credenciales credibilidad creıble credito cruzada cruzado abrazo culminar culminacion culti-

var cultivo cultura cupido cure reverencia linda dance atrevimiento atrevido carino intrepido

dawn deslumbrar deal querido estimado decencia bueno descifrar decorar decoracion deco-

rativo dedicarle dedicarle dedicacion deducir defender defensor defensa deferencia definitivo

delicadeza delicado el placer el placer encantador confianza confiable divisar merecer mereci-

damente deseable deseoso dedicar dedicar devocion devoto destreza dig digno dignificar dig-

nidad diligente discernir discreto discrecion discutir distinto distincion distintivo distinguir dis-

66

Page 84: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

tinguir distinguido divina divina divinidad dominio donar donacion adorar indudable paıs de

los suenos durabilidad durable dinamica ansioso afan serio la seriedad facilidad facilidad faci-

les faciles faciles faciles economizar extasis extatico comestible educados educacion educativo

eficaz eficacia eficacia eficiencia eficiente elaborar elaboracion regocijado elegancia elegante

elocuente embellecer abrazo eminencia eminente empatıa autorizar empoderamiento habilitar

enchant enchant encantamiento alentar alentar animo hacerse querer por endosar dotar resisten-

cia energetico energizar realizar mejorar mejora disfrutar agradable disfrute iluminar a iluminar

a ilustracion enriquecer enriquecimiento conjunto asegurar entertain entertain entretenimien-

to entusiasmo entusiasta de emprendedor confiar guardar igualdad equitativo equidad esencial

esencial establecer establecer estima etico etica etiqueta aun aun eterno exact exact exaltar so-

bresalir excelencia excelente excite excite emocionado excitedness emocion esfuerzo regocijo

exotico experiencia experiencia experto experto exquisito ensalzar extraordinario extravagan-

cia exuberancia exuberante exultar exultacion ojo fabuloso facilitar factual fair fair fair justicia

fe fe fiel fidelidad fama familiar familiaridad familiarizar famoso lujoso fantastico fantasıa hi-

permetrope fascinacion de moda favor favor favor favor favor favorable favorito audaz factible

fiesta fiesta companero companerismo fertil ferviente fervor festival festivo festividad fidelidad

ardiente filial fill fino fino fino fino fino firmeza fit fit aptitud instinto ostentoso halagar adula-

cion lucir perfecto flexible ligar florecer fluido fond fond fond fond fond fond 6 fond 7 carino

principal prevision perdone perdonar perdonado perdon formalidad fortalecer fortaleza afortu-

nado forward fomentar fragante franco libre libre libre libre libre libertad fresco amigo amistoso

amistad fiesta frugal fructıfero fruicion cumplir cumplimiento plenitud fun divertidos divertidos

divertida alegrıa alegremente gain gain galante galanterıa juego adornar gay generar generosi-

dad generoso genial genio amable autentico mareado regalo dotado dar glad glad alegrar alegrıa

atractivo glamour brillo brillo espigar alegrıa luz tenue gescucha gescucha brillo brillo glorificar

glorioso gloria lustroso glow glow divino devocion oro dorado bueno adios bondad maravillo-

so gracia agraciado cortes graduacion grandioso grandeza agradecido gratificacion satisfacer

gratitud gran gran gran grandeza saluda saluda novio garantıa garantıa guardian guıa guıa guıa

entusiasmo hallowed mano 9 hermoso practico felicidad feliz feliz feliz feliz resistente inofen-

sivo armonioso armonizar armonıa aprovechar refugio sanar salud sano saludable saludable

corazon sinceramente cielo celestial ayuda servicial heroe heroico heroına heroısmo realce di-

67

Page 85: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

vertidısimo hit santo homenaje casa honesto honesto honesto luna de miel honor honor honor

honorable hope hope esperanzado hospitalario abrazo humano humanitario humanidad humilde

humildad humor humorıstico higiene ideal ideal ideal idealismo ıdolo idolatrar iluminar ilustre

imaginacion imaginativo inmaculado inmortal imparcial imparcialidad imperativo impermeable

ımpetu importancia importante impress impresionante mejorar la mejorar mejorar mejora impu-

nidad inaugurar inauguracion independencia independent independent indescriptible indicativo

indispensabilidad indispensable individualidad indomable indulgencia industrioso barato infa-

libilidad infalible inferir inferencia inform inform ingenioso ingenio heredar inocencia inocente

innovar innovador inquisitivo inseparable vision insistente inspiracion inspirado inspire inspire

instintivo integridad intelecto intelectual intelectual intelectual inteligencia inteligente inteligi-

ble interceder coito interes interes interes interesado interesado interponer intimidad ıntimo in-

trincado intriga inestimable inventor invencible invitacion invite invite invulnerable irresistible

broma registrarse conjuntamente broma broma broma alegre alegrıa alegre jubiloso aniversario

solo solo justicia justificadamente justificacion justificar afilado kid clase tipo amabilidad beso

beso saber saber conocimiento loable risa risa risa risa 6 risa prodigar ley legal lead learn learn

aprendiz legal legitimidad legıtimo ocio liberal liberal liberalismo liberar libertad para toda la

vida luz luz agradable al igual que al igual que vivo 6 animado logica logico longevidad amor

amor amor amor hermosura encantador amante leal lealtad lucido suerte por suerte suerte lu-

crativo luminoso lujuria lustre lustroso exuberante lujoso lujo lırica lırico magico magnetico

magnificencia magnıfico main majestuoso majestad mayor haz 6 haz 7 manejable varonil mari-

tal matrimonio casara casara maravilla maravilloso maestro maestrıa incomparable mate mate

materia madura madura madura madurez maximizar significativo mensurable mediar medita-

cion meet meloso melodıa memorable arreglar mentor misericordioso misericordia merit merit

meritorio alegremente alegrıa alegre malla meticuloso poderoso templado cuenta consciente de

ministro menta milagro milagroso alegrıa movilidad movilizar moderar moderacion moderni-

dad modesto modestia trascendental monumental moral moral moralizador moralidad motivar

motivados motivacion motivo multitud mutua mutua mirıada natural natural navegable ordena-

do necesariamente negociar agradable agradable agradable agradable nicho agil nobleza noble

noble silencioso nombrar no violencia no violento normal notable notoriedad nutrir alimento

novedad enfermera nutrir nutritivo oasis obediencia obediente obedecer objetivo objetivo obli-

68

Page 86: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

gar obtener asequible oferta oferta oferta compensar comienzo adelante abierto open oportuno

oportunidad optima optimismo optimista opcional orden orden orden 6 organizar organizar ori-

ginalidad extrovertida sobrevivir a total correr mas que comienzo excepcional burlar superar

lleno de alegrıa esmerado sabroso palaciego mimar paraıso supremo perdon perdon determina-

do companero asociacion paso apasionado paciencia paciente paciente patriota patriotico patron

mecenazgo pay paz paz pacıfico pacıfico sin par perfecto perfecto perfecto perfeccion perfeccio-

nismo perfeccionista perfume permiso permiso perseverancia perseverar persuasivo pertinente

pintoresco piedad pinaculo piadoso liso liso liso liso plausibilidad jugueton companero de juego

juguete agradable agradable broma por favor por favor contento contento agradable placer pro-

mesa abundante mucho poetico conmovedor poise polaco cortes cortesıa pompa popular popu-

laridad populoso portatil positivo lo positivo positividad posteridad potencia potente practicable

practica elogio cabriola precaucion precedente precepto precioso preciso precision preeminen-

te preferencia primer ministro premisa prima preparatorio prestigio bien bonita bonita bonita

bonita no tiene precio orgullo ante todo principal director principio principio principio intimi-

dad privilegiado privado premio pro proactivo prodigioso prodigio productivo productividad

profesar oferta competente resultado resultado rentable profundo progreso progreso progresi-

vo prolıfico prominencia prominente promesa promesa prompt prompt prontamente apropia-

do propicio propiedad propiedad enjuiciar prosperar prosperidad prospero proteger proteccion

protector protector orgulloso proporcionar providencia valor prudencia prudente puntual puro

purificacion purificar pureza util ronroneo pintoresco calificar calificar calidad aplacar acele-

rar resplandor radiante irradiar reunion compenetracion arrebatado rapto racional delirio facil-

mente verdadero realista de modo realista recoger razonable seguridades tranquilizar receptivo

reclamar reclinar recompensa conciliar reconciliacion recreacion redimir redencion restable-

cer refinar refinamiento refugio real relacion rehabilitacion reforzamiento reintegrar alegrarse

relajacion pertinencia pertinencia pertinente confiabilidad de confianza alivio aliviar religiosa

saborear notable notablemente remedio remodelar renacimiento renovacion renovar renovacion

renombre reparacion reparacion reparacion arrepentirse arrepentimiento reposo acreditado res-

cate rescate resuelto resuelven resuelven resuelto resonar ingenioso inventiva respecto respec-

to respecto respetable respetuoso respiro resplandeciente responsabilidad responsable sensible

sosegado restauracion restaurar resucitar retorno retorno reunion reunir jaranear revelacion re-

69

Page 87: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

verenciar reverencia reverente reverentemente revitalizar renacimiento reanimar recompensa

recompensa recompensa rich rich rich rich rich rich 6 riqueza riqueza derecho derecho 6 justo

justicia legıtimo maduro madurar robusto romance romantico romantizar rosado round desper-

tar sagrado safe safe safe safe salvaguardia seguridad sagacidad sabio santo saludable saludo

saludo salvacion santificar santuario cuerdo optimista sanitario cordura satisfaccion satisfac-

toriamente satisfactorio satisfacer satisfacer satisfacer guardar ahorros saborear comprension

corretear scruples escrupuloso seguro seguro seguridad seguridad selectivo autonomo respeto

a ti mismo apariencia sensacional sentido sentido sensato sensible sensibilidad sereno grave

gravedad resolver parte compartir compartir refugio refugio proteger brillante perspicaz astucia

significado significativo significar sencillez simplifique simplifique sincero sinceridad destre-

zas habil pulcro inteligente inteligente inteligente sonrisa sonrisa sonrisa sonrisa smitten sobrio

sociable blandura consuelo solucion calmar sofisticado buscado sonido sonido 6 solvencia re-

puesto brillar especial espectacular rapidamente esplendido esplendor inmaculado animado en

angulo recto estabilidad estabilizar estable soporte estandarizar grapa majestuoso estatuario fir-

me staunchness firme constancia firmeza estable estimular estımulo pie recta sencillo puntal

semental estudioso estupendo robusto elegante afable sublime suscribir suscripcion subven-

cionar subvencion subsistir subsistencia justificar sutil exito exito exitoso satisfacer suficiente

juego traje adecuado cumbre suntuoso super superior superioridad superlativo soporte soporte

soporte soporte apoyo suprema suprema oleada conjetura superar a superar supervivencia so-

brevivir sobreviviente sweet sweet sweet sweet endulzar novio dulzura rapidez desmayo jurada

simbolizar simetrıa simpatico compadecerse simpatıa sıntesis tacto tactica talento talentoso sa-

bor templanza templado tentar tenaz tenacidad sensibilidad estupendo gracias gracias gracias

agradecido terapeutico completo pensativo consideracion ahorro ahorrativo emocion prosperar

tingle unidad tolerancia tolerante tolerar tolerancia mas alto tradicion tradicional tren tranquilo

tranquilidad recorrido tesoro tesoro invitacion tratado tratado tremenda tremenda tributo triunfo

triunfo triunfal triunfante trofeo true integridad confiable verdad veraz unbound intacto poco

comun entender comprensible entendido sin alguna duda indudablemente inolvidable sin prisas

intachable unico unidad ilimitado altruista incontaminados optimista en la delantera mejorar

estimados defender edificacion mas alto vertical arriba hacia arriba usable util utilidad utilitario

utilizacion utilizar mas lejano valiente valido validez valor valioso valor vencer a vastedad ve-

70

Page 88: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

nerable venerar verificacion verificar verdadero versatil versatilidad viabilidad viable victorioso

vigilancia vigilante virtud virtuoso visionario visualizacion vitalidad vivaz vıvido voluntario

conceder caliente warmhearted calor recepcion bienestar bien caprichoso saludable deliberado

complaciente complacencia sabidurıa ingenioso maravilla maravilloso maravilloso cortejar fac-

tible hechura mundialmente famoso vale vale la pena dignidad digno cenit animo honesto justo

leal coherente lıder profesional serio extranamos mio

Diccionario palabras negativas

abandonar abandono disminuir abdicar aborrecer abyecto anormal abolir abominable abrasivo

abrupto fugarse ausencia ausente despistado ausente absurdo absurdo abuso abuso abismo acci-

dente abordar maldito acusacion acusaran acusaran dolor mordaz acritud adicto adiccion amo-

nestar amonestacion adulterar adulteracion adulterio adversario adverso adversidad afectacion

afligir afliccion miedo en contra agravar agravacion agresion agresivo agresividad agresor ofen-

der espantado agitar agitacion agitador agonizar agonıa afligir enfermedad sin objetivo alarma

alarmante ay coartada extraterrestre enajenar alienacion alegacion alegar a distancia altercado

ambiguedad ambiguo ambivalente emboscada emboscada mal amputar anarquista anarquıa ira

ira enojado angustia animosidad aniquilar aniquilacion molestar molestia anomalo anomalıa

antagonismo antagonista antagonista enemistarse antisocial antipatıa anticuado antimonopolis-

ta ansiedad preocupados preocupados ansiedad apatico apatıa appall appall detencion aprensivo

arbitrario arduo argue argumento arresto arresto arrogancia arrogante artificial avergonzado ata-

car agresor asesino asesinar asalto asalto por mal camino en pedazos atroz atrofia ataque ataque

ataque audaz audacia austero autocrata autocratico avaricia avaro vengar aversion evitar evi-

tar evitacion horrible torpe torpeza hacha balbucear hacia atras atraso malo mal deflector des-

concierto fianza cebo obstaculo banal bandido perdicion desterrar desterrar destierro arruinado

bancarrota bar barbaro barbaro esteril barrera tımido bastardo batalla batalla campo de batalla

bestial golpe golpe golpe mendigar mendigo decapitar tardıo desmentir empequenecer belige-

rante correa privar duelo privado enloquecido implorar acosar sitiar traicionar traicion tener cui-

dado confundir desconcierto bit malevolo mordida mordida mordida amargo amargura extrano

chantaje paja culpa culpa amable blast blast evidente desolado defecto blind blind blind blind

ceguera bloque bloque estupido matanza sanguinario sangriento blow blow torpeza embotar di-

71

Page 89: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

fuminar decir bruscamente consejo 7 alarde jactancioso falso bullicioso tornillo bomba bomba

bombardear bombardeo esclavitud bota alesaje alesaje alesaje aburrimiento bother bother mo-

lesto obligado combate caja jactarse blandir palo de golf bravata pelearse descarado incumpli-

miento pausa pausa pausa descompostura soborno cerda fragil rompio rompio rompio rompio 7

con el corazon roto crıa moreton brusco brutalidad bruto brutal hebilla error bala culo estropear

carga carga gravoso ladron robo burn burn burn burn enterrar entrometido carnicerıa calamidad

calloso cancelar cancelacion cancer canıbal canon capital capitular caprichoso zozobrar cautivo

captura captura carena descuidado descuido vıctima cataclismo catastrofe captura cave censurar

censura censura rozar reto reto caos caotico suplemento carga carga carga 7 chase chase castigar

barato abaratar cheater reprendo infantil cebador cebador faena cronico cırculo clamor clamoro-

so choque estrepito camarilla obstruir cerrar cerrar 7 club club torpe desorden grueso tosquedad

engreimiento engreıdo obligar coercion coactivo frıo frıo frıo frıo colapso colapso chocar coli-

sion colusion colonia combate combate combatiente conmiseracion commit plebeyo vulgar con-

mocion obligar obligar competir competencia competitivo competidor quejar queja complejo

complejidad complican complican complicacion complicidad compulsion encubrir presuncion

preocupacion preocupacion condenar condenar condenacion condescendiente condescendencia

confesar confesion aısle aısle confinamiento confiscar confiscacion conflicto conflicto conflicto

conflicto confundir confrontar confrontacion confuse confuse confuse confuse confusion con-

gestionado congestion conspiracion conspirador conspirar consternacion constrenir restriccion

consuntivo contagioso contaminar contaminacion desprecio despreciable desdenoso contender

contradecir contradiccion contradictorio contrario polemico controversia convict convict guay

frescura corroer corrosion corrosivo corrupto corrupcion coste coste alto precio costoso contra-

rrestar neutralizacion falsificacion encubierto codiciar cobarde astuto atestar calambre de ma-

niatico craso pedir arrastre manıa locura loca credulo crimen criminal encogerse lisiado crisis

crıtico criticar croar ladron torcido cruz cruz cruz 7 crudo cruel crueldad desmoronarse arru-

ga crush crush aplastante culpable culpable incomodo maldicion maldicion superficial brusco

acortar cut cut cınico cinismo dano dano maldita sea detestable maldito peligro peligroso oscu-

ro oscurecer oscuridad maldito desalentadora holgazanear aturdimiento muerto punto muerto

mortal peso muerto sordo sordera deal escasez muerte discutible deudor decadencia decaden-

te decay decay fallecimiento engano enganoso enganar enganar engano enganoso disminucion

72

Page 90: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

disminucion descomponer disminucion disminucion difamar defecto derrota derrota defecto de-

fectuoso acusado defensivo desafıo desafiante deficiencia deficiente deficit desfiladero desafiar

degenerar degradar abatido retraso retraso delincuencia delincuente delirio diluvio engano de-

gradar fallecimiento demoler demonio desmoralizar negacion denunciar mella negar dependien-

te agotar deplorable deplorar deponer depravado depreciar depreciacion depress depress depress

depresion depresion privar ridiculizar burla burlon despectivo desert desert desercion deseo so-

litario soledad desesperacion desesperacion desesperado desesperacion despreciable desprecio

desprecio indigente destruir destruccion destructivo desapego detener desalentar disuasorio de-

testar detestable detraer perjudicial devastar devastacion desviarse desviacion diablo diabolico

tortuoso vacıo diabolico diabolico dictar dictatorial diferir de difıcil dificultad dilema dim dim

estruendo terrible suciedad sucio inhabilitar desventaja desventajoso desagradable desacuerdo

decepcionar a decepcionar a decepcionar a decepcionar a decepcion desaprobacion desaprobar

desarmar desastre desastroso repudiar negacion incredulidad descarga descarga negar incomo-

didad desconcertado descontento discordia discordante disuada disuada desanimo descredito

discrepante discriminar desden enfermedad enfermo desgracia disfraz disgust disgust disgust

disgust disgust desalentar deshonesto deshonra falso desinteres dislike dislike triste desestimar

desestimar desobediencia desobediente trastorno desestructurado disipar prescindible dispensar

desplazar desagradar disgusto disposicion disponer disponer desproporcionado refutar dispu-

table disputa disputa indiferencia interrumpir ruptura insatisfaccion insatisfecho descontentar

disentimiento disension disolucion distorsionar distorsion distraer distrayendo distraccion so-

corro socorro desconfiado perturb perturb perturb disturbio desviacion desviar divide divide

division divorcio divorcio divorcio mareado zona de las calmas ecuatoriales dominar dominar

dominar dominacion doom doom dıa del juicio final droga doble doble duda duda duda du-

doso alicaıdo caıda desanimado monotono arrastrar pavor terrible triste drive inclinarse drop

drop drop sequıa drown drown somnolencia sonoliento borracho borracho borracho borracho

dudoso aburrido tonto dump dump burro mazmorra deber disminuirse morir morir excentrico

excentricidad edge egolatra eliminar eliminacion avergonzar verguenza emergencia vacıo vacıo

invadir invasion poner en peligro enemigo hacer cumplir sumergir enfurecer esclavizar enredar

enredo rogar a envidioso envidia epidemia epıteto equıvoco erradicar borrar erosionar erosion

errar erroneo error esoterico estranged evadir evasion aun desalojar mal mal exageracion exas-

73

Page 91: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

perar exasperacion excepcion exceso excesivo excluir exclusion excomunion ejecutar eximir

escape agotamiento exilio salida conveniente expulsar gastos gastos costoso explotar explotar

explosion explosivo exponer exterminar exterminio extinto extinguir extravagante fabricar fa-

bricacion fallo fallo fallo fallo fracaso debil falso caıda 7 falacia caer falso falsedad desfallecer

hambruna famelico fanatico fanatico farsa fascista fat fat fat fatal fatalista fatiga culpa miedo

miedo miedo temeroso temible fed debil fingir finta feroz ferocidad feudo feudal fiebre febril

fiasco voluble agitarse demonio feroz lucha lucha lucha combatiente inmundicia inmundo fino

fino 7 fuego fuego fuego puno revision flagrante falla huido huir fugaz endeble piso platija

enemigo debilidad tonto tonto tonto tonterıa prohibir prohibido fuerza fuerza fuerza presenti-

miento extranjera perder olvido abandonado formidable abandonar luchado fundador fractura

fragil frenetico freneticamente fraude fraudulento tenso monstruo traste displicente asustar a

asustar a asustar a espantoso frıgido frıvolo frente frown frown infructuoso frustrar a frustrar a

frustrar a frustracion fugitivo buscar a tientas fun furioso furia escandalo exigente futilidad hiel

gamble gamble tajo llamativo germen get horrible ghetto deslumbramiento relamerse oscuri-

dad melancolico sombrıo goddamn agarrar luchar gratuito grave grave grave grave grave dolor

queja afligirse severo oso pardo grotesco grunido resentimiento brusco queja guerrilla culpa

culpable guisa credulo pistola hombres armados cortar maquina de alquiler bruja demacrado

cesto mano desventaja hang hang al azar desventurado acosar acoso duro duro privacion dano

dano perjudicial duro molestia hate hate hate enemigo odio arrogante guarida estragos peligro

peligro peligroso confusion brumoso dolor de cabeza cruel frenetico cobertura hedonista des-

atento atroz infierno ayuda indefenso impotencia horrible impedir obstaculo hit hit acumular

cojear hoyo hoyo hueco acogedor sin esperanza horda horn horrible horrible horrorizar horror

hostil hostilidad caliente humillar humillacion hung hambre hambriento hunt hunt hunt cazador

hurt hurt hiriente ajetreo estafador hipocresıa hipocrita histeria histerico idiota idiota ociosi-

dad innoble ignorancia ignorante ill ill ill ill ilegal ilegalidad analfabeto enfermedad ilogico

inmaduro inmovilidad inmoral inmoralidad inamovible perjudicar punto muerto impaciencia

impaciente impedir impedimento imperfecto impersonal impetuoso implicar implorar imponer

imprecision encarcelar prision incorrecto impulsivo impuro impureza incapacidad inaccesible

inexactitud inadecuado inane incapaz incesante incompatibilidad incompatible incompetencia

incompetente inconsecuencia inconveniente incorrecto increıble incurable indecente indefinido

74

Page 92: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

indeterminable indeterminado acusacion indiferencia indiferente indignacion complacer inefi-

caz inoperancia ineficaz ineficacia ineficacia desigualdad inexacto inexplicable infame infectar

infeccion inferior inferioridad infestar infiltracion inflamar inflacion infligir infraccion infrac-

cion enfurecer ingratitud inhibir inhibicion inhumano mandato lesionar perjudicial lesion insano

inseguro inseguridad insensible insidioso insignificante insinuar insolencia insolente inestabili-

dad inestable insuficiencia insuficiente insulto interferir interferencia interrumpir interrupcion

intervencion intimidar intolerable intoxicar entrometerse intruso intrusion inundar inundados

invadir invalido invisible involuntario involve fastidiar iron iron ironico ironıa irracional irre-

gular irregularidad irresponsable irritable irritacion aislar aislar carcel carcel jar burla poner en

peligro peligro tiron tiron nervioso desempleado asustadizo basura kick kick kick secuestrar

matanza matanza asesino cuchillo knock knock knock falta falta falta retraso laid cojo lamento

lamentable languidecer lapso risa ilegal lay perezosamente perezoso fuga fuga let responsa-

bilidad responsable mentiroso mentira mentira sin vida lımite lımite lımite limitacion cojear

liquidar liquidacion camada carga solitario soledad solitario solitario solitario telar perder per-

der perdedor perdida perdido perdido perdido perdido sin amor baja baja baja humilde ridıculo

calma lunatico senuelo estar al acecho mentira mentira mad mad loco locura haz inadaptado in-

adaptacion enfermedad malicia malicioso maligno mutilar manipular manipulacion homicidio

involuntario mar mar marginal masacre materia pobre mala sin sentido entrometerse medio-

cre manso melancolıa melodramatico amenaza servil despiadado lıo lıo cuenta 9 mina portar-

se mal mal comportamiento travesura danoso avaro miserable miseria desgracia manejar mal

percance informar mal mal informado enganar falsificar srta error error error equivocado des-

confianza entender mal malentendido incomprendido mal uso mix gemido burlarse de mofa

molestar monotono monotonıa monstruo monstruoso temperamental mortificar inmovil abiga-

rrado llorar llorar doliente confusion fangoso mascullar mundano asesinato asesinato asesino

turbio murmurar me¿nag ingenuo asqueroso travieso nebuloso necesidad necesidad necesidad

aguja necesitado negar negacion negativo abandono abandono negligencia negligente nervioso

nerviosismo neurotico neutralizar pesadilla nada ruido despreocupado disparates curioso noto-

rio principiante molestia anulacion anular entumecido nueces objeto objecion oblicuo obliterar

desagradable oscuro obsoleto obstaculo obstinado obstruir obstruccion impar rareza ofender de-

lincuente ofensiva ominoso omision omitir dogmatico adversario oponerse oponerse oponerse

75

Page 93: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

oposicion oprimir opresion opresivo ordalıas orden 8 huerfano condenar al ostracismo expul-

sar brote explosion paria grito proscrito atropello indignante forastero despotico rebosar pasar

por alto dominar invadir vigilancia derrocamiento anular abrumador exceso de trabajo deber

dolor doloroso miserable pandemonio panico paralisis paralizado paranoico parasito determi-

nado dividir paso 8 paso 0 paso pasado de moda patetico patrocinar peculiar peligro peli-

groso perecer dejar perplejo perplejidad perseguir persecucion perturbar perverso pervertido

pesimismo pesimista parasito pequeno fobia seleccion pieza pinch pinch lamentable despia-

dado plaga plaga demandante situacion paso pesado parcela punto n ◦ inutil veneno veneno-

so contaminar contaminacion pomposo poor poor poor poor poor poor libra abadejo pobreza

impotente precario precipitado predicamento perjudicar perjudicial absurdo prensa presuntuo-

so fingir pretension pretencioso prision prision prisionero problema aplazar dilacion pinchar

prohibir prohibicion prohibitivo propaganda enjuiciamiento protesta protesta provocacion pro-

vocar merodear palanca punetazo castigar escuchimizado push push push perplejidad escrupulo

dilema pelea pelea peleon raro cuestionable sutileza dejar cobarde race radical rabia raid au-

mentar divagar desenfrenado bribon erupcion rata racionar rattle estrago reaccionario reactivo

rebelde rebelde rebelion rebelde rechazo reprension refutar recalcitrante alejarse recesion te-

merario imprudencia retroceso redundancia redundante estribillo refugiado negativa rechazar

independientemente regreso regresion regret regret lamentable rechazar rechazo recaıda reacio

remordimiento renuncia renuncia revocar reprensible reprimir reproche repudiar repugnante re-

chazar repulsivo resentirse de resentido resentimiento resignacion inquieto inquietud restringen

restringen restringen restriccion tomar represalias retardar jubilarse retiro retiro venganza re-

vertir revocar revuelta revolucion eliminar paseo burla burla ridıculo rıgido rigor riguroso rip

rip arriesgado rival rival rivalidad ladron robo pıcaro root putrefaccion podrido bruto aspereza

rotonda basura grosero ruda rufian ruina ruina ruina ruina ruinoso rumor arrugar operacion no

run huir ruptura ruptura oxidado implacable crueldad sabotaje triste tristeza hundimiento sank

savia sarcasmo sarcastica salvaje escaldadura escandalo escandaloso chivo expiatorio cicatriz

escasez susto susto asustado asustado de miedo esquema esquema burla scold scold quemar

desden desdenoso sinverguenza ceno raspar scream scream screech screech tornillo escudrinar

pelea escoria secesionarse secesion secreto secreto sedentario hervir segregacion aprovechar

egoısta egoısmo senil sin sentido la oracion secuestrar servir servicio servidumbre cortar grave

76

Page 94: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

gravedad en mal estado la sombra sombreado lanudo shake superficial verguenza vergonzoso

desvergonzado tiburon shell shell naufragio eludir temblar descarga descarga descarga descarga

descarga pacotilla disparar disparar disparar breve escasez defecto miope shot empujon show

desgarrar musarana grito estridente marchitar sudario encogimiento encogimiento rehuir timi-

dez sick sick sick sick enfermizo enfermedad cerco tonto simplista sin sin pecaminoso siniestro

esceptico incompleto escaramuza esconderse golpe calumnia calumniador difamatorio bofe-

tada barra oblicua sacrificio asesino sordido insomne leve leve leve leve limo poco riguroso

perezoso perezoso babosa lento depresion astuto tortazo smash smash frotis ahogar hacer con-

trabando trampa grunido arrebatar furtivo burla ronquido sollozo sombrıo dolorido dolor dolor

triste triste triste ordenar agrio azotar spear derramar solterona pese malevolo split mimar spot

esguince chisporroteo malgastar punalada estancado manchar duro estancamiento balbucear

sello parada rıgido asustar inanicion morir de hambre estatico robar robar popa barra sofocar

estigma picadura hedor estola robado robado storm tormentoso rezagarse straggler cepa cepa

estrangular extraviado estres estres afligido estricta estricta estricta lucha huelga huelga riguroso

pulso lucha lucha lucha obstinado tercamente testarudez estudio cargado truco estupido estupi-

do estupido estupidez estupor sujecion subyugar subyugacion sumiso subordinacion disminuir

sustitucion sustraer subversion subvertir sucumbir ventosa sufrir sufrir vıctima sofocar hosco

romper superficial superficialidad superfluo supersticion supersticioso reprimir supresion sus-

ceptible sospechoso sospechoso suspender suspension sospecha suspicaz jurar juraron sıntoma

tabu mancha manosear berrinche tardıo arancel andrajo taunt taunt impuestos tear tear moles-

tar tedioso genio genio tempestad temporalmente tentacion tiempo tension terrible aterrorizar

terror terrorismo aterrorizar robo ladron sed sediento espinoso desconsiderado movimiento de

piernas amenaza amenazar tiro tiro ruido sordo frustrar timidez neumatico neumatico neumati-

co cansado cansado cansado cansado cansado esfuerzo tolerable too derrocar tormento torrente

tortuoso quisquilloso tragedia tragico traidor vagabundo pisotear transgredir trap trap trauma

traumatico traicionero traicion traicion treasonous pecado truco truco trivial problema problema

problema problema molesto ausente caminar penosamente try try turbulento confusion turn turn

8 contraccion nerviosa tiranıa feo ultimatum no acostumbrado unarm no atractivo unauthentic

inevitable inaguantable increıble incivil inmundo poco claro incomodo tosco undependability

poco confiable socavar inframundo indeseable deshicieron poco digna deshacer deshecho inde-

77

Page 95: UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor: Jefferson Tarcisio Beltr´an Morales Este proyecto tiene como finalidad crear un modelo

bido inquietud difıcil antieconomico desempleados desigual desigual inesperadamente injusto

infiel desconocido desfavorable insensible impropio imprevistos desafortunada desafortunada

desafortunada antipatico desagradecido sin defensa infelicidad infeliz insalubre sin importancia

no informado injusto injustificado cruel ilegal desafortunado impasible antinatural innecesario

enervar inadvertido desapercibido desagradable impopular improductivo no cualificado irrazo-

nable la falta de fiabilidad no fidedigno disturbios revoltoso inseguro insatisfactorio poco es-

crupuloso invisible inquietante defectuoso indecible inestable inestabilidad inestable fracasado

prematuro inexperto falso indigno de confianza mentira reacio renuencia imprudente indigno de

convulsion levantamiento escandalo desarraigar trastornado trastornado trastornado trastornado

trastornado inutil usurpar declaracion vagabundo vagabundo vago vaguedad vano desaparecer

vanidad vehemente venganza veneno venenoso veto vejar vejacion vexing vice vicioso rivali-

zar vil villano violar violacion violencia violento vıbora vacıo volatil volatilidad vomito vulgar

gemido espere revolcarse por menguar sin sentido guerra guerra belicoso deformacion caute-

loso residuos residuos antieconomico despilfarro rebelde debilitar desgaste cansancio aburrido

pequenito hierba llorar extrano moza golpear gemido gimoteo whip whip whip malvado mali-

cia salvaje salvaje salvaje salvaje marchitar astuto contraerse de dolor brujerıa withheld retener

afliccion lamentable desgastado desgastado worrier preocupacion preocupacion preocupacion

preocupacion preocupacion peor empeorar peor sin valor herida herida herida ira ruina luchar

desgraciado miseria arruga retorcerse mal mal ilegal forjado bostezo anorar ganido corrupto

hipocrita doble moral inconcistente prepotente injusto comunista arrogante petulante insolen-

te burdo vulgar odioso mentiroso charlatan ladron ambicioso controlador ignorante victimista

insensato inepto calumniador manipulador

78