Post on 24-May-2020
Estimación del Trasvase de Votos entre Partidos: Aplicación a las Elecciones Generales
2015 y 2016 en Madrid
Javier Lejarraga Cañas
Febrero 2017
Tutor 1: Jesús Juan Ruiz
Tutor 2: Víctor Gómez Frías
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
2 Escuela Técnica Superior de Ingenieros Industriales (UPM)
“El esfuerzo es solo esfuerzo
cuando empieza a doler”
José Ortega y Gassett
“Yo creo bastante en la suerte. Y he constado que,
cuanto más duro trabajo, más suerte tengo”
Thomas Jefferson
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 3
A mis Padres;
Agradecimientos
4 Escuela Técnica Superior de Ingenieros Industriales (UPM)
AGRADECIMIENTOS
Deseo agradecer a mis Directores del Proyecto Jesús Juan y Víctor Gómez, por brindarme la
oportunidad de realizar este Trabajo de Fin de Grado, por compartir sus conocimientos,
consejos, puntos de vista y experiencias, acompañándome a lo largo de todo el trabajo.
A mi familia por animarme y ayudarme día tras día a alcanzar mis metas, y en especial a mis
Padres por los medios y facilidades que han puesto a mi alcance, así como el apoyo recibido
durante toda la carrera en los momentos de flaqueza. Sin olvidar a mi Tía, por el esfuerzo y
dedicación prestada a lo largo de la carrera.
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 5
Resumen
6 Escuela Técnica Superior de Ingenieros Industriales (UPM)
RESUMEN
Desde que comenzó la Democracia, la sociedad y en particular los distintos partidos han
intentado averiguar qué ocurrirá en las siguientes elecciones y cuál será la intención de voto. En
este trabajo, se trata de estimar el trasvase de votos entre dos procesos electorales, ya que
dicho trasvase permite analizar el sentido hacia el que se dirige la sociedad. Un hecho relevante
fue el que se dio en las elecciones parlamentarias alemanas en 1933, cuando el Partido
Nacionalista Obrero Alemán ganó las elecciones de Marzo de 1993 con una 43.91% y las de
noviembre de 1933 con un 92.1%, hecho que revela la importancia de haber podido conocer el
trasvase de votos producido. Sin embargo esta importancia ha ido creciendo con el paso de los
días, debido a la Crisis Política y Social por la que atraviesa el Planeta, como los movimientos
sociales ocurridos tras las elecciones presidenciales de Estados Unidos, e incluso de España,
donde la aparición de nuevas opciones políticas catalizadas por la situación económica y social
unido al destape de los casos de corrupción, han conseguido acabar con el bipartidismo;
provocando que el estudio del trasvase de votos cobre cada día más importancia.
El objetivo de este Trabajo de Fin de Grado ha sido el estudio del trasvase de votos producido
en Madrid en las Elecciones al Congreso General de los Diputados entre las elecciones del 20
de Diciembre de 2015 y las elecciones del 26 de Junio de 2016. Para ello se ha desarrollado un
modelo de estimación de la conducta electoral, basándose en los principios de la Inferencia
Ecológica, que trate de reflejar el comportamiento ante las urnas de la sociedad madrileña en
las Elecciones. Las ventajas que muestra este método es la posibilidad de conocer y cuantificar
el flujo interno de votos producido en un partido entre 2 elecciones, desenmascarando todo
aquello que no es apreciable a simple vista mediante el análisis macro de los datos.
La Inferencia Ecológica es un método que trata de estimar o predecir el comportamiento
individual a partir de datos agregados. En este trabajo se ha utilizado este método para predecir
la estimación de conductas electorales entre dos elecciones. Se ha trabajado con clusters
(agrupación de barrios con conducta electoral similar), con el fin de establecer una estimación
de la conducta electoral válida para cada grupo. Mediante el análisis cluster, se ha clasificado
cada barrio en uno de los tres cluster considerados, estos clusters representan la derecha,
centro e izquierda de la ciudad. Una vez realizada la clasificación se ha obtenido el siguiente
mapa:
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 7
Ilustración 1 Mapa de los barrios de Madrid
Posteriormente se procede a la realización del modelo de regresión lineal múltiple (MRLM) con
restricciones. Este modelo relaciona los votos obtenidos por las candidaturas en las elecciones
de 2015 y 2016. Para la estimación de este modelo se ha decidido utilizar el método me
mínimos cuadrados, se ha elegido este método de estimación con el fin de que no se
compensen los residuos unos con otros y además, penalizar aquellos residuos más alejados de
la recta de regresión.
Un vez se haya formulado el modelo se procederá a la computación y resolución del modelo en
R-Studio, se obtienen unas tablas de estimación del trasvase de votos en cada cluster. En estas
tablas se puede apreciar tanto el destino de los votos obtenidos por una candidatura en el año
2015, como el origen de los votos obtenidos por una candidatura en el año 2016, reflejando el
trasvase de votos entre los dos periodos electorales.
Resumen
8 Escuela Técnica Superior de Ingenieros Industriales (UPM)
CLUSTER 1 (NORTE)
CATEGORIAS PP2016 PSOE2016 UNIDOS.PODEMOS2016 CIUDADANOS2016 RESTO2016 BLANCO2016 ABSTENCION2016
PP2015 1 PSOE2015
0.98
0.008
0.012
IU2015
0.377 0.623
PODEMOS2015
0.737 0.093
0.17
CIUDADANOS2015 0.169
0.776
0.055
RESTO2015
0.042
0.304 0.364
0.29
BLANCO2015
0 1
ABSTENCION2015 0.029 0.008 0.019
0.048 0.019 0.877
CLUSTER 2 (CENTRO-FRONTERA)
CATEGORIAS PP2016 PSOE2016 UNIDOS.PODEMOS2016 CIUDADANOS2016 RESTO2016 BLANCO2016 ABSTENCION2016
PP2015 0.996 0.004 PSOE2015
0.788
0.212
IU2015
0.35 0.453 0.197
PODEMOS2015
0.063 0.858
0.021
0.058
CIUDADANOS2015 0.162
0.803
0.035
RESTO2015
0.318
0.237 0.398 0.001 0.046
BLANCO2015
0.913
0.087
ABSTENCION2015
0.003
0.04 0.02 0.937
CLUSTER 3 (SUR)
CATEGORIAS PP2016 PSOE2016 UNIDOS.PODEMOS2016 CIUDADANOS2016 RESTO2016 BLANCO2016 ABSTENCION2016
PP2015 0.991
0.007 0.002 PSOE2015
0.840
0.160
IU2015
0.266 0.457 0.256
0.021
PODEMOS2015 0.010 0.026 0.882
0.036 0.003 0.043
CIUDADANOS2015 0.109
0.805
0.086
RESTO2015 0.088 0.351
0.113 0.449 BLANCO2015 0.327 0.673
ABSTENCION2015
0.010
0.013 0.008 0.969
Tabla 1 Estimación para los tres clusters
Por último destacar que cada trasvase de voto hace referencia a una conducta electoral distinta,
estas conductas son clave para explicar el motivo del trasvase de votos. Las conductas
electorales identificadas se muestran a continuación:
Votantes incondicionales: Son aquellos votantes fieles a un partido
Votantes frontera: Aquellos simpatizantes a dos o más partidos que dudan a que
candidatura destinar su voto hasta el mismo día de las elecciones. Son los principales
responsables del trasvase de votos.
Votantes veleta: Aquellos que se mueven en dirección del viento que sople más fuerte, es
decir, apoyarán a aquella candidatura con más opciones de ganar.
Votantes castigadores: Son aquellos que están descontentos con el rumbo del partido o con
la adhesión de su partido a otra formación.
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 9
Palabras Clave: Trasvase, inferencia, cluster, regresión, estimación y votante.
Código Unesco: 120913 (Técnicas de Inferencia Estadística)
Índice
10 Escuela Técnica Superior de Ingenieros Industriales (UPM)
I NDICE
AGRADECIMIENTOS ................................................................................................................. 4
RESUMEN .................................................................................................................................. 6
ÍNDICE ...................................................................................................................................... 10
ÍNDICE DE ILUSTRACIONES ................................................................................................... 14
ÍNDICE DE TABLAS ................................................................................................................. 16
ÍNDICE DE ECUACIONES ........................................................................................................ 18
1. INTRODUCCIÓN ............................................................................................................... 20
2. OBJETIVOS ...................................................................................................................... 22
3. METODOLOGÍA ................................................................................................................ 24
3.1 RECOPILACION DE DATOS ...................................................................................... 24
3.2 ANALISIS CLUSTER .................................................................................................. 26
3.3 MODELO DE REGRESION ........................................................................................ 39
3.4 ESTIMACION DE MINIMOS CUADRADOS ................................................................ 45
4. CÓDIGO EN R-STUDIO .................................................................................................... 48
4.1 AGRUPACIÓN JERARQUICA (DENDOGRAMA) ....................................................... 48
4.1.1 CORTE DENDOGRAMA ...................................................................................... 49
4.2 AGRUPACION POR PARTICIONES (K-MEANS) ....................................................... 49
4.2.1 EXTRACCION AGRUPACION Y DEL VECTOR DE AGRUPACION ................... 49
4.2.3 ANÁLISIS DE SILUETA ............................................................................................ 49
4.2.4 PLOTEAR EL CLUSTER .......................................................................................... 50
4.3 PLOTEAR MAPAS ...................................................................................................... 50
4.3.1 PINTAR MAPAS SEGÚN COLORES ................................................................... 50
4.3.2 CENTROS DE GRAVEDAD DE CADA DISTRITO ............................................... 52
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 11
4.3.3 MARCAR MESAS ELECTORALES ..................................................................... 52
4.4 REGRESIÓN LINEAL ................................................................................................. 52
4.5 ESTIMACIÓN .............................................................................................................. 53
4.6 ESTIMACION CON OTRO TIPO DE RESTRICCIONES ............................................. 54
4.7 DIAGRAMA DE DISPERSION MATRICIAL ................................................................ 56
5. RESULTADOS .................................................................................................................. 58
5.1 ESTIMACIONES DE LA CONDUCTA ELECTORAL ................................................... 58
5.1.1 Cluster 1............................................................................................................... 58
5.1.2 Cluster 2............................................................................................................... 59
5.1.3 Cluster 3............................................................................................................... 60
5.2 RELACIONES ENTRE LAS CANDIDATURAS ............................................................ 61
Análisis de los resultados ...................................................................................................... 63
5.2.1 Partido Popular (PP) ............................................................................................ 63
5.2.2 Partido Socialista Obrero Español (PSOE) ........................................................... 64
5.2.3 Podemos .............................................................................................................. 65
5.2.4 Izquierda Unida (IU) ............................................................................................. 66
5.2.5 Unidos Podemos: ................................................................................................. 66
5.2.6 Ciudadanos (C´s) ................................................................................................. 67
5.2.7 Resto de opciones políticas.................................................................................. 68
5.2.8 Voto en Blanco ..................................................................................................... 69
5.2.9 Abstenciones ....................................................................................................... 70
6. CONCLUSIONES .............................................................................................................. 72
7. LINEAS FUTURAS ............................................................................................................ 75
8. PLANIFICACION TEMPORAL ........................................................................................... 76
8.1 Paquetes de trabajo .................................................................................................... 76
8.2 Estructura Descomposición del Proyecto (EDP) .......................................................... 79
8.3 Diagrama de Gantt ...................................................................................................... 80
Índice
12 Escuela Técnica Superior de Ingenieros Industriales (UPM)
9. PRESUPUESTO ............................................................................................................... 82
10. BIBLIOGRAFÍA ............................................................................................................... 84
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 13
Índice de ilustraciones
14 Escuela Técnica Superior de Ingenieros Industriales (UPM)
I NDICE DE ILUSTRACIONES
Ilustración 1 Mapa de los barrios de Madrid ................................................................................ 7
Ilustración 2 Votos de las candidaturas a lo largo de la Democracia ......................................... 22
Ilustración 3 Dendograma de la agrupación jerárquica .............................................................. 28
Ilustración 4 Gráfico de silueta para 2 clusters .......................................................................... 30
Ilustración 5 Gráfico de silueta para 3 clusters .......................................................................... 31
Ilustración 6 Gráfico de silueta para 4 clusters .......................................................................... 31
Ilustración 7 Gráfico de silueta para 5 clusters .......................................................................... 32
Ilustración 8 Gráfico 2D sobre la agrupación en 3 clusters ........................................................ 33
Ilustración 9 Clusplot del análisis cluster ................................................................................... 34
Ilustración 10 Datos de la conducta de voto referentes al cluster 1 ........................................... 35
Ilustración 11 Datos de la conducta de voto referentes al cluster 2 ........................................... 35
Ilustración 12 Datos de la conducta de voto referentes al cluster 3 ........................................... 36
Ilustración 13 Mapa geográfico de los barrios de la ciudad de Madrid y su agrupación en
clusters ...................................................................................................................................... 39
Ilustración 14 Diagrama de dispersión matricial por clusters ..................................................... 62
Ilustración 15 Destino de los votos obtenidos por el PP ........................................................... 63
Ilustración 16 Origen de los votos obtenidos por el PP .............................................................. 64
Ilustración 17 Destino de los votos obtenidos por el PSOE ....................................................... 64
Ilustración 18 Origen de los votos obtenidos por el PSOE ......................................................... 65
Ilustración 19 Destino de los votos obtenidos por Podemos ...................................................... 65
Ilustración 20 Destino de los votos obtenidos por IU ................................................................. 66
Ilustración 21 Origen de los votos obtenidos por Unidos Podemos ........................................... 66
Ilustración 22 Destino de los votos obtenidos por Ciudadanos .................................................. 67
Ilustración 23 Origen de los votos obtenidos por Ciudadanos ................................................... 67
Ilustración 24 Destino de los votos obtenidos por el Resto de opciones políticas ...................... 68
Ilustración 25 Origen de los votos obtenidos por el Resto de opciones políticas ....................... 68
Ilustración 26 Destino de los votos obtenidos por el Voto en Blanco ......................................... 69
Ilustración 27 Origen de los votos obtenidos por el Voto en Blanco........................................... 69
Ilustración 28 Destino delos votos obtenidos por la Abstención ................................................. 70
Ilustración 29 Origen de los votos obtenidos por la Abstención ................................................. 70
Ilustración 30 Trasvases de votos en el PSOE .......................................................................... 73
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 15
Ilustración 31 Procedencia del trasvase entrante al PSOE ........................................................ 73
Ilustración 32 Estructura de Descomposición del Proyecto ....................................................... 79
Ilustración 33 Diagrama de Gantt .............................................................................................. 80
Ilustración 34 Desglose mensual del presupuesto ..................................................................... 83
Ilustración 35 Desglose del importe total ................................................................................... 83
Índice de tablas
16 Escuela Técnica Superior de Ingenieros Industriales (UPM)
I NDICE DE TABLAS
Tabla 1 Estimación para los tres clusters .................................................................................... 8
Tabla 2 Resultados totales de las candidaturas en los años 2015 y 2016 ................................. 23
Tabla 3 Modelo de recogida de datos para el año 2015 ............................................................ 25
Tabla 4 Modelo de recogida de datos para el año 2016 ............................................................ 26
Tabla 5 Centroides de las categorías en el año 2015 ................................................................ 34
Tabla 6 Centroides de las categorías en el año 2016 ................................................................ 34
Tabla 7 Barrios pertenecientes a cada cluster ........................................................................... 36
Tabla 8 Barrios pertenecientes al cluster 1 ................................................................................ 37
Tabla 9 Barrios pertenecientes al cluster 2 ................................................................................ 37
Tabla 10 Barrios pertenecientes al cluster 3 .............................................................................. 38
Tabla 11 Estimación del % de trasvase de votos en el cluster 1 ................................................ 58
Tabla 12 Estimación del del trasvase de votos en el cluster 1 ................................................... 58
Tabla 13 Estimación del % de trasvase de votos en el cluster 2 ................................................ 59
Tabla 14 Estimación del del trasvase de votos en el cluster 2 ................................................... 59
Tabla 15 Estimación del % de trasvase de votos en el cluster 3 ............................................... 60
Tabla 16 Estimación del del trasvase de votos en el cluster 3 ................................................... 60
Tabla 17 Fidelidad de los ciudadanos a cada candidatura ........................................................ 61
Tabla 18 Presupuesto ............................................................................................................... 82
Tabla 19 Coste Mensual del Proyecto (IVA no incluido) ............................................................ 82
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 17
Índice de ecuaciones
18 Escuela Técnica Superior de Ingenieros Industriales (UPM)
I NDICE DE ECUACIONES
Ecuación 1 Distancia euclídea................................................................................................... 27
Ecuación 2 Coeficiente de silueta .............................................................................................. 29
Ecuación 3 Modelo de Regresión para PP2016 ........................................................................ 41
Ecuación 4 Modelo de regresión para PSOE2016 ..................................................................... 41
Ecuación 5 Modelo de Regresión para UNIDOS PODEMOS 2016 ........................................... 41
Ecuación 6 Modelo de Regresión matricial para PP2016 .......................................................... 42
Ecuación 7 Modelo de Regresión matricial para PSOE2016 ..................................................... 42
Ecuación 8 Modelo de Regresión matricial para UNIDOS PODEMOS2016 .............................. 42
Ecuación 9 Modelo General de Regresión matricial .................................................................. 43
Ecuación 10 Restricciones de igualdad del modelo ................................................................... 44
Ecuación 11 Restricciones de igualdad del modelo en forma matricial ...................................... 44
Ecuación 12 Restricciones mayor o igual del modelo ................................................................ 44
Ecuación 13 Restricciones mayor o igual del modelo en forma matricial ................................... 44
Ecuación 14 Estimación por Mínimos Cuadrados ...................................................................... 46
Ecuación 15 Restricciones de igualdad del modelo ................................................................... 46
Ecuación 16 Restricciones mayor o igual del modelo ................................................................ 46
Ecuación 17 Modelo de estimación a resolver en el software .................................................... 47
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 19
Introducción
20 Escuela Técnica Superior de Ingenieros Industriales (UPM)
1. INTRODUCCIO N
Desde que comenzó la época de la democracia, el ser humano ha tratado de conocer las
causas de unos resultados electorales y cuáles de los distritos o regiones han apoyado a un
bando o a otro. Prueba de ello fueron las elecciones parlamentarias en Alemania en 1932,
cuando el Partido Nacionalista Obrero Alemán ganó las elecciones por mayoría simple. Desde
las elecciones del año 1928 a las de 1932 el partido ganó 13 millones de votantes, pero, de
donde provinieron todos estos votos. Qué distrito o Clase Social fue la que más apoyó al
Nacismo Alemán. La Inferencia Ecológica trata de responder o dar una estimación a todas
estas preguntas.
Otra prueba de la necesidad de la estimación del comportamiento social fueron los cambios en
los resultados electorales producidos en América, una vez entrara en vigor la ley de Derecho a
Voto, que reconocía a todos los Afroamericanos nacidos en EEUU su derecho a voto y
participación en la democracia.
O más recientemente en la actualidad cuando contra todo pronóstico, debido a la duras
medidas sociales y políticas racistas que iba a llevar a cabo en caso de que fuera elegido
presidente, Donald Trupm se convirtió en el nuevo inquilino de la Casa Blanca. Pero como es
posible que en Estados como Georgia o Lusiana, con un elevado porcentaje de población latina
y afroamericana, pudiese ganar alguien que iba en contra de sus derechos y libertades.
Con el estudio y estimación de la conducta electoral geográfica se podrían encontrar las
respuestas a todas estas preguntas siempre y cuando se dispusiera de una fuente fiable y
veraz de los datos electorales.
Para obtener la estimación de la conducta electoral, hemos utilizado el método de La Inferencia
Ecológica. Este método, trata de estimar o predecir un comportamiento individual a partir de
datos agregados. Una interesante aplicación sería la estimación de conductas electorales entre
dos elecciones. Además este método sería muy interesante para la estimación del cambio de
voto siempre y cuando exista una concordancia entre los niveles agregados y los niveles
individuales, ya que en caso contrario, provocaría errores en dicha estimación.
Cuando se aplica la Inferencia Ecológica en la estimación de conductas electorales hay que
tener en cuenta que cada conducta dependerá de la situación geográfica, es decir, cada área
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 21
estudiada, tendrá patrones de conducta electoral únicos y a su vez serán similares a los
comportamientos de áreas adyacentes. Además el cambio de patrón de conducta dependerá
del sector geográfico estudiado, ya que por ejemplo, la conducta seguida de un área en el
cambio de voto, dependerá de las características socio-económicas, motivaciones y prácticas
religiosas de sus individuos, ya que existirán partidos que se encuentren alineados con sus
intereses. Por tanto habrá que estudiar áreas con un patrón de conducta de voto similar,
permitiendo reflejar la dependencia geográfica de la conducta.
En este Trabajo, se ha aplicado la Inferencia Ecológica a las recientes Elecciones Generales al
Congreso de los Diputados de Diciembre de 2015 y Junio de 2016 para la ciudad de Madrid.
Estas dos elecciones generales resultan realmente interesantes debido su proximidad en el
tiempo, sin embargo el aspecto más relevante a destacar en este par de elecciones ha sido el
aumento de opciones electorales, ya que son las primeras elecciones al Congreso de España
donde cobran protagonismo un mayor número de candidaturas, debido al resurgir de otras
opciones políticas catalizadas por la situación de crisis que atravesaba el país. Además hay que
destacar que tras las primeras elecciones, no se consiguió formar Gobierno, ya que ninguna de
las candidaturas consiguió alcanzar por medio de pactos la mayoría absoluta, y medio año
después se tuvieron que volver a repetir las elecciones.
Objetivos
22 Escuela Técnica Superior de Ingenieros Industriales (UPM)
2. OBJETIVOS
El objeto de estudio ha sido estimar la procedencia en el intercambio de votos obtenidos por las
candidaturas en cada uno de los barrios de Madrid Capital, entre las Elecciones Generales al
Congreso de los Diputado en las elecciones de Diciembre de 2015 y las elecciones de Junio de
2016.
Madrid es la Capital de España situada en el centro peninsular y, además la capital de la
Comunidad de Madrid. Cuenta con 3,2 millones de censados, que acceden al sistema electoral
por medio de las 3.305 mesas electorales, repartidas en los 128 barrios de los 21 distritos de la
ciudad. Políticamente es una ciudad cambiante con el paso de las candidaturas. En particular
en las últimas elecciones al ayuntamiento, el Partido Popular obtuvo la mayoría simple de votos,
aunque la unión de PSOE y Ahora Madrid obtuvo la mayoría para gobernar.
Ilustración 2 Votos de las candidaturas a lo largo de la Democracia
El análisis se ha realizado a partir de la división del territorio en los 128 barrios de la
organización administrativa de la ciudad de Madrid. Uno de los más importantes aspectos a
tener en cuenta en este par de elecciones fue la coalición electoral española conformada por
Podemos, Izquierda Unida, Equo y otras formaciones de izquierdas, constituida el 13 de mayo
de 2016 para presentarse a las elecciones generales del 2016.
0
200
400
600
800
1000
1200
1979 1983 1987 1991 1995 1999 2003 2007 2011 2015
Ahora Madrid
PSOE
PCE/IU
C's
UPyD
UCD
CDS
PP
Abstención
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 23
En 2015 el Censo electoral de Madrid fue de 2.371.327 personas, hubo una abstención de
553.289 (23,33%) personas que no acudieron a las urnas ese año. Por otro lado en 2016 el
Censo electoral fue de 2.362.455 personas, hubo una abstención de 618.531 (26,18%). Los
grupos o partidos que se han tenido en cuenta para realizar este análisis han sido:
1. Abstención: formado por todas aquellas personas que figuraban en el censo pero no
ejercieron el derecho a voto.
2. Partido Popular (PP): partido político conservador español, situado en la centroderecha o la
derecha política.
3. Partido Socialista Obrero Español (PSOE): partido político español que se sitúa en el
centroizquierda política.
4. Podemos: partido político español de izquierdas.
5. Ciudadanos (C`s): partido político español situado en el centro político.
6. Izquierda Unida (IU): partido político español de izquierdas.
7. Unidos Podemos: coalición electoral integrada por formaciones de la izquierda política como
Podemos, Izquierda Unida y Equo, para presentarse a las Elecciones Generales al
Congreso de 2016.
8. Resto de opciones políticas: formado por el resto de candidaturas políticas que obtuvieron
un porcentaje de voto menor al 2%, así como los votos blancos y votos nulos registrados.
A continuación se muestran los resultados electorales que obtuvo cada candidatura en ambas
elecciones.
Elección Censo Abstención PP PSOE Podemos CIUDADANOS IU Unidos
Podemos
Resto
2015 2.371.327 553.289 645.675 306.862 376.306 314.987 96.322 - 77.886
2016 2.362.455 618.531 696.804 329.947 - 287.711 - 367.526 61.936
Tabla 2 Resultados totales de las candidaturas en los años 2015 y 2016
Metodología
24 Escuela Técnica Superior de Ingenieros Industriales (UPM)
3. METODOLOGI A
3.1 RECOPILACION DE DATOS
La recopilación de los datos consiste, en la obtención del número de votos que obtuvo cada
candidatura en cada barrio de Madrid en las Elecciones Generales al Congreso de los
Diputados correspondientes al 20 de Diciembre de 2015 y a las del 26 de Junio de 2016. Las
fuentes de las que provienen los datos de ambas elecciones son:
Página web del Ayuntamiento de Madrid > Banco de datos > Elecciones y participación
ciudadana > Congreso de los diputados.
Página web del Ministerio del Interior > información electoral > área de descargas >
descargas personalizadas.
Los datos han sido contrastados entre ambas fuentes para la verificación de los datos. Así
pues, una vez recopilados todos los datos, los hemos estructurado en función de las
candidaturas más relevantes que obtuvieron al menos un 2% de votos, las demás candidaturas
que no alcanzaron este mínimo, han quedado agrupadas en la categoría “RESTO”. El número
de votos que obtuvo cada candidatura en los diferentes barrios ha sido convertido a porcentaje
de voto en tanto por 1, debido a que no todos los barrios poseen el mismo censo electoral y
esto podría ocasionar problemas a la hora de realizar la agrupación.
Las categorías, con al menos un 2% de votos que hemos analizado han sido:
-Partido Popular (PP): Partido político conservador, situado en la centroderecha política.
-Partido Socialista Obrero Español (PSOE): Partido político socialista, situado en la
centroizquierda política.
-Podemos: Partido político progresista, situado en la izquierda política.
-Ciudadanos (C´s): Partido político liberal, situado en el centro político.
-Izquierda Unida (IU): Partido político comunista, situado en la izquierda política.
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 25
-Unidos Podemos (UP): Coalición electoral formada por Podemos, Izquierda Unida, EQUO Y
demás partidos de izquierda, con ideas progresistas-comunistas, situados en la izquierda
política.
-Resto: Conjunto de partidos que no llegaron a conseguir el 2% de los votos. A este grupo
pertenecen partidos como:
Unión Progreso y Democracia (UPyD)
Partido Animalista Contra el Maltrato Animal (PACMA)
VOX
EQUO
-BLANCO: corresponde a los votos en blanco. Que representa la no afinidad del elector a
ningún partido.
-ABSTENCIONES: Representa aquellas personas, que figuraban en el censo electoral pero que
no acudieron a las urnas.
A continuación se muestran 2 tablas que muestran la forma en la que se han estructurado los
datos de ambas elecciones. Como podemos observar se han agrupado los votos obtenidos en
cada colegio electoral por barrios, creando una tabla con 128 filas, que representan los 128
barrios que posee Madrid.
ELECCIONES GENERALES AL CONGRESO EN EL AÑO 2015
BARRIO PP PSOE PODEMOS C´s IU RESTO BLANCO ABSTENCIONES TOTAL
1 XPP,1 XPSOE, 1 XPOD, 1 XC´s, 1 XIU, 1 XRESTO, 1 XBLANCO, 1 XABST, 1 X1
2 XPP,2 X PSOE, 2 XPOD, 2 XC´s, 2 XIU, 2 XRESTO, 2 XBLANCO, 2 XABST, 2 X2
: : : : : : : : : :
128 XPP 128 X PSOE, 128 XPOD, 128 XC´s, 128 XIU, 128 XRESTO, 128 XBLANCO, 128 XABST, 128 X128
Tabla 3 Modelo de recogida de datos para el año 2015
Metodología
26 Escuela Técnica Superior de Ingenieros Industriales (UPM)
ELECCIONES GENERALES AL CONGRESO EN EL AÑO 2016
BARRIO PP PSOE UNIDOS
PODEMOS
C´s RESTO BLANCO ABSTENCIONES TOTAL
1 XPP,1 XPSOE, 1 XUP, 1 XC´s, 1 XRESTO, 1 XBLANCO, 1 XABST, 1 X1
2 XPP,2 X PSOE, 2 XUP, 2 XC´s, 2 XRESTO, 2 XBLANCO, 2 XABST, 2 X2
: : : : : : : : :
128 XPP 128 X PSOE, 128 XUP, 128 XC´s, 128 XRESTO, 128 XBLANCO, 128 XABST, 128 X128
Tabla 4 Modelo de recogida de datos para el año 2016
3.2 ANALISIS CLUSTER
Para hacer uso de la inferencia ecológica, necesitamos trabajar a partir de niveles de datos
agregados, como hemos comentado anteriormente, la forma de agregar nuestros datos será
geográficamente, es decir, necesitamos agrupar todos los datos en distintos cluster para así
poder trabajar con datos similares y poder sacar conclusiones grupales. La elección del número
de clusters, vendrá determinada por el volumen de los datos y por la diferencia aceptable que
se presente dentro de las muestras que pertenezcan a un mismo cluster.
El propósito de este análisis es la agrupación de los barrios según su similitud; de tal forma que
las conductas electorales (comportamiento mostrado a la hora de ejercer el derecho a voto) que
muestre cada barrio dentro de un mismo grupo, sean similares entre sí, y por tanto presenten
una conducta diferente de los demás barrios que pertenezcan a un grupo distinto.
Antes de comenzar con el análisis cluster, debemos establecer el número que deseamos de
grupos en los que poder situar a cada uno de nuestros barrios, hay que saber que elegir un
número mayor o menor de cluster conllevará a unas ventajas e inconvenientes, es decir, si
nuestro número de grupos en los que clasificar nuestros barrios es elevado, se reducirá la
distancia entre las muestras pertenecientes a un mismo, así como las distancias entre los
grupos, por tanto los cluster no estarán diferenciados. Además disminuirá el número de
muestras existentes en cada grupo. Pero si por el contrario disminuimos el número de grupos el
efecto será contrario, por tanto debemos encontrar un número adecuado de cluster donde se
optimicen las ventajas y desventajas explicadas anteriormente.
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 27
Existen varios métodos de agrupación de las conductas, dependiendo del algoritmo a utilizar se
pueden clasificar:
Agrupación jerárquica (dendograma):
Representación gráfica de los datos en forma de árbol, creando subgrupos en función de la
mínima distancia euclídea que haya entre cada dato, creando ramas con otros subgrupos u
otros datos.
La distancia euclídea entre 2 puntos cualesquiera del espacio euclídeo se define como:
𝐴 = (𝑎1, 𝑎2, 𝑎3, … , 𝑎𝑛) 𝐵 = (𝑏1, 𝑏2, 𝑏3, … , 𝑏𝑛)
𝑑𝐸(𝐴, 𝐵) = √∑ (𝑎𝑖 − 𝑏𝑖)2
𝑛
𝑖=1
Ecuación 1 Distancia euclídea
Estas distancias han quedado recogidas en una matriz cuadrada y simétrica que recoge cada
una de las distancias existentes entre cada dato. A partir de este momento el algoritmo irá
agrupando todos los barrios minimizando las distancias entre ellos.
A continuación podemos ver el Dendograma de los 128 barrios de Madrid, las dos primeras
cifras que acompañan a cada barrio representan el distrito al cual pertenece cada barrio. Así
pues, los barrios que pertenezcan a un mismo Distrito pertenecerán normalmente a un mismo
grupo, aunque por supuesto, no siempre es necesario que se cumpla.
Como nuestro propósito ha sido la creación de 3 grupos, se ha realizado un corte al 0.43 para la
obtención de 3 ramas (conjuntos), además se ha rodeado cada rama por un cuadrado para
reflejar la asignación a cada cluster.
Metodología
28 Escuela Técnica Superior de Ingenieros Industriales (UPM)
Ilustración 3 Dendograma de la agrupación jerárquica
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 29
Agrupación por particiones (k-means):
La agrupación se realiza a partir de un número conocido o deseado de conjuntos, asignando un
centroide a cada conjunto, cada dato pertenecerá a uno u otro conjunto según la mínima
distancia a cada centroide, de cada conjunto. Posteriormente se recalcula cada centroide, de tal
forma que minimice las distancias de los centroides a sus elementos.
Debido a la flexibilidad superior que aporta este tipo de agrupación se ha considerado
más adecuada la utilización de este algoritmo.
Para aprovechar al máximo este método debemos elegir un número adecuado de clusters, ya
que nuestro número de clusters a elegir va a condicionar el tamaño de cada cluster, la
variabilidad dentro del cluster y la diferencia entre los centroides del cluster. Por ello hay que
elegir un número adecuado de clusters que optimice las dependencias existentes entre el
tamaño muestral, la variabilidad dentro del cluster y la diferencia entre los centroides de los
clusters.
Para elegir el número adecuado de cluster vamos a recurrir al análisis de silueta. El análisis de
silueta se utiliza para estudiar la distancia de separación entre los clusters resultantes. El gráfico
de la silueta compara la similitud existente entre una muestra con otras muestras de un mismo
cluster, y la similitud de esta muestra con muestras de otros clusters vecinos. Este análisis se
compara mediante el coeficiente de silueta, que puede ser expresado por:
𝑠(𝑖) =𝑏 − 𝑎
𝑚𝑎𝑥(𝑎, 𝑏)
Ecuación 2 Coeficiente de silueta
Siendo:
𝑎, la distancia media entre la muestra y las demás muestras del mismo cluster.
𝑏, la distancia media entre la muestra y las demás muestras de otro cluster distinto.
Este análisis proporciona un recurso para evaluar el número de clusters visualmente. El
coeficiente de silueta tiene un rango de [-1, 1].
Metodología
30 Escuela Técnica Superior de Ingenieros Industriales (UPM)
Valores del coeficiente de silueta próximos a +1, indican que la muestra se encuentra
alejada de clústeres vecinos.
Valores del coeficiente de silueta próximos a 0, indican que la muestra se encuentra en el
límite existente entre los clusters. Por tanto se encontrarían cerca del límite de decisión.
Valores del coeficiente de silueta próximos a -1, indican que la muestra se podría haber
clasificado en clusters adyacentes.
Los gráficos de silueta obtenidos en este análisis han sido los siguientes:
2 clusters:
Ilustración 4 Gráfico de silueta para 2 clusters
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 31
3 Clusters
Ilustración 5 Gráfico de silueta para 3 clusters
4 clusters
Ilustración 6 Gráfico de silueta para 4 clusters
Metodología
32 Escuela Técnica Superior de Ingenieros Industriales (UPM)
5 clusters
Ilustración 7 Gráfico de silueta para 5 clusters
Con este análisis se puede descartar el agrupamiento en 4 y en 5 clusters, ya que poseen un
área elevada en la zona negativa, y por tanto no sería indicado, por tanto podrían ser válidas las
agrupaciones en 2 y 3 clusters. Se ha desechado la utilización de 2 clusters debido a que el
número de barrios que poseía cada cluster eran bastante diferentes (48 frente a 80), mientras
que en la agrupación de 3 clusters era mucho más similar el número (36, 41 y 51). Además es
fácil apreciar los rasgos significativos que poseerá cada cluster, haber 3 cluster ocuparan
respectivamente los espacios del espectro político (derecha, izquierda y centro político).
Una vez hayamos establecido el número de clusters a 3, procederemos a realizar el análisis K-
MEANS. El resultado de esta agrupación ha sido la siguiente:
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 33
Ilustración 8 Gráfico 2D sobre la agrupación en 3 clusters
A continuación se representa el clusplot de la agrupación, el clusplot es una representación
gráfica única para las agrupaciones por particiones como es el caso del análisis k-means, esta
forma de representación gráfica representa las muestras como puntos en el diagrama
bidimensional, y los clusters como elipses de diversos tamaños y formas.
Metodología
34 Escuela Técnica Superior de Ingenieros Industriales (UPM)
Ilustración 9 Clusplot del análisis cluster
Una vez hayamos realizado el análisis k-means obtendremos los tres clusters y sus respectivas
características, los datos más relevantes que ha mostrado el análisis k-means han sido:
Centroides pertenecientes a cada cluster
CLUSTER PP2015 PSOE2015 IU2015 PODEMOS
2015
CIUDADANOS
2015
RESTO2015 BLANCO2015 ABSTENCION
2015
1 0.429723908 0.075886337 0.024729407 0.086906336 0.172868654 0.028473509 0.003628049 0.177783799
2 0.27649229 0.125510568 0.044345688 0.163961583 0.149526594 0.030375487 0.004112349 0.205675441
3 0.19312759 0.153783228 0.043785383 0.186161411 0.10279959 0.027453756 0.003488416 0.289400626
Tabla 5 Centroides de las categorías en el año 2015
CLUSTER PP2016 PSOE2016 CIUDADANOS
2016
UNIDOS
PODEMOS2016
RESTO2016 BLANCO2016 ABSTENCION
2016
1 0.466076427 0.086237377 0.151290085 0.081792701 0.018848148 0.003254508 0.192500755
2 0.300280342 0.139440563 0.136829089 0.160617161 0.023320611 0.003847248 0.235664987
3 0.209504619 0.160787297 0.097213863 0.183325476 0.023205411 0.00358567 0.322377664
Tabla 6 Centroides de las categorías en el año 2016
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 35
Ilustración 10 Datos de la conducta de voto referentes al cluster 1
Este Primer Cluster se caracteriza por una preferencia por el centro-derecho político, al obtener
entre el Partido Popular y Ciudadanos aproximadamente un 60% del censo electoral.
Ilustración 11 Datos de la conducta de voto referentes al cluster 2
Este Segundo Cluster se caracteriza por una ligera preferencia por el centro-derecha, al ser las
dos opciones con un ligero número de votos superior, el Partido Popular y Ciudadanos. Hay que
destacar una presencia significativa de la abstención.
0%
5%
10%
15%
20%
25%
30%
35%
40%
45%
50%
PP PSOE UNIDOSPODEMOS
C´s RESTO BLANCO ABTENCION
CLUSTER 1
PP
PSOE
UNIDOS PODEMOS
C´s
RESTO
BLANCO
ABTENCION
0%
5%
10%
15%
20%
25%
30%
35%
PP PSOE UNIDOSPODEMOS
C´s RESTO BLANCO ABTENCION
CLUSTER 2
PP
PSOE
UNIDOS PODEMOS
C´s
RESTO
BLANCO
ABTENCION
Metodología
36 Escuela Técnica Superior de Ingenieros Industriales (UPM)
Ilustración 12 Datos de la conducta de voto referentes al cluster 3
Este Tercer Cluster es bastante homogéneo en cuanto a opciones políticas, al estar todas ellas
en un rango de votos en torno al 10%-20% del censo electoral. Hay que destacar el alto
porcentaje (31%) del censo electoral que ha obtenido la abstención.
Numero de muestras pertenecientes a cada cluster
CLUSTER TAMAÑO DEL CLUSTER ITERACCIONES
1 36 2
2 41 2
3 51 2
Tabla 7 Barrios pertenecientes a cada cluster
Barrios pertenecientes a cada cluster
El resultado del análisis ha arrojado 3 grupos, los barrios que pertenecen a cada grupo se
muestran en las tres siguientes tablas:
0%
5%
10%
15%
20%
25%
30%
35%
PP PSOE UNIDOSPODEMOS
C´s RESTO BLANCO ABTENCION
CLUSTER 3
PP
PSOE
UNIDOS PODEMOS
C´s
RESTO
BLANCO
ABTENCION
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 37
BARRIOS PERTENECIENTES AL CLUSTER 1
033. La Estrella 054. Hispanoamérica 081. El Pardo 097. Aravaca
035. Los Jerónimos 055. Nueva España 082. Fuentelarreina 156. San Juan Bautista
036. Niño Jesús 056. Castilla 085. La Paz 157. Colina
041. Recoletos 062. Cuatro Caminos 087. Mirasierra 158. Atalaya
042. Goya 063. Castillejos 088. El Goloso 159. Costillares
044. Guindalera 071. Gaztambide 092. Argüelles 161. Palomas
045. Lista 074. Almagro 093. Ciudad Universitaria 162. Piovera
046. Castellana 075. Ríos Rosas 095. Valdemarín 166. Valdefuente
051. El Viso 076. Vallehermoso 096. El Plantío 215. Corralejos
Tabla 8 Barrios pertenecientes al cluster 1
BARRIOS PERTENECIENTES AL CLUSTER 2
014. Justicia 043. Fuente del Berro 104. Aluche 163. Canillas
021. Imperial 052. Prosperidad 105. Campamento 164. Pinar del Rey
022. Las Acacias 053. Ciudad Jardín 107. Las Águilas 165. Apóstol Santiago
023. La Chopera 072. Arapiles 142. Horcajo 182. Santa Eugenia
024. Legazpi 073. Trafalgar 143. Marroquina 191. Casco H. de Vicálvaro
025. Las Delicias 083. Peñagrande 144. Media Legua 205. Rosas
026. P. de Moguer 084. Del Pilar 146. Vinateros 206. Rejas
027. Atocha 086. Valverde 153. Quintana 208. El Salvador
031. Pacífico 091. Casa de Campo 154. La Concepción 211. Alameda de Osuna
032. Adelfas 094. Valdezarza 155. San Pascual 214. Timón
034. Ibiza
Tabla 9 Barrios pertenecientes al cluster 2
Metodología
38 Escuela Técnica Superior de Ingenieros Industriales (UPM)
BARRIOS CLUSTER 3
011. Palacio 111. Comillas 127. Pradolongo 173. Butarque
012. Embajadores 112. Opañel 131. Entrevías 174. Los Rosales
013. Cortes 113. San Isidro 132. San Diego 175. Los Ángeles
015. Universidad 114. Vista Alegre 133. Palomeras Bajas 181. Casco H. de Vallecas
016. Sol 115. Puerta Bonita 134. Palomeras Sudeste 192. Ambroz
061. Bellas Vistas 116. Buenavista 135. Portazgo 201. Simancas
064. Almenara 117. Abrantes 136. Numancia 202. Hellín
065. Valdeacederas 121. Orcasitas 141. Pavones 203. Amposta
066. Berruguete 122. Orcasur 145. Fontarrón 204. Arcos
101. Los Cármenes 123. San Fermín 151. Ventas 207. Canillejas
102. Puerta del Ángel 124. Almendrales 152. Pueblo Nuevo 212. Aeropuerto
103. Lucero 125. Moscardó 171. San Andrés 213. Casco H. de Barajas
106. Cuatro Vientos 126. Zofío 172. San Cristóbal
Tabla 10 Barrios pertenecientes al cluster 3
Todos estos barrios se muestran gráficamente clasificados en su respectivo cluster, el mapa
que mostramos a continuación. Este mapa corresponde al mapa de los 128 barrios de Madrid
Se ha coloreado el área ocupada por cada barrio según su pertenencia a cada cluster, de tal
manera que se ha asignado el color azul, amarillo o rojo según correspondan al cluster 1, 2 o 3
respectivamente. Además se han marcado en dicho mapa los colegios electorales de la ciudad
de Madrid.
Como se puede observar el cluster 1 predomina en la zona norte de la ciudad, mientras que el
cluster 3 predomina por el sur de la ciudad y consecuentemente el cluster 2 ocupa el centro.
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 39
Ilustración 13 Mapa geográfico de los barrios de la ciudad de Madrid y su agrupación en clusters
3.3 MODELO DE REGRESION
Una vez hayamos asignado a cada cluster los barrios correspondientes, se procederá a realizar
el modelo de regresión lineal múltiple (MRLM) con restricciones, que se aplicará a cada una de
las agrupaciones obtenidas anteriormente.
Mediante el modelo MRLM, vamos a relacionar el comportamiento de una determinada variable,
llamada dependiente o explicada con el comportamiento de otras variables, llamadas
independientes o explicativas. Esta relación será de forma lineal, por tanto se podrá explicar la
variable dependiente Y en función de una combinación lineal de las variables independientes X,
mediante el parámetro 𝛽, que mide la influencia de la variable explicativa sobre la explicada.
Metodología
40 Escuela Técnica Superior de Ingenieros Industriales (UPM)
Estas relaciones tendrán un cierto grado de aleatoriedad, por tanto tendremos que introducir un
parámetro que capte dicha aleatoriedad. Este término será conocido como residuo, que
representa la diferencia entre el modelo linealizado y la realidad, ya que muchas veces las
observaciones muéstrales distan del modelo.
Nuestro modelo se dividirá en dos partes:
1. Parte determinista que podremos conocer; representada por la relación lineal existente entre
las variables dependientes e independientes.
2. Parte estocástica o aleatoria, representada por los residuos, y se encargarán de cuantificar
el error.
Por tanto nuestro MRLM a aplicar, a cada categoría perteneciente a cada uno de los cluster estará formado por:
Variable dependiente o explicada, que denotaremos por la letra Yn. Es un vector de
dimensión n (número de barrios que posee cada cluster), que recoge el número de votos
obtenidos por un categoría, en cada uno de los n barrios, durante las elecciones de 2016.
Variable dependiente o explicativa, que denotaremos por la letra Xn,k1. Es una matriz de
dimensión n x k1, que recoge el número de votos obtenidos por cada una de las k1
candidaturas durante las elecciones de 2015, en cada uno de los n barrios que posee cada
cluster.
Parámetro a estimar 𝛽k1, es un vector de dimensión k1, que recoge la influencia de cada
una de las variables independientes sobre la dependiente, Este parámetro es el responsable
de la estimación de la conducta electoral. Cada una de las componentes de este vector
serán de la forma 𝛽𝑗𝑖, que representa la probabilidad de que un votante eligiera la
candidatura i durante las elecciones del 2015, elija la candidatura j durante las elecciones de
2016.
Residuos, que denotaremos por la letra e, es un vector de dimensión n, que recoge la
desviación existente entre el modelo y los datos muestrales en cada uno de los n barrios
que pertenezcan a cada cluster.
El modelo de regresión que debemos aplicar a cada uno de los tres cluster donde n representa
el número de barrios perteneciente a cada cluster será:
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 41
Modelo de regresión para la categoría PP2016
Modelo de regresión para la categoría PSOE2016
Modelo de regresión para la categoría PODEMOS2016
Modelo de regresión para la categoría UNIDOS PODEMOS2016
De igual forma se expresarían los demás modelos de regresión para el resto de categorías
(C´s, RESTO, BLANCO, ABSTENCIONES)
Este conjunto de ecuaciones también puede expresarse de una forma más compacta usando
notación matricial, con la que es más fácil operar:
𝑦𝑈𝑃,12016 = 𝛽31𝑥𝑃𝑃,1
2015 + 𝛽32𝑥𝑃𝑆𝑂𝐸,12015 + 𝛽33𝑥𝑃𝑂𝐷𝐸𝑀𝑂𝑆,1
2015 + 𝛽34𝑥𝐼𝑈,12015 + 𝛽35𝑥𝐶´𝑠,1
2015 + 𝛽36𝑥𝑅𝐸𝑆𝑇𝑂,12015 + 𝛽37𝑥𝐵𝐿𝐴𝑁𝐶𝑂,1
2015 + 𝛽28𝑥𝐴𝐵𝑆,12015 + 𝑒𝑈𝑃,1
𝑦𝑈𝑃,22016 = 𝛽31𝑥𝑃𝑃,2
2015 + 𝛽32𝑥𝑃𝑆𝑂𝐸,22015 + 𝛽33𝑥𝑃𝑂𝐷𝐸𝑀𝑂𝑆,2
2015 + 𝛽34𝑥𝐼𝑈,22015 + 𝛽35𝑥𝐶´𝑠,2
2015 + 𝛽36𝑥𝑅𝐸𝑆𝑇𝑂,22015 + 𝛽37𝑥𝐵𝐿𝐴𝑁𝐶𝑂,2
2015 + 𝛽28𝑥𝐴𝐵𝑆,22015 + 𝑒𝑈𝑃,2
𝑦𝑈𝑃,32016 = 𝛽31𝑥𝑃𝑃,3
2015 + 𝛽32𝑥𝑃𝑆𝑂𝐸,32015 + 𝛽33𝑥𝑃𝑂𝐷𝐸𝑀𝑂𝑆,3
2015 + 𝛽34𝑥𝐼𝑈,32015 + 𝛽35𝑥𝐶´𝑠,3
2015 + 𝛽36𝑥𝑅𝐸𝑆𝑇𝑂,32015 + 𝛽37𝑥𝐵𝐿𝐴𝑁𝐶𝑂,3
2015 + 𝛽28𝑥𝐴𝐵𝑆,32015 + 𝑒𝑈𝑃,3
::
𝑦𝑈𝑃,𝑛 2016 = 𝛽31𝑥𝑃𝑃,𝑛
2015 + 𝛽22𝑥𝑃𝑆𝑂𝐸,𝑛2015 + 𝛽23𝑥𝑃𝑂𝐷𝐸𝑀𝑂𝑆,𝑛
2015 + 𝛽24𝑥𝐼𝑈,𝑛2015 + 𝛽25𝑥𝐶´𝑠,𝑛
2015 + 𝛽26𝑥𝑅𝐸𝑆𝑇𝑂,𝑛2015 + 𝛽27𝑥𝐵𝐿𝐴𝑁𝐶𝑂,𝑛
2015 + 𝛽28𝑥𝐴𝐵𝑆,𝑛2015 + 𝑒𝑈𝑃,𝑛
𝑦𝑃𝑆𝑂𝐸,12016 = 𝛽21𝑥𝑃𝑃,1
2015 + 𝛽22𝑥𝑃𝑆𝑂𝐸,12015 + 𝛽23𝑥𝑃𝑂𝐷𝐸𝑀𝑂𝑆,1
2015 + 𝛽24𝑥𝐼𝑈,12015 + 𝛽25𝑥𝐶´𝑠,1
2015 + 𝛽26𝑥𝑅𝐸𝑆𝑇𝑂,12015 + 𝛽27𝑥𝐵𝐿𝐴𝑁𝐶𝑂,1
2015 + 𝛽28𝑥𝐴𝐵𝑆,12015 + 𝑒𝑃𝑆𝑂𝐸,1
𝑦𝑃𝑆𝑂𝐸,22016 = 𝛽21𝑥𝑃𝑃,2
2015 + 𝛽22𝑥𝑃𝑆𝑂𝐸,22015 + 𝛽23𝑥𝑃𝑂𝐷𝐸𝑀𝑂𝑆,2
2015 + 𝛽24𝑥𝐼𝑈,22015 + 𝛽25𝑥𝐶´𝑠,2
2015 + 𝛽26𝑥𝑅𝐸𝑆𝑇𝑂,22015 + 𝛽27𝑥𝐵𝐿𝐴𝑁𝐶𝑂,2
2015 + 𝛽28𝑥𝐴𝐵𝑆,22015 + 𝑒𝑃𝑆𝑂𝐸,2
𝑦𝑃𝑆𝑂𝐸,32016 = 𝛽21𝑥𝑃𝑃,3
2015 + 𝛽22𝑥𝑃𝑆𝑂𝐸,32015 + 𝛽23𝑥𝑃𝑂𝐷𝐸𝑀𝑂𝑆,3
2015 + 𝛽24𝑥𝐼𝑈,32015 + 𝛽25𝑥𝐶´𝑠,3
2015 + 𝛽26𝑥𝑅𝐸𝑆𝑇𝑂,32015 + 𝛽27𝑥𝐵𝐿𝐴𝑁𝐶𝑂,3
2015 + 𝛽28𝑥𝐴𝐵𝑆,32015 + 𝑒𝑃𝑆𝑂𝐸,3
::
𝑦𝑃𝑆𝑂𝐸,𝑛 2016 = 𝛽21𝑥𝑃𝑃,𝑛
2015 + 𝛽22𝑥𝑃𝑆𝑂𝐸,𝑛2015 + 𝛽23𝑥𝑃𝑂𝐷𝐸𝑀𝑂𝑆,𝑛
2015 + 𝛽24𝑥𝐼𝑈,𝑛2015 + 𝛽25𝑥𝐶´𝑠,𝑛
2015 + 𝛽26𝑥𝑅𝐸𝑆𝑇𝑂,𝑛2015 + 𝛽27𝑥𝐵𝐿𝐴𝑁𝐶𝑂,𝑛
2015 + 𝛽28𝑥𝐴𝐵𝑆,𝑛2015 + 𝑒𝑃𝑆𝑂𝐸,𝑛
𝑦𝑃𝑃,12016 = 𝛽11𝑥𝑃𝑃,1
2015 + 𝛽12𝑥𝑃𝑆𝑂𝐸,12015 + 𝛽13𝑥𝑃𝑂𝐷𝐸𝑀𝑂𝑆,1
2015 + 𝛽14𝑥𝐼𝑈,12015 + 𝛽15𝑥𝐶´𝑠,1
2015 + 𝛽16𝑥𝑅𝐸𝑆𝑇𝑂,12015 + 𝛽17𝑥𝐵𝐿𝐴𝑁𝐶𝑂,1
2015 + 𝛽18𝑥𝐴𝐵𝑆,12015 + 𝑒𝑃𝑃,1
𝑦𝑃𝑃,22016 = 𝛽11𝑥𝑃𝑃,2
2015 + 𝛽12𝑥𝑃𝑆𝑂𝐸,22015 + 𝛽13𝑥𝑃𝑂𝐷𝐸𝑀𝑂𝑆,2
2015 + 𝛽14𝑥𝐼𝑈,22015 + 𝛽15𝑥𝐶´𝑠,2
2015 + 𝛽16𝑥𝑅𝐸𝑆𝑇𝑂,22015 + 𝛽17𝑥𝐵𝐿𝐴𝑁𝐶𝑂,2
2015 + 𝛽18𝑥𝐴𝐵𝑆,22015 + 𝑒𝑃𝑃,2
𝑦𝑃𝑃,32016 = 𝛽11𝑥𝑃𝑃,3
2015 + 𝛽12𝑥𝑃𝑆𝑂𝐸,32015 + 𝛽13𝑥𝑃𝑂𝐷𝐸𝑀𝑂𝑆,3
2015 + 𝛽14𝑥𝐼𝑈,32015 + 𝛽15𝑥𝐶´𝑠,3
2015 + 𝛽16𝑥𝑅𝐸𝑆𝑇𝑂,32015 + 𝛽17𝑥𝐵𝐿𝐴𝑁𝐶𝑂,3
2015 + 𝛽18𝑥𝐴𝐵𝑆,32015 + 𝑒𝑃𝑃,3
::
𝑦𝑃𝑃,𝑛 2016 = 𝛽11𝑥𝑃𝑃,𝑛
2015 + 𝛽12𝑥𝑃𝑆𝑂𝐸,𝑛2015 + 𝛽13𝑥𝑃𝑂𝐷𝐸𝑀𝑂𝑆,𝑛
2015 + 𝛽14𝑥𝐼𝑈,𝑛2015 + 𝛽15𝑥𝐶´𝑠,𝑛
2015 + 𝛽16𝑥𝑅𝐸𝑆𝑇𝑂,𝑛2015 + 𝛽17𝑥𝐵𝐿𝐴𝑁𝐶𝑂,𝑛
2015 + 𝛽18𝑥𝐴𝐵𝑆,𝑛2015 + 𝑒𝑃𝑃,𝑛
Ecuación 3 Modelo de Regresión para PP2016
Ecuación 4 Modelo de regresión para PSOE2016
Ecuación 5 Modelo de Regresión para UNIDOS PODEMOS 2016
Metodología
42 Escuela Técnica Superior de Ingenieros Industriales (UPM)
Modelo de regresión en forma matricial para la categoría PP2016
(
𝑦𝑃𝑃,12016
𝑦𝑃𝑃,22016
𝑦𝑃𝑃,32016
:𝑦𝑃𝑃,𝑛2016
)
=
(
𝑥𝑃𝑃,12015
𝑥𝑃𝑃,22015
𝑥𝑃𝑃,32015
:𝑥𝑃𝑃,𝑛2015
𝑥𝑃𝑆𝑂𝐸,12015
𝑥𝑃𝑆𝑂𝐸,22015
𝑥𝑃𝑆𝑂𝐸,32015
:𝑥𝑃𝑆𝑂𝐸,𝑛2015
𝑥𝑃𝑂𝐷,12015
𝑥𝑃𝑂𝐷,22015
𝑥𝑃𝑂𝐷,32015
:𝑥𝑃𝑂𝐷,𝑛2015
𝑥𝐼𝑈,12015
𝑥𝐼𝑈,22015
𝑥𝐼𝑈,32015
:𝑥𝐼𝑈,𝑛2015
𝑥𝐶´𝑠,12015
𝑥𝐶´𝑠,22015
𝑥𝐶´𝑠,32015
:𝑥𝐶´𝑠,𝑛2015
𝑥𝑅𝐸𝑆𝑇𝑂,12015
𝑥𝑅𝐸𝑆𝑇𝑂,22015
𝑥𝑅𝐸𝑆𝑇𝑂,32015
:𝑥𝑅𝐸𝑆𝑇𝑂,𝑛2015
𝑥𝐵𝐿𝐴𝑁𝐶𝑂,12015
𝑥𝐵𝐿𝐴𝑁𝐶𝑂,22015
𝑥𝐵𝐿𝐴𝑁𝐶𝑂,32015
:𝑥𝐵𝐿𝐴𝑁𝐶𝑂,𝑛2015
𝑥𝐴𝐵𝑆,12015
𝑥𝐴𝐵𝑆,22015
𝑥𝐴𝐵𝑆,32015
:𝑥𝐴𝐵𝑆,𝑛2015
)
*
(
𝛽11𝛽12𝛽13:𝛽18)
+
(
𝑒𝑃𝑃,1𝑒𝑃𝑃,2𝑒𝑃𝑃,3:
𝑒𝑃𝑃,𝑛)
Ecuación 6 Modelo de Regresión matricial para PP2016
Modelo de regresión en forma matricial para la categoría PSOE2016
(
𝑦𝑃𝑆𝑂𝐸,12016
𝑦𝑃𝑆𝑂𝐸,22016
𝑦𝑃𝑆𝑂𝐸,32016
:𝑦𝑃𝑆𝑂𝐸,𝑛2016
)
=
(
𝑥𝑃𝑃,12015
𝑥𝑃𝑃,22015
𝑥𝑃𝑃,32015
:𝑥𝑃𝑃,𝑛2015
𝑥𝑃𝑆𝑂𝐸,12015
𝑥𝑃𝑆𝑂𝐸,22015
𝑥𝑃𝑆𝑂𝐸,32015
:𝑥𝑃𝑆𝑂𝐸,𝑛2015
𝑥𝑃𝑂𝐷,12015
𝑥𝑃𝑂𝐷,22015
𝑥𝑃𝑂𝐷,32015
:𝑥𝑃𝑂𝐷,𝑛2015
𝑥𝐼𝑈,12015
𝑥𝐼𝑈,22015
𝑥𝐼𝑈,32015
:𝑥𝐼𝑈,𝑛2015
𝑥𝐶´𝑠,12015
𝑥𝐶´𝑠,22015
𝑥𝐶´𝑠,32015
:𝑥𝐶´𝑠,𝑛2015
𝑥𝑅𝐸𝑆𝑇𝑂,12015
𝑥𝑅𝐸𝑆𝑇𝑂,22015
𝑥𝑅𝐸𝑆𝑇𝑂,32015
:𝑥𝑅𝐸𝑆𝑇𝑂,𝑛2015
𝑥𝐵𝐿𝐴𝑁𝐶𝑂,12015
𝑥𝐵𝐿𝐴𝑁𝐶𝑂,22015
𝑥𝐵𝐿𝐴𝑁𝐶𝑂,32015
:𝑥𝐵𝐿𝐴𝑁𝐶𝑂,𝑛2015
𝑥𝐴𝐵𝑆,12015
𝑥𝐴𝐵𝑆,22015
𝑥𝐴𝐵𝑆,32015
:𝑥𝐴𝐵𝑆,𝑛2015
)
*
(
𝛽21𝛽22𝛽33:𝛽38)
+
(
𝑒𝑃𝑆𝑂𝐸,1𝑒𝑃𝑆𝑂𝐸,2𝑒𝑃𝑆𝑂𝐸,3:
𝑒𝑃𝑆𝑂𝐸,𝑛)
Ecuación 7 Modelo de Regresión matricial para PSOE2016
Modelo de regresión en forma matricial para la categoría UP 2016
(
𝑦𝑈𝑃,12016
𝑦𝑈𝑃,22016
𝑦𝑈𝑃,32016
:𝑦𝑈𝑃,𝑛2016)
=
(
𝑥𝑃𝑃,12015
𝑥𝑃𝑃,22015
𝑥𝑃𝑃,32015
:𝑥𝑃𝑃,𝑛2015
𝑥𝑃𝑆𝑂𝐸,12015
𝑥𝑃𝑆𝑂𝐸,22015
𝑥𝑃𝑆𝑂𝐸,32015
:𝑥𝑃𝑆𝑂𝐸,𝑛2015
𝑥𝑃𝑂𝐷,12015
𝑥𝑃𝑂𝐷,22015
𝑥𝑃𝑂𝐷,32015
:𝑥𝑃𝑂𝐷,𝑛2015
𝑥𝐼𝑈,12015
𝑥𝐼𝑈,22015
𝑥𝐼𝑈,32015
:𝑥𝐼𝑈,𝑛2015
𝑥𝐶´𝑠,12015
𝑥𝐶´𝑠,22015
𝑥𝐶´𝑠,32015
:𝑥𝐶´𝑠,𝑛2015
𝑥𝑅𝐸𝑆𝑇𝑂,12015
𝑥𝑅𝐸𝑆𝑇𝑂,22015
𝑥𝑅𝐸𝑆𝑇𝑂,32015
:𝑥𝑅𝐸𝑆𝑇𝑂,𝑛2015
𝑥𝐵𝐿𝐴𝑁𝐶𝑂,12015
𝑥𝐵𝐿𝐴𝑁𝐶𝑂,22015
𝑥𝐵𝐿𝐴𝑁𝐶𝑂,32015
:𝑥𝐵𝐿𝐴𝑁𝐶𝑂,𝑛2015
𝑥𝐴𝐵𝑆,12015
𝑥𝐴𝐵𝑆,22015
𝑥𝐴𝐵𝑆,32015
:𝑥𝐴𝐵𝑆,𝑛2015
)
*
(
𝛽31𝛽32𝛽33:𝛽38)
+
(
𝑒𝑈𝑃,1𝑒𝑈𝑃,2𝑒𝑈𝑃,3:
𝑒𝑈𝑃,𝑛)
Ecuación 8 Modelo de Regresión matricial para UNIDOS PODEMOS2016
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 43
Y de forma general se puede expresar de la siguiente forma:
𝑌𝑃𝑃2016 = 𝑋2015*𝛽1 + 𝑒𝑃𝑃
𝑌𝑃𝑆𝑂𝐸2016 = 𝑋2015*𝛽2 + 𝑒𝑃𝑆𝑂𝐸
𝑌𝑈𝑃2016 = 𝑋2015*𝛽3 + 𝑒𝑈𝑃
𝑌𝐶´𝑠2016 = 𝑋2015*𝛽4 + 𝑒𝐶´𝑠
𝑌𝑅𝐸𝑆𝑇𝑂2016 = 𝑋2015*𝛽5 + 𝑒𝑅𝐸𝑆𝑇𝑂
𝑌𝐵𝐿𝐴𝑁𝐶𝑂 2016 = 𝑋2015*𝛽6 + 𝑒𝐵𝐿𝐴𝑁𝐶𝑂
𝑌𝐴𝐵𝑆2016 = 𝑋2015*𝛽7 + 𝑒𝐴𝐵𝑆
Para poder relacionar todas las variables de nuestro sistema escribiremos el anterior sistema de
ecuaciones de forma matricial de la siguiente forma:
(
𝑌𝑃𝑃2016
𝑌𝑃𝑆𝑂𝐸2016
𝑌𝑈𝑃2016
𝑌𝐶´𝑠2016
𝑌𝑅𝐸𝑆𝑇𝑂2016
𝑌𝐵𝐿𝐴𝑁𝐶𝑂2016
𝑌𝐴𝐵𝑆2016 )
=
(
𝑋2015
000000
0𝑋2015
00000
00
𝑋2015
0000
000
𝑋2015
000
0000
𝑋2015
00
00000
𝑋2015
0
000000
𝑋2015)
∗
(
𝛽1𝛽2𝛽3𝛽4𝛽5𝛽6𝛽7)
+
(
𝑒𝑃𝑃𝑒𝑃𝑆𝑂𝐸𝑒𝑈𝑃𝑒𝐶´𝑠𝑒𝑅𝐸𝑆𝑇𝑂𝑒𝐵𝐿𝐴𝑁𝐶𝑂𝑒𝐴𝐵𝑆 )
Ecuación 9 Modelo General de Regresión matricial
De forma aún más compacta y general con la que podamos trabajar más fácilmente será de la
siguiente manera:
𝑌 = 𝑋 ∗ 𝛽 + 𝑒 Dónde
Y es un vector de n*k2 componentes
X es una matriz de 7*n filas y 7*k1 columnas
𝛽 es un vector de 7*k1 componentes
e es un vector de n*k2 componentes
Las restricciones a incorporar en nuestro modelo serán de 2 tipos:
Metodología
44 Escuela Técnica Superior de Ingenieros Industriales (UPM)
i. Restricciones de igualdad: que representa la suma de las fracciones de voto obtenido por
una candidatura en el 2015, que han ido destinadas a las diferentes candidaturas del 2016.
∑𝛽𝑖𝑗 = 1 ; ∀ 𝑗 ∈ [1 , 8]
7
𝑖=1
Ecuación 10 Restricciones de igualdad del modelo
Esta restricción de forma matricial se puede expresar de la siguiente manera:
( 𝐼 𝐼 𝐼 𝐼 𝐼 𝐼 𝐼 ) ∗
(
𝛽1𝛽2𝛽3𝛽4𝛽5𝛽6𝛽7)
=
(
11111111)
Ecuación 11 Restricciones de igualdad del modelo en forma matricial
Donde I es la matriz identidad de dimensión 8
ii. Restricciones mayor o igual:
𝛽𝑖𝑗 ≥ 0 ; ∀ 𝑗 ∈ [1 , 8] ∀ 𝑖 ∈ [1, 7]
Ecuación 12 Restricciones mayor o igual del modelo
Esta restricción de forma matricial se puede expresar de la siguiente manera:
(
𝐼000000
0𝐼00000
00𝐼0000
000𝐼000
0000𝐼00
00000𝐼0
000000𝐼)
∗
(
𝛽1𝛽2𝛽3𝛽4𝛽5𝛽6𝛽7)
≥
(
0000000)
Ecuación 13 Restricciones mayor o igual del modelo en forma matricial
Donde el cero representa una matriz cuadrada de dimensión 8 e I es la matriz identidad
de dimensión 8
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 45
De las dos anteriores restricciones se puede deducir una tercera restricción implícita. Si la suma
de todos ellos debe ser igual a uno y ninguno de ellos puede ser negativo implica que β está
acotada superiormente por 1.
𝛽𝑖𝑗 ≤ 1 ∀ 𝑗 ∈ [1 , 8] ∀ 𝑖 ∈ [1, 7]
3.4 ESTIMACION DE MINIMOS CUADRADOS
A la hora de realizar la estimación de las β, se ha optado por el método de mínimos cuadrados
ordinarios (MCO), que minimiza el error cuadrático, esto es el cuadrado de los residuos (𝑒𝑛2), de
esta forma se consiguen que los residuos no se compensen. Además con este método se
minimizan el número de residuos de gran tamaño, ya que este método penaliza notablemente a
los residuos de gran tamaño frente a los residuos de menor tamaño, ya que se estiman por el
cuadrado de la distancia.
Por tanto se desea que el modelo de estimación por el método de MCO se ajuste lo mejor
posible a la realidad y por consiguiente se minimice el error, transformándose el problema de
estimación en uno de minimizar el error cuadrático.
Objetivo → minimizar ∑ 𝑒𝑖2
𝑘2∗𝑛
𝑖=1
Como hemos expuesto anteriormente el modelo que nos permitiría trabajar con facilidad es el
modelo de regresión lineal compacto:
𝑌 = 𝑋 ∗ 𝛽 + 𝑒
Introduciendo esta ecuación en nuestra ecuación a minimizar, nos permite expresarla en
función de los estimadores de la siguiente manera,
Metodología
46 Escuela Técnica Superior de Ingenieros Industriales (UPM)
min∑(∑𝑒𝑖,𝑗2
𝑛
𝑗=1
)
𝑘2
𝑖=1
= min∑(∑ ( 𝑌𝑖,𝑗 −∑𝛽𝑖,𝑘 ∗ 𝑋𝑘,𝑗2015
𝑘1
𝑘=1
)
2𝑛
𝑗=1
)
𝑘2
𝑖=1
Ecuación 14 Estimación por Mínimos Cuadrados
Con las restricciones escritas de forma matricial:
i. Restricciones de igualdad:
( 𝐼 𝐼 𝐼 𝐼 𝐼 𝐼 𝐼 ) ∗
(
𝛽1𝛽2𝛽3𝛽4𝛽5𝛽6𝛽7)
= (1)
Ecuación 15 Restricciones de igualdad del modelo
ii. Restricciones mayor o igual:
(
𝐼000000
0𝐼00000
00𝐼0000
000𝐼000
0000𝐼00
00000𝐼0
000000𝐼)
∗
(
𝛽1𝛽2𝛽3𝛽4𝛽5𝛽6𝛽7)
≥
(
0000000)
Ecuación 16 Restricciones mayor o igual del modelo
= min∑
(
∑
(
(𝑌𝑖,𝑗 −∑(𝛽𝑖,𝑘 ∗ 𝑋𝑘,𝑗
2015)
𝑘1
𝑘=1
)
𝑇
∗ (𝑌𝑖,𝑗 −∑(𝛽𝑖,𝑘 ∗ 𝑋𝑘,𝑗2015)
𝑘1
𝑘=1
)
)
𝑛
𝑗=1
)
𝑘2
𝑖=1
= min( 𝑌2 + 𝛽𝑇(𝑋𝑇𝑋)𝛽 + 2𝑌𝑇𝑋𝛽 )
= min(cte + 1
2𝛽𝑇 ∗ 𝑄 ∗ 𝛽 − 𝐴 ∗ 𝛽)
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 47
El modelo de estimación a resolver se puede expresar de la siguiente forma:
min { 𝑘 + 𝛽𝑇 𝑄 𝛽 + 𝐴 𝛽 }
𝐶1𝛽 = 𝑏1
𝐶2𝛽 ≥ 𝑏2
𝑄 = 𝑋𝑇𝑋 =
(
𝑋2015
000000
0𝑋2015
00000
00
𝑋2015
0000
000
𝑋2015
000
0000
𝑋2015
00
00000
𝑋2015
0
000000
𝑋2015)
𝑇
∗
(
𝑋2015
000000
0𝑋2015
00000
00
𝑋2015
0000
000
𝑋2015
000
0000
𝑋2015
00
00000
𝑋2015
0
000000
𝑋2015)
𝐴 = 𝑌𝑇𝑋 = (𝑌𝑃𝑃2016 𝑌𝑃𝑆𝑂𝐸
2016 𝑌𝑈𝑃2016𝑌𝐶´𝑠
2016𝑌𝑅𝐸𝑆𝑇𝑂2016 𝑌𝐵𝐿𝐴𝑁𝐶𝑂
2016 𝑌𝐴𝐵𝑆2016) ∗
(
𝑋2015
000000
0𝑋2015
00000
00
𝑋2015
0000
000
𝑋2015
000
0000
𝑋2015
00
00000
𝑋2015
0
000000
𝑋2015)
𝐶1 = ( 𝐼 𝐼 𝐼 𝐼 𝐼 𝐼 𝐼 )
𝐶2 =
(
𝐼000000
0𝐼00000
00𝐼0000
000𝐼000
0000𝐼00
00000𝐼0
000000𝐼)
Ecuación 17 Modelo de estimación a resolver en el software
Este ha sido el modelo que hemos tenido que programar en R-Studio, para la obtención de la
estimación de la conducta electoral en cada cluster, es decir se ha tenido que ejecutar 3 veces,
ya que varían los datos de entrada al modelo, aunque siempre manteniendo la relación
necesaria de dimensiones para que se pueda realizar el producto matricial, por tanto esta
relación viene condicionada por el número de barrios que posee cada cluster, ya que el resto de
las dimensiones quedarán constantes al no variar número de candidaturas presentadas en cada
elección (𝑘1y 𝑘2)
Código en R-Studio
48 Escuela Técnica Superior de Ingenieros Industriales (UPM)
4. CO DIGO EN R-STUDIO
A lo largo del trabajo se ha necesitado por unos motivos u otros la utilización de la herramienta
de trabajo R-Studio. A continuación mostramos tanto el uso que hemos dado de ella, como el
código utilizado para la obtención.
4.1 AGRUPACIÓN JERARQUICA (DENDOGRAMA)
Gráfico en forma de árbol, que ha ido agrupando los barrios según su conducta electoral, de
menor a mayor similitud, dicho diagrama ha sido utilizado en el apartado 3.2 de este trabajo
para la realización del análisis cluster.
#extraemos los datos de nuestras tablas, en la primera tabla se encontraran nuestros datos a
agrupar y en la segunda tabla estarán los nombres de cada barrio
tabla1<-read.csv(file.choose(), header=TRUE, sep=";")
tabla2<-read.csv(file.choose(), header=TRUE, sep=";")
#extraemos los nombres de cada barrio de la tabla 2 a un vector
nombres <- c(as.character(tabla2$BARRIO)) #introducimos nos nombres de cada barrio en los datos
row.names(tabla1)<- nombres #calculamos la matriz de distancias
distancias <- dist(tabla1)
#obtenemos el dendograma
dendograma <- hclust(distancias)
#ploteamos el dendograma
plot(dendograma, cex=0.7, main="Dendrograma de los barrios según
la conducta”)
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 49
4.1.1 CORTE DENDOGRAMA
hcd <- as.dendrogram(dendograma)
#corte del dendograma a una altura de “0.8” escogiendo el grupo “2”
plot(cut(hcd, h = 0.8)$lower[[2]], main = "corte inferior
dendograma 0.8")
4.2 AGRUPACION POR PARTICIONES (K-MEANS)
tabla1<-read.csv(file.choose(), header=TRUE, sep=";")
#agrupación por el método k-means en “4” clusters
cluster <- kmeans(tabla1, 3)
cluster
4.2.1 EXTRACCION AGRUPACION Y DEL VECTOR DE AGRUPACION
#introducir la información en una estructura de datos para luego poder extraerla
Agrupacioncluster <- data.frame(cluster$centers) vectorcluster <- data.frame(cluster$cluster)
#escribir es .CSV con la información de los clusters
write.csv(Agrupacioncluster, file="clusters.csv") write.csv(vectorcluster, file="vectorcluster.csv")
4.2.3 ANÁLISIS DE SILUETA
PACK NECESARIO “cluster”
#realizamos el análisis cluster con el número de cluster que deseemos obtener en el gráfico de
silueta
tabla1 <- read.csv(file.choose(), header=TRUE, sep=";") cluster <- kmeans(tabla1, 3)
#calculamos todas las distancias entre pares de observaciones d1 <- daisy(tabla1) d2 <- d1*d1
Código en R-Studio
50 Escuela Técnica Superior de Ingenieros Industriales (UPM)
#pintamos el gráfico de silueta
sk2 <- silhouette(cluster$cluster,d2) plot(sk2)
4.2.4 PLOTEAR EL CLUSTER
tabla1 <- read.csv(file.choose(), header=TRUE, sep=";") k <- kmeans(tabla1, 3)
#ploteamos la agrupación realizada en el espacio 2D plotcluster (tabla1,k$cluster)
4.3 PLOTEAR MAPAS
PACK NECESARIO “rgdal”
#necesario formato .shp (shape file) y que esté situado en el directorio que tiene R
barrios<-readOGR(“barrios.shp”, layer=”barrios”)
plot(barrios)
4.3.1 PINTAR MAPAS SEGÚN COLORES
barrios <- readOGR("barrios.shp", layer = "barrios")
#tabla de datos que contiene la información de pertenencia a los diferentes cluster, de cada barrio
tabla1<-read.csv(file.choose(), header=TRUE, sep=";")
#muestra el tipo de datos contenido en el .shp, es ideal que sea del tipo “S4”
mode(barrios)
#muestra las categorías que hay dentro de nuestro formato .shp names(barrios)
#muestra la longitud de nuestro .shp, para ello nuestro vector de datos con el que vamos a
relacionar el formato .shp debe ser de la misma longitud
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 51
length(barrios)
#dibuja nuestro .shp
plot(barrios)
#con el comando “@data” (barrios@data), podemos acceder a toda la información contenida en
nuestro .shp
barrios@data
#de esta forma se asigna a la columna CODBAR de los datos contenidos en el .shp la columna
CLUSTER donde se almacena la información de a que cluster pertenece cada barrio
barrios@data$CODBAR <- tabla1$CLUSTER
#establecemos los colores que deseamos que tengan cada cluster y los almacenamos en un vector
c<-c("blue", "yellow", "red") c<- as.character(c)
#le decimos que toda la información contenida en CODBAR (donde anteriormente habíamos
almacenado la información de a que cluster pertenece cada barrio) la almacene en 3 grupos.
SE NECESITA EL PACK “CLASSINT” DE R
intervalos <- classIntervals(barrios@data$CODBAR, n=3)
#asigna a cada intervalo un color
colcode <- findColours(intervalos, c)
#ploteamos nuestro mapa segun el color detallado anteriormente
plot(barrios, col=colcode, border= "black")
#asignamos un título al mapa
title(main = "Agrupación de barrios en 3 clusters segun conducta electoral")
#guardamos la leyenda de nuestro mapa en un vector
Código en R-Studio
52 Escuela Técnica Superior de Ingenieros Industriales (UPM)
a <- c("cluster 1", "cluster 2", "cluster 3")
#introducimos la leyenda en nuestro mapa, le tenemos que dar la posición que deseamos
ocupe nuestra leyenda en el mapa, el nombre de cada intervalo y el color que deseamos que
tenga cada intervalo
#introducimos la leyenda en nuestro mapa, le tenemos que introducir la posición
legend("bottomright", legend = a, fill = c)
4.3.2 CENTROS DE GRAVEDAD DE CADA DISTRITO
#obtenemos la posición de los centroides de cada barrio
centroides <- coordinates(barrios)
nombres <- c(as.character(tabla2$DISTRITOS)) text(centroides, nombres, cex=0.7)
4.3.3 MARCAR MESAS ELECTORALES
barrios<-readOGR(file.choose(),layer = "barrios")
plot(barrios)
#guardamos las coordenadas de cada mesa electoral en una tabla
tabla1<-read.csv(file.choose(), header=TRUE, sep=";")
attach(tabla1)
#pintamos las coordenadas de cada mesa electoral
points(COORDENADA.X,COORDENADA.Y)
4.4 REGRESIÓN LINEAL
lm(PP2016~PP2015+PSOE2015+IU2015+PODEMOS2015+CIUDADANOS2015+RESTO2015+BLANCO2015+ABSTENCION2015) plot(PP2016, PP2015) summary(lm)
abline(lsfit(C.s.2016, PP))
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 53
4.5 ESTIMACIÓN
tabla1<-read.csv(file.choose(), header=TRUE, sep=";")
tabla2<-read.csv(file.choose(), header=TRUE, sep=";")
#construcción de la matriz de restricciones
a <- diag(8)
a2 <- cbind(a,a,a,a,a,a,a)
a3 <- diag(56)
a4 <- rbind(a2,a3)
c <- t(a4)
c <- as.matrix(c)
#construcción de la matriz D
X <- as.matrix(tabla1)
K <- X*0
X1 <- cbind(X,K,K,K,K,K,K)
X2 <- cbind(K,X,K,K,K,K,K)
X3 <- cbind(K,K,X,K,K,K,K)
X4 <- cbind(K,K,K,X,K,K,K)
X5 <- cbind(K,K,K,K,X,K,K)
X6 <- cbind(K,K,K,K,K,X,K)
X7 <- cbind(K,K,K,K,K,K,X)
XX <- rbind(X1,X2,X3,X4,X5,X6,X7)
XX <- as.matrix(XX)
D <- t(XX) %*% XX;
D <- as.matrix(D)
#construcción del vector de restricciones
b <- c(rep(1,8),rep(0,56))
b <- as.vector(b)
#construcción del vector Y de variables a explicar
Código en R-Studio
54 Escuela Técnica Superior de Ingenieros Industriales (UPM)
Y <- c(tabla2$PP2016, tabla2$PSOE2016,tabla2$UNIDOS.PODEMOS2016,
tabla2$CIUDADANOS2016, tabla2$RESTO2016, tabla2$BLANCO2016,
tabla2$ABSTENCION2016)
Y <- as.vector(Y)
#construcción del vector d
d <- Y %*% XX
d <- as.vector(d)
#solución de la estimación. SE NECESITA INSTALAR EL PACK “quadprog” DE R
estimacion <-solve.QP(Dmat = D, factorized = FALSE, dvec = d,
Amat = c, bvec = b, meq = 8)
#estructurar la información de la estimación en una matriz, dándole nombres a cada una de
las categorías
ma <- matrix(estimacion$solution, ncol = 7)
colnames(ma)<-names(tabla2)
rownames(ma)<-names(tabla1)
ma
#escribir la matriz de estimaciones en un archivo .csv
estimacion<- data.frame(ma)
write.csv(estimacion, file="estimacion.csv")
4.6 ESTIMACION CON OTRO TIPO DE RESTRICCIONES
tabla1<-read.csv(file.choose(), header=TRUE, sep=";")
tabla2<-read.csv(file.choose(), header=TRUE, sep=";")
#construcción de la matriz de restricciones
a <- c(rep(1,8))
a2 <- a*0
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 55
a3 <- rbind(a,a2,a2,a2,a2,a2,a2)
a4 <- rbind(a2,a,a2,a2,a2,a2,a2)
a5 <- rbind(a2,a2,a,a2,a2,a2,a2)
a6 <- rbind(a2,a2,a2,a,a2,a2,a2)
a7 <- rbind(a2,a2,a2,a2,a,a2,a2)
a8 <- rbind(a2,a2,a2,a2,a2,a,a2)
a9 <- rbind(a2,a2,a2,a2,a2,a2,a)
a11 <- cbind(a3,a4,a5,a6,a7,a8,a9)
a12 <- diag(56)
a13 <- rbind(a11,a12)
c <- t(a13)
c <- as.matrix(c)
#construcción de la matriz D
X <- as.matrix(tabla1)
K <- X*0
X1 <- cbind(X,K,K,K,K,K,K)
X2 <- cbind(K,X,K,K,K,K,K)
X3 <- cbind(K,K,X,K,K,K,K)
X4 <- cbind(K,K,K,X,K,K,K)
X5 <- cbind(K,K,K,K,X,K,K)
X6 <- cbind(K,K,K,K,K,X,K)
X7 <- cbind(K,K,K,K,K,K,X)
XX <- rbind(X1,X2,X3,X4,X5,X6,X7)
XX <- as.matrix(XX)
D <- t(XX) %*% XX;
D <- as.matrix(D)
#construcción del vector de restricciones
b <- c(rep(1,7),rep(0,56))
b <- as.vector(b)
#construcción del vector Y de variables a explicar
Código en R-Studio
56 Escuela Técnica Superior de Ingenieros Industriales (UPM)
Y <- c(tabla2$PP2016, tabla2$PSOE2016,tabla2$UNIDOS.PODEMOS2016,
tabla2$CIUDADANOS2016, tabla2$RESTO2016, tabla2$BLANCO2016,
tabla2$ABSTENCION2016)
Y <- as.vector(Y)
#construcción del vector d
d <- Y %*% XX
d <- as.vector(d)
#solución de la estimación. SE NECESITA INSTALAR EL PACK “quadprog” DE R
estimacion <-solve.QP(Dmat = D, factorized = FALSE, dvec = d,
Amat = c, bvec = b, meq = 8)
#estructurar la información de la estimación en una matriz, dándole nombres a cada una de
las categorías
ma <- matrix(estimacion$solution, ncol = 7)
colnames(ma) <- names(tabla2)
rownames(ma) <- names(tabla1)
ma
#escribir la matriz de estimaciones en un archivo .csv
Estimación <- data.frame(ma)
write.csv (estimacion, file="estimacion.csv")
4.7 DIAGRAMA DE DISPERSION MATRICIAL
tabla1 <- read.csv(file.choose(), header=TRUE, sep=";") k <- kmeans(tabla1, 3)
#analiza las regresiones entre pares de variables with (tabla1, pairs(tabla1, col=c(“blue”, “yellow”, “red”)[k$cluster]))
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 57
Resultados
58 Escuela Técnica Superior de Ingenieros Industriales (UPM)
5. RESULTADOS
5.1 ESTIMACIONES DE LA CONDUCTA ELECTORAL
A continuación se muestran las matrices de cambio de voto entre las elecciones generales al
congreso del 20 de Diciembre de 2015 y el 26 de Junio de 2016. Como podemos observar en
las siguientes tablas se muestra la estimación fraccionada para cada uno de los clusters,
posibilitando así su análisis independiente. Estas matrices representan la procedencia de los
votos que obtuvo cada una de las candidaturas en el año 2016. Por ello la suma de todas las
filas (correspondientes a las candidaturas del año 2015) es igual a la unidad.
5.1.1 Cluster 1
CLUSTER 1 (NORTE)
CATEGORIAS PP2016 PSOE2016 UNIDOS.PODEMOS2016 CIUDADANOS2016 RESTO2016 BLANCO2016 ABSTENCION2016
PP2015 1 0 0 0 0 0 0
PSOE2015 0 0.98 0 0.008 0 0 0.012
IU2015 0 0.377 0.623 0 0 0 0
PODEMOS2015 0 0 0.737 0.093 0 0 0.17
CIUDADANOS2015 0.169 0 0 0.776 0 0 0.055
RESTO2015 0 0.042 0 0.304 0.364 0 0.29
BLANCO2015 0 0 0 0 0 0 1
ABSTENCION2015 0.029 0.008 0.019 0 0.048 0.019 0.877 Tabla 11 Estimación del % de trasvase de votos en el cluster 1
CLUSTER 1 (NORTE)
CATEGORIAS PP2016 PSOE2016 UNIDOS.PODEMOS2016 CIUDADANOS2016 RESTO2016 BLANCO2016 ABSTENCION2016 TOTAL 2015
PP2015 214064 0 0 0 0 0 0 214064
PSOE2015 0 40682 0 350 0 0 491 41523
IU2015 0 5269 8689 0 0 0 0 13958
PODEMOS2015 0 0 35946 4542 0 0 8311 48799
CIUDADANOS2015 15055 0 0 69143 0 0 4910 89108
RESTO2015 0 643 0 4607 5523 0 4402 15175
BLANCO2015 0 0 0 0 0 0 1949 1949
ABSTENCION2015 2726 721 1762 0 4479 1757 81508 92953
TOTAL 2016 231845 47314 46398 78642 10002 1757 101571 517529 Tabla 12 Estimación del trasvase de votos en el cluster 1
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 59
5.1.2 Cluster 2
CLUSTER 2 (CENTRO-FRONTERA)
CATEGORIAS PP2016 PSOE2016 UNIDOS.PODEMOS2016 CIUDADANOS2016 RESTO2016 BLANCO2016 ABSTENCION2016
PP2015 0.996 0.004 0 0 0 0 0
PSOE2015 0 0.788 0 0 0 0 0.212
IU2015 0 0.35 0.453 0.197 0 0 0
PODEMOS2015 0 0.063 0.858 0 0.021 0 0.058
CIUDADANOS2015 0.162 0 0 0.803 0 0 0.035
RESTO2015 0 0.318 0 0.237 0.398 0.001 0.046
BLANCO2015 0 0.913 0 0 0 0.087 0
ABSTENCION2015 0 0.003 0 0 0.04 0.02 0.937 Tabla 13 Estimación del % de trasvase de votos en el cluster 2
CLUSTER 2 (CENTRO-FRONTERA)
CATEGORIAS PP2016 PSOE2016 UNIDOS.PODEMOS2016 CIUDADANOS2016 RESTO2016 BLANCO2016 ABSTENCION2016 TOTAL 2015
PP2015 235174 1038 0 0 0 0 0 236212
PSOE2015 0 87109 0 0 0 0 23411 110520
IU2015 0 13078 16943 7351 0 0 0 37372
PODEMOS2015 0 8625 117923 0 2853 0 8005 137406
CIUDADANOS2015 19953 0 0 99026 0 0 4304 123283
RESTO2015 0 8249 0 6160 10330 32 1193 25964
BLANCO2015 0 3242 0 0 0 308 0 3550
ABSTENCION2015 0 543 0 0 7071 3540 164606 175760
TOTAL 2016 255127 121884 134865 112538 20254 3879 201519 850067 Tabla 14 Estimación del trasvase de votos en el cluster 2
Resultados
60 Escuela Técnica Superior de Ingenieros Industriales (UPM)
5.1.3 Cluster 3
CLUSTER 3 (SUR)
CATEGORIAS PP2016 PSOE2016 UNIDOS.PODEMOS2016 CIUDADANOS2016 RESTO2016 BLANCO2016 ABSTENCION2016 TOTAL 2015
PP2015 193597 24 0 0 1300 478 0 195399
PSOE2015 0 130026 0 0 0 0 24793 154819
IU2015 0 11978 20549 11526 0 939 0 44992
PODEMOS2015 1855 4987 167739 0 6784 642 8094 190101
CIUDADANOS2015 11178 0 0 82612 0 0 8806 102596
RESTO2015 2427 9699 0 3124 12421 0 0 27671
BLANCO2015 1171 2406 0 0 0 0 0 3577
ABSTENCION2015 0 2709 0 0 3645 2363 275859 284576
TOTAL 2016 210229 161828 188288 97261 24149 4423 317553 1003731 Tabla 16 Estimación del trasvase de votos en el cluster 3
Uno de los parámetros a resaltar ha sido la fidelidad de voto que ha obtenido el Partido Popular
en ambas elecciones. Para destacar dicho parámetro, como puede observarse, han sido
resaltadas las celdas correspondientes a la fidelidad de cada partido. También se ha calculado
la fidelidad media que ha obtenido cada candidaturas entre los tres clusters.
CLUSTER 3 (SUR) CATEGORIAS PP2016 PSOE2016 UNIDOS.PODEMOS2016 CIUDADANOS2016 RESTO2016 BLANCO2016 ABSTENCION2016
PP2015 0.991 0 0 0 0.007 0.002 0
PSOE2015 0 0.840 0 0 0 0 0.160
IU2015 0 0.266 0.457 0.256 0 0.021 0
PODEMOS2015 0.010 0.026 0.882 0 0.036 0.003 0.043
CIUDADANOS2015 0.109 0 0 0.805 0 0 0.086
RESTO2015 0.088 0.351 0 0.113 0.449 0 0
BLANCO2015 0.327 0.673 0 0 0 0 0
ABSTENCION2015 0 0.010 0 0 0.013 0.008 0.969 Tabla 15 Estimación del % de trasvase de votos en el cluster 3
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 61
Candidatura Fidelidad
PP 99.5%
PSOE 86.9%
IU 51.1%
PODEMOS 82.6%
CIUDADANOS 79.5%
RESTO 40.4%
BLANCO 2.9%
ABSTENCION 92.8%
Tabla 17 Fidelidad de los ciudadanos a cada candidatura
Además se puede observar que los datos obtenidos son perfectamente posibles, es decir, no
hay ningún parámetro de estimación que salte a la vista o llame la atención, pudiéndose dar por
válida la estimación realizada.
5.2 RELACIONES ENTRE LAS CANDIDATURAS
Para estudiar las relaciones existentes entre las candidaturas se ha construido un Diagrama de
Dispersión Matricial, ya que es la forma más simple de estudiar las relaciones pares entre las
muestras. En una matriz donde cada cuadrante representa un diagrama de dispersión sencillo,
encontrándose la diagonal de la matriz vacía. Cada celda de la matriz (i,j) representa el
diagrama de dispersión de la candidatura i, frente a la candidatura j.
Como podemos observar están altamente relacionadas las estimaciones halladas en el primer
apartado con el diagrama de dispersión matricial, ya que como podemos observar, cuanto
mayor sea la relación lineal positiva entre 2 candidaturas en distintas elecciones, mayor será la
transferencia de voto entre ellas, si se comparara una misma candidatura para ambas
elecciones, esta relación mostraría la fidelidad de voto entre ambas elecciones.
También hay que destacar de este Diagrama de Dispersión Matricial, que se ha obtenido un
diagrama de cada cluster, es decir, aunque exista una única recta, esta recta está formada por
diversos puntos de los colores azul, amarillo y rojo; correspondientes a los colores asociados a
los clusters 1, 2 y 3; en el mapa geográfico de la ilustración 12, perteneciente al apartado 3.2
Resultados
62 Escuela Técnica Superior de Ingenieros Industriales (UPM)
Ilustración 14 Diagrama de dispersión matricial por clusters
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 63
Análisis de los resultados
De los resultados obtenidos anteriormente vamos a proceder a analizar los trasvases más
relevantes, estos coinciden con las casillas señaladas continuación.
CATEGORIAS PP2016 PSOE2016 UNIDOS.PODEMOS2016 CIUDADANOS2016 RESTO2016 BLANCO2016 ABSTENCION2016
PP2015 PSOE2015
IU2015 PODEMOS2015
CIUDADANOS2015 RESTO2015
BLANCO2015
ABSTENCION2015
En estas casillas, se han identificado una o varias conductas electorales que ayudan a
entender el trasvase de votos producido en las elecciones.
Para poder obtener información detallada sobre de los resultados obtenidos, se ha
procedido a realizar un análisis sobre el destino de los votos de cada candidatura del
2015 y otro análisis del origen de los votos de la cada candidatura del 2016. En este
análisis se han identificado una serie de conductas electorales que ayudan a entender los
resultados, estas conductas las definimos a continuación:
5.2.1 Partido Popular (PP)
Destino de los votos obtenidos en el 2015
Ilustración 15 Destino de los votos obtenidos por el PP
El PP obtuvo casi una fidelidad de voto del 100%.
Resultados
64 Escuela Técnica Superior de Ingenieros Industriales (UPM)
Origen de los votos obtenidos en el 2016
Ilustración 16 Origen de los votos obtenidos por el PP
El trasvase de votos en el primer y segundo cluster proceden de Ciudadanos,
corresponden a votantes frontera que finalmente en el 2016 se han decantado por el PP.
Este trasvase ha representado 1/8 del total recibido por el Partido Popular
5.2.2 Partido Socialista Obrero Español (PSOE)
Destino de los votos obtenidos en el 2015
Ilustración 17 Destino de los votos obtenidos por el PSOE
En el primer cluster el PSOE ha conseguido una fidelidad de voto casi del 100%.
En el segundo y tercer cluster, el trasvase de votos (-) destinados a la abstención hacen
referencia a los votantes castigadores, que no están de acuerdo con el rumbo que ha
tomado el partido
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 65
Origen de los votos obtenidos en el 2016
Ilustración 18 Origen de los votos obtenidos por el PSOE
Los votos recibidos por el PSOE en el 2016 proceden principalmente de IU y del Resto de
Partidos
5.2.3 Podemos
Destino de los votos obtenidos en el 2015
Ilustración 19 Destino de los votos obtenidos por Podemos
En los tres cluster, aunque sobre todo en el cluster 1, se produce un trasvase de voto (-) a
la abstención, este trasvase hace referencia al votante castigador. Llama la atención el
trasvase de votos de Podemos a Ciudadanos en el primer cluster ya que estos partidos
poseen ideologías distintas. El error que ha podido arrojar el modelo en esta estimación,
ha sido fruto de la baja representación que obtuvo este partido en el primer cluster
(aproximadamente un 6%), esto ha provocado que un ligero trasvase de votos haya
podido ser interpretado por el modelo como una gran fracción del trasvase.
Resultados
66 Escuela Técnica Superior de Ingenieros Industriales (UPM)
5.2.4 Izquierda Unida (IU)
Destino de los votos obtenidos en el 2015
Ilustración 20 Destino de los votos obtenidos por IU
Debido a la coalición formada para las elecciones de 2016, los votantes incondicionales
mantienen el voto a dicha coalición (5/8 en el cluster 1 y casi 1/2 en los cluster 2 y 3).
Sin embargo los votantes frontera se han decantado por otras opciones que han sido
Ciudadanos y PSOE.
5.2.5 Unidos Podemos:
Origen de los votos obtenidos en el 2016
Ilustración 21 Origen de los votos obtenidos por Unidos Podemos
El voto proviene de los votantes incondicionales de los partidos que conforman la
colación, con unos resultados muy similares en los tres clusters.
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 67
5.2.6 Ciudadanos (C´s)
Destino de los votos obtenidos en el 2015
Ilustración 22 Destino de los votos obtenidos por Ciudadanos
Aproximadamente 1/6 de los votantes de este partido, se decantan por la candidatura que
obtuvo mayoría simple (trasvase de votos – hacia el Partido Popular), ya que la ven como
la opción con más posibilidades de ganar. Estas personas que cambian su opción se
encuentran en la frontera entre ambos partidos, que finalmente se han decantado por la
lista con mayores probabilidades de ganar.
Origen de los votos obtenidos en el 2016
Ilustración 23 Origen de los votos obtenidos por Ciudadanos
Este partido sale reforzado por aquellas personas que votaron a opciones políticas que no
llegaron al 2% de los votos y que debido a la menor cuantía de votos que obtuvo esta
formación, supone una gran aportación.
Resultados
68 Escuela Técnica Superior de Ingenieros Industriales (UPM)
5.2.7 Resto de opciones políticas
Destino de los votos obtenidos en el 2015
Ilustración 24 Destino de los votos obtenidos por el Resto de opciones políticas
Hay que destacar que en la Comunidad de Madrid se necesita al menos un 2-3% del voto
total para conseguir un diputado, por tanto todos aquellos votantes de un Partido que no
hayan alcanzado esta cifra, consideraran su voto más efectivo en otras organizaciones.
En esta categoría se producen numerosos trasvases de votos, todos ellos son votantes
veleta que ven su voto más útil en otras categorías que en aquellas con las que más
simpatizan, los votantes veleta se han decantado mayormente por ciudadanos y el PSOE.
Origen de los votos obtenidos en el 2016
Ilustración 25 Origen de los votos obtenidos por el Resto de opciones políticas
El origen de los votos proviene de aquellos votantes incondicionales de las opciones
políticas incluidas en esta categoría.
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 69
5.2.8 Voto en Blanco
Destino de los votos obtenidos en el 2015
Ilustración 26 Destino de los votos obtenidos por el Voto en Blanco
Desaparece casi al completo el voto en blanco, este va destinado a las 2 listas más
votadas o a la abstención. Estos votantes que se decantan por las dos listas más votadas
Origen de los votos obtenidos en el 2016
Ilustración 27 Origen de los votos obtenidos por el Voto en Blanco
Únicamente en el cluster 2 continúa existiendo voto en blanco.
Resultados
70 Escuela Técnica Superior de Ingenieros Industriales (UPM)
5.2.9 Abstenciones
Destino de los votos obtenidos en el 2015
Ilustración 28 Destino delos votos obtenidos por la Abstención
Ha habido un ligero trasvase de votos a diversas candidaturas procendente de la
abstención.
Origen de los votos obtenidos en el 2016
Ilustración 29 Origen de los votos obtenidos por la Abstención
Votantes resignados con la celebración de las elecciones que deciden no acudir a las
urnas en señal de castigo a la política. Esta conducta hace referencia al votante
castigador
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 71
Conclusiones
72 Escuela Técnica Superior de Ingenieros Industriales (UPM)
6. CONCLUSIONES
El trasvase de votos entre 2 procesos electorales tan cercanos como los estudiados, se
encuentra altamente influidos por:
Votantes incondicionales: Son aquellos votantes fieles a un partido
Votantes frontera: Aquellos simpatizantes a dos o más partidos que dudan a que
candidatura destinar su voto hasta el mismo día de las elecciones. Son los principales
responsables del trasvase de votos.
Votantes veleta: Aquellos que se mueven en dirección del viento que sople más fuerte,
es decir, apoyarán a aquella candidatura con más opciones de ganar.
Votantes castigadores: Son aquellos que están descontentos con el rumbo del partido
o con la adhesión de su partido a otra formación.
Recordemos los resultados electorales en Madrid:
Elección Censo Abstención PP PSOE Podemos CIUDADANOS IU Unidos
Podemos
Resto
2015 2.371.327 553.289 645.675 306.862 376.306 314.987 96.322 - 77.886
2016 2.362.455 618.531 696.804 329.947 - 287.711 - 367.526 61.936
Los Votantes Frontera están situados entre PP y C´s se han decantado por el PP.
Estos votantes han representado aproximadamente el 10.8% del voto recibido por el
PP en el 2016
Los Votantes Castigadores han perjudicado al PSOE, Podemos e IU.
-Los Votantes Castigadores del PSOE, han elegido la abstención
-Los Votantes Castigadores de Podemos se han decantado sobre todo por el
PSOE (43%) y la abstención (53%)
-Los Votantes Castigadores de IU se han ido al PSOE.
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 73
Los Votantes Veleta que se han decantado por el PP en el 2016, provienen
principalmente de Ciudadanos, Resto de Partidos, Voto en Blanco y de la Abstención.
Debido a que el trasvase de votos de Izquierda Unida, Podemos, Resto de Partidos, Voto
en Blanco y Abstención al PSOE, ha sido superior al trasvase de votos del PSOE a la
abstención, han quedado enmascarados los votantes castigadores del PSOE. Esto no es
apreciable en el análisis macro de los datos. Mediante el método llevado a cabo es
posible desenmascarar los trasvases, así como obtener su cuantía y la procedencia.
Ilustración 30 Trasvases de votos en el PSOE
Ilustración 31 Procedencia del trasvase entrante al PSOE
0
10000
20000
30000
40000
50000
60000
70000
80000
CLUSTER 1(NORTE)
CLUSTER 2(CENTRO)
CLUSTER 3(SUR)
TOTAL
Trasvase de votoentrante al PSOE
Trasvase de votosaliente del PSOE
0
5000
10000
15000
20000
25000
30000
35000
CLUSTER 1(NORTE)
CLUSTER 2(CENTRO)
CLUSTER 3(SUR)
ABSTENCION
BLANCO
RESTO
POD
Conclusiones
74 Escuela Técnica Superior de Ingenieros Industriales (UPM)
Para finalizar, decir que durante las Elecciones Generales al Congreso de los Diputados
de 2015 y 2016, los votantes incondicionales (incluidos también aquellos que son fieles a
la abstención) representaron el 90% del censo electoral, y el 10% restante (235 mil
votantes), modificaron su decisión en las segundas elecciones. Un alto porcentaje,
teniendo en cuenta que el periodo de tiempo entre estas dos elecciones fue
aproximadamente 6 meses. Este 10% es suficientemente importante como para producir
cambios relevantes en las segundas elecciones. Por tanto los partido políticos en su
campaña deberían focalizar sus esfuerzos en captar la mayor parte de ese voto indeciso,
que como se ha visto puede ser crucial.
Líneas futuras
75 Escuela Técnica Superior de Ingenieros Industriales (UPM)
7. LINEAS FUTURAS
Tras la realización de este proyecto, se han considerado los siguientes trabajos futuros:
Crear la línea de evolución de la estimación de la conducta de voto en Madrid a lo
largo de la historia de la democracia.
Realizar la estimación de la conducta de voto entre ambas elecciones a nivel de
comunidad de Madrid o incluso a nivel nacional.
Predicción de la conducta de voto en unas hipotéticas terceras elecciones.
Realización de la misma estimación cambiando el tipo de algoritmo utilizado en la
agrupación y comparar los resultados.
Realizar la estimación con otro algoritmo de estimación distinto al de mínimos
cuadrados
Planificación temporal
76 Escuela Técnica Superior de Ingenieros Industriales (UPM)
8. PLANIFICACION TEMPORAL
8.1 Paquetes de trabajo
A continuación se muestra la planificación temporal del proyecto. Para ello, se adjunta la
EDP (Estructura Descomposición del Proyecto) realizado así como una explicación de los
paquetes de trabajo en los que se ha descompuesto el proyecto, y el diagrama de Gantt
correspondiente.
Los paquetes en los que se ha descompuesto este proyecto han sido:
Paquete de Trabajo 1: Búsqueda de información.
Descripción: Búsqueda de información relacionada con la regresión ecológica, sus
orígenes, su historia y propulsores.
Comienzo: 4/07/2016
Final: 11/07/2016
Paquete de Trabajo 2: Analizar el estado del arte.
Descripción: Búsqueda de información de trabajos anteriores relacionados directa
o indirectamente con el tema, de donde se pudiese obtener un punto o visión de
partida sobre el trabajo a realizar
Comienzo: 11/07/2016
Final: 25/07/2016
Paquete de Trabajo 3: Recogida de datos.
Descripción: Investigación y obtención de todos los datos electorales necesarios
para poder empezar a tratarlos y analizarlos.
Comienzo: 25/07/2016
Final: 8/08/2016
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 77
Paquete de Trabajo 4: Dimensionamiento del problema a analizar
Descripción: Elegir la relación adecuada entre nivel de detalle y dificultad de
tratamiento de datos que se deseaba adecuada para el problema.
Comienzo: 1/09/2016
Final: 3/09/2016
Paquete de Trabajo 5: Afianzar información detallada sobre la inferencia ecológica
y la regresión lineal
Descripción: Establecer los puntos de confluencia entre los objetivos de nuestro
trabajo, la inferencia ecológica y la regresión lineal múltiple.
Comienzo: 3/09/2016
Final: 25/09/2016
Paquete de Trabajo 6: Toma de contacto con el programa R-Studio
Descripción: Instalación del programa y paquetes necesarios para nuestro
propósito, toma de contacto con la interfaz del programa.
Comienzo: 26/09/2016
Final: 5/10/2016
Paquete de Trabajo 7: Aprendizaje y manejo del programa R-Studio
Descripción: Lectura de manuales, visión de tutoriales sobre este programa y
manejo del mismo, con el propósito de poder desarrollar computacionalmente
nuestro proyecto.
Comienzo: 6/10/2016
Final: 31/10/2016
Planificación temporal
78 Escuela Técnica Superior de Ingenieros Industriales (UPM)
Paquete de Trabajo 8: Identificación de paquetes relacionados con nuestro
proyecto.
Descripción: Instalación, aprendizaje y manejo de los paquetes necesarios para la
programación de nuestro problema.
Comienzo: 1/11/2016
Final: 15/11/2016
Paquete de Trabajo 9: Computación, desarrollo y resolución de nuestro problema
Descripción: Desarrollo del código empleado para la estimación de la conducta
electoral.
Comienzo: 15/11/2016
Final: 7/12/2016
Paquete de Trabajo 10: Validación y extracción de la solución.
Descripción: Contrastar que la solución obtenida es perfectamente posible y válida
para nuestro trabajo y extracción de la misma.
Comienzo: 7/12/2016
Final: 17/12/2016
Paquete de Trabajo 11: Realización de la memoria
Descripción: Plasmar sobre el papel todo lo llevado a cabo durante el trabajo
Comienzo: 17/12/2016
Final: 25/01/2017
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 79
Paquete de Trabajo 11: Corrección de errores
Descripción: Una vez revisado el trabajo por el tutor, se procede a corregir los
errores encontrados, para así poder dar por finalizada la redacción de la memoria
Comienzo: 26/01/2017
Final: 5/02/2017
Paquete de Trabajo 12: Preparación de la presentación y de la exposición
Descripción: Desarrollo del Power Point y práctica de la presentación
Comienzo: 7/02/2017
Final: 20/02/2017
8.2 Estructura Descomposición del Proyecto (EDP)
Ilustración 32 Estructura de Descomposición del Proyecto
Planificación temporal
80 Escuela Técnica Superior de Ingenieros Industriales (UPM)
8.3 Diagrama de Gantt
Ilustración 33 Diagrama de Gantt
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
81 Escuela Técnica Superior de Ingenieros Industriales (UPM)
Presupuesto
82 Escuela Técnica Superior de Ingenieros Industriales (UPM)
9. PRESUPUESTO
A continuación se presenta una estimación presupuesto mensual sobre los gastos
acometidos en el proyecto. En este presupuesto se han considerado los gastos más
relevantes llevados a cabo. Para la elaboración de este presupuesto se ha tenido en
cuenta el número de horas dedicadas al proyecto por parte del Doctor Ingeniero, Experto
Ingeniero y del Ingeniero Junior, el transporte entre el domicilio y el lugar de trabajo, así
como los costes necesarios del material (ordenador) necesario para realizar el trabajo y
los costes indirectos asociados a la utilización de dicho material (electricidad).
Tipo IVA Base Cuota Importe total
Salario Doctor Ingeniero
21% 6,560 € 1,378 € 7,938 €
Salario Experto Ingeniero
21% 800 € 168 € 968 €
Salario Ingeniero Junior
21% 8,600 € 1,806 € 10,406€
Transporte 10% 146 € 15 € 160 €
Ordenador 21% 88 € 18 € 106 €
Consumo de electricidad
21% 1 € 0.13 € 0.73 €
16,194 € 3,401 € 19,595€
Tabla 18 Presupuesto
Tipo IVA Importe sin IVA
Julio Agosto Septiembre Octubre Noviembre Diciembre Enero Febrero
Salario Doctor
Ingeniero 21% 160€/hora 640 € 0 € 800 € 960 € 960 € 960 € 1,280€ 960 €
Salario Experto
Ingeniero 21% 160€/hora 0 € 0 € 0 € 0 € 0 € 0 € 480 € 320 €
Salario Ingeniero
Junior 21% 25€/hora 500 € 125 € 1,000 € 1,475 € 1,750 € 1,500 € 1,500€ 750 €
Transporte 10% 18.2€/mes 18 € 18 € 18 € 18 € 18 € 18 € 18 € 18 €
Ordenador 21% 660€
amortizado a 5 años
11 € 11 € 11 € 11 € 11 € 11 € 11 € 11 €
Consumo de
electricidad 21%
0.04 €/KWh
0.035€ 0.009 € 0.070 € 0.104 € 0.123 € 0.106 € 0.106€ 0.053 €
Tabla 19 Coste Mensual del Proyecto (IVA no incluido)
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 83
Ilustración 34 Desglose mensual del presupuesto
Ilustración 35 Desglose del importe total Los recursos necesarios para el desarrollo de este proyecto, son ligeramente constantes
en torno a los 800€ mensuales. La viabilidad económica de este proyecto vendría
condicionada por el precio que una entidad, tanto pública como privada estaría dispuesto
a pagar.
0 €
500 €
1,000 €
1,500 €
2,000 €
2,500 €
3,000 €
3,500 €
4,000 €
4,500 €
IVA
Base
40%
5%
53%
1% 1% 0%
Desglose del Importe Total (IVA incluido) Salario Doctor Ingeniero Salario Experto Ingeniero Salario Ingeniero Junior
Transporte Ordenador Consumo electrico
Bibliografía
84 Escuela Técnica Superior de Ingenieros Industriales (UPM)
10. BIBLIOGRAFI A
[1] Web del Ayuntamiento de Madrid (Banco de datos)
http://www-2.munimadrid.es/CSE6/control/seleccionDatos?numSerie=7010301012
[2] Información Electoral del Ministerio del Interior
http://www.infoelectoral.interior.es/min/areaDescarga.html?method=inicio
[3] Del Barrio T. Clar M. y Suriñach J. “Modelo de regresión lineal múltiple: especificación,
estimación y contraste” Universidad Virtual. 2002
[4] Correa J.C. y González N. “Gráficos estadísticos con R” Postgrado en Estadística, Universidad
Nacional-Sede Medellin.
[5] Imai K. y Khanna K. “Improving Ecological Inference by Predicting Individual Ethnicity from
Voter Registration Records” Department of Politics and center for statistics and machine learning,
Princenton University NJ 08544
[6] Tam Cho W. y Manski C. “CROSS-LEVEL/ECOLOGICAL INFERENCE” Department of
Political Science, Northwestern University
[7] “Diseño de experimentos y regresión” Laboratorio de Estadistica, etsii UPM
[8] King G. “A Solution to the Ecological Inference Problem: Reconstructing Individual Behavior
from Aggregate Data” Princeton University
[9] King G. “Ecological Inference: New methodological Strategies”, Harvard University
[10] Puig X. y Ginebra J. “A Cluster Analysis of Vote Transitions” Departamento de Estadística,
Universidad Técnica de Barcelona
[11] Puig X. y Ginebra J. “A cluster analysis of vote transitions”, Departamento de Estadística,
Universidad Tecnica de Barcelona
[12] Puig X. y Ginebra J. “A Bayesian cluster analysis of election results” Departamento de
Estadística, Universidad Técnica de Barcelona
Estimación del Trasvase de Votos entre Partidos: Elecciones 2015 y 2016 en Madrid
Javier Lejarraga Cañas 85
[13] Puig X. y Ginebra J. “Ecological inference and spatial variation of individual behavior:
National divide and elections in Catalonia” Departamento de Estadística, Universidad Tecnica de
[14] Romero R. “Trasvase de votos entre partidos en las elecciones autonómicas catalanas del 27 de
Septiembre de 2015”, Real Academia de Cultura Valenciana
[15] Borge L. “Estimación de un modelo de regresión con restricciones de orden en los parámetros”
Universidad de Valladolid
[16] Barcelona Berwin A. “Functions to solve Quadratic Programming Problems”, Package
quadprog