M etodos Bayesianos para caracterizar el comportamiento ...

102
Facultad de Estad´ ıstica Maestr´ ıa en Estad´ ıstica Aplicada Proyecto de grado Julio 2021 etodos Bayesianos para caracterizar el comportamiento legislativo del Senado colombiano en el periodo 2010–2014. Bayesian methods to characterize the legislative behavior of Colombian’s Senate in the 2010–2014 period. Carolina Maria Luque Zabala. a [email protected] Dr. Juan Camilo Sosa Mart´ ınez. b [email protected] Resumen Este trabajo aplica metodolog´ ıas Bayesianas para caracterizar el comportamiento legislativo del Senado colombiano durante el periodo 2010–2014. El an´ alisis se hace a trav´ es de las votaciones nominales plena- rias de ´ esta c´ amara legislativa. Adem´ as, la conducta electoral parlamentaria se operacionaliza mediante la implementaci´ on del estimador unidimensional de punto ideal Bayesiano est´ andar por medio de algorit- mos de cadenas de Markov Monte Carlo. Los resultados obtenidos proveen aportes principalmente en dos direcciones: dimensi´ on del espacio pol´ ıtico e identificaci´ on de legisladores pivote. El patr´ on que revelan los puntos ideales estimados sugiere un rasgo latente no ideol´ ogico (oposici´ on–no oposici´ on) subyacente a la votaci´ on de los diputados del Senado. As´ ı, este trabajo adem´ as de proveer evidencia emp´ ırica para una mejor comprensi´ on de la pol´ ıtica legislativa en Colombia durante el periodo objeto de an´ alisis, tam- bi´ en ofrece herramientas metodol´ ogicas, te´ oricas y pr´ acticas, para guiar el pre–procesamiento y an´ alisis de datos de votaci´ on nominal en contextos de parlamentos desequilibrados (a diferencia del parlamento norteamericano), tomando como referencia el caso particular del Senado de Colombia. Palabras clave : etodos de cadenas de Markov Monte Carlo, estimador de punto ideal Bayesiano, votaciones nominales, comportamiento legislativo, parlamentos desequilibrados. Resumen This work applies Bayesian methodologies to characterize the legislative behavior of the Colombian Senate during the 2010–2014 period. The analysis is done through the plenary roll-call votes of this legislative chamber. Furthermore, parliamentary electoral behavior is operationalized by implementing the one-dimensional standard Bayesian ideal point estimator by means of Markov chain Monte Carlo algorithms. The results mainly provide contributions in two directions: Political space dimensionality and pivotal legislators identification. Patterns revealed by the estimated ideal points suggest non–ideological latent trait (opposition–no opposition) underlying the vote of the Senate deputies. Thus, in addition to providing empirical evidence for a better understanding of legislative policy in Colombia during the period under analysis, this work also offers methodological, theoretical, and practical tools to guide the pre-processing and analysis of roll-call data in contexts of unbalanced parliaments (as opposed to the North American parliament), taking as a reference the particular case of the Colombian’s Senate. Palabras clave : Markov Chain Monte Carlo methods, Bayesian ideal point estimator, roll-call votes, legislative behavior, unbalanced parliaments. a Estudiante, Maestr´ ıa en Estad´ ıstica Aplicada, Universidad Santo Tom´as, Bogot´a b Director, Profesor Asistente, Departamento de Estad´ ıstica, Universidad Nacional de Colombia, Bogot´a 1

Transcript of M etodos Bayesianos para caracterizar el comportamiento ...

Page 1: M etodos Bayesianos para caracterizar el comportamiento ...

Facultad de EstadısticaMaestrıa en Estadıstica Aplicada

Proyecto de gradoJulio 2021

Metodos Bayesianos para caracterizar el comportamientolegislativo del Senado colombiano en el periodo 2010–2014.

Bayesian methods to characterize the legislative behavior of Colombian’s Senate in the2010–2014 period.

Carolina Maria Luque Zabala.a

[email protected]. Juan Camilo Sosa Martınez.b

[email protected]

Resumen

Este trabajo aplica metodologıas Bayesianas para caracterizar el comportamiento legislativo del Senadocolombiano durante el periodo 2010–2014. El analisis se hace a traves de las votaciones nominales plena-rias de esta camara legislativa. Ademas, la conducta electoral parlamentaria se operacionaliza mediantela implementacion del estimador unidimensional de punto ideal Bayesiano estandar por medio de algorit-mos de cadenas de Markov Monte Carlo. Los resultados obtenidos proveen aportes principalmente en dosdirecciones: dimension del espacio polıtico e identificacion de legisladores pivote. El patron que revelanlos puntos ideales estimados sugiere un rasgo latente no ideologico (oposicion–no oposicion) subyacentea la votacion de los diputados del Senado. Ası, este trabajo ademas de proveer evidencia empırica parauna mejor comprension de la polıtica legislativa en Colombia durante el periodo objeto de analisis, tam-bien ofrece herramientas metodologicas, teoricas y practicas, para guiar el pre–procesamiento y analisisde datos de votacion nominal en contextos de parlamentos desequilibrados (a diferencia del parlamentonorteamericano), tomando como referencia el caso particular del Senado de Colombia.

Palabras clave: Metodos de cadenas de Markov Monte Carlo, estimador de punto ideal Bayesiano,votaciones nominales, comportamiento legislativo, parlamentos desequilibrados.

Resumen

This work applies Bayesian methodologies to characterize the legislative behavior of the ColombianSenate during the 2010–2014 period. The analysis is done through the plenary roll-call votes of thislegislative chamber. Furthermore, parliamentary electoral behavior is operationalized by implementingthe one-dimensional standard Bayesian ideal point estimator by means of Markov chain Monte Carloalgorithms. The results mainly provide contributions in two directions: Political space dimensionality andpivotal legislators identification. Patterns revealed by the estimated ideal points suggest non–ideologicallatent trait (opposition–no opposition) underlying the vote of the Senate deputies. Thus, in additionto providing empirical evidence for a better understanding of legislative policy in Colombia during theperiod under analysis, this work also offers methodological, theoretical, and practical tools to guide thepre-processing and analysis of roll-call data in contexts of unbalanced parliaments (as opposed to theNorth American parliament), taking as a reference the particular case of the Colombian’s Senate.

Palabras clave: Markov Chain Monte Carlo methods, Bayesian ideal point estimator, roll-call votes,legislative behavior, unbalanced parliaments.

aEstudiante, Maestrıa en Estadıstica Aplicada, Universidad Santo Tomas, BogotabDirector, Profesor Asistente, Departamento de Estadıstica, Universidad Nacional de Colombia, Bogota

1

Page 2: M etodos Bayesianos para caracterizar el comportamiento ...

2 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

Introduccion

La teorıa espacial del voto establece consideraciones teoricas y metodologicas bajo las cuales se desarrollanlos modelos de votacion espacial. Estos modelos reunen un conjunto de herramientas matematicas yestadısticas que permiten estudiar el comportamiento competitivo de agentes polıticos. Su aplicacion hadesempenado un papel destacado en la ciencia polıtica desde los anos 50 (Arrow, 1990; Krehbiel, 1988),con el desarrollo de “la teorıa economica de la democracia” (Downs, 1957) y “la teorıa de los comites ylas elecciones” (Black et al., 1958). Desde entonces son numerosas las publicaciones que han aumentadola visibilidad y resaltado la utilidad de estos modelos para ofrecer evidencia empırica que fundamente laexplicacion teorica del comportamiento y formas de organizacion electoral en diferentes contextos.

Dentro de los modelos de votacion espacial se destaca principalmente el estimador de punto ideal Ba-yesiano (Clinton et al., 2004; Jackman, 2004), cuya especificacion e implementacion data de la ultimadecada. Son varios los estudios que han mostrado como su aplicacion, adaptacion y generalizacion pro-veen evidencia empırica para diferentes fenomenos polıticos (e.g., Clinton et al., 2004; Tsai, 2020). Laliteratura explıcitamente indica que este modelo es una herramienta fundamental para la investigacion enel campo de las ciencias polıticas (Yu and Rodriguez, 2019a), y ademas advierte que es un instrumentometodologico y teorico dominante para analizar patrones de votacion modernos (ver Yu and Rodriguez,2019b; Moser et al., 2021). Esto justifica la eleccion de este modelo para investigar el comportamientolegislativo colombiano.

La eleccion colectiva es un fenomeno de estudio relevante en el contexto polıtico, dado que las preferenciasde los electores no son perfectamente homogeneas (Krehbiel, 1988). En el caso de cuerpos deliberantescomo el Senado, los legisladores muestran opiniones diferentes frente al tipo de polıticas que se debenadoptar, lo cual conlleva a un conflicto de opiniones e intereses colectivo, que resulta atractivo para loscientıficos en este campo.

En el contexto de Colombia son pocos los estudios que han aplicado algun modelo de votacion espacialpara analizar la conducta electoral parlamentaria. Se tiene conocimiento de un solo trabajo (Carroll andPachon, 2016) que aplica el metodo de escalamiento de Aldrich-McKelvey (Hare et al., 2015) y clasifica-cion optima (Poole, 2000) para dar cuenta de patrones de conducta electoral legislativa a traves de datosde encuesta y votaciones nominales. Especıficamente, hasta nuestro conocimiento, no se han identificadoinvestigaciones que empleen el estimador de punto ideal Bayesiano para identificar preferencias polıticasde los legisladores a partir de datos de votacion nominal en el Senado de Colombia.

La literatura disponible sobre comportamiento legislativo en Colombia, senala un incipiente campo deinvestigacion (ver, Archer and Shugart, 1997; Cardenas et al., 2008; Aleman and Pachon, 2008; Pachon,2011; Carroll and Pachon, 2016; Pachon and Johnson, 2016; Pachon and Munoz, 2020, entre otros) yconstituye una base esencial para perfilar estudios que permitan obtener evidencia empırica de los deter-minantes de comportamiento legislativo, ası como obtener resultados coherentes con las caracterısticasinstitucionales del sistema polıtico nacional. Una revision exhaustiva muestra que la investigacion cuan-titativa del parlamento colombiano se ha direccionado hacia la busqueda de patrones y determinantesde conducta legislativa a nivel de partido, coalicion y comite (e.g., Carroll and Pachon 2016; Pachon andJohnson 2016), dejando abierto el campo de investigacion a nivel de legislador.

El analisis de la conducta individual en un contexto como el de Colombia es pertinente, dado que elsistema polıtico del paıs se caracteriza por una polıtica personalizada (Pachon 2011; Pachon and Munoz2020). Adicionalmente, la mayorıa de los estudios sobre comportamiento legislativo apoyan sus resultadospor medio de analisis descriptivos de los proyectos de ley introducidos y votados en el Congreso de laRepublica (e.g., Pachon and Munoz 2020; Pachon 2011), lo que indica una oportunidad para hacerestimaciones e inferencias sobre la conducta electoral legislativa en parlamentos desequilibrados (lasfacciones que lo integran no tienen un numero equivalente de curules) como el colombiano.

En esta vıa, se propone la aplicacion de metodos Bayesianos para caracterizar el comportamiento le-gislativo del Senado de la Republica de Colombia 2010–2014. Especıficamente, se busca identificar losfenomenos legislativos y aspectos metodologicos que permiten direccionar la investigacion cuantitativa

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 3: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 3

del comportamiento de votacion parlamentario en Colombia; reconocer las condiciones bajo las cuales soninvariantes los resultados que se obtienen al aplicar el estimador de punto ideal unidimensional Bayesianoestandar a los datos de votacion nominal del Senado; y distinguir los rasgos latentes, patrones partidis-tas y de coalicion que subyacen a las decisiones legislativas de los diputados. En este sentido, se hacehincapie en las regularidades que revelan los puntos ideales junto con los parametros de discriminaciony aprobacion.

Ası, con el fin de atender a estos objetivos, en este trabajo se (i) propone una taxonomıa para darcuenta de la revision sistematica de las aplicaciones, extensiones y modelos derivados del estimador depunto ideal Bayesiano; (ii) se caracteriza exhaustivamente la votacion nominal teniendo en cuenta lasparticularidades de los diputados y proyectos de ley sometidos a deliberacion durante el 2010–2014; (iii)se llevan a cabo varios estudios de simulacion para evaluar el desempeno del modelo teniendo en cuentadistintas configuraciones de legisladores de anclaje, tasas de datos perdidos (abstenciones e inasistencias),funciones de enlace y estados de informacion previa; y (iv) se analiza a profundidad los datos de votacionnominal del Senado para investigar las preferencias polıticas junto con los patrones de votacion. Ası,este trabajo ademas de proveer evidencia empırica para una mejor comprension de la polıtica legislativaen Colombia durante el periodo objeto de analisis, tambien ofrece herramientas metodologicas, teoricasy practicas, para guiar el pre–procesamiento y analisis de datos de votacion nominal en contextos deparlamentos desequilibrados (a diferencia del parlamente norteamericano), tomando como referencia elcaso particular el Senado de Colombia.

Este documento se estructura como sigue. La Seccion 1, presenta los referentes teoricos relacionadoscon la pertenencia del analisis Bayesiano en la ciencias sociales, los fundamentos de la estimacion einferencia Bayesiana, y la especificacion, identificacion e implementacion del estimador de punto ideal.En la Seccion 2, se presenta una revision exhaustiva y detallada de la literatura en relacion con elcomportamiento legislativo en el contexto norteamericano, de America latina y Colombia; se hace hincapieen las investigaciones que han implementado el estimador de punto ideal, y en el caso particular deColombia, se expone el escenario polıtico bajo el cual se han llevado a cabo estudios cuantitativos sobreconducta electoral parlamentaria. En la Seccion 3, se reporta la fuente de informacion de los datos, elpre–procesamiento y el analisis descriptivo de los mismos. En la Seccion 4, se exponen los detalles de laimplementacion del estimador de punto ideal Bayesiano. En la Seccion 5, se presentan los resultados delestudio de simulacion. En la Seccion 6, se ilustra la aplicacion del modelo, tomando como caso particular,los datos del Senado de la Republica de Colombia 2010–2014. Finalmente, en la Seccion 7, se discutenlos resultados del trabajo y se presentan algunas alternativas de investigacion futura.

1. Marco teorico

1.1. Analisis Bayesiano en ciencias sociales.

Los metodos Bayesianos son herramientas de analisis de datos que se derivan de los principios de lainferencia Bayesiana, i.e, del aprendizaje inductivo a traves del teorema de Bayes. Estos proporcionanestimaciones de parametros con buenas propiedades estadısticas, descripciones parsimoniosas de los datosobservados, predicciones de datos faltantes y predicciones para observaciones futuras, ası como un marcocomputacional para la estimacion, seleccion y validacion de modelos (Hoff, 2009). En el contexto delas ciencias sociales, en particular, de las ciencias polıticas, estos metodos se han convertido en unametodologıa predominante para el analisis de diferentes fenomenos polıticos desde la decada de los 90,como lo demuestra una gran variedad de publicaciones cientıficas en el campo (e.g., Western and Jackman,1994; Jackman, 2004; Gill and Walker, 2005; Barbera, 2015; Moser et al., 2021).

Son varias las razones que justifican la adopcion de un enfoque Bayesiano para la inferencia estadısticaen ciencias sociales, y en particular, en ciencias polıticas. La configuracion de esta area del conocimientoes muy diferente a la de las ciencias experimentales (Jackman, 2009), en tanto, la investigacion cientıficaen el campo social, presenta caracterısticas y requerimientos particulares, que son afines a la filosofıa de

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 4: M etodos Bayesianos para caracterizar el comportamiento ...

4 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

la estadıstica Bayesiana y que distan de los supuestos del enfoque clasico frecuentista. Algunas de estascaracterısticas son:

En algunas investigaciones, los datos no se constituyen en una muestra de una poblacion masgrande, por el contrario, las observaciones disponibles para el analisis, agotan la poblacion deinteres (e.g, analisis de datos transnacionales provenientes de organismos internacionales como laOCDE; Jackman, 2009). El hecho de que, en algunos casos, los datos no sean producto del muestreode una poblacion, conlleva a un conflicto en la interpretacion de los resultados que se obtienen desdeun enfoque frecuentista. Interpretaciones convencionales de intervalos de confianza o pruebas dehipotesis, en terminos de un patron observado bajo repeticion, proporcionan explicaciones confusase inadecuadas en contextos donde la incertidumbre no se debe a la variacion en el muestreo repetidode una poblacion sino al estado del conocimiento sobre las cantidades de interes (Jackman, 2009;Western and Jackman, 1994). Adherirse a una concepcion frecuentista de probabilidad frente adatos no repetibles, no tiene sentido, es por ello, que la aproximacion Bayesiana, desde su nocionde probabilidad subjetiva, proporciona una base mas coherente para la inferencia en campo de lasciencias sociales, donde el muestreo repetido no arroja valores diferentes para las variables ni paralas estimaciones de parametros.

Es comun que los cientıficos sociales dispongan de conjuntos de datos “pequenos” para el analisis,los cuales se generan en condiciones menos que ideales, en tanto, los juicios subjetivos sobre laespecificacion y adecuacion del modelo se hacen inevitables e inherentes al ejercicio cientıfico en estaarea (Jackman, 2009). Ası, establecer una previa e interpretar la probabilidad de manera subjetiva,resulta natural para los cientıficos en este contexto. Por otro lado, no contar con “grandes” conjuntosde datos, hace que las estimaciones bajo un enfoque frecuentista, no cuenten con buenas propiedadesestadısticas en lo que respecta a las distribuciones asintoticas que justifican los procedimientosde inferencia. Estudios de investigacion comparativa en el campo social, han mostrado que laaplicacion de metodos clasicos, a conjuntos de datos pequenos y colineales, en el contexto de laregresion, producen estimaciones imprecisas de los efectos de las variables explicativas (Westernand Jackman, 1994).

En el campo social abundan conjuntos de datos que se agrupan en varias unidades o perıodos detiempo, por ende, una pregunta clave en la investigacion es ¿como varıa una estructura causal queopera en un nivel de analisis (e.g., individuos) a lo largo de un nivel superior (e.g., localidades operıodos de tiempo)? El enfoque Bayesiano de la inferencia estadıstica es adecuado para responder aesta pregunta, dado que, permite al investigador, a traves de la caracterizacion de creencias previas,formalizar suposiciones sobre la heterogeneidad entre grupos. Es ası, como la distribucion previa,considerada por los crıticos de la inferencia Bayesiana como una debilidad, provee un camino parala expansion de un modelo simple a un modelo de heterogeneidad causal, que permite analizarcasos donde la investigacion social requiere comprender el peso relativo de las variables a nivelmicro, macro o contextual, ası como la interaccion entre las mismas (Jackman, 2009).

Otras ventajas de la inferencia Bayesiana, que no son propias del campo social pero que resultan atractivaspara los cientıficos en esta area, son:

La inferencia Bayesiana es simple y directa: en principio se establecen creencias previas sobre can-tidades de interes, que luego se confrontan con evidencia (datos) para producir afirmaciones deprobabilidad posterior, sobre tales cantidades, a luz de los datos (Jackman, 2009). A diferencia delenfoque frecuentista, la inferencia Bayesiana no requiere de pasos adicionales (e.g., el calculo deestadısticos de prueba), esto debido a que la distribucion posterior refleja el estado actual de lainformacion sobre el parametro y por ende, a partir de ella, pueden elaborarse estimaciones pun-tuales, intervalos de confianza, pruebas de hipotesis e incluso hacer interpretaciones probabilısticasacerca del verdadero valor del parametro. La sencillez conceptual de la inferencia Bayesiana lahace atractiva para los cientıficos sociales y justifica que se haya convertido en una metodologıapredominante para la investigacion cuantitativa en esta area (Jackman, 2009).

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 5: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 5

El paradigma Bayesiano ofrece un marco computacional, a traves del cual, problemas estadısticosdifıciles se vuelven mas faciles de resolver (Jackman, 2004; Jackman, 2009). El bajo costo y larapidez de computo, de los ultimos tiempos, ha hecho factible, para los cientıficos sociales, elanalisis de datos desde una aproximacion Bayesiana basada en simulacion. El conjunto de algoritmosconocido como Cadenas de Markov de Monte Carlo (MCMC, por sus siglas en ingles) ha permitidoque el enfoque Bayesiano no solo sea una curiosidad teorica, sino que sea una realidad practica paralos investigadores aplicados (Jackman, 2009). Estos algoritmos han demostrado ser poderosos yflexibles en la estimacion de modelos que no se pueden estimar facilmente desde un enfoque clasico.Estimaciones de modelos jerarquicos (como los de heterogeniedad causal), modelos con muchosparametros, modelos de variables latentes ası como aquellas basadas en conjuntos de observacionescon datos faltantes, se han convertido en procedimientos sencillos, puesto que, las matematicas yla computacion subyacente al analisis Bayesiano se simplifica drasticamente vıa simulacion MonteCarlo.

Con el proposito de comprender los fundamentos de la inferencia Bayesiana, en lo que sigue se presentanalgunos conceptos e ideas basicas en relacion a: diferencias conceptuales entre el enfoque Bayesiano y laaproximacion frecuentista, importancia del analisis de sensitividad, conveniencia del analisis conjugado,evaluacion y contraste de modelos; y computacion Bayesiana vıa simulacion de Monte Carlo.

1.2. Inferencia estadıstica: frecuentista versus Bayesiana.

Como ya se ha mencionado, en estadıstica coexisten dos enfoques para el analisis de datos: frecuentis-ta y Bayesiano; estos difieren en la interpretacion de la probabilidad, la naturaleza de los parametrosy los metodos estadısticos que se usan para hacer inferencia. Ambos enfoques se rigen por fundamen-tos axiomaticos de probabilidad y utilizan la funcion de verosimilitud en la estimacion de parametrosdesconocidos.

Bajo cualquiera de los enfoques, la relacion entre datos observados y = (y1, ..., yn) y parametro θ ∈ Θ,se establece mediante un modelo y ∼ p(y | θ), el cual, dado un valor de θ, caracteriza completamente elproceso aleatorio que genera el conjunto de datos. La naturaleza de θ es una de las principales diferenciasentre la estadıstica frecuentista y Bayesiana. El enfoque frecuentista, admite el parametro θ como unacantidad poblacional fija pero desconocida; cualquier estimacion de este, θ, se basa en muestreo repetidoy es aleatoria dada su dependencia de la muestra seleccionada. Para determinar el valor de θ que maxi-miza la probabilidad de observar los datos, los frecuentistas, usualmente utilizan el metodo de maximaverosimilitud; un procedimiento que permite optimizar la funcion de verosimilitud p(y | θ), definidacomo una funcion de θ, que resume la informacion que hay sobre el parametro en la muestra. Por otrolado, el paradigma Bayesiano asume a θ como una variable aleatoria, en tanto, cualquier estimacion, θ,es fija y se constituye en una realizacion de la variable. Desde este punto de vista, no se tiene certezadel verdadero valor del parametro pero se considera que existe algun conocimiento previo del mismo,por ello, para los Bayesianos, tiene sentido materializar tal conocimiento a traves de una distribucion deprobabilidad previa, p(θ), cuyo objeto es caracterizar la incertidumbre que se tiene sobre θ. En sıntesis,la previa es una distribucion que antecede a los datos y resume el estado de conocimiento del investigadorsobre el parametro. Ası, una vez se observan los datos, las creencias previas se modifican en funcion delo observado y se obtiene una distribucion posterior que resume el conocimiento del investigador sobrelos parametros de interes, dados los datos y las creencias previas. En este contexto, se alude al teoremade Bayes como fundamento para modificar creencias previas sobre el parametro a la luz de la evidencia(Hoff, 2009; Jackman, 2004).

El proposito de la inferencia Bayesiana es cuantificar el cambio en la incertidumbre (Hoff, 2009), en tanto,el teorema de Bayes se convierte en un mecanismo para alcanzar dicho objetivo, dado que, plantea unarelacion entre probabilidades marginales y condicionales que permite incorporar informacion muestral ala distribucion del parametro y por ende, actualizar la incertidumbre sobre θ a partir de los datos y.

En la mayorıa de los analisis en ciencias sociales se busca aprender sobre un parametro θ continuo

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 6: M etodos Bayesianos para caracterizar el comportamiento ...

6 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

(Jackman, 2004), caso para el cual el teorema de Bayes se expresa como

p(θ|y) =p(y | θ)p(θ)∫

Θp(y | θ)p(θ) dθ

donde p(θ | y) es la distribucion de probabilidad posterior, es decir, la densidad que resume todo elconocimiento sobre θ despues de observar los datos y; p(y | θ) representa la verosimilitud y p(y) =∫

Θp(y | θ)p(θ) dθ la probabilidad marginal de los datos de acuerdo a la estructura del modelo; esta

ultima, es una integral que no depende de θ, en tanto, corresponde a una constante de normalizacionque permite expresar el teorema de Bayes como

p(θ | y) ∝ p(y | θ)p(θ) (1)

La expresion (1) evidencia dos aspectos importantes: (i) la distribucion posterior es proporcional a ladistribucion previa por la verosimilitud y (ii) algunos resultados frecuentistas pueden verse como uncaso particular del analisis Bayesiano aunque la filosofıa subyacente sea diferente. En relacion al primeraspecto, se observa que la influencia relativa de la informacion previa y los datos sobre las creenciasactualizadas depende de que tan informativa es la previa y el peso de la informacion muestral. Enrelacion al segundo aspecto, la equivalencia entre los dos enfoques, se puede ejemplificar, tomando unadistribucion previa no informativa, es decir, asumiendo una distribucion que otorgue la misma relevanciapara todos los posibles valores del parametro; en este caso, la distribucion posterior toma la misma formade la funcion de verosimilitud.

En un sentido general, el analisis Bayesiano se basa en la misma receta (teorema de Bayes) en todas susaplicaciones, lo cual lo hace mas simple y directo desde un punto de vista conceptual frente al analisisfrecuentista, que requiere de metodos y supuestos adicionales para hacer inferencia. La inferencia Baye-siana condiciona el analisis a los datos disponibles para producir afirmaciones de probabilidad posteriorsobre parametros e hipotesis, razonamiento que es contrario al que subyace en los procedimientos de in-ferencia frecuentista, donde el analisis se condiciona a una hipotesis nula para evaluar la plausibilidad dedatos observados y no observados, siendo estos ultimos un resultado hipotetico de un muestreo adicional(Jackman, 2009).

1.3. Analisis de sensitividad.

La crıtica principal al enfoque Bayesiano radica en la modificacion de estados de informacion externosal conjunto de datos una vez se lleva a cabo el proceso de observacion. Para los frecuentistas, basar elanalisis y los resultados en estados de informacion subjetivos (que dependen del analista), parece pocoriguroso. Sin embargo, la pregunta es ¿por que desistir de informacion disponible y consecuente con larealidad, cuando esta puede contribuir a explicar el fenomeno ası como conducir a inferencias mas precisasy conclusiones plausibles? Trabajos como los de Cox (1946), Cox (1963) y Savage (1972), constituyen unsoporte teorico para justificar que si p(θ) y p(y | θ) representan las creencias de una persona racional(en un sentido probabilıstico), entonces el teorema de Bayes es el metodo optimo para actualizar suscreencias de acuerdo con las leyes de la probabilidad.

Dado que el estado de informacion puede variar dependiendo del analista, la justificacion de la eleccion dela distribucion previa ası como la robustez de las inferencias basadas en esta eleccion, es en sı mismo untema fundamental en la inferencia Bayesiana. En relacion a la eleccion de la previa, la literatura exponealgunos metodos para determinar o suscitar antecedentes subjetivos (e.g., Berger, 2013; Congdon, 2007;Garthwaite et al., 2005; Stuart et al., 1994), sin embargo, en la practica puede ser difıcil formularmatematicamente y con precision las creencias previas del investigador. Por tal motivo, a menudo ladistribucion previa es solo una aproximacion de tales creencias y se puede elegir de forma convenientedesde un punto de vista computacional (Hoff, 2009).

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 7: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 7

Para explorar la robustez de las inferencias, desde la perspectiva Bayesiana, comunmente se realiza unanalisis de sensitividad, cuyo proposito es examinar como cambia la distribucion posterior a medida que seadoptan diferentes valores de los hiperparametros. Este analisis permite argumentar que las conclusionesson consistentes desde un punto de vista tanto cualitativo como cuantitativo. Hay dos formas de realizarun analisis de sensitividad en la practica, bien sea (i) debilitando o fortaleciendo la previa adoptada, o(ii) repitiendo el analisis con diferentes previas (Jackman, 2004).

1.4. Distribuciones conjugadas.

La conjugacion es un concepto importante en estadıstica Bayesiana porque aporta simplicidad al procesode inferencia al encajar la distribucion posterior en una familia de distribuciones conocidas. Supongaque una densidad previa p(θ) pertenece a una familia de distribuciones parametricas, entonces se diceque la previa esta conjugada con respecto a una distribucion p(y | θ) si la distribucion posterior p(θ | y)pertenece a la misma familia. Este resultado presenta dos caracterısticas importantes para la inferenciaBayesiana (Jackman, 2004; Jackman, 2009):

Cuando se cumple la conjugacion, la inferencia Bayesiana es equivalente a tomar una precisionponderada promedio de la informacion previa sobre θ y la informacion en los datos sobre θ. Esdecir, cuando la previa sea difusa, la distribucion posterior estara dominada por la verosimilitud(los datos contienen mas informacion sobre el parametro que la previa); cuando la previa sea muyinformativa la verosimilitud tendra un menor peso en las creencias posteriores; y en el caso de unaprevia degenerada, donde toda la probabilidad esta concentrada en un punto, la informacion en losdatos sobre θ se ignorara por completo y la posterior tambien sera una distribucion degenerada.

En un analisis conjugado, la precision posterior es mayor que la precision previa o la precision delos datos. Dicho de otra manera, nunca se pierde precision al combinar la informacion sobre θ enlos datos con la informacion sobre θ en una conjugada previa. Ademas, con repetidos aplicacionesdel proceso de generacion de datos, la precision posterior continuara aumentando y eventualmenteabrumara a cualquier previa no degenerada. El resultado es que analistas con creencias previasdiferentes (no degeneradas) sobre θ estaran eventualmente de acuerdo (en el sentido, de que lasopiniones convergen a medida que se acumula el conocimiento cientıfico) siempre que (a) se generensuficientes datos en el proceso de simulacion de la distribucion posterior y (b) sus creencias seactualicen utilizando el teorema de Bayes.

Aunque tener previas conjugadas simplifica el analisis, no es un requisito trabajar con este tipo de previaspara hacer inferencia Bayesiana.

1.5. Computacion Bayesiana vıa simulacion de Monte Carlo.

En la inferencia Bayesiana, pueden surgir analisis conjugados complejos, desde un punto de vista ma-tematico, o incluso analisis no conjugados (ver Hoff, 2009; Jackman, 2009) que conllevan a la necesidadde utilizar metodos MCMC para explorar la distribucion posterior. Estos metodos permiten generarrecorridos aleatorios, en algunos casos computacionalmente intensivos, de la distribucion posterior de losparametros del modelo cuando los calculos subyacentes al analisis son exigentes; i.e., cuando las integra-les inherentes al teorema de Bayes o aquellas que resultan al tratar de estimar una medida resumen uobtener una cantidad predictiva, son intratables analıticamente, ya sea por la cantidad de parametrosdel modelo o la dimensionalidad de la distribucion. El procedimiento para aproximar la distribucionposterior a traves de MCMC, se fundamenta en los dos metodos implıcitos en estas siglas: el metodo deMonte Carlo (Seccion 1.5.1) y las Cadenas de Markov.

El principio de Monte, establece que cualquier caracterıstica de una variable aleatoria θ, se puede apro-ximar a traves de muestreo repetido de la distribucion de θ; claro esta, que la precision con la que se

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 8: M etodos Bayesianos para caracterizar el comportamiento ...

8 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

aprenda sobre las caracterısticas de θ esta sujeta a la cantidad de muestras aleatorias que se obtengande esta variable. Por otro lado, las Cadenas de Markov, son un proceso estocastico de primer orden, quepermite explorar espacios de parametros multidimensionales cuando la distribucion posterior tiene unaforma analıtica compleja o desconocida; a traves de este proceso se construye una secuencia o caminatade valores aleatorios con un tipo particular de dependencia serial, que permite explorar el espacio devalores asociados con la distribucion probabilıstica de una variable aleatoria en cualquier dimension, auncuando las muestras esten correlacionadas (un tratamiento formal y detallado de la teorıa de Cadenasde Markov se puede ver en Carlin and Louis, 2008; Jackman, 2009; Meyn and Tweedie, 2012 y Norris,1998; en particular, Tierney, 1994, expone metodos y estrategias para el muestreo de una distribucionposterior; Bradley and Meek, 2014, proporcionan aplicaciones a las ciencias sociales para un publico noespecializado).

Es importante resaltar que las cadenas de Markov no son un mecanismo para generar “datos nuevos”sinomuestras correlacionadas de la poblacion objetivo; en otras palabras, son una herramienta para explorarla distribucion posterior mas no un metodo de inferencia. La teorıa al respecto, senala que es posibleconstruir Cadenas de Markov en espacios de parametros, de tal forma que la cadena visite ubicacionesen tal espacio con frecuencias proporcionales a la probabilidad de esas ubicaciones bajo una distribucionde interes como la distribucion posterior p(θ | y); una cadena con esta propiedad se denomina ergodi-ca (Jackman, 2004). La ergodicidad es una propiedad importante porque permite generar Cadenas deMarkov con distribucion estacionaria proxima a la distribucion posterior p(θ | y) cuando el numero deiteraciones tiende a infinito.

El historial iterativo que genera la cadena se almacena y se trata como una serie de muestras de la distri-bucion posterior, en tanto, siguiendo el principio de Monte Carlo, estas muestras se pueden utilizar paraaprender sobre θ a posteriori. En concordancia, la combinacion del principio de Monte Carlo y la teorıasobre Cadenas de Markov, proporcionan algoritmos MCMC, como el metodo de Metropolis-Hastings (Sec-cion 1.5.2), el muestreador de Gibbs (Seccion 1.5.3) y el metodo de Monte Carlo Hamiltoniano (Seccion1.5.4), que son herramientas computacionales poderosas y utiles para aproximar la distribucion posterioren la que se basa la inferencia Bayesiana. En la actualidad, la literatura acerca de los metodos de MCMCse encuentra en desarrollo; para una revision acerca de metodos modernos en este sentido se recomiendaconsultar parte III de Gelman et al. (2014).

En inferencia Bayesiana, el metodo de Monte Carlo y los metodos MCMC cumplen el mismo proposito,generar secuencias de valores de θ que permitan describir o aproximar la distribucion posterior de θdados los datos. En el caso de la simulacion de Monte Carlo, se generan muestras independientes dep(θ | y) que se constituyen en una representacion directa de la distribucion posterior, hecho que no sepuede asegurar para el caso de las muestras que se obtienen mediante MCMC. Dada la dependenciaserial de las muestras que surgen a traves de MCMC, no es posible garantizar que estas proporcionenuna distribucion empırica proxima a la distribucion posterior en un cierto numero de iteraciones, en otraspalabras, debido a la autocorrelacion entre los valores consecutivos de la cadena no se tiene certeza queesta explore completamente el espacio de parametros y por ende, que converja a la distribucion p(θ | y),por ello, la implementacion de los metodos MCMC conlleva a afrontar el problema de la autocorrelacionası como la cuestion de evaluar la convergencia de la cadena a la distribucion objetivo, p(θ | y).

Evaluar la convergencia y la precision con la que la que las cadenas se aproximan a la distribucionposterior mediante el uso de algoritmos MCMC no es facil, de hecho, en la practica es comun diagnosticarla no convergencia, de manera informal, a traves de representaciones graficas (de autocorrelacion ydel comportamiento de la cadena) o con algunas medidas numericas como el tamano efectivo de lamuestra y la estadıstica R (Gelman et al., 2014). Aunque varios autores han propuesto estrategias paraexaminar convergencia (Gelman et al., 1992; Geweke et al., 1991; Raftery and Lewis, 1991), sus trabajoshan resaltado el problema de establecer tales diagnosticos y no han garantizado un metodo adecuadopara evaluarla (Geyer, 1992). En consecuencia, para alcanzar una buena aproximacion a la distribucionobjetivo, utilizando algoritmos MCMC, se recomienda simular la cadena un numero lo suficientementegrande de veces, de hecho, un numero mayor de iteraciones en comparacion a las que se utilizarıan conel metodo de Monte Carlo (Hoff, 2009).

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 9: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 9

El incremento en el numero de iteraciones permite adelgazar la cadena con el proposito de disminuir laautocorrelacion entre muestras. Para ello, es usual descartar los valores iniciales de la cadena (periodode calentamiento) ası como tomar muestras sistematicas de la misma (adelgazamiento). Tambien seacostumbra iniciar varias cadenas en diferentes puntos del espacio de parametros para probar si todasse aproximan a la misma distribucion estacionaria. En el proceso de aproximacion a la distribucionposterior de θ, a traves de MCMC, se pueden presentar limitaciones de procesamiento (tiempo) y/oalmacenamiento (memoria), dependiendo de la cantidad de parametros y la complejidad del modelo. Acontinuacion se presenta formalmente de cada uno de los algoritmos MCMC mencionados.

1.5.1. Metodo de Monte Carlo.

Sea θ el parametro de interes y sea y una muestra de valores observados de una distribucion posteriorp(θ | y). Suponga que se toma una muestra de tamano B, aleatoria, independiente e identicamentedistribuida (i.i.d) de p(θ | y), i.e.,

θ(1), · · · , θ(B) i.i.d∼ p(θ | y)

Luego, la distribucion empırica del conjunto de valores θ(1), · · · , θ(B) se conoce como una aproximacionde Monte Carlo para la distribucion objetivo p(θ | y); la distribucion empırica proporciona una versionmas cercana a la distribucion objetivo verdadera, en la medida que B se incrementa. En la practica seacostumbra elegir B, lo suficientemente grande, de tal manera que el error estandar de Monte Carlo (i.e.,la aproximacion a la desviacion estandar de las muestras de Monte Carlo) sea menor que la precisioncon la que se quiere reportar una cantidad posterior de interes (Hoff, 2009). Adicionalmente, si g(θ) escualquier funcion de θ, la ley de los grandes numeros senala que, si θ(1), · · · , θ(B) son muestras i.i.d. dep(θ | y), entonces

1

B

B∑b=1

g(θ(b))→ E[g(θ) | y] =

∫Θ

g(θ)p(θ | y) dθ cuando B →∞

En consecuencia, cualquier caracterıstica (medidas de tendencia central, variabilidad, percentiles, ladistribucion acumulada, etc.) de la distribucion posterior p(θ | y) se puede estimar con una muestra deMonte Carlo lo suficientemente grande. Son varios los problemas estadısticos en los que se ha aplicadoel metodo de Monte Carlo (ver Rubinstein and Kroese, 2016; Robert and Casella, 2013), en particular,en el enfoque Bayesiano, resulta util para hacer muestreo de distribuciones predictivas (ver Hoff, 2009;Jackman, 2009), evaluar el ajuste del modelo (ver Gelman et al., 1996; Guttman, 1967; Johnson et al.,2007; Rubin, 1984), ası como para generar medidas directas de discrepancia (como el valor p predictivoposterior) entre cantidades observadas y sus respectivas predicciones (ver De la Horra and Rodriguez-Bernal, 2001; Bayarri and Berger, 2000; Meng et al., 1994; Steinbakk and Storvik, 2009).

1.5.2. Metropolis-Hastings

El algoritmo Metropolis-Hastings es un metodo generico que permite obtener una aproximacion de ladistribucion posterior bajo cualquier combinacion de distribucion previa y verosimilitud, i.e., es un meto-do que se aplica a analisis conjugados, semiconjugados y no conjudados. Su aplicacion es adecuada enlos casos donde no es posible tomar muestras de forma directa de la distribucion posterior, ya sea por sucomplejidad matematica o porque no es estandar.

La aproximacion a la distribucion posterior se hace a traves de la construccion de una Cadena de Markov,que genera una coleccion de valores θ(1), · · · , θ(B) cuya distribucion empırica (denominada estacionaria)se aproxima a p(θ | y), en otras palabras, es un algoritmo iterativo que define un conjunto de “reglas desalto”que generan una cadena sobre el espacio de parametros Θ, con distribucion proxima a la distribucion

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 10: M etodos Bayesianos para caracterizar el comportamiento ...

10 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

objetivo p(θ | y). Al inicio de la iteracion se tiene θ(b−1), luego se hace la transicion a θ(b), mediante elsiguiente procedimiento (Gelman et al., 2014; Jackman, 2009):

1. Se simula un valor candidato θ∗ cercano a θ(b−1), de una distribucion de salto, propuesta o candi-data, J(θ∗ | θ(b−1)). Usualmente, J(θ∗ | θ(b−1)) es una distribucion que genera valores θ∗ cercanosa θ(b−1) con una alta probabilidad (Hoff, 2009).

2. Se calcula la razon

r =p(θ∗ | y)/J(θ∗ | θ(b−1))

p(θ(b−1) | y)/J(θ(b−1) | θ∗)donde r es una tasa de aceptacion que refleja la plausibilidad del valor candidato θ∗ relativa alvalor actual θ(b−1).

3. Se determina la probabilidad de transicion, del valor candidato, mediante

α = mın{r, 1}

Ası, si el valor candidato aumenta la probabilidad de la distribucion posterior, se acepta conprobabilidad 1 pero si el valor candidato no aumenta la probabilidad de la distribucion posterior,se acepta con probabilidad r. Usualmente r se trabaja en escala logarıtmica para lograr estabilidadnumerica a la hora de hacer la implementacion computacional.

4. Se genera un valor aleatorio de la distribucion uniforme, U ∼ (0, 1).

5. Si U ≤ α entonces θ(b) = θ∗ y en caso contrario, θ(b) = θ(b−1).

Se puede demostrar que el esquema anterior, independientemente de la forma de distribucion propuestay del valor inicial, genera una cadena de Markov que se aproxima a la distribucion posterior p(θ | y)mediante su distribucion invariante (Jackman, 2009; Hoff, 2009). Este algoritmo genera una secuenciade valores de θ dependientes donde θ(b) depende de θ(0), · · · , θ(b−1) solo a traves de θ(b−1), es decir,una cadena de Markov donde θ(b) es condicionalmente independiente de θ(0), · · · , θ(b−2) dado θ(b−1).Esta correlacion hace que la cadena de Markov requiera de varias iteraciones para obtener una buenaaproximacion de p(θ | y), esto debido a que la cantidad de informacion que se obtiene sobre θ de Bmuestras correlacionadas positivamente es menor a la informacion que se obtiene a partir de B muestrasindependientes (Hoff, 2009). Con las muestras que genera el algoritmo se puede estimar cualquier cantidadde interes al igual que en la aproximacion de Monte Carlo.

1.5.3. Muestreador de Gibbs.

Cuando la distribucion posterior es difıcil de muestrear directamente, en ocasiones, resulta mas facil tomarmuestras de la distribucion condicional completa p(θi | θ1, · · · , θi−1, θi+1, · · · , θk,y) de cada parametroθi, donde i = 1, · · · , k. En tales casos, se puede hacer una aproximacion a la distribucion posterior conel muestreador de Gibbs; un algoritmo iterativo, considerado un caso especial de Metropolis-Hastings,en el sentido de que cada componente de θ se actualiza secuencialmente utilizando como distribucion

de salto la distribucion condicional p(θi | θ(b)1 , · · · , θ(b)

i−1, θ(b−1)i+1 , · · · , θ(b−1)

k ,y) donde b = 1, · · · , B. Laparticularidad del muestreador de Gibbs, implica que la tasa de aceptacion r siempre sera de 1 y quecada valor candidato siempre se acepta (Jackman, 2004).

Dado el estado actual de los parametros θb−1 = (θ(b−1)1 , · · · , θ(b−1)

k ) se actualiza el estado del conoci-miento sobre los mismos generando muestras θ(b) desde θ(b−1), como sigue

1. Simular θ(b)1 ∼ p(θ1 | θ(b−1)

2 , θ(b−1)3 , · · · , θ(b−1)

k )

2. Simular θ(b)2 ∼ p(θ2 | θ(b)

1 , θ(b−1)3 , · · · , θ(b−1)

k )...

k. Simular θ(b)k ∼ p(θk | θ(b)

1 , θ(b)2 , · · · , θ(b)

k−1)

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 11: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 11

Este algoritmo genera una secuencia de vectores dependientes

θ(1) = (θ(1)1 , · · · , θ(1)

k )

θ(2) = (θ(2)1 , · · · , θ(2)

k )...

θ(B) = (θ(B)1 , · · · , θ(B)

k )

Esta secuencia, al igual que en los dos metodos descritos, se puede utilizar para estimar cualquier carac-terıstica de interes de cada θ.

1.5.4. Metodo de Monte Carlo Hamiltoniano.

Una posible ineficiencia inherente al muestreador de Gibbs y el algoritmo de Metropolis-Hastings, radicaen su comportamiento de caminata aleatoria local (Gelman et al., 2014), el cual hace que a la cadena letome demasiado tiempo explorar eficientemente la distribucion posterior. Tal comportamiento conllevaa que el algoritmo tarde en converger, particularmente, cuando se trata de modelos complejos comoaquellos que conducen a distribuciones posteriores de alta dimension (Betancourt, 2019).

Un algoritmo alternativo para superar tal ineficiencia es el metodo de Monte Carlo Hamiltoniano (HMCpor sus siglas en ingles), un muestreador que incorpora para el parametro θ una variable de “ impulso”ϕ, con el fin de explorar mas rapidamente la distribucion objetivo mediante movimientos en diferentestrayectorias, suprimiendo el movimiento de caminata aleatoria local que describen otros muestreadores(Betancourt, 2017; Betancourt, 2019). Tanto θ como ϕ se actualizan conjuntamente en un algoritmo deMetropolis, en el que la distribucion de propuestas para θ se determina a traves de ϕ.

En un algoritmo Hamiltoniano, la densidad posterior p(θ | y) se aumenta mediante la distribucion deimpulso p(ϕ) y las simulaciones se hacen desde la distribucion conjunta p(θ, ϕ | y) = p(ϕ)p(θ | y);sin embargo, solo son de interes las simulaciones de θ, dado que el vector ϕ opera como una variableauxiliar, introducida para permitir que el algoritmo se mueva de manera eficiente a traves del espacio deparametros. Este algoritmo procede como sigue:

1. Simular ϕ ∼ N(0,M), donde M es una matriz diagonal que representa la matriz de covarianza dela funcion de impulso p(ϕ).

2. Actualizar simultaneamente (θ, ϕ), mediante L saltos escaldados por un factor ε. En un paso desalto, tanto θ como ϕ cambian uno en relacion al otro como sigue:

a) Actualizar ϕ:

ϕ← ϕ+1

2εd log p(θ | y)

b) Actualizar θ:θ ← θ + εM−1ϕ

c) Repetir los pasos anteriores L− 1 veces.

3. Sean θ(b−1) y ϕ(b−1) los valores iniciales de θ y ϕ respectivamente, y θ∗, ϕ∗ los valores correspon-dientes despues de los L pasos. Se calcula la razon

r =p(θ∗ | y)p(ϕ∗)

p(θ(t−1) | y)p(ϕ(t−1))

donde r es la tasa de aceptacion que refleja la posibilidad relativa del valor candidato θ∗ frente alvalor actual θ(b−1).

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 12: M etodos Bayesianos para caracterizar el comportamiento ...

12 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

4. Establecer θ(b) = θ∗ con probabilidad mın{r, 1}, o θ(b) = θ(b−1) con probabilidad 1−mın{r, 1}.

Ver Gelman et al. (2014) para detalles mas especıficos acerca de este algoritmo.

1.6. Bondad de ajuste de modelos Bayesianos.

Luego de establecer la estructura del modelo y aproximar la distribucion posterior p(θ | y), es conve-niente evaluar el ajuste del modelo, para detectar inferencias enganosas a causa de un modelo deficiente.Formalmente, se verifica la bondad de ajuste modelo mediante validacion externa, procedimiento queconsiste en utilizar p(θ | y) para hacer replicas hipoteticas del fenomeno, yrep, obtenidas a partir de ladistribucion predictiva posterior, p(yrep | y) =

∫p(yrep | θ)p(θ | y) dθ , a fin de contrastarlas con los datos

observados, y, e identificar si existe una consistencia entre tales replicas y la realidad. En otras palabras,si el modelo presenta un buen ajuste, entonces los datos replicados deben presentar un comportamientosimilar al de los datos observados.

Ası, la discrepancia entre el modelo y los datos se examina a traves de cantidades denominadas estadısticosde prueba (e.g., medidas de tendencia y variabilidad), t(y, θ). Estas cantidades son un resumen escalar,que se utilizan como medida estandar para comparar el comportamiento de las observaciones con lassimulaciones predictivas, y ademas permiten verificar los aspectos relevantes del conjunto de datos quese reproducen de forma razonable con el modelo propuesto.

La falta de ajuste de los datos con respecto a la distribucion predictiva posterior, se mide a traves delvalor p Bayesiano o valor p predictivo posterior, ppp = Pr(t(yrep, θ) ≥ t(y, θ) | y), el cual se puedeinterpretar como la probabilidad de que los datos replicados sean mas extremos que los datos. Ası, unmodelo Bayesiano presenta un buen ajuste con respecto al estadıstico t si y solo si el ppp no asumevalores extremos como 0 o 1 (Gelman et al., 2014).

1.7. Evaluacion y contraste de modelos Bayesianos.

Los criterios de informacion permiten evaluar y comparar modelos a traves de su rendimiento predictivo.Se distinguen principalmente el criterio de informacion de la devianza (DIC, por sus siglas en ingles; verGelman et al., 2014; Spiegelhalter et al., 2002) y el criterio Watanabe-Akaike (WAIC, por sus siglas eningles; ver Gelman et al., 2014; Watanabe, 2013).

El DIC se define como

DIC = −2 log p(y | θBayes) + 2pDIC ,

donde θBayes = E(θ | y) ≈ 1B

∑Bb=1 θ

(b) es la media posterior de θ, y pDIC al numero efectivo deparametros,

pDIC = 2[log p(y | θBayes)− Eposterior(log p(y | θ))

].

En la practica, el pDIC se calcula como sigue:

pDIC = 2

[log p(y | θBayes)−

1

B

B∑b=1

log p(y | θ(b)

)].

Por otro lado, el WAIC se define como

WAIC = −2lppd + 2pWAIC,

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 13: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 13

donde el lppd = log∏ni=1 p(yi | y) =

∑mi=1 log

∫Θp(yi | θ)p(θ | y)dθ ≈

∑mi=1 log

(1B

∑Bb=1 p

(yi | θ(b)

)),

es la distribucion predictiva posterior en escala logarıtmica, la cual resume la capacidad predictiva delmodelo ajustado a los datos.

El numero de efectivo de parametros correspondiente, pWAIC, se especifica mediante

pWAIC = 2

n∑i=1

[log(Eposteriorp(yi | θ))− Eposterior(log p(yi | θ))] ,

y en la practica se calcula como

pWAIC = 2

k∑i=1

[log

(1

B

B∑b=1

p(yi | θ(b))

)− 1

B

B∑b=1

log p(yi | θ(b))

].

En el contraste de modelos, los valores mas bajos de DIC y WAIC implican una mayor precision predic-tiva.

Aunque el DIC se usa ampliamente como una herramienta para la seleccion de modelos, tiene una serie dedesventajas frente a otras medidas de precision predictiva como el WAIC. Las crıticas comunes incluyen:la penalizacion, pDIC, no es invariable a la reparametrizacion; el DIC puede no ser consistente frente areplicas identicas de un mismo experimento; el DIC no se basa en un criterio predictivo completamenteBayesiano (ver Spiegelhalter et al., 2014, para mas detalles). Por su parte, el WAIC aborda muchas deestas crıticas. En particular, este es invariante a las reparametrizaciones, lo cual lo hace util para el casode modelos con estructuras jerarquicas, en los cuales el numero de parametros aumenta con el tamanode la muestra (Spiegelhalter et al., 2014).

1.8. Modelos de votacion espacial: contexto historico.

La eleccion colectiva es un fenomeno de estudio interesante en el contexto polıtico, dado que las preferen-cias de los electores no son perfectamente homogeneas (Krehbiel, 1988); en el caso de cuerpos deliberantescomo el congreso, los legisladores muestran opiniones diferentes frente al tipo de polıticas que se debenadoptar, esto conlleva a un conflicto de opiniones e intereses colectivo producto de un comportamien-to individual. A traves de los modelos de votacion espacial se busca representar ese fenomeno, bajo elsupuesto de que sujetos diferentes (legislador, juez, ciudadano, etc.) tienen preferencias distintas sobreobjetos o alternativas de eleccion (candidatos, polıticas, propuestas, mociones, etc.).

La mayor parte de los trabajos teoricos sobre modelos de votacion espacial, ha supuesto una funcionde utilidad normal o cuadratica (Carroll et al., 2013), hipotesis que tiene sustento en el campo de lapsicologıa y las matematicas. Trabajos en el area de la psicologıa han senalado que la funcion de respuestade los individuos cuando juzgan similitudes entre ciertos estımulos o manifiestan sus preferencias esaproximadamente normal (Poole, 2005) y estudios en el campo de las matematicas han mostrado queesta forma gaussiana se puede aproximar a una forma cuadratica mediante una serie de potencias deprimer orden (Carroll et al., 2009a).

Suponer una funcion de utilidad cuadratica en los modelos de votacion espacial, no es solo una abstraccionmatematica conveniente, es una formulacion estandar que permite captar el tipo de respuesta que seespera tenga un individuo cuando se enfrenta a una eleccion. Desde esta perspectiva, cada sujeto tieneuna funcion de utilidad centrada en un punto ideal (alternativa optima) que lo caracteriza y desde elcual su utilidad se declina a medida que aumenta la distancia entre su punto ideal y las alternativas deeleccion; ası, cada individuo vota por la alternativa que le resulta mas “cercana” (segun la metrica quese defina sobre el espacio de referencia), en terminos matematicos o probabilısticos.

Es este sentido, un modelo de votacion espacial ofrece un representacion que resume el comportamientode los individuos en un proceso electoral y permite visualizar el mundo polıtico en un contexto especıfico

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 14: M etodos Bayesianos para caracterizar el comportamiento ...

14 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

como el de una legislatura; ası, la cercanıa de legisladores en el espacio polıtico muestra similaridaden sus registros de votacion y senala la presencia de rasgos latentes (no observados, e.g. la ideologıa)subyacentes a su comportamiento electoral (Poole, 2005). Esta representacion resulta util para estudiardiversos temas, por ejemplo, la evolucion de los partidos polıticos en el tiempo, las posiciones optimaspara ganar una contienda, la existencia de votaciones estrategicas, la representacion de minorıas encuerpos deliberantes, intereses e incentivos electorales, las relaciones entre instituciones, entre otros. Noobstante, para que esta representacion cobre sentido en el contexto polıtico y sea interpretable, se requiereque varios aspectos teoricos converjan (Poole and Rosenthal, 1985): (i) los fundamentos matematicos yestadısticos del modelo de votacion espacial, (ii) la teorıa que explica la manera como los electores tomandecisiones, (iii) los elementos que dan cuenta de los sistemas de creencias (ideologıa) de los votantes, loscuales estan ligados a los supuestos del modelo y la toma de decisiones; (iv) la teorıa que ofrece unacomprension sustancial del sistema polıtico en el que se incrustan las instituciones objeto de analisisy (v) los fundamentos computacionales que incorporan los primeros cuatro aspectos y que generan lasrepresentaciones y resultados relevantes.

Tal concurrencia teorica permite abarcar una gran variedad de tematicas polıticas; tan amplia que laaplicacion de estos modelos ha conducido a una numerosa y variada literatura, la cual ha fluctuadoentre los intereses propios de la ciencia polıtica y la busqueda de metodos cuantitativos que resultenapropiados para caracterizar el comportamiento electoral. Los trabajos de Black et al. (1958) y Downs(1957), sientan las bases de la teorıa del voto, pero no presentan una estructura matematica rigurosaa partir de la cual se pueda disenar instrumentos de medicion para probar teorıa polıtica (Poole andRosenthal, 1985); esta falencia, senala un campo abierto para la investigacion cuantitativa y metodologicaen el contexto polıtico. Los primeros modelos de votacion espacial que presentan una teorıa susceptible deprueba empırica, aparecen casi una decada mas tarde y se centran en operacionalizar el comportamientoelectoral para dar respuesta a las condiciones bajo las cuales existe una alternativa ganadora en unaeleccion por mayorıa, especıficamente, en conocer la posicion del espacio polıtico que debe adoptar uncandidato para ganar una contienda electoral (Davis and Hinich, 1965; Davis et al., 1970; Hinich andOrdeshook, 1970). Estas investigaciones, establecen las bases matematicas de la teorıa espacial del voto(Arrow, 1990), particularmente, introducen y formalizan el concepto de funcion de utilidad, senalandosu importancia para cuantificar la distancia entre la posicion del elector y las alternativas de votacionen el espacio polıtico, ası como para modelar las preferencias del electorado; esta primera version, de losmodelos de votacion espacial, no contempla una componente aleatoria en la votacion (Poole, 2005).

Luego de estos desarrollos, fue tal el crecimiento de la teorıa espacial del voto en el ambito de las cien-cias polıticas, que para dar cuenta de sus avances posteriores algunos autores sugirieron subdividirla enteorıa espacial de comites y teorıa espacial de elecciones (Arrow, 1990). En la primera los votantes sonlos actores clave y el interes se centra en explicar o predecir su comportamiento de votacion cuando seenfrentan a diferentes alternativas polıticas; mientras que en la segunda los actores clave son los candi-datos (competidores) y el interes radica en explicar o predecir el comportamiento optimo del candidatopara maximizar los votos esperados o la probabilidad de ganar. En principio estas dos lıneas se traba-jan de forma indistinta y las formulaciones teoricas las influenciaron de manera conjunta, de ahı que seencuentren resultados y procedimientos analogos a pesar de su diferencia (Arrow, 1990).

Los trabajos enfocados en explicar el comportamiento de votacion en los comites tienen una base teoricainicial en la teorıa de juegos (Aumann, 1964; McKelvey et al., 1978). Estos se enfocaron en esclarecerconducta electoral estrategica a traves de juegos cooperativos y aunque permitieron explorar algunasideas no arrojaron resultados generales del comportamiento de votacion (Arrow, 1990); es por ello, quea finales de los 70 la investigacion cientıfica se direcciona hacia otras metodologıas. Trabajos posterioresexploran las propiedades matematicas de la funcion de utilidad y se basan en la teorıa de la agendapara dar cuenta del papel que tienen las estructuras y los procedimientos en la configuracion de losresultados de votacion legislativa (Romer and Rosenthal, 1978; Shepsle, 1979). Estos estudios, arrojaronconclusiones en relacion a la forma en la que el comportamiento de votacion se ve afectado por el poderpara determinar que polıticas se someten a votacion, en que orden y el metodo que se utiliza para dividirlas propuestas que se votan.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 15: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 15

A finales de los 70, la investigacion cuantitativa de la conducta electoral se direcciona hacia la aplicacionde metodos de analisis multivariado para identificar patrones en el comportamiento del electorado. En estaepoca, se dan varios aportes importantes para el modelamiento de votacion en los comites: se desarrollala teorıa probabilıstica del comportamiento de los votantes (Coughlin and Nitzan, 1981; Manski, 1977) yse introduce el concepto de dimensiones predictivas o latentes (Enelow and Hinich, 1984) bajo el soportede metodos de escalamiento multidimensional (Cahoon et al., 1978; Wolters, 1978), los cuales permitenescalar respuestas binarias y politomicas, resultantes de una votacion, como una variable continua en unespacio euclidiano de baja dimension.

La teorıa probabilıstica del comportamiento de los votantes da paso a los primeros modelos en los cualesse asume el voto como una variable aleatoria ası como modelos que postulan funciones de utilidadestocasticas, es decir, funciones que no solo dependen de la distancia entre el punto ideal del elector yla alternativa de votacion sino que tambien incorporan un error aleatorio (McFadden, 1976; Poole andRosenthal, 1984). Estos choques aleatorios permiten vincular las diferencias sistematicas de la utilidadespacial a las probabilidades de votar por cada alternativa. En la literatura, se ha supuesto que dichoserrores aleatorios pueden tener distribucion logıstica o normal, lo que conduce a una funcion de enlacelogit o probit, respectivamente (Carroll et al., 2009a; Jackman, 2004); ademas se ha mostrado, que estosdos procesos de error conducen a resultados similares y que la eleccion entre el uno o el otro presentadiferencias arbitrarias de escala pero no tiene efecto sobre las estimaciones de los parametros del modelode votacion espacial en consideracion (Hahn and Soyer, 2005; Carroll et al., 2009a; Lofland et al., 2017).

Por otro lado, los trabajos alrededor del concepto de dimensiones predictivas senalan una metodologıapropicia para localizar objetos de eleccion y electores en un mismo espacio de baja dimensionalidad, asıcomo para modelar similitudes entre votantes a partir de distancias entre puntos en el espacio polıti-co (Poole and Rosenthal, 1984; Weisberg and Rusk, 1970). En esta direccion, surgen investigacionesencaminadas a dar una mayor relevancia e interpretar la dimension del espacio polıtico, asociandolacon temas, polıticas o sistemas de creencias (Cahoon et al., 1978; Poole and Rosenthal, 1985; Hinichand Munger, 1996; Hinich et al., 1997). En este escenario, la decision frente al numero de dimensionesque debe tener el espacio polıtico encuentra conexion con otras teorıas y adquiere un significado. Porejemplo, investigaciones en el contexto polıtico norteamericano, senalan que el numero de dimensionesnecesarias para representar las posiciones de los objetos de eleccion y de los electores en el congreso debeser “pequeno”, porque los legisladores tienden a decidir su voto sobre la base polıtica que subyace en susposiciones (izquierda–derecha, republicano–democrata), en tanto, solo se requiere de unas dimensionesbasicas para capturar la estructura del comportamiento de votacion en el parlamento (Cahoon et al.,1978; Poole, 2005). Por otro lado, investigaciones en el contexto de la psicologıa tambien soportan elhallazgo de la baja dimensionalidad. Trabajos en este campo, senalan que la aplicacion de metodos mul-tivariados en estudios de percepcion muestran como caracterıstica comun una baja dimension subyacenteen el comportamiento de eleccion de los individuos (Poole, 2005). Especıficamente, se expone que la bajadimensionalidad se debe a que las personas tienen una capacidad limitada para percibir objetos distintos(Miller, 1956) y que ademas presentan tendencia al enfrentamiento de grupo contra grupo (Tajfel, 1981).En concordancia, tanto estudios en el contexto polıtico como psicologico apoyan la idea de requerir a lomas tres dimensiones para explicar el comportamiento electoral (e.g. Poole and Rosenthal, 1984).

Los modelos de votacion espacial fundamentados en tecnicas de reduccion de datos como el escalamientomultidimensional (Cahoon et al., 1978), analisis factorial (Brazill and Grofman, 2002), analisis de com-ponentes principales (De Leeuw, 2006), entre otros, no permiten modelar directamente las respuestasbinarias de los individuos en funcion de los parametros de interes, ya que, no proporcionan un marcometodologico para recuperar puntos ideales de los votantes ni para modelar la probabilidad de votoindividual (Jackman, 2001). En este sentido y frente al interes de los investigadores por explicar el com-portamiento individual de los miembros del congreso, a mediados de los 80, se da paso al desarrollo delos modelos de votacion parlamentaria (Poole and Rosenthal, 1985), enfocados especıficamente en laslegislaturas con el proposito de estimar puntos ideales de los diputados y recuperar los rasgos latentes(preferencias polıticas) que subyacen a la votacion. Estos modelos, desde sus inicios, combinan modeloslineales generalizados (McCullagh, 2018) y metodos iterativos (como los metodos de Monte Carlo y elbootstrap parametrico; e.g. Carroll et al., 2009a; Carroll et al., 2009b; Lewis and Poole, 2004; Martin and

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 16: M etodos Bayesianos para caracterizar el comportamiento ...

16 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

Quinn, 2002) para muestrear las distribuciones de probabilidad de los parametros del modelo a partirde registros de votacion nominal (votacion que sigue el llamado a lista para elegir a favor o en contra deuna mocion) (Poole, 2005; Poole and Rosenthal, 1985; Poole and Rosenthal, 1987).

En este escenario, la votacion nominal adquiere una mayor relevancia dado que se reconoce como una delas formas de comportamiento individual que emplean los legisladores para revelar sus preferencias a losdemas parlamentarios, al ejecutivo y a los ciudadanos mientras estan en el cargo (Mayhew, 1974). Desdeentonces, se ha constituido en una actividad polıtica que ilustra la toma de decisiones y provee a loscientıficos sociales datos que son insumo para estimar puntos ideales y recuperar las preferencias polıticasde los miembros del parlamento (Aleman et al., 2009). Trabajos previos relacionados con el analisis dedatos de votacion nominal (e.g., MacRae, 1952; MacRae, 1958; MacRae, 1965), muestran que antes delos 80, este tipo de datos no fueron empleados predecir la decision de voto individual; se utilizaron parala aplicacion de tecnicas como el analisis factorial y de conglomerados, con el proposito de estudiar lacorrelacion entre miembros de la legislatura utilizando matrices de varianzas y covarianzas (Poole, 2005).La mayorıa de los trabajos relacionados con votacion nominal, han considerado solo datos binarios, esdecir, dos alternativas de votacion, a favor (“SI”) y en contra (“NO”) de una mocion (estas alternativastambien se suelen denominar “proyecto de ley” y “status quo”, respectivamente; Carroll et al., 2009a).En la literatura son pocos los estudios que consideran abstenciones y votaciones multiples (Poole, 2005;Rosas et al., 2015; Thurner, 2000).

El trabajo de Poole and Rosenthal (1985), es el fundamento de una serie de investigaciones que proponenmodelos alternativos, estimadores y paquetes de software, para recuperar puntos ideales y variableslatentes en un espacio polıtico, a partir de datos de votacion nominal. Particularmente, de esta propuestaemergen dos modelos lideres NOMINATE e IDEAL (los detalles teoricos de este ultimo, se presentan enla Seccion 1.9), ambos basados en modelos de comportamiento (funciones de utilidad aleatorias) paraderivar estimadores estadısticos (Carroll et al., 2009a), pero disenados bajo paradigmas diferentes, unofrecuentista y otro Bayesiano, respectivamente. Aunque en principio solo fueron abordados para analizarel comportamiento de los diputados en el Senado y la Camara de Representantes, principalmente de losEstados Unidos (Poole, 2005), su aplicacion se ha ampliado a otros contextos no legislativos como lasNaciones Unidas (e.g., Voeten, 2000; Voeten, 2013; Bailey et al., 2017) y las cortes judiciales (Martinand Quinn, 2002).

NOMINATE cobija diferentes versiones de un modelo inicial (1982 -1984) que se nombro bajo esta mis-ma denominacion y se caracterizo por ofrecer estimaciones de los parametros del modelo de votacionespacial en un espacio unidimensional. Su exito radico en la capacidad para incorporar la componentealeatoria de la funcion de utilidad en la estimacion de puntos ideales, mostrando una mejor clasificacionde registros de votacion, frente a otras herramientas que operaban sobre funciones de utilidad deter-ministas (Poole, 2005). Posteriormente, se diseno e implemento D-NOMINATE (1986) (Poole, 2005),una version extendida de NOMINATE que opera bajo la misma filosofıa pero que permite el trabajocon modelos multidimensionales dinamicos; ambas versiones fueron desarrolladas en FORTRAN (Carrollet al., 2009a). La decada de los 90 se enmarca en la exploracion y aplicacion de estos dos modelos, y enel desarrollo e implementacion de otras dos versiones, W-NOMINATE (1991) y DW-NOMINATE (1997)(Carroll et al., 2009a), las cuales proporcionan los primeros analisis unidimensionales y multidimensio-nales dinamicos ponderados de datos de votacion nominal, respectivamente; estas ultimas cuentan conuna implementacion en R a traves del paquete wnominate (Poole et al., 2018).

NOMINATE se convirtio en un modelo estandar y se ha utilizado en cientos de publicaciones relevantestanto en ciencias polıticas como en economıa (Carroll et al., 2009a). Los estudios que han reportadoanalisis de votacion parlamentaria utilizando alguna version de NOMINATE, han senalado que es unametodologıa que permite analizar el comportamiento individual de los legisladores y recuperar la posicionmedia entre alternativas de votacion; ademas, han mostrado que los resultados que se obtienen sonsimilares a los alcanzados con otros metodos como el clasificacion optima (Carroll et al., 2009a; Poole,2005), el cual tambien se deriva de la propuesta de Poole and Rosenthal (1985) (detalles del mismo sepueden encontrar en Poole, 2000).

A inicios del nuevo milenio, nace IDEAL (tambien denominado estimador de punto ideal o modelo

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 17: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 17

de votacion Bayesiano cuadratico; Clinton et al., 2004, Jackman, 2001), un modelo Bayesiano lider enla aplicacion de algoritmos MCMC para estimar puntos ideales de los legisladores a partir de datosde votacion nominal. IDEAL fue desarrollado originalmente en C como un programa independiente,pero ahora se puede implementar en R a traves de paquetes como pscl (Jackman et al., 2020), rstan(Carpenter et al., 2017), entre otros. El modelo basico cuenta con ampliacion a un modelo dinamicode punto ideal (Martin and Quinn, 2002) ası como con su respectiva implementacion en R a traves delpaquete MCMCpack (Martin et al., 2020). Este es el mas reciente de los modelos de votacion parlamentariacon enfoque Bayesiano.

En la literatura se senalan aspectos en los que distan y se asemejan IDEAL y NOMINATE (ver Carrollet al., 2009a; Clinton et al., 2004, para mas detalles). Algunos de estos son:

Los dos se basan en funciones de utilidad aleatorias euclidianas pero sus formas difieren. En IDEALlas preferencias de los legisladores se representan mediante funciones cuadraticas mientras que enNOMINATE tienen forma gaussiana escalada.

En ambos los parametros son latentes y estos solo se identifican hasta la eleccion de una escala. Enel caso de IDEAL, la escala se suele definir fijando dos legisladores en los extremos de la misma yrestringiendo los puntos ideales a tener media cero y varianza unitaria. En cambio, en NOMINATEes usual restringir los puntos medios entre alternativas de votacion al intervalo [−1, 1].

Dada su naturaleza, estos difieren en la tecnica de estimacion que utilizan para determinar losparametros del modelo. NOMINATE utiliza un algoritmo iterativo de maxima verosimilitud res-tringida mientras que IDEAL utiliza algoritmos MCMC.

Aspectos como los citados, han sido el punto de partida de una serie de trabajos comparativos que hanbuscado identificar las ventajas y desventajas de cada estimador ası como reconocer cual es el metodomas apropiado para analizar datos de votacion nominal (Carroll et al., 2009a; Clinton et al., 2004; Clintonand Jackman, 2009). Una de las desventajas que presenta NOMINATE frente a IDEAL, es el uso demetodologıas adicionales (por lo general ad-hoc) para hacer inferencia sobre los parametros del modeloy estimar cantidades auxiliares. Trabajos en la direccion de NOMINATE, han reportado la aplicacionde “bootstrap” parametrico para medir el sesgo e incertidumbre de las estimaciones de puntos idealesası como para calcular errores estandar y construir intervalos de confianza para cantidades auxiliaresde interes (Lewis and Poole, 2004; Carroll et al., 2009b). En este sentido, IDEAL se muestra como unestimador mas sencillo, en terminos de su aplicacion, puesto que solo requiere del teorema de Bayes paralos procesos de estimacion e inferencia.

En la vıa de reconocer ventajas y desventajas de cada modelo, estudios iniciales buscaron establecercondiciones bajo las cuales un estimador presenta una prelacion frente al otro. Algunas investigacio-nes, senalaron que las diferencias entre estos dos estimadores se presentaban cuando el tamano de lalegislatura era grande (Lewis and Poole, 2004; Hagemann, 2007; Clinton et al., 2004), en cambio, otrasmostraron diferencias mas sustanciales para cuerpos de votacion mas pequenos (Clinton et al., 2004)e incluso algunas citaron que las diferencias se daban cuando se busca identificar posiciones de interescomo el miembro medio del cuerpo legislativo (Carroll et al., 2009a). Sin embargo, estudios posteriores,concluyeron que las discrepancias senaladas en trabajos previos no justificaban una ventaja practica deun modelo sobre otro, y sostuvieron que las diferencias surgen producto de la identificacion arbitraria ylas restricciones impuestas por cada metodo (Carroll et al., 2009a; Clinton and Jackman, 2009).

En la actualidad, gracias al incremento en la capacidad de computo, la brecha entre IDEAL y NOMINA-TE es reducida, en terminos de la incertidumbre asociada a la estimacion de los parametros del modeloy cantidades auxiliares de interes (Lewis and Poole, 2004). Estudios demuestran que no hay diferenciasimportantes atribuibles unicamente a la implementacion de MCMC o el metodo de maxima verosimi-litud (Carroll et al., 2009a). Las ventajas que tiene un metodo sobre otro no radican en el proceso deestimacion e inferencia de los parametros, se centran en las caracterısticas propias de su formulacionmatematica y estadıstica, ası como en sus posibilidades de expansion para probar y analizar hipotesissustantivas.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 18: M etodos Bayesianos para caracterizar el comportamiento ...

18 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

IDEAL es un modelo cuyo enfoque tiene una correspondencia directa con naturaleza de la investigacioncientıfica en ciencias sociales (e.g., Jackman, 2004; Jackman, 2009), campo donde la inferencia estadısticaclasica no tiene sentido en muchas de sus aplicaciones (Clinton and Jackman, 2009), este es uno de losaspectos ventajosos frente a NOMINATE. Ademas es un estimador cuya formulacion (se soporta en unafuncion de utilidad cuadratica y las estimacion e inferencias solo requieren del teorema de Bayes) e imple-mentacion (utiliza algoritmos de MCMC como el muestreador de Gibbs con seudo-datos aumentados) esmas sencilla y flexible en comparacion con otros metodos. Las formulaciones matematicas y estadısticasque sustentan a IDEAL, lo hacen generalizable, y por ende, lo postulan como un metodo que permiteabordar una amplia gama de preguntas (Clinton and Jackman, 2009).

La funcion de utilidad cuadratica que involucra IDEAL, permite que las estimaciones de los parametros sefundamentan en diferencias de utilidad lineales, que permite modelar la probabilidad de voto individualtomando como referente modelos de teorıa de respuesta al ıtem (IRT, por sus siglas en ingles; Albert,1992; Albert and Chib, 1993). Tener como base un modelo conocido y previamente aplicado en el campoeducativo, permite que la modelacion de datos de votacion nominal a traves de IDEAL se soporte endesarrollos, implementaciones e interpretaciones de IRT en el contexto Bayesiano (Albert, 1992; Albertand Chib, 1993; Clinton et al., 2004).

Adicionalmente, el enfoque Bayesiano de IDEAL, permite al investigador incorporar de forma rigurosaestados de informacion externos al analisis de datos de votacion nominal, utiles para explicar la con-figuracion de los resultados al interior de la legislatura. Por ejemplo, admite incorporar estados sobrela naturaleza de las dimensiones subyacentes al espacio polıtico para inspeccionar el tipo de propuestasde votacion que discriminan con respecto a cada dimension (Jackman, 2001). Otra ventaja relativa deIDEAL sobre NOMINATE, es la flexibilidad que ofrece para evaluar modelos alternativos en diferentescontextos (Carlin and Louis, 2008). Por ejemplo, Clinton et al. (2004), senala la manera como se pue-de extender el modelo para probar hipotesis sustantivas relacionadas con el cambio de partido; Quinn(2004), analiza la extension del mismo a datos no binarios incluidos los continuos; Treier and Jackman(2008), utiliza variantes del modelo para medir el nivel de democracia en un paıs; y Rosas et al. (2015),propone una variante del mismo para analizar el comportamiento de voto cuando la abstencion es unaopcion informativa.

Recientemente, estas extensiones tambien se han propuesto para estudiar el comportamiento de votacionen legislaturas con caracterısticas diferentes a las del contexto americano. Por ejemplo, Zucco (2013) hautilizado una variante de IDEAL para analizar las relaciones ejecutivo–legislativo en Uruguay entre 1985y 2005 bajo el contexto de coaliciones presidenciales. De otra parte, Tsai (2020) ha propuesto un modelopara analizar votaciones de la Camara de Diputados de Brasil en el periodo 2003–2006 destacando el efec-to que tienen los incentivos polıticos en el comportamiento electoral. Otras investigaciones recientes, hanpostulado a IDEAL como un modelo base para el desarrollo de otros modelos de votacion espacial Baye-sianos, que exploran el uso de metricas diferentes a la euclidiana con el proposito de explicar fenomenoslegislativos no abordados formalmente o para los cuales aun no se postulan explicaciones satisfactoriasdesde un punto de vista empırico (e.g., Yu and Rodriguez, 2019a; Yu and Rodriguez, 2019b).

Trabajos como los senalados anteriormente no solo destacan la ventaja de IDEAL frente a otros esti-madores sino que ademas resaltan su relevancia en la investigacion cuantitativa en ciencias sociales yponen en evidencia que el estudio de las preferencias polıticas de los legisladores a partir de registros devotacion nominal es aun un area de investigacion activa (Yu and Rodriguez, 2019b). En la literatura, sehace explıcito que este modelo es una herramienta importante para la investigacion en el campo (Yu andRodriguez, 2019a) y se advierte que es un instrumento metodologico y teorico dominante en la cienciapolıtica moderna (Moser et al., 2021). Esto justifica la eleccion del modelo de votacion espacial Baye-siano cuadratico como marco que fundamenta y motiva el desarrollo de un estudio que de cuenta delcomportamiento legislativo en el contexto colombiano. En la siguiente seccion se presentan los elementosteoricos del modelo en cuestion.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 19: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 19

1.9. Modelo de votacion espacial Bayesiano cuadratico.

Los datos de votacion nominal se generan cuando n legisladores votan a m mociones (proyecto de ley,artıculos, iniciativas legislativas, etc.); cada legislador i ∈ {1, . . . , n} debe tomar una posicion a favoro en contra de la mocion j ∈ {1, . . . ,m}, i.e., debe elegir entre votar “SI” o “NO” a cada una de laspropuestas que se le presentan. En la operacionalizacion del comportamiento de votacion legislativo, lasalternativas de votacion se representan como puntos en un espacio euclidiano d-dimensional (denominadoespacio polıtico) mediante ψj y ζj , para un voto a favor o en contra de la mocion j, respectivamente.

Sea yi,j ∈ {0, 1} el voto emitido por el legislador i en la mocion j, donde yi,j = 1 si el legislador vota“SI” y yi,j = 0 si el legislador vota “NO”. Se asume que cada legislador i tiene una preferencia polıticarepresentada por un factor latente (no observado) βi ∈ Rd denominado “punto ideal”. Ademas, bajoesta formulacion se asume que el legislador i toma decisiones a partir de su punto ideal, de acuerdocon funciones de utilidad cuadraticas aleatorias (2), las cuales se definen sobre el espacio de polıticas ydependen de las alternativas de votacion ψj y ζj , como sigue:

Ui(ψj) = − ‖ ψj − βi ‖2 +ηi,j Ui(ζj) = − ‖ ζj − βi ‖2 +υi,j (2)

donde Ui(ψj) y Ui(ζj) representan las utilidades del legislador i por votar “SI” o “NO” a la mocionj, respectivamente; ‖ · ‖ corresponde a la norma euclidiana en Rd, y finalmente, ηi,j y υi,j son lasdesviaciones estocasticas (choques aleatorios) producto de la incertidumbre asociada con los procesos devotacion, cuya distribucion conjunta es tal que E(ηi,j − υi,j) = 0 y Var(ηi,j − υi,j) = σ2

j . Los errores sonindependientes tanto de los legisladores como de las mociones (Jackman, 2004). Bajo estos supuestos yla teorıa de la eleccion racional (Clinton et al., 2004; Yu and Rodriguez, 2019b), se tiene que el legisladori vota “SI” a la propuesta j si y solo si Ui(ψj) > Ui(ζj), es decir

yi,j | ζj ,ψj , σj ,βi =

{1, si Ui(ψj)− Ui(ζj) > 0

0, en otro caso.

Lo anterior implica que

Pr(yi,j = 1 | ζj ,ψj , σj ,βi) = Pr(Ui(ψj)− Ui(ζj) > 0)

= Pr(‖ ζj − βi ‖2 − ‖ ψj − βi ‖2 +ηi,j − υi,j > 0)

= Pr(υi,j − ηi,j <‖ ζj − βi ‖2 − ‖ ψj − βi ‖2)

(3)

Dado que

‖ ζj − βi ‖2 = ζTj ζj − 2βTi ζj + βT

i βi

y

‖ ψj − βi ‖2= ψTj ψj − 2βT

i ψj + βTi βi

entonces,

‖ ζj − βi ‖2 − ‖ ψj − βi ‖2 = ζTj ζj −ψTj ψj + 2(ψj − ζj)Tβi.

Luego, si εi,j = (υi,j − ηi,j)/σj , µj = (ζTj ζj − ψTj ψj)/σj y αj = 2(ψj − ζj)/σj , la probabilidad (3) se

puede escribir como

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 20: M etodos Bayesianos para caracterizar el comportamiento ...

20 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

Pr(yi,j = 1 | ζj ,ψj , σj ,βi) = Pr(εi,j < µj +αTj βi) = G(µj +αT

j βi)

donde µj es el parametro de “aprobacion” a partir del cual se puede calcular la probabilidad de referenciade un voto positivo para la propuesta j; αj es el parametro de discriminacion o efecto del punto idealdel legislador i sobre la probabilidad de un voto positivo a la mocion j y G(·) una funcion de enlaceapropiada. Por ejemplo, si εi,j sigue una distribucion Normal estandar, entonces G conduce a un modeloprobit,

G(µj +αTj βi) = Φ(µj +αT

j βi) (4)

donde Φ es la distribucion acumulada de la Normal estandar; mientras que si εi,j sigue una distribucionLogıstica estandar, entonces G conduce a un modelo logit,

G(µj +αTj βi) =

exp (µj +αTj βi)

1 + exp (µj +αTj βi)

= expit(µj +αTj βi). (5)

Debido a que tanto αj como βi son desconocidos, (4) y (5) corresponden a un modelo de factores latentespara datos binarios (Yu and Rodriguez, 2019a) que permite modelar la probabilidad de un voto positivo.Cualquier modelo de la forma (4) o (5) se puede expresar como un modelo de regresion lineal latente (verAlbert, 1992; Albert and Chib, 1993; Gelman et al., 2014; Patz and Junker, 1999; Polson et al., 2013).Como se detalla en el Apendice A, en el caso probit se tiene que

y∗i,j = µj +αTj βi + εi,j donde εi,j

iid∼ N(0, 1) (6)

donde y∗i,j es el predictor lineal que impulsa la probabilidad de voto positivo. Asumiendo que los yi,j sonintercambiables, dados µj ,αj ,βi, se tiene

yi,j | µj ,αj ,βiiid∼ Ber(G(µj +αT

j βi))

y por lo tanto, la verosimilitud del modelo se puede expresar como

p(Y | µ,A,B) =

n∏i=1

m∏j=1

G(µj +αTj βi)

yi,j[1−G(µj +αT

j βi)]1−yi,j

(7)

donde Y es una matriz n ×m de votos observados con (i, j)-esimo elemento yi,j ; µ = (µ1, · · · , µm), Auna matriz m× d con j-esima fila αT

j y B una matriz n× d con i-esima fila βTi .

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 21: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 21

Por simplicidad computacional, es comun usar distribuciones previas normales para µj ,αj ,βi (ver Jack-man, 2004; Yu and Rodriguez, 2019a; Yu and Rodriguez, 2019b); esta eleccion conduce a un analisissemiconjugado y a mayor eficiencia computacional. En tanto,

(µj ,αj) | a0,A0iid∼ N(a0,A0) (8)

y

βi | bi,Biind∼ N(bi,Bi) (9)

donde a0,A0, bi,Bi son los hiper–parametros del modelo, a0 y bi son los vectores de medias (d + 1)-dimensional y d-dimensional, yA0 yBi las matrices de varianzas y covarianzas de tamano (d+1)×(d+1)y d × d, respectivamente. La distribucion previa (9) indica que de manera anticipada el punto ideal decada legislador se distribuye Normal con un vector de medias y una matriz de varianzas y covarianzasparticular. En la Figura 1 se muestra el grafo acıclico dirigido (DAG, por sus siglas en ingles) querepresenta la estructura del modelo de votacion espacial Bayesiano cuadratico unidimensional.

Figura 1: Grafo acıclico dirigido (DAG, por sus siglas en ingles) para el modelo de votacion espacialBayesiano cuadratico unidimensional.

Algunos autores (Clinton et al., 2004) proponen configurar a0 = 0(d+1) y A0 = σ2I(d+1) con σ2 unaconstante arbitrariamente grande (25 o 100) o modelarla por medio de una distribucion gamma inversa, afin de asignar una distribucion previa no informativa centrada en cero para estos parametros y establecerbi = 0d y Bi = Id para todos los legisladores, ya que esto impondrıa restriccion para la identificacion delos parametros desde la previa.

El modelo que se presenta en esta seccion describe el modelo de votacion espacial Bayesiano basico, cuyasencillez proporciona un punto de partida conveniente para la elaboracion de modelos mas complejos(Clinton et al., 2004) que involucren otras caracterısticas importantes del fenomeno de estudio como:el efecto de partido, el impacto de los incentivos polıticos, la influencia de la agenda legislativa en elcomportamiento de votacion, entre otros.

1.9.1. Identificabilidad.

Ası, sin restricciones los parametros del modelo (7) no son identificables, puesto que cualquier transfor-macion (de escala, rotacion, traslacion o reflexion) sobre la matriz B de puntos ideales y la matriz Ade los parametros asociados a las propuestas, mantiene constantes las distancias entre puntos ideales yalternativas de votacion, lo cual se hace indistinguible la probabilidad de ocurrencia de un voto positivopara cualquier patron de votacion Y (Clinton et al., 2004; Jackman, 2004).

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 22: M etodos Bayesianos para caracterizar el comportamiento ...

22 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

Considere, por ejemplo, una rotacion del espacio polıtico Rd dada por una matriz ortogonal Q de tamanod× d (i.e., QTQ = Id). Entonces,

(Qαj)T(Qβi) = αT

j βi

y en consecuencia,Pr(yij = 1 | µj ,Qαj ,Qβi) = Pr(yij = 1 | µj ,αj ,βi) .

Aunque la identificabilidad de los parametros no es un requisito para la estimacion si es necesaria parafundamentar las inferencias sobre las posiciones ideales de los agentes polıticos y los parametros asociadosa las propuestas de votacion. Es por ello, que en la literatura se exponen condiciones necesarias y sufi-cientes para la identificacion de modelos de votacion espacial multidimensionales basadas en restriccionesprevias sobre los parametros. Por ejemplo, es comun establecer σj = 1 para todo j = 1, · · · ,m, debidoa que esta escala no puede identificarse por separado de la escala asociada al espacio polıtico (Yu andRodriguez, 2019a). Por otro lado, para hacer que el espacio de polıticas resulte invariante a traslaciones,rotaciones, reflexiones y reescalamiento, es comun:

1. Imponer restricciones sobre la media y la varianza de los puntos ideales βi (Jackman, 2004) yrestringir el signo de los parametros de discriminacion αj (Lofland et al., 2017). Especıficamente,hacer que el vector de medias y la matriz de varianzas y covarianzas de los puntos ideales sea 0d yB0 = Id (elimina problemas de traslacion y escala), respectivamente; y restringir los vectores αjpara que la componente αj,j > 0 (elimina el problema de la reflexion) y la componente αj,k = 0para k > j (elimina el problema de la rotacion) (Lofland et al., 2017).

2. Fijar la posicion de d+ 1 legisladores en el espacio polıtico (Clinton et al., 2004; Rivers, 2003). Seconsidera que el conocimiento previo del investigador permite identificar legisladores que se puedenfijar en ciertas posiciones. Por ejemplo, en un espacio polıtico unidimensional, es usual ubicar enlados opuestos (en −1, 1) a lideres de partido o senadores extremos (Clinton et al., 2004; Loflandet al., 2017).

1.9.2. Estimacion e inferencia.

La verosilimitud (7) y las distribuciones previas (8) y (9), permiten expresar la distribucion posterior delos parametros, dados los votos observados Y , como

p(µ,A,B | Y) ∝ p(Y | µ,A,B)× p(µ,A,B)

= p(Y | µ,A,B)× p(µ,A)p(B)

=

n∏i=1

m∏j=1

G(µj +αTj βi)

yi,j[1−G(µj +αT

j βi)]1−yi,j×

=

m∏j=1

N(µj ,αj | a0,A0)

{

n∏i=1

N(βi | bi,Bi)

} (10)

El analisis de datos de votacion nominal se caracteriza por generar modelos estadısticos con muchosparametros; especıficamente, el modelo de votacion espacial euclideano d-dimensional con datos de nlegisladores sobre m propuestas de votacion, genera un modelo estadıstico con nd+m(d+ 1) parametros(Jackman, 2001; Jackman, 2004), de los cuales nd corresponden a las componentes de los puntos idealesy m(d+ 1) a los parametros especıficos de las propuestas de votacion. Tal cantidad de parametros haceque la distribucion posterior (10) sea una distribucion con una alta dimensionalidad y a su vez unaexpresion intratable analıticamente. En este contexto, a traves de los algoritmos MCMC, se proporcionauna metodologıa que permite manejar de forma sencilla y rutinaria una formulacion compleja como laque subyace en (10).

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 23: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 23

En el caso del analisis de datos de votacion nominal, es apropiado el uso de un muestreador de Gibbspara aproximar la distribucion posterior (10), puesto que la especificacion de las distribuciones previaspara µj ,αj y βi (como se sugiere en la Seccion 1.9), permite estructurar un analisis semiconjugado. Elmuestreador de Gibbs garantiza que se generen muestras de la distribucion posterior, sin importar delpunto del espacio de parametros donde se inicialice el algoritmo (Clinton et al., 2004); estas muestrasse generan a traves de las distribuciones condicionales completas de µj ,αj y βi, y mediante un procesoiterativo que contempla imputaciones y regresiones lineales latentes que alternan entre la actualizacionde las utilidades, los parametros de las propuestas y los puntos ideales. En el apendice A, se detalla elprocedimiento bajo el cual opera el muestreador de Gibbs en el contexto especıfico de los modelos devotacion espacial Bayesianos.

2. Antecedentes.

En esta seccion se presenta una revision sistematica de las aplicaciones, extensiones y modelos derivadosdel estimador de punto ideal (Clinton et al., 2004; Jackman, 2004) a fin de identificar fenomenos legislati-vos y aspectos metodologicos que permiten direccionar la investigacion cuantitativa del comportamientode votacion parlamentario en diferentes contextos desde una perspectiva Bayesiana. En particular, en elLatinoamericano, donde algunos organos deliberantes como el de Colombia han sido poco estudiados yse constituyen en escenarios genuinos y novedosos para operacionalizar la conducta electoral de cuerposlegislativos a traves de datos de votacion nominal.

Una revision como la que se presenta en esta seccion, es relevante para la comunidad cientıfica por variasrazones: (i) sintetiza fenomenos legislativos y cuestiones de interes polıtico que se pueden abordar desdeun enfoque Bayesiano, (ii) reune herramientas metodologicas que han sido empleadas recientemente, pa-ra estudiar hipotesis sustantivas de cuerpos legislativos en diferentes escenarios, senalando un punto departida para identificar metodos que permitan ampliar la investigacion en contextos donde los estudioscuantitativos sobre comportamiento parlamentario son escasos; (iii) refleja la importancia de la concu-rrencia entre principios matematicos y estadısticos, la teorıa polıtica y los fundamentos computacionales,al momento de aplicar, extender o derivar un modelo de votacion espacial Bayesiano que provea evidenciaempırica coherente con una realidad legislativa; (iv) revela las limitaciones del estimador de punto idealBayesiano y las exhibe como una oportunidad para extender la investigacion metodologica y teorica enpro de explicar fenomenos de votacion legislativa particulares; (v) finalmente, proporciona a academicossociales y estadısticos, un comparativo del estado actual de la investigacion cuantitativa sobre conductaelectoral parlamentaria en diferentes escenarios, lo cual permite reconocer lıneas de estudio, diferenciasy semejanzas teoricas y metodologicas, y nichos emergentes de investigacion en distintos contextos.

Para dar cuenta de la revision, esta seccion se divide como sigue: en la Seccion 2.1, se presentan losantecedentes de aplicacion, adaptacion y generalizacion del estimador de punto ideal Bayesiano en elcontexto de los Estados Unidos. Esta seccion tiene doble proposito, destacar el potencial metodologicodel modelo de votacion espacial Bayesiano cuadratico y proporcionar inspiracion para el estudio de lascamaras legislativas de America Latina, en particular, del parlamento colombiano. En la Seccion 2.2, seexhiben los diferentes contextos latinoamericanos en los que se ha aplicado el estimador de punto idealBayesiano. De manera general, se citan algunos estudios sobre el comportamiento legislativo en AmericaLatina, haciendo hincapie en el tipo de fenomenos que se han estudiado bajo la metodologıa de interesy en las limitaciones que presenta el estimador en su version estandar a la hora de modelar fenome-nos particulares de algunas de las legislaturas de la region. Adicionalmente, se alude a las condicionesque impone el contexto y que suscitan la variacion del modelo para abordar fenomenos legislativos enun escenario diferente al norteamericano. En la Seccion 2.3, se presentan los antecedentes del analisiscuantitativo de comportamiento legislativo para el caso particular de Colombia. Se presentan algunasgeneralidades en terminos de las reglas institucionales que influyen en la conducta parlamentaria y sesenalan los metodos estadısticos que se han utilizado, en las investigaciones mas recientes.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 24: M etodos Bayesianos para caracterizar el comportamiento ...

24 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

2.1. Estudios en el contexto norteamericano.

La revision de la literatura, en el contexto de los Estados Unidos, ha mostrado que el modelo de votacionespacial Bayesiano cuadratico ( ver Seccion 1.9), es una configuracion basica y generalizable, que provee deherramientas para analizar determinantes de conducta parlamentaria a nivel de grupo (partido, comision,etc.) e individuo; su aplicacion permite apoyar conjeturas sobre el comportamiento de votacion de loslegisladores teniendo en cuenta las singularidades del parlamento y la teorıa polıtica al respecto. Lasinvestigaciones recopiladas, han exaltado la flexibilidad del estimador de punto ideal Bayesiano paraabordar fenomenos especıficos que requieren de evidencia empırica para exhibir la relacion que existeentre las preferencias polıticas de los legisladores, los arreglos institucionales y los resultados legislativos.

Las aplicaciones, extensiones y modelos derivados del estimador de punto ideal, no solo senalan un caminonovedoso para poner a prueba hipotesis sustantivas del comportamiento legislativo en las camaras delCongreso de los Estados Unidos, tambien se constituyen en un referente para reconocer las limitacionesdel estimador en su version estandar (ver Seccion 1.9) e identificar en estas una oportunidad para ampliarla investigacion metodologica del comportamiento legislativo en una direccion mas consecuente con lasrealidades polıticas del parlamento. Los hallazgos han mostrado que la literatura disponible se puedesintetizar teniendo en cuenta los fenomenos polıticos de estudio. En este sentido, con el proposito exponerlos resultados de la revision en el contexto norteamericano, se propone una taxonomıa basada en el tipode fenomenos parlamentarios que han motivado la aplicacion, extension y generalizacion del estimadorde punto ideal Bayesiano. La categorizacion propuesta se constituye de ocho lıneas: (i) dimension delespacio polıtico (Seccion 2.1.1), (ii) identificacion de legisladores pivote (Seccion 2.1.2), (iii) votacionesrestringidas a la naturaleza de la agenda (Seccion 2.1.3), (iv) cambio en las preferencias de los actorespolıticos (Seccion 2.1.4), (v) evolucion de las preferencias de los actores polıticos (Seccion 2.1.5), (vi)influencia de lideres o grupos polıticos (Seccion 2.1.6), (vii) abstenciones estrategicas (Seccion 2.1.7)y (viii) extremos votando juntos (Seccion 2.1.8). A continuacion se presenta cada una de estas lıneas,se mencionan las investigaciones mas preponderantes que han abordado el fenomeno polıtico que lasdenomina, el tipo de cuestiones que se abordan y la manera como el estimador se emplea o se adapta pararesponder a cada situacion; tambien se senalan algunos de los resultados y conclusiones mas relevantesde los trabajos desarrollados en el marco de cada una de ellas.

2.1.1. Dimension del espacio polıtico.

La discusion academica sobre la dimension del espacio polıtico ha sido un tema popular en la literaturade ciencias polıticas (e.g., Aldrich et al., 2014; Dougherty et al., 2014; Jackman, 2001; Potoski andTalbert, 2000; Roberts et al., 2016; Talbert and Potoski, 2002). Los trabajos en esta direccion handestacado el papel de los parametros de votacion αj , de sus respectivas distribuciones previas (Jackman,2001) y de la tipologıa de las propuestas de votacion Moser et al. (2021) para responder a cuestionesrelacionadas con: el numero de rasgos latentes necesarios para modelar el comportamiento de votacionde los legisladores, la naturaleza de las dimensiones recuperadas y los problemas de identificacion enmodelos multidimensionales.

La dimension del espacio polıtico, d, desde un punto de vista tecnico, corresponde al numero de rasgoslatentes necesarios para modelar con precision el comportamiento de votacion de los legisladores y sueleccion se traduce en un problema de seleccion de modelo, donde se busca equilibrar el ajuste con lacomplejidad del mismo (Moser et al., 2021); la literatura al respecto, dispone de trabajos que discutenconsideraciones metodologicas y epistemologicas relacionadas con la dimension del espacio polıtico (verBenoit and Laver, 2012; De Vries and Marks, 2012) ası como de trabajos que describen mecanismospuntuales para su eleccion (Jackman, 2001; Lofland et al., 2017; Moser et al., 2021). En esta ultimavıa, Jackman (2001) muestra como a traves de los parametros de la votacion (tambien conocidos comoparametros de discriminacion), αj , es posible explorar y determinar la dimension del espacio polıtico asıcomo evaluar la pertenencia de pasar a dimensiones superiores en un contexto especıfico. Su propuestase enfoca en examinar la relevancia de los parametros αj en terminos de su capacidad para: (i) ayudara discernir el contenido sustantivo de las dimensiones recuperadas, (ii) evaluar la dimension del espacio

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 25: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 25

polıtico, (iii) verificar la bondad de ajuste del modelo y (iv) proporcionar una vıa para incorporar yprobar creencias previas de los investigadores en relacion a las dimensiones que subyacen al espacio depolıticas.

Jackman (2001), recurre a la estrecha conexion que existe entre el analisis de datos de votacion nominal,los modelos multidimensionales de respuesta al ıtem y el analisis factorial para explicar la relevancia delos parametros de votacion en la identificacion del numero rasgos latentes que subyacen a la conductaelectoral de los parlamentarios. En este sentido, argumenta que los parametros αj se pueden analizarde forma similar a los parametros de discriminacion de un modelo de respuesta al ıtem y ası utilizarlospara identificar las listas de votacion que discriminan entre legisladores a lo largo de las dimensionesdel espacio polıtico. Ası mismo, dichos parametros se pueden interpretar como las cargas factorialesde un analisis factorial, permitiendo identificar el contenido sustantivo de las dimensiones recuperadas.En consecuencia, este autor senala en un contexto unidimensional, que el numero de propuestas devotacion j con parametro de discriminacion αj > 0, estadısticamente significativo (aquellos para loscuales el intervalo de credibilidad no contiene el cero), proporcionan informacion sobre el numero derasgos latentes y el contenido sustantivo que subyace a la votacion. En palabras de Jackman (2001), unacantidad considerable de parametros de discriminacion indistinguibles de cero indica que la dimensiondel modelo propuesto puede no recoger todos los rasgos latentes que subyacen a la votacion, por lotanto, esto se convierte en un indicio para considerar la posibilidad de evaluar un modelo de dimensionessuperiores.

Por otro lado, inspeccionar el contenido de las listas de votacion con un parametro de discriminacionno significativo, puede contribuir a revelar el caracter cualitativo de las dimensiones adicionales enconsideracion. Aunque es frecuente suponer que las dimensiones adicionales se alinean con el contenidode los proyectos de ley sometidos a eleccion, hay autores que discrepan de esta suposicion, y sostienen quelas dimensiones del espacio latente de un modelo de votacion espacial no necesariamente se tienen quecorresponder con cuestiones sustantivas polıticamente relevantes, esto debido a que puede darse el casode un subconjunto de proyectos de ley, cuyo patron de votacion, sugiera una dimension adicional peroque su contenido no encaje en alguna cuestion sustantiva particular (Moser et al., 2021); en tal situacionla interpretacion de las dimensiones en terminos de cuestiones sustantivas no resulta coherente y conllevaa discusiones academicas en las que se senala la importancia de hacer distincion entre la dimension deun espacio basico y uno tematico (ver Moser et al., 2021; Poole, 2007).

El trabajo de Jackman (2001), no solo proporciona una metodologıa para explorar y evaluar la dimensiondel espacio polıtico vıa parametros de discriminacion, tambien senala un camino para favorecer la iden-tificacion de modelos multidimensionales mediante la incorporacion de estados de informacion previossobre las dimensiones que subyacen al espacio polıtico. Esto ultimo, realza las virtudes del enfoque Baye-siano, dado que muestra como la formulacion de distribuciones previas informativas para los parametrosde la votacion, αj , contribuye a manejar las complejidades de dimensiones superiores.

En un estudio reciente, Moser et al. (2021) ha senalado que los modelos de votacion espacial estandar,como el estimador de punto ideal Bayesiano, asumen que la dimension del espacio polıtico es fija y comun;suposicion que constituye un limitante para analizar preferencias de los actores polıticos en diferentesdominios de eleccion e identificar patrones de votacion individual. En este sentido, Moser et al. (2021)propone una metodologıa basada el estimador de punto ideal Bayesiano y en principios de agregacionpara el analisis de datos nominales (ver Roberts et al., 2016), que posibilita determinar rasgos latentescomunes a la camara y especıficos de cada legislador teniendo en cuenta diferentes dominios de votacion.Su enfoque supone que los legisladores pueden revelar preferencias distintas dependiendo de la tipologıade la votacion, y ademas, presume la existencia de subconjuntos de legisladores, cuyo patron de votacionpara ciertos grupos de votos, no es explicable a traves de las combinaciones lineales de los rasgos latentesrecuperados para todo el grupo. La metodologıa propuesta por (Moser et al., 2021), se presenta comouna alternativa a la forma tradicional de determinar e interpretar la dimension del espacio polıtico; enparticular, se postula como una vıa que permite investigar la interrelacion entre cuestiones sustantivas yla dimension intrınseca del espacio latente.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 26: M etodos Bayesianos para caracterizar el comportamiento ...

26 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

2.1.2. Identificacion de legisladores pivote.

La identificacion de legisladores pivote recoge aquellos trabajos centrados en la estimacion e inferenciatanto de puntos ideales como de cantidades auxiliares que sean funcion de los parametros del modelo.Tales cantidades permitan reconocer los miembros del parlamento cuya posicion en el espacio polıticose considera relevante para para comprender lo que sucede al interior de la legislatura. En esta lıneade trabajo son importantes todas aquellas cuestiones relacionadas con la identidad y posicion de loslegisladores pivote (tambien conocidos como legisladores fundamentales), extremistas, minoritarios, entreotros.

Clinton et al. (2004) senala que la nocion de legislador pivote es sustancial para algunas teorıas decomportamiento parlamentario que caracterizan y pronostican el proceso de formulacion de leyes conbase en la posicion de estos legisladores en el espacio polıtico (ver Krehbiel, 1998). En el contextonorteamericano, tales teorıas senalan que los legisladores pivote son aquellos cuyo voto es fundamentalpara el exito o fracaso del proceso legislativo. Particularmente, su voto puede garantizar el cierre de undebate ası como definir una votacion por mayorıa en una situacion legislativa extraordinaria (Krehbiel,1998).

Bajo este panorama, los estadısticos de orden de los puntos ideales de los legisladores juegan un papelimportante, puesto que, a traves de estos y en conjunto con las posiciones que indica la teorıa polıticalegislativa, se pueden identificar los legisladores pivote y la region del espacio polıtico donde los pro-yectos de ley que intentan cambiar el status quo no tienen oportunidad de exito. Clinton et al. (2004)alude a dicha region como el “intervalo de estancamiento” de una polıtica y afirma que su delimitaciongeneralmente se calcula utilizando los puntos ideales estimados de aquellos legisladores que la teorıapolıtica senala como fundamentales (Howell et al., 2000 y Schickler, 2000 utilizan esta estrategia parahacer operativas las teorıas sobre legisladores pivote). Por ejemplo, para el caso de un presidente liberal,la teorıa sostiene que dicho intervalo esta definido por la ubicacion del legislador en la posicion 33 (pivotede veto) y la ubicacion del legislador en la posicion 60 (pivote obstruccionista) (ver Krehbiel, 1998).

La teorıa polıtica en el contexto norteamericano, proporciona conocimiento en relacion al papel y la je-rarquıa de los legisladores pivote dentro del parlamento, pero no proporciona su identidad ni su ubicacionen el espacio polıtico. Con el fin de suministrar un camino que permita operacionalizar los supuestosy predicciones de la teorıa polıtica en relacion a los legisladores pivote, Clinton et al. (2004) exponeuna metodologıa basada en el estimador unidimensional de punto ideal Bayesiano estandar, que permitediscernir la identidad y ubicacion espacial de los diputados que juegan un papel importante dentro delcuerpo legislativo. La metodologıa corresponde a un esquema secuencial e iterativo de tres pasos: (i)muestrear los puntos ideales de los legisladores, βi, de su distribucion posterior conjunta; (ii) ordenarde forma ascendente los puntos ideales muestreados, y (iii) observar que legisladores ocupan un pivoteparticular o una estadıstica de orden de interes. Tras repetir el esquema un numero arbitrariamentegrande de veces, se determina la proporcion de ocurrencias para las cuales el punto ideal del i-esimolegislador, βi, fue la estadıstica de orden de interes sobre las muestras extraıdas de la distribucion poste-rior; tal proporcion hace factible conocer los legisladores mas o menos probables en ocupar una posicionparticular, ası como reconocer aquellas posiciones de interes que no se logran identificar con el metodopropuesto en un contexto especıfico.

2.1.3. Votaciones restringidas a la naturaleza de la agenda.

Los trabajos en esta direccion resaltan la importancia de estimar los parametros de las alternativas devotacion (ver Seccion 1.9), ψj y ζj , a fin de estudiar y probar teorıas sobre el comportamiento de lasmismas. Algunas de estas investigaciones revelan las limitaciones que presenta el estimador de punto idealBayesiano estandar para recuperar estos parametros y hacer inferencia sobre ellos. El analisis empıricoen esta vıa permite indagar sobre cuestiones relacionadas con el comportamiento del status quo en unperiodo especıfico, el posicionamiento de las nuevas polıticas en momentos y contextos particulares y larelacion de dependencia entre votaciones bajo una estructura particular de la agenda, entre otras.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 27: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 27

Clinton and Meirowitz (2001) manifiestan que los estimadores de preferencias polıticas estandar, co-mo IDEAL, no incorporan la naturaleza secuencial de la agenda, es decir, parten del supuesto que losparametros recuperados no se ven afectados por un reordenamiento de la secuencia de votos; esta omisiondescuida informacion util para la identificacion del modelo, la ubicacion de los parametros de las alterna-tivas de votacion (ψj y ζj) y la estimacion de la dimension del espacio polıtico. Adicionalmente, puedederivar en estimaciones erroneas tanto de los puntos ideales como de la dimension, y en consecuencia,apoyar interpretaciones enganosas, en terminos de las teorıas legislativas que se ponen a prueba con estosmodelos.

Para incorporar la naturaleza secuencia del la agenda en el analisis de votacion nominal y abordar elfenomeno de las votaciones relacionadas, Clinton and Meirowitz (2001) proponen extender el estimadorde punto ideal Bayesiano estandar a un modelo de agenda restringida, donde los parametros de lasalternativas de votacion se vinculan con los valores de los parametros del estatus quo. En terminosformales y bajo el supuesto del conocimiento del orden de la agenda, se relaciona el estatus quo de lalista de votacion j (ζj) con los parametros de la lista de votacion j − 1, de tal forma que, si ψj−1 fueaprobada, entonces el nuevo status quo es ζj = ψj−1 y si ψj−1 fue negada, entonces ζj = ζj−1. Estemapeo supone que un voto a favor para la propuesta j es un voto para moverse en el espacio polıtico yun voto en contra es para evitar el movimiento.

Aunque la propuesta de estos autores permite abarcar un fenomeno legislativo especıfico, es importanteresaltar que la extension del estimador de punto ideal Bayesiano bajo la consideracion del orden de laagenda, implica un precio en terminos de parsimonia, A diferencia del modelo estandar, la extensionpropuesta incluye mas parametros a estimar, y por lo tanto, mas dificultades tecnicas.

Los resultados obtenidos, tras aplicar el modelo restringido para un periodo legislativo particular delparlamento norteamericano, revelaron que este arroja estimaciones de puntos ideales mas coherentes conlas polıticas que se ponen a prueba en contraste con las producidas por el estimador tradicional, estodebido a que incorporar informacion sobre el orden de la agenda legislativa implica revelar la ubicacion delstatus quo ası como su relacion con la ultima propuesta aprobada. Clinton and Meirowitz (2001), senalanque su modelo no aborda la formacion de agenda endogena, la votacion estrategica y tampoco consideraformas particulares de restringir las ubicaciones de las propuestas para una estructura determinada de laagenda. Ası mismo, su analisis no proporciona evidencia en relacion a la consistencia de los estimadoresrestringidos y no restringidos.

2.1.4. Cambio en las preferencias de los actores polıticos.

Bajo esta lınea son de interes todas aquellas cuestiones que involucran contrastes para determinar cambiosen las preferencias de los actores polıticos en un momento determinado o contexto especıfico. Particu-larmente, son de interes preguntas relacionadas con: la estabilidad de las preferencias polıticas de loslegisladores en momentos coyunturales del proceso legislativo, como el cambio de partido; las discrepan-cias en los patrones de votacion cuando los actores polıticos se enfrentan a distintos dominios de votaciono tienen representacion en diferentes instituciones, entre otras.

Estudios en esta lınea, han mostrado que el analisis de votacion nominal provee de evidencia empırica parareconocer contextos y factores que influyen en el cambio de las preferencias polıticas de los parlamentarios.Tambien, ha incentivado el debate en torno a la importancia de establecer escalas latentes comunes quepermitan contrastar la conducta electoral de los actores polıticos (e.g., Asmussen and Jo, 2016; Shoret al., 2010; Shor and McCarty, 2011). Estudios relacionados con la instauracion de escalas latentescompartidas, buscan responder a cuestiones metodologicas relacionadas con los puentes que permitenescalar puntos ideales de actores polıticos en una escala comun, para asegurar que los contrastes entreinstituciones, periodos u otros escenarios sean compatibles. En esta vıa, Shor et al. (2010) afirma queno es valido equiparar estimaciones de puntos ideales que se han realizado por separado, dado que,cada conjunto produce estimaciones en una escala latente distinta. Este autor propone utilizar “actorespuente” (e.g., legisladores con registros de votacion comunes) para anclar espacios latentes y confortarla conducta electoral de sujetos cuyas decisiones de voto no se han observado simultaneamente.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 28: M etodos Bayesianos para caracterizar el comportamiento ...

28 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

En terminos del fenomeno de cambio de preferencias, se han encontrado trabajos que lo abordan desdediferentes perspectivas. Algunas investigaciones han asumido que las preferencias de los diputados per-manecen estables, al menos en periodos cortos de tiempo (Moser et al., 2021), y que las variaciones enlas mismas se dan por eventos particulares que emergen al interior de las legislaturas como el cambio departido. En este sentido, Clinton et al. (2004), ilustra el cambio de preferencias en el contexto del cam-bio de partido, mediante la aplicacion del estimador de punto ideal Bayesiano estandar unidimensional(liberal–conservador).

Este autor, afirma que los legisladores que cambian de afiliacion partidista en el ejercicio de su cargo sonclaves para identificar el efecto de partido en el comportamiento de votacion de los miembros del cuerpolegislativo; esto debido a que al momento del cambio, otros determinantes de la votacion permanecenconstantes (e.g., la circunscripcion y la afiliacion de los demas legisladores, entre otros) y la nueva afi-liacion puede reflejar una variacion en los puntos ideales de los legisladores producto de la influencia delcambio. Bajo su propuesta, asume que todos los legisladores pueden presentar una variacion en las esti-maciones de sus puntos ideales despues del cambio, sin embargo, supone que la variacion experimentadapor quienes cambian de partido es mayor que la reflejada por quienes mantienen su afiliacion polıtica. Eneste sentido, propone analizar tales variaciones mediante cambios relativos, parametrizando los puntosideales post cambio como βi,1 = βi,0+δi para i = 1 · · ·n, donde βi,0 y βi,1 son los puntos ideales legisladori antes y despues del cambio, respectivamente, y δi el cambio relativo del i-esimo legislador.

En el analisis, Clinton et al. (2004) alude a dos aspectos que son importantes en la investigacion cuantita-tiva del cambio de preferencias de los actores polıticos: la precision y compatibilidad de las estimaciones.En esta direccion, argumenta que bajo el enfoque de simulacion Bayesiana estos dos aspectos se puedenabordar de una manera mas sencilla en comparacion con otros procedimientos convencionales (ver Mc-Carty et al., 2001). En relacion a la precision, senala que la simulacion Bayesiana permite identificar,de forma adecuada, la imprecision que surge de dividir el conjunto de datos en pre y post cambio; estodebido a que su implementacion proporciona evaluaciones de incertidumbre para todos los parametrosdel modelo permitiendo evidenciar la caıda en la precision de las estimaciones tras fraccionar el conjuntode datos alrededor del cambio de partido. Por otro lado, propone abordar el problema de las estimacionescomparables a traves de la estandarizacion posterior de los puntos ideales.

El enfoque de Clinton et al. (2004) ha sido cuestionado por Lofland et al. (2017), quien senala las siguientesinconsistencias metodologicas en su propuesta: (i) al comparar el orden jerarquico de los legisladoresmediante estimaciones producidas antes y despues del cambio de liderazgo, se ignora el hecho de que lasposiciones de los diferentes legisladores no son independientes, es decir, para que un legislador aumentesu posicion, otro u otros necesitan de disminuir la suya; (ii) las estimaciones obtenidas ajustando modelosseparados a cada coleccion de mociones no son directamente comparables y estandarizarlas no garantizaque los puntos ideales se escalen en una dimension latente comun; ademas, (iii) la forma en la que planteala hipotesis de cambio de partido, no aborda el problema de la falta de ajuste cuando se ponen a pruebamultiples hipotesis.

Las inconsistencias citadas motivan la extension del estimador de punto ideal Bayesiano estandar. Eneste sentido, Lofland et al. (2017) propone un modelo jerarquico que presenta la ventaja de inducir unaescala comun en ambos espacios de polıticas, sin dividir el conjunto de votos y bajo el supuesto de queno todos los legisladores cambian sus preferencias; ası, los legisladores cuyas preferencias permanecessin cambio, a lo largo del periodo objeto de analisis, sirven de puente entre los espacios polıticos (verShor et al., 2010 y Shor and McCarty, 2011). El modelo utiliza previas Normales con punto de masaen cero, para identificar los legisladores puente que conectan las escalas ideologicas arbitrarias y lashacen comparables. Adicionalmente, permite abordar problemas de comparaciones multiples de formasimultanea (en concordancia con Scott and Berger, 2006 y Scott and Berger, 2010) teniendo en cuentafactores de Bayes y probabilidades posteriores. Aunque la propuesta esta inspirada en el trabajo deMartin and Quinn (2002), el objeto no es modelar la evolucion de las preferencias de los diputados a lolargo del tiempo sino probar hipotesis de cambio de partido en terminos sus las preferencias reveladas,en un momento coyuntural del proceso legislativo.

El analisis de Lofland et al. (2017), expone resultados sobre la influencia del cambio de partido en las

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 29: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 29

preferencias de los diputados, pero no proporciona evidencia sobre el efecto del estatus de mayorıa enlas preferencias reveladas. Un resultado importante de su trabajo, es la evaluacion del impacto potencialque tiene el uso de diferentes funciones de enlace en el analisis de los datos de votacion nominal. Enesta direccion concluye que los vınculos probit y logit tienden a proporcionar resultados similares, perosugiere que el analisis de estabilidad en las preferencias de los legisladores se realice utilizando enlacescomo el logit, porque esto permite que el modelo sea mas robusto ante valores extremos.

Inspirado en el trabajo de Lofland et al. (2017), Moser et al. (2021) propone otra extension del estimadorde punto de ideal Bayesiano. Su formulacion no se centra en el cambio de partido sino en el cambio en laspreferencias de los legisladores cuando estos se someten a votaciones en diferentes dominios, i.e., cuandovotan sobre distintas tematicas. Moser et al. (2021), afirma que la estimacion de puntos ideales de actorespolıticos en dominios de votacion disımiles, es una version del fenomeno del cambio de preferencias delos parlamentarios poco estudiada, y por ende, con escasas propuestas metodologicas para llevar a caboestudios comparativos en esta direccion. Su extension, ademas de permitir estimar puntos ideales bajouna escala comun, proporciona un marco metodologico para hacer contrastes a nivel de individuo y grupo,en relacion a las semejanzas y discrepancias que presentan las preferencias reveladas de los diputadoscuando toman decisiones en diferentes dominios de votacion. Por ejemplo, permite contrastar su conductaelectoral cuando votan sobre temas de orden publico frente a su comportamiento cuando deciden sobrecuestiones economicas. Tanto la propuesta de Lofland et al. (2017) como la de Moser et al. (2021) giranen torno a la estimacion de la identidad de los “legisladores partidarios” (legisladores puente), votantescuya preferencia revelada permanece sin alteracion para todas las listas de votacion. Su enfoque no asumeun conocimiento previo de la identidad de los votantes partidarios, estos se deducen a partir del procesode estimacion e inferencia.

La propuesta de Moser et al. (2021) tambien admite investigar la relacion entre el espacio polıtico y elespacio tematico a traves de un modelo de agrupacion, bajo el cual se asume que los legisladores puedentener preferencias diferentes para cada grupo de votos. Este autor declara que utilizar agrupacionesprevias permite reducir el numero de posiciones distintas que puede tener un legislador y contribuye atener una menor incertidumbre en las estimaciones de los parametros del modelo. A diferencia de Loflandet al. (2017), quien propone un modelo para comparar las preferencias reveladas entre dos grupos devotos, Moser et al. (2021) plantea un modelo aplicable a un numero arbitrario de grupos mediante laintroduccion de distribuciones previas que particionan el conjunto de votos en un numero de gruposdeterminado por el analista. La generalidad del modelo permite diversas aplicaciones potenciales. Porejemplo, facilita el estudio de relaciones entre votaciones de comite y votacion en plenaria e indagar sobrediferencias y similitudes en los patrones de votacion de partidos mayoritarios y minoritarios, entre otras.

2.1.5. Evolucion de las preferencias de los actores polıticos.

Bajo esta lınea son de interes todas aquellas cuestiones relacionadas con los cambios en las preferencias delos actores polıticos a lo largo del tiempo. Los modelos propuestos para el analisis de la evolucion temporalde los puntos ideales de los individuos, se llevan a cabo sobre datos longitudinales y se fundamentan enmodelos lineales dinamicos (West and Harrison, 2006).

Martin and Quinn (2002), inspirados en el trabajo de Clinton et al. (2004), postulan una version dinami-ca del modelo de votacion espacial Bayesiano estandar. Su propuesta se aplica a multiples seccionestransversales de votos con el fin de revelar la posible dependencia temporal que existe en el comporta-miento de votacion de actores polıticos. Aunque su trabajo no se presenta en el contexto del parlamentonorteamericano sino en el escenario de las cortes judiciales, su extension al campo de las legislaturas esinmediata y sus planteamientos se consideran un referente para estudios evolutivos de las preferenciasde los parlamentarios.

La propuesta de Martin and Quinn (2002) consiste en incorporar el cambio sistematico de los puntos idea-les de los individuos a traves del tiempo al modelo de votacion espacial Bayesiano Cuadratico estandar.La especificacion del modelo es analoga al modelo base pero con la indexacion del punto ideal del i-esimoindividuo en el periodo de tiempo t ∈ {1, . . . , T}. En este sentido, el estimador de punto ideal Bayesiano

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 30: M etodos Bayesianos para caracterizar el comportamiento ...

30 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

en su version dinamica se especıfica como un modelo lineal dinamico de la forma

y∗i,j,t = µj +αTj βi,t + εi,j,t ,

donde βi,t corresponde al punto ideal del legislador i en el tiempo t y εi,j,t es la desviacion estocasticaproducto de la incertidumbre asociada con el proceso de votacion en el tiempo. Los demas parametrostienen la misma connotacion de la Seccion 1.9.

El modelo dinamico discrepa del modelo base principalmente en la definicion de las distribuciones previasde los puntos ideales de los actores polıticos. Martin and Quinn (2002) hacen explıcita la dependenciatemporal de los βi,t mediante el uso de previas dinamicas jerarquicas; especıficamente, formulan elcaracter dinamico por medio de caminatas aleatorias Normales,

βi,t | βi,t−1,∆βi,t

ind∼ N(βi,t−1,∆βi,t)

donde ∆βi,tes un parametro de variacion de la evolucion temporal fijado previamente por el investigador,

es decir, ∆βi,tes un hiper–parametro del modelo.

El trabajo de Martin and Quinn (2002) es relevante en la literatura porque proporciona evidencia empıricasobre el cambio de los puntos ideales de los actores polıticos en el tiempo, y adicionalmente, ofrece unavision general de los diferentes enfoques que se han empleado para medir cambios en las preferencias delos individuos a nivel temporal; ası mismo, presenta la estructura teorica que permite incorporar modeloslineales dinamicos en la estimacion dinamica de puntos ideales y la metodologıa que soporta la inferenciaBayesiana correspondiente.

2.1.6. Influencia de lideres o grupos polıticos.

Una cuestion de interes para los academicos del congreso norteamericano es la influencia de lideres departido y grupos polıticos en el comportamiento de votacion de los legisladores. En esta lınea se encuentranaquellos estudios cuyo analisis se centra en el efecto del partidismo en la conducta electoral, ası como enlos incentivos que reciben los legisladores por parte de lideres o grupos polıticos y que tienen efecto ensu decision de voto, en otras palabras, se enfatizan en patrones de votacion que distan de una conductaelectoral sincera.

En esta vıa, Clinton et al. (2004) proporciona una metodologıa para interpretar y operacionalizar elfenomeno de la influencia de grupos polıticos en el comportamiento de votacion de los parlamentarios.Su planteamiento inicial senala que modelar dicho fenomeno puede verse como una forma de transgredirla independencia condicional que supone el estimador de punto ideal Bayesiano estandar. Sin embargo,sostiene que no incorporarlo en el analisis de datos votacion nominal, conlleva a estimaciones de puntosideales que absorben un impacto comun a los miembros de un partido o grupo determinado, ası como aestimaciones que revelan una polarizacion partidista mayor de la que realmente subyace en las preferenciasde los diputados. Bajo este panorama, y para no alterar los supuestos del modelo, propone considerar lainfluencia del partido como un mecanismo plausible para generar incentivos extra de utilidad asociadosa un grupo polıtico especıfico.

En este sentido, presenta una extension del estimador estandar, en un escenario unidimensional, cond = 1, que permite modelar los incentivos de partido de manera directa. La ampliacion del modeloimplica considerar las funciones de utilidad:

Ui(ψj) = −(ψj − βi)2 + δDj + ηi,j y Ui(ζj) = −(ζj − βi)2 + δRj + υi,j ,

donde Ui(ψj) y Ui(ζj) representan las utilidades del legislador i por votar “SI” o “NO” a la mocionj, respectivamente; δDj y δRj son los incentivos que recibe el legislador i por votar “SI” frente a “NO”dependiendo de su afiliacion de partido, donde D representa los democratas y R los republicanos; y, ηi,j

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 31: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 31

y υi,j son los choques aleatorios producto de la incertidumbre asociada con los procesos de votacion, loscuales se asumen independientes e identicamente con distribucion logıstica. Estas funciones de utilidadconducen a un un modelo lineal de la forma

y∗i,j = µj + αjβi + δjDi + εi,j ,

donde εi,j = (υi,j − ηi,j)/σj , µj = (ζ2j − ψ2

j )/σj y αj = 2(ψj − ζj)/σj , Di es una variable dummy que

toma el valor de 1 si el legislador i es democrata, y 0 en caso contrario; y, δj = δDj − δRj es una diferencianeta de incentivos especıficos del partido democrata; observe que si δj > 0 entonces el incentivo neto fuepara que los democratas votaran a favor de la mocion j, mientras que sı δj < 0 entonces el incentivo fuepara que votaran en contra de la mocion j.

Clinton et al. (2004), declara que la extension descrita resulta ventajosa frente a otras propuestas me-todologicas que se han utilizado para estudiar el fenomeno de la influencia de partido. A diferencia deotros mecanismos utilizados, no requiere de un analisis diferencial de ıtems (e.g, Wainer, 1993), ni deluso de procedimientos en dos etapas, (e.g, Snyder Jr and Groseclose, 2000) los cuales han sido criticadosdebido al sesgo que se presenta en el proceso de estimacion (e.g, McCarty et al., 2001). En este sentido,el enfoque Bayesiano mejora varias implementaciones de modelos de influencia partidaria disponibles enla literatura. El modelo se ajusta a todos los datos, teniendo en cuenta las especificaciones estadısticasadicionales derivadas de aumentar las funciones de utilidad con incentivos especıficos de partido paracada mocion.

La extension propuesta por Clinton et al. (2004), se aplica a un conjunto de datos de votacion no unanimesdel Senado 105 de los Estados Unidos. Adicional a las restricciones de identificacion del modelo estandar ysiguiendo el enfoque de Snyder Jr and Groseclose (2000), Clinton et al. (2004) introduce restricciones paralos parametros δj ; particularmente, restringe a δj = 0 (i. e., δDj = δRj ) para las las listas de votacion nominaldecididas con mayorıas del 65 % o mas (votos “desiguales”) y asume distribuciones previas no informativaspara los parametros δj restantes, asociados con las votaciones nominales decididas por margenes mascercanos a 35 %—65 % (votos “cerrados”). La aplicacion del modelo conduce a la identificacion de laslistas de votacion sujetas incentivos netos especıficos de partido e informan sobre los efectos netos delpartido que resultaron estadısticamente significativos (en el sentido, que el intervalo de credibilidad del95 % de δj correspondiente no superpone a cero). La evaluacion de la magnitud del efecto de partido,permite estimar la probabilidad de voto positivo tanto para democratas como republicanos. Clintonet al. (2004) senala que aunque hay evidencia consistente con la influencia de partido en solo un terciode los votos cerrados, la magnitud de estos incentivos es grande y polıticamente consecuente con elcomportamiento de los diputados.

Finalmente, Clinton et al. (2004) contrasta las estimaciones de los puntos ideales producidos por elmodelo extendido con las del modelo estandar, y pone en evidencia que el estimador de punto idealBayesiano tradicional no proporciona ninguna superposicion entre los puntos ideales de democratas yrepublicanos en el contexto del senado 105, lo cual muestra que cualquier votacion sobre votos cerradosimpulsada por incentivos especıficos de cada partido se atribuye totalmente a diferencias en los puntosideales de los legisladores y no se asocia con un efecto comun. Adicionalmente, senala que la estimacionde los incentivos netos especıficos de cada partido para cada lista de votacion, permite determinar unapolarizacion partidista con una mayor precision.

En esta misma lınea, Hahn et al. (2012) adaptan del estimador de punto ideal Bayesiano estandarmediante modelos de factor disperso (ver e.g, Pati et al., 2014; Bernardo et al., 2003; Carvalho et al.,2008), con el proposito de develar patrones partidistas en las votaciones nominales del Senado EE.UU.Su propuesta incorpora referentes teoricos del modelo probit multivariado (ver e.g., Chib and Greenberg,1998), el modelo de factor gaussiano (ver e.g., Murray et al., 2013) y previas dispersas de masa puntualen cero (ver e.g., Castillo et al., 2015), para identificar casos en los cuales el partidismo no es predictivode la votacion nominal. En este sentido, su formulacion permite caracterizar patrones de covarianza endatos binarios multivariados para establecer cuales son los proyectos de ley y los legisladores que no serecargan sobre un factor latente especıfico, en particular, uno de caracter partidista. En esta vıa, Hahn

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 32: M etodos Bayesianos para caracterizar el comportamiento ...

32 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

et al. (2012) manifiestan que el modelo probit de factor disperso es una herramienta exploratoria clavepara el analisis de datos categoricos correlacionados de alta dimension.

Hahn et al. (2012), proponen estudiar cambios historicos en la importancia del partidismo mediante elporcentaje de variacion en las votaciones nominales atribuibles al factor de partidismo y la fraccion deelementos distintos de cero en el vector de cargas de este factor. Estos autores senalan, que al igual queel estimador estandar su metodo es adaptable e indica que una extension interesante serıa agregar unacomponente de autocorrelacion, ya sea espacial o temporal, a las puntuaciones de los factores, dado queesto permitirıa explicar el nivel de partidismos de senadores que sirven en congresos consecutivos o queson espacialmente cercanos (e.g., que pertenecen a la misma circunscripcion).

2.1.7. Abstenciones estrategicas.

Otras investigaciones en el contexto norteamericano (ver, Rodrıguez and Moser, 2015; Rosas et al.,2015), han propuesto una extension del estimador de punto ideal Bayesiano estandar a fin de estudiarel fenomeno las abstenciones estrategicas (para una explicacion teorica sobre este fenomeno ver, e.g.,Cohen and Noll, 1991; Kromer, 2005; Voeten, 2000). Esta situacion es una caracterıstica de los procesosde votacion de cuerpos deliberantes que suele ignorarse sin respaldo empırico (Rodrıguez and Moser,2015; Rosas et al., 2015) y sobre la cual no se ha presentado una amplia discusion en la literaturarelacionada con los modelos de votacion espacial Bayesianos. Los estudios al respecto, han mostrado queen esta lınea son de interes cuestiones relacionadas con la identidad de los legisladores que participanfrecuentemente en abstenciones estrategicas, el comportamiento de las tasas de abstencion de grupos olideres polıticos a lo largo del tiempo o bajo condiciones especıficas y los tipos de proyectos de ley paralos cuales la ubicacion del legislador es un factor clave de abstencion, entre otras.

En esta direccion, se expone que el estimador de punto ideal Bayesiano estandar ignora los valoresperdidos y supone que el proceso que genera estos datos es irrelevante para los propositos de inferirpuntos ideales (Rosas et al., 2015). Los valores perdidos pueden derivarse de abstenciones explıcitas (loslegisladores manifiestan su eleccion de no votar), ausencias oficiales (situaciones en las que el legisladoresta fısicamente ausente de la sala) o abstenciones implıcitas (el legislador esta presente en el piso pero noregistra un voto), las cuales pueden ser el reflejo de las preferencias de los legisladores cuando se enfrentaal dilema de no afectar a otros (lideres de partido o electores, por ejemplo) durante la competencia(Rodrıguez and Moser, 2015; Rosas and Shomer, 2008).

Rosas et al. (2015) expone las consecuencias de violar el supuesto de ignorabilidad de datos perdidosque subyace en los metodos estandar para el analisis de votaciones nominales y senala que la decisionde modelar la falta de respuesta debe basarse en fundamentos teoricos y no en medidas de bondad deajuste, dado que el caracter estrategico de las abstenciones esta ligado al contexto de cada legislatura.Adicionalmente, sostiene que modelar presuntos patrones de falta de respuesta no ignorables producebeneficios inferenciales sobre los modelos actuales que suponen una abstencion aleatoria.

Las extensiones del estimador estandar, construidas para abordar el fenomeno de las abstenciones, hansurgido en dos direcciones: (i) pasar de un modelo binario a un modelo ordinal que incluya la no respuestacomo una categorıa intermedia entre el voto positivo y el negativo (Rodrıguez and Moser, 2015) y (ii)mantener un modelo binario pero considerando la probabilidad conjunta de voto positivo y registro devoto (Rosas et al., 2015). Estas extensiones buscan caracterizar el mecanismo que impulsa la presenciade valores perdidos en las listas de votacion. Su implementacion permite modelar la no respuesta y laeleccion de voto simultaneamente, ası como modelar el impacto de la ideologıa sobre la probabilidad deno respuesta o viseversa (Rodrıguez and Moser, 2015; Rosas et al., 2015).

La aplicacion de estos modelos ha llevado a conclusiones importantes en terminos de las caracterısticas delos parlamentarios que presentan una mayor proporcion de votos de abstenciones, la identificacion de laslistas de votacion que han presentado abstenciones producto de votaciones estrategicas, el reconocimientode sesiones legislativas para la cuales tiene sentido ignorar las no respuestas de los legisladores. Enparticular, (Rodrıguez and Moser, 2015), en el contexto del senado 108 de los Estados Unidos, ha afirmado

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 33: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 33

que no se evidencia un papel de abstencion estrategica y que en este caso el modelo propuesto permiteprobar explıcitamente los supuestos de ignorabilidad generalmente asumidos para los votos faltantes enel contexto norteamericano.

2.1.8. Extremos votando juntos.

En una lınea reciente, emergen los modelos Bayesianos de factor latente esferico para datos multivariadosbinarios y ordinales (ver, Yu and Rodriguez, 2019a, Yu and Rodriguez, 2019b y Yu, 2020); aunque estetipo de modelos tiene similitud con el estimador de punto ideal Bayesiano propuesto en Clinton et al.(2004), no se consideran una extension del mismo, puesto que, se postulan como una clase de modelos masgeneral, cuya especificacion e implementacion difiere de la estrategia clasica; este ultimo es visto como uncaso lımite de la nueva familia de modelos, particularidad que senala, un camino para explorar, a travesde los datos, la geometrıa que subyace al espacio polıtico (Yu and Rodriguez, 2019b). El desarrollo y laaplicacion, de los modelos Bayesianos basados en geometrıas esfericas, tiene una motivacion particularen la operacionalizacion y obtencion de evidencia empırica relacionada con la geometrıa que subyaceal espacio polıtico y los patrones de votacion no convencionales como el que se observa cuando loslegisladores ideologicamente opuestos y extremistas se unen para votar en la misma direccion.

Yu and Rodriguez (2019a) menciona que la mayorıa de los modelos de votacion espacial asumen quelos puntos ideales pertenecen a un espacio polıtico euclidiano (posiblemente multidimensional), mas sinembargo, hay situaciones en las que la geometrıa euclidiana no permite explicar ciertos comportamientosde votacion. Tal es el caso, del fenomeno que se presenta cuando los miembros de extremos opuestos en elespectro ideologico revelan preferencias similares votando juntos en contra del resto de la legislatura. Enestos casos ni el aumento de la dimensionalidad del espacio latente ni la realizacion de transformacioneslineales permiten que el estimador clasico pueda abordar el fenomeno de “extremos votando juntos”; talfenomeno sucede porque el estimador estandar tiende a mostrar un mejor desempeno cuando los datosde votacion nominal provienen de sistemas polıticos donde los partidos estan relativamente unificados(Yu and Rodriguez, 2019a).

El fenomeno senalado, es un patron que se ha vuelto frecuente en el Congreso de los Estados Unidosdurante los ultimos anos, lo cual demanda propuestas metodologicas mas consecuentes con el compor-tamiento electoral de los legisladores. En la propuesta de Yu and Rodriguez (2019b) y Yu (2020), losparametros del modelo, βi, ψj y ζj , reposan sobre una variedad de Riemann D (ver, e.g., Lee, 2018),en tanto, la distancia euclidiana se reemplaza por la distancia geodesica ρ correspondiente en D. Ladistancia entre dos puntos se define sobre una hiperesfera unitaria en d + 1 dimensiones y se establececomo el angulo mas pequeno que forman las proyecciones de los puntos a traves del origen. El caso d = 1,conduce a un modelo de votacion espacial en un espacio circular, donde las funciones de utilidad son:

Ui(ψj) = −ρ(ψj ,βi)2

+ ηi,j y Ui(ζj) = −ρ(ζj ,βi)2

+ υi,j ,

donde ρ(a, b) = arc cos (cos (a− b)) ∈ [0, π] es la distancia geodesica que establece el angulo mas pequenoentre a y b. Ası, βi, ψj y ζj ∈ [−π, π] se pueden interpretar como posiciones angulares en un cırculounitario. La especificacion de la funcion de utilidad, deriva en cambios sustanciales en terminos de laeleccion de la funcion de enlace, las distribuciones previas de los parametros, la identificacion e inter-pretacion del modelo y su implementacion computacional (ver detalles, en Yu and Rodriguez, 2019a; Yuand Rodriguez, 2019b; Yu, 2020).

Yu and Rodriguez (2019a), aplico la version circular de esta familia de modelos, a los datos de la Cama-ra de Representantes de los Estados Unidos desde 1988 a 2019; esta implementacion permitio evaluarel desempeno del modelo propuesto y compararlo con el estimador de punto ideal Bayesiano estandarunidimensional. Sus resultados revelaron que el modelo de votacion circular proporciona una mejor ex-plicacion de patrones de votacion modernos en comparacion con los modelos euclidianos tradicionales.La discusion, tambien exalta la importancia de la varianza circular como medida de esfericidad (compor-tamiento de votacion extremo) para analizar la evolucion del fenomeno “extremos votando juntos”, a lo

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 34: M etodos Bayesianos para caracterizar el comportamiento ...

34 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

largo del tiempo; la evidencia muestra que los patrones de votacion circular se ha intensificado durantelos ultimos anos producto del surgimiento de facciones ideologıas extremas dispuestas a votar en contrade la corriente principal del partido (especialmente entre los republicanos).

Los modelos presentados en esta seccion aun no cuentan con una amplia aplicacion; las implementacionesexistentes no solo son novedosas y proporcionan evidencia empırica para un fenomeno reciente, sino quetambien senalan caminos metodologicos que aun estan por investigar. Por ejemplo, aun no se reportantrabajos que ilustren como incorporar e interpretar abstenciones estrategicas en este tipo de modelos; lasaplicaciones expuestas, hasta el momento, suponen que los valores perdidos son resultado del azar. Adi-cionalmente, hay un camino abierto, para la exploracion de distribuciones previas que resulten adecuadasen contextos de esferas de alta dimension (Yu and Rodriguez, 2019a).

2.2. Estudios en el contexto de America Latina.

En la ultima decada, se ha evidenciado un aumento en el uso de datos de votacion nominal para analizarcomportamiento legislativo en contextos distintos al de Estados Unidos (ver, e.g., Desposato, 2001; Des-posato, 2003; Hix et al., 2005; Jones and Hwang, 2005a; Zucco, 2013). Analistas de diferentes legislaturas,han utilizado este tipo de datos para examinar diversos fenomenos polıticos, tomando prestadas tecni-cas desarrolladas para el estudio del congreso norteamericano; no obstante, hay quienes senalan, que esimportante tener en cuenta la variacion institucional de la polıtica legislativa a la hora de implementarestas metodologıas (Jones and Hwang, 2005a). Particularmente, se exalta la necesidad de reflexionarsobre la validez que tienen teorıas y supuestos que subyacen a los modelos de votacion espacial, comoel estimador de punto ideal Bayesiano, cuando estos se aplican en contextos que difieren de la polıticaestadounidense (ver, e.g., Jones and Hwang, 2005a; Pereira and Mueller, 2004a; Zucco, 2013).

Los estudios sobre el Congreso de los Estados Unidos son, teorica y metodologicamente, el subcampo masavanzado en ciencias polıticas (Jones and Hwang, 2005a). Este desarrollo ha proporcionado un amplioconocimiento del parlamento norteamericano pero ha mostrado un impacto limitado en la evolucion dela teorıa legislativa en terminos generales (Gamm and Huber, 2002). Dicha limitacion, se debe a quemetodos y teorıas se han enmarcado en un contexto institucional muy particular (e.g., bipartidista),cuyas caracterısticas distan de la mayorıa de los sistemas presidenciales democraticos del mundo, enparticular, de los sistemas de America Latina. En este sentido, algunos autores senalan que para mejorarla comprension de la conducta de votacion de cuerpos deliberantes y avanzar en la teorıa general de lasinstituciones legislativas en Latinoamerica, la ruta mas prometedora es partir de los desarrollos dadosen el contexto norteamericano para adaptarlos a las legislaturas de la region (Gamm and Huber, 2002).En esta lınea, son varios los autores que han postulado extensiones teoricas (e.g, Jones and Hwang,2005a) y metodologicas (e.g, Tsai, 2020) para el analisis del comportamiento legislativo en el continenteamericano. Tambien hay quienes han aplicado metodologıas sin ninguna adaptacion (e.g., McDonnell,2017); en este ultimo caso, es importante reconocer las limitaciones que presenta la aplicacion directade metodos implementados en el contexto norteamericano, en terminos de las variables contextuales queno se contemplan y que pueden tener efectos en la precision de las estimaciones e inferencias desde unpunto de vista estadıstico.

El analisis sistematico de la votacion legislativa en Latinoamerica tiene sus inicios en los 90, epoca en laque algunos paıses de la region toman decisiones importantes en terminos de sus polıticas de estado. Porejemplo, en Brasil se promulga la constitucion polıtica de 1988 (Tsai, 2020), en Chile cae la dictadura delgeneral Augusto Pinochet y el paıs entra en transicion democratica en 1990 (Carey, 1998) y en Colombiase promulga la nueva constitucion polıtica de 1991, en la cual se otorga un mayor poder al legislativo(Carroll and Pachon, 2016). En este contexto, las legislaturas empiezan a tener un papel preponderanteen la formulacion de proyectos de ley (McDonnell et al., 2019) y los datos de votacion legislativa empiezana ser mas accesibles para los cientıficos interesados en la investigacion polıtica con enfoque cuantitativo.En Colombia, los registros de votacion en general, y en particular, los datos de votacion nominal empiezana ser recopilados a partir del 2006 (Carroll and Pachon, 2016).

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 35: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 35

Bajo este panorama, las legislaturas latinoamericanas se constituyen en un campo joven para realizaranalisis empıricos de conducta electoral parlamentaria. Investigaciones recientes, han evidenciado que esposible la aplicacion del estimador de punto ideal Bayesiano en varios parlamentos de la region (ver, e.g,McDonnell, 2017; Tsai, 2020; Zucco, 2013); algunos de estos estudios, tambien han resaltado la necesidadde adaptar el estimador estandar a las caracterısticas institucionales parlamentarias, con el proposito deproducir estimaciones y resultados que expliquen aspectos de interes polıtico coherentes con la realidadlegislativa de las camaras objeto de analisis (ver, McDonnell, 2017; Tsai, 2020).

Para tener una perspectiva general sobre la direccion que han tomado los estudios del comportamientolegislativo en America Latina en los ultimos anos, en particular, de las investigaciones que han aplicadoy adaptado al contexto, el estimador de punto ideal Bayesiano, se propone una taxonomıa, en la mismalınea de Estados Unidos, para presentar los hallazgos de la revision de la literatura en Latinoamerica.En este escenario, se identifican cuatro lıneas, segun el fenomeno de estudio: (i) dimension del espaciopolıtico (Seccion 2.2.1), (ii) cambios en las preferencias polıticas de los legisladores (Seccion 2.2.2), (iii)abstenciones estrategicas (Seccion 2.2.3), (iv) e influencia del ejecutivo, lideres y grupos polıticos (2.2.4).A continuacion se detalla cada una de las categorıas propuestas.

2.2.1. Dimension del espacio polıtico.

Son pocos los estudios en el contexto Latinoamericano que se enfocan en la estimacion de las dimensionesdel espacio polıtico; la mayorıa de los trabajos asumen una o dos dimensiones subyacentes al comporta-miento de votacion nominal y la postulacion de las mismas de fundamenta en el contexto polıtico de laslegislaturas objeto de analisis (ver, e.g., Zucco, 2013; Zucco and Lauderdale, 2011). En esta vıa, algunosautores senalan que aspectos como la presencia de partidos religiosos, linguısticos o etnicos son sospe-chosos de la existencia de una segunda dimension ideologica (Zucco and Lauderdale, 2011); en cambio,la presencia de coaliciones, distritos electorales, divisiones regionales o provinciales, entre otros, son in-dicadores de posibles dimensiones superiores no ideologicas (Zucco and Lauderdale, 2011; Zucco, 2013).Por otro lado, hay quienes afirman que en la mayorıa de los paıses de la region, la polıtica legislativa esunidimensional (Rosas, 2005).

La revision de la literatura en esta lınea, permite identificar un solo trabajo, en el contexto de Argentina,que explora el numero de rasgos latentes que subyacen a la votacion legislativa del parlamento. Inspiradoen el trabajo de Jackman (2001), Jones and Hwang (2005a) propone examinar la dimension del espaciopolıtico a traves del analisis de los parametros de discriminacion del estimador de punto ideal estandar.Postula un modelo unidimensional con distribuciones previas normales de media 0 y varianza 2 para loscoeficientes αj (parametros de discriminacion, ver Seccion 1.9). Las estimaciones de estos parametrosproporcionan evidencia empırica para garantizar que existe solo una dimension subyacente al espaciode polıticas en el caso de la votaciones nominales de la Camara de Representantes de Argentina parael periodo 1989-2003. Este autor afirma que, un modelo unidimensional se ajusta razonablemente a losdatos de votacion nominal y que es muy poco probable que un modelo de mayor dimension proporcioneun mejor ajuste.

2.2.2. Cambio en las preferencias polıticas de los legisladores.

En el contexto latinoamericano, particularmente en el escenario de Brasil, se han desarrollado estudiosque proponen comparar el comportamiento legislativo de las camaras o instituciones que componen elcongreso. En esta direccion, se han presentado trabajos que confrontan estimaciones de los puntos idealesde los miembros de la Camara de Diputados y los integrantes del Senado Federal de Brasil (Bernabel,2015); no obstante, la metodologıa y los resultados de algunos de estos trabajos ya han sido cuestionados(Shor et al., 2010; McDonnell, 2017), debido a que el contraste se realiza sobre estimaciones producidascon conjuntos de datos separados y metodologicamente no se presenta un propuesta para afrontar elproblema de garantizar una escala latente comun (ver, detalles en la Sesion 2.1.4).

Con el objeto de establecer una metodologıa apropiada que permita contrastar el comportamiento de

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 36: M etodos Bayesianos para caracterizar el comportamiento ...

36 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

votacion de las camaras brasilenas a lo largo del tiempo, McDonnell (2017) propone la aplicacion delestimador de punto ideal Bayesiano dinamico estandar (ver, Quinn, 2004), en su version unidimensional(izquierda - derecha). Este autor no presenta una extension del modelo, pero su trabajo expone consi-deraciones metodologicas e institucionales, propias del contexto brasileno, que considera permiten hacereste tipo de contrastes de una forma valida. Particularmente, propone establecer un espacio polıticocomun entre camaras, a traves de votaciones conjuntas de los miembros de ambas casas. De esta manera,aprovecha una caracterıstica del sistema polıtico de Brasil: diputados y senadores suelen votar secuen-cialmente en el Congreso Nacional. Con esta estrategia, busca equiparar el comportamiento legislativocon la aplicacion de una prueba educativa; asegurando que si los legisladores de ambas camaras votansobre las mismas polıticas y lo hacen casi de manera simultanea, el problema de la escala desaparece ylos puntos ideales, βi, son comparables.

2.2.3. Abstenciones estrategicas.

En la lınea de las abstenciones estrategicas se identifica un solo trabajo inspirado en el estimador depunto ideal Bayesiano, el cual es un referente teorico y metodologico para comprender el fenomenoen cuestion. El estudio de Rosas and Shomer (2008) presenta una extension del estimador de puntoideal canonico (modelo estandar donde las abstenciones se asumen completamente aleatorias, tambiendenominado modelo de abstenciones ignorables) para analizar procesos de abstencion y votacion demanera simultanea, en situaciones en las que se sospecha que los datos faltantes no ocurren de maneracompletamente aleatoria. La extension propuesta se ilustra a traves de los datos del Congreso Federalde Argentina para el periodo 1993-1995. Rosas and Shomer (2008) afirma que los datos de votacionnominal de este parlamento son propicios para el analisis, debido a las altas tasas de abstencion yausencia registradas (un total de 32 % para el periodo objeto de analisis); ademas, senala que la literaturadisponible (ver, Jones and Hwang, 2005a), ofrece argumentos para pensar que las abstenciones en elescenario argentino no son ignorables. Estos autores, postulan un modelo probit bivariado unidimensional,que recoge dos fuentes de informacion: (i) la eleccion de voto (1=SI, 0=NO) y (ii) el indicador de registrode voto (1= No registro y 0= Registro) de los legisladores. A partir de esta informacion, se define y∗1,i,jy y∗2,i,j como predictores lineales que impulsan la probabilidad de voto positivo y de abstencion para ellegislador i en la mocion j, respectivamente. Estos predictores se expresan como:

y∗1,i,j = µj + αjβi + γjci + ε1,i,j donde ε1,i,jiid∼ N(0, 1) (11)

y∗2,i,j = ηj + δjci + ε2,i,j donde ε2,i,jiid∼ N(0, 1) (12)

donde (11) es el modelo latente canonico con un predictor adicional ci que representa el parametro depropension (latente o no observada) a la abstencion del legislador i en la mocion j, γj es el efecto delparametro de propension del legislador i sobre la probabilidad de un voto positivo a la mocion j; estosparametros se incorporan a fin de permitir que el proceso de abstencion sea informativo del resultadode la votacion. Por otro lado, (12) es el modelo que caracteriza el mecanismo generador de abstencion(probabilidad de que el legislador i se abstenga en el voto j); en este ultimo δj y ηj son parametrosespecıficos de la lista de votacion j. Las distribuciones previas de los parametros se definen bajo elsupuesto de la influencia de las delegaciones de los partidos provinciales (PPD, por sus siglas en ingles)sobre el comportamiento electoral de los diputados (ver, Jones and Hwang, 2005b); se presume que laspropensiones de abstencion se agrupan dentro de las PPD, en tanto, se define una previa comun paralos miembros de una misma delegacion. En este sentido, la membresıa de los legisladores se convierteen un mecanismo para refinar las estimaciones y mejorar el desempeno del modelo frente al estimadorestandar. Aunque fueron 20 los partidos con representacion en el congreso durante el periodo objeto deanalisis, los resultados solo proveen informacion sobre el proceso de votacion y abstencion del partidomayoritario y de oposicion.

Finalmente, Rosas and Shomer (2008) manifiesta que el modelo expandido funciona mejor que el modeloconvencional que asume ignorabilidad de las abstenciones; no obstante, senala que la informacion conte-

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 37: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 37

nida en los datos legislativos es escasa y en tanto, el analisis muestra pocas mejoras frente al estimadorestandar. Por otro lado, advierte que el modelo propuesto permite obtener conclusiones en relacion alproceso polıtico que genera abstenciones y elecciones de voto; especıficamente, proporciona informacionacerca de las listas de votacion y los proyectos de ley que generan mayores tasas de abstencion y quemejor discriminan entre legisladores. Por ultimo, senala que el modelo extendido ofrece informacion quepermite explorar la credibilidad de los supuestos tradicionales sobre los valores perdidos.

2.2.4. Influencia del ejecutivo, lideres y grupos polıticos.

En comparacion con las categorıas previas de America Latina, los hallazgos en esta lınea, han mostradouna literatura mas amplia. La influencia del ejecutivo, lideres y grupos polıticos (lideres de partidomayoritario, coaliciones, delegaciones, etc.) en la votacion legislativa es un fenomeno destacable en laregion; estudios en esta direccion, han analizado el fenomeno en cuestion, bajo diferentes metodologıas.Segun los hallazgos, han sido objeto de analisis las camaras legislativas de Argentina ( Aleman et al.,2018; Clerici, 2021; Jones and Hwang, 2005a), Brasil (Borges et al., 2020; Hiroi and Renno, 2016; Pereiraand Mueller, 2004b; Tsai, 2020; Zucco and Lauderdale, 2011), Chile (Aleman, 2008; Aleman and Navia,2016; Carey, 1998), Colombia (Carroll and Pachon, 2016; Pachon and Johnson, 2016), Peru (Ponce, 2016)y Uruguay (Zucco, 2013). Estas investigaciones han mostrado que las legislaturas en America Latinapresentan una estructura y dinamica propia que difiere del parlamento de Estados Unidos (Pereira andMueller, 2004b); adicionalmente, han senalado que la relacion ejecutivo-legislativo (Pereira and Mueller,2004b; Zucco, 2013), la consolidacion de coaliciones gobierno-oposicion (Carey, 1998; Carroll and Pachon,2016; Tsai, 2020; Zucco and Lauderdale, 2011), el multipartidismo (Ames, 2002; Neto, 2002; Figueiredoand Limongi, 2000; Pereira and Mueller, 2004b; Tsai, 2020; Zucco, 2013), la jerarquıa de los actorespolıticos y las subdivisiones internas (comites) o externas (circunscripciones, delegaciones, entre otras)a las camaras legislativas (Cheibub et al., 2009; Clerici, 2021; Jones and Hwang, 2005a; Pachon andJohnson, 2016; Tsai, 2020), son factores determinantes de conducta electoral parlamentaria. Incluso, hayquienes argumentan que, en contraste con el componente ideologico, estos tienen un mayor impacto enel proceso de votacion legislativa (ver, e.g., Aleman et al., 2018; Tsai, 2020).

Las hipotesis de investigacion en esta lınea, se apoyan en las caracterısticas propias de los sistemaspolıticos en los cuales se incrustan las legislaturas; especıficamente, se fundamentan en las reglas insti-tucionales que otorgan poder legislativo a ciertos grupos o actores polıticos (lideres de partido, jefes departido mayoritario, presidentes estatales o de comites, gobernadores, coaliciones, etc.) y que, en algunoscasos, favorecen fenomenos como el patrocinio, el clientelismo y la corrupcion dentro del parlamento, loscuales, influyen drasticamente en la decision de voto de los legisladores (Tsai, 2020).

En algunos de los sistemas polıticos latinoamericanos, son los jefes institucionales quienes tienen el poderpara legislar e influir en el comportamiento de votacion de los diputados; su poder se deriva del manejode recursos estatales (cargos publicos, presupuesto, beneficios para distritos electorales potenciales, entreotros) y del dominio de la burocracia, aspectos de los que dependen los legisladores para su supervivenciapolıtica (Tsai, 2020; Pereira and Mueller, 2004b). En el caso de los jefes de Estado, el control de los recur-sos polıticamente importantes, les permite influir, de manera directa o indirecta (e.g, a traves de lideresde partido o coaliciones), sobre el comportamiento electoral parlamentario a fin de asegurar resultadosconsistentes con los intereses del ejecutivo; tal proceder tiene como consecuencia, un comportamientode votacion legislativo, cuyo resultado es producto de factores que van mas haya de la ideologıa polıtica(Tsai, 2020; Zucco and Lauderdale, 2011).

La influencia del ejecutivo sobre el parlamento, se ha convertido en la fuente del conflicto legislativo enalgunos paıses de la region (Tsai, 2020; Zucco and Lauderdale, 2011) y recientemente, se ha argumentadoque frente a la ideologıa, la relacion ejecutivo-legislativo, es la dimension mas importante para explicarla votacion nominal en algunos de los congresos latinoamericanos (Zucco and Lauderdale, 2011). Elintercambio de favores polıticos entre estas dos ramas del poder publico, comunmente se estructura atraves de la formacion estrategica de coaliciones no ideologicas (Alston and Mueller, 2006; Figueiredoand Limongi, 2000; Neto, 2006; Pereira and Mueller, 2004a); alianzas mediante las cuales el gobierno

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 38: M etodos Bayesianos para caracterizar el comportamiento ...

38 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

busca equilibrar fuerzas en el parlamento para obtener beneficios legislativos.

En este direccion y con el objeto de operacionalizar el fenomeno de la influencia del ejecutivo y los grupospolıticos, Tsai (2020), propone adaptar el modelo de votacion espacial Bayesiano para incorporar factoresno ideologicos (como la membresıa a la coalicion gobernante) al analisis de la votacion nominal; basadoen estudios previos, describe tales factores y utiliza el modelo propuesto para ofrecer evidencia empıricade la relevancia de los mismos en el comportamiento de votacion legislativa de la Camara de Diputadosde Brasil durante el periodo 2003-2006.

Tsai (2020), manifiesta que la extension del modelo es necesaria, dado que la asamblea de Brasil esun ejemplo de una legislatura que refleja una conducta electoral mediada por la negociacion polıtica(estrategias para acceder a recursos polıticos) y las preferencias ideologicas; en tanto, las estimaciones depuntos ideales estandar no resultan optimas, puesto que, no distinguen entre el impacto de la dinamicade la coalicion y el efecto de las preferencias polıticas individuales que subyacen al comportamiento devotacion (otros autores que sugieren una reconfiguracion de los modelos de votacion espacial bajo unargumento similar son Zucco, 2009; Zucco and Lauderdale, 2011).

La estrategia de modelado propuesta por Tsai (2020), asume que el problema polıtico subyacente a lavotacion nominal tiene un contenido ideologico unidimensional (izquierda–derecha) bajo el cual se puedeobservar decisiones de voto diferentes para legisladores que mantienen la misma posicion polıtica. En estesentido, argumenta que la discrepancia en la eleccion se puede explicar por el estado gobierno-oposicion,especıficamente, senala que se puede evidenciar a traves del analisis de los parametros de dificultad, µj ,del modelo de regresion (13) bajo el cual opera el estimador de punto ideal Bayesiano.

Tsai (2020), operacionaliza la influencia del ejecutivo en la votacion legislativa a traves de la afiliacionpartidista de los diputados y la membresıa de los partidos a la coalicion gobernante. Asume que loslegisladores, cuyo partido pertenece a la coalicion, tienen incentivos adicionales, δ > 0 y λ > 0, si votana favor de las propuestas del gobierno y en contra de las propuestas de la oposicion, respectivamente.En el contexto polıtico de Brasil, los incentivos son exclusivos de los aliados del gobierno, puesto que, elpresidente solo distribuye los recursos polıticos entre sus copartidarios.

En esta vıa, de manera analoga a la formulacion dada en Clinton et al. (2004), los incentivos adicionales,producto del conflicto gobierno–oposicion, se incorporan a las funciones de utilidad como sigue:

Ui(ψj) = −(ψj − βi)2 + δ ·MGobk[i]PGobj + ηi,j

y

Ui(ζj) = −(ζj − βi)2 + λ ·MGobk[i]POpoj + υi,j ,

donde Ui(ψj) y Ui(ζj) representan las utilidades del legislador i por votar “SI” o “NO” a la mocion j,respectivamente; ηi,j y υi,j son los choques aleatorios, cuya distribucion conjunta es tal que E(ηi,j−υi,j) =0 y Var(ηi,j − υi,j) = σ2

j ; los cuales son independientes tanto de los legisladores como de las mociones(Jackman, 2004). Adicionalmente, k[i] = 1, · · · ,K denota la afiliacion partidista del legislador i, MGobk[i]

corresponde a un indicador binario que toma el valor de 1 cuando el legislador i pertenece al partido kde la coalicion gobernante, y en caso contrario, toma el valor de 0; PGobj y POpoj son variables dummyque toman el valor de 1 cuando la propuesta j proviene del gobierno y de la oposicion, respectivamente,en caso contrario, estos toman el valor de 0.

Bajo esta configuracion, los incentivos δ y λ tienen un efecto directo sobre el parametro, µj , del modelode regresion (13). Ası, considerar incentivos adicionales, conlleva a que el valor de µj dependa del estadode gobierno u oposicion de la propuesta j, permitiendo que este parametro se pueda modelar en funcionde la dinamica de la coalicion, como sigue:

µj = γ1 + γ2PGobj + νj νjiid∼ N(0, σ2

ν) ,

donde γ1 representa la probabilidad de referencia para otorgar un voto positivo cuando la propuestaes emitida por la oposicion, mientras que γ2 > 0 indica que el conflicto gobierno–oposicion incrementa

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 39: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 39

la probabilidad de votar a favor cuando la propuesta j es gubernamental, i.e., la dinamica gobierno-oposicion favorece el exito del ejecutivo, y γ2 < 0 indica que la dinamica de la coalicion no tiene unefecto positivo en direccion gubernamental. Tsai (2020) asume las siguientes distribuciones previas:

σ2ν ∼ GI

(a0

2,b02

)

γ1 ∼ N(γ0, σ2ν) y γ2 ∼ N(γ0, σ

2ν) ,

donde a0, b0 y γ0 son hiperparametros.

Tsai (2020), tambien incorpora la afiliacion partidista al estimador propuesto con el fin tener en cuenta lavariacion entre partidos y analizar el efecto de la coalicion gobernante en la votacion legislativa a travesde una base partidista. El estimador de punto ideal estandar, supone que los puntos ideales se muestreana partir de una distribucion previa comun, sin embargo, los legisladores de diferentes partidos puedentener preferencias distintas o incluso opuestas. Para incorporar las diferencias entre partidos, supone queel punto ideal del legislador i proviene de una distribucion especıfica de su partido polıtico, la cual secentra en la media del partido µβk[i]

con varianza σ2β , i.e.,

βi | µβk[i], σ2β∼N(µβk[i]

, σ2β).

La especificacion de una distribucion previa partidista para los puntos ideales, esta inspirada en Zuccoand Lauderdale (2011), pero a diferencia de estos autores, Tsai (2020) propone hiperprevias para lamedia del partido, en lugar de fijarlas en valores estimados a partir de una encuesta. En este sentido,propone que

µβ1| µβ2

∼U(−3, µβ2), µβk

| µβk−1, µβk+1

∼U(µβk−1, µβk+1

), µβK| µβK−1

∼U(µβK−1, 3) ,

para k = 2, · · · ,K − 1. Ası, µβkesta sujeto a una restriccion de ordenamiento previa, a traves de la

cual se organizan los partidos polıticos de izquierda a derecha, teniendo en cuenta posiciones que hansido identificadas por otros autores (ver e.g., Zucco, 2009; Zucco and Lauderdale, 2011). Adicionalmente,basado en el orden preestablecido, se seleccionan dos partidos con diferencia ideologıa, para anclar los ex-tremos de la escala. Esta especificacion, le permite resolver el problema de la invarianza rotacional, puestoque, hace que los partidos de izquierda y derecha esten al lado correspondiente de la escala ideologicasubyacente. Por otro lado, el elegir “partidos de anclaje” con diferentes ideologıas pero pertenecientesal mismo campo, en terminos del estatus gobierno-oposicion (seleccion que se fundamenta en estudiosprevios, ver, Zucco and Lauderdale, 2011), permite asegurar que la dimension ideologica subyacente,previamente asumida, y el conflicto gobierno-oposicion no se superponen por completo.

De esta manera, el modelo permite detectar si el comportamiento de voto de los legisladores esta influen-ciado por efectos no ideologicos como el conflicto gobierno–oposicion al estimar puntos ideales de tantode legisladores como de partidos. Ademas, debido a que el modelo, discrimina entre el comportamientoestructurado por la coalicion y el inducido por las preferencias, permite analizar si los puntos idealesestimados reflejan o no las preferencia de los legisladores.

En el caso de los parametros de discriminacion, αj , Tsai (2020) senala que estos pueden ser positivos onegativos, y asume que su signo revela el estado ideologico de la propuesta j; en tanto, propone especificarsus distribuciones previas de la siguiente manera:

αj∼N(−2, 1)I(αj < 0) para j = 1, · · · ,m0

αj∼N(0, 1) para j = m0, · · · ,m

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 40: M etodos Bayesianos para caracterizar el comportamiento ...

40 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

donde I(·) denota una funcion indicadora. Para abordar el problema de la invariancia de escala, Tsai(2020), propone reescalar todos los parametros del modelo, mediante una estandarizacion en cada itera-cion del MCMC.

La aplicacion del modelo, permitio concluir, en el escenario de Brasil, que el conflicto gobierno-oposiciontiene efecto en el comportamiento de votacion legislativo. Tsai (2020) afirma, que sus resultados reve-lan que los legisladores con membresıa en la coalicion gubernamental, son mas propensos a apoyar laspropuestas del gobierno sin importar si son de izquierda o de derecha; los hallazgos tambien muestranque la votacion legislativa se basa en los partidos, puesto que, estos juegan un papel importante enel conflicto gobierno–oposicion. Adicionalmente, senala que la estimacion de los puntos ideales de los11 partidos en la escala ideologica izquierda–derecha, exhibe un ordenamiento proximo al de estudiosprevios; finalmente, senala que el modelo permitio identificar los partidos polıticos y legisladores paralos cuales los puntos ideales individuales se alejan de la media del partido (i.e., partidos que presentanuna mayor variabilidad en los puntos ideales de sus legisladores), poniendo en evidencia aquellos grupospolıticos cuyos miembros muestran mayor influencia del conflicto gobierno-oposicion,

En el mismo espıritu de Tsai (2020), se encuentra la propuesta de Zucco and Lauderdale (2011), quienesplantean una version del estimador de punto ideal estandar en dos dimensiones, izquierda–derecha ygobierno–oposicion. Tales dimensiones se asumen fundamentadas en la literatura polıtica disponible y sepostulan como un mecanismo que permite discriminar los efectos ideologicos de la dinamica de la coalicionen el contexto de Brasil. Estos autores utilizan votaciones nominales junto con datos de encuestas en elanalisis, estas ultimas con la intencion de identificar previamente la dimension ideologica autoinformadade los legisladores. Especıficamente, utilizan informacion auxiliar, para especificar una distribucion previainformativa para la primera dimension de los puntos ideales de los legisladores; la distribucion previa seasume como normal centrada en la media estimada del partido al que pertenece el legislador con varianzaconstante para todos los puntos ideales. Para la segunda dimension, estos autores, utilizan una previanormal con media 0 y varianza 1.

A diferencia de Tsai (2020), Zucco and Lauderdale (2011) no incorporan efectos adicionales a las funcionesde utilidad, su analisis se centra en la evaluacion de la fuerza relativa que tienen las dos dimensiones endiferentes periodos legislativos. Sus resultados les permiten concluir que cuando se forman coalicionescoherentes desde el punto de vista ideologico y los incentivos proporcionados por el gobierno refuerzan lasdiferencias ideologicas, es difıcil evaluar la importancia relativa de cada dimension, en cambio, cuando seforman coaliciones incoherentes desde una perspectiva ideologica, estas dos dimensiones son distinguibles.

Por otro lado, Jones and Hwang (2005a) aplica el estimador estandar para recuperar los puntos ideales delos legisladores de la Camara de Diputados de Argentina en el perıodo 1989-2003. Este autor no presentauna discusion alrededor de las estimaciones realizadas, su enfoque se centra en utilizar dichas estimacionespara construir una medida de homogeneidad para las PPD (ver, Seccion 2.2.3). Esta medida se establececomo un indicador de comportamiento legislativo provincial a traves del cual busca analizar la influenciade los gobernadores en la conducta legislativa de sus copartıcipes provinciales en la Camara de Diputados.La evaluacion del efecto del gobernador en la conducta electoral parlamentaria, se lleva a cabo bajo unmodelo de regresion lineal, cuya variable respuesta es la homogeneidad estimada a partir de los puntosideales y las variables explicativas son variables dummy asociadas con caracterısticas del gobernador.Sus resultados senalan que el analisis de la homogeneidad del PPD y de las votaciones nominales norespaldan sus hipotesis; contrario a lo que se establece desde la teorıa polıtica, los resultados no revelanefectos provinciales en el comportamiento legislativo de los diputados y tampoco reflejan alguna relacionsignificativa entre las caracterısticas del gobernador y la medida de homogeneidad estimada.

En una direccion similar, Zucco (2013) propone analizar las relaciones ejecutivo-legislativo en el contextodel Senado de Uruguay entre 1985 y 2005. Su propuesta se hace bajo el estimador de punto idealestandar unidimensional por dos razones: (i) disponen de un numero de votos reducido para el analisisdel comportamiento de votacion del Senado de Uruguay, y (ii) argumentan que el sistema de partidos deeste paıs se caracteriza por una alta institucionalizacion. Esto ultimo, conlleva a que el comportamientolegislativo se explique en una sola dimension. La estimacion de los puntos ideales, permite evidenciarque las posiciones de los legisladores senalan una division gobierno-oposicion mas no un fraccionamiento

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 41: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 41

ideologico izquierda-derecha; esta revelacion, conduce a considerar que la dimension asumida no puedeinterpretarse en terminos ideologicos sino que debe explicarse funcion de la relacion ejecutivo-legislativo.

Con el fin de evaluar sistematicamente el efecto de la coalicion de gobierno en el comportamiento legis-lativo, Zucco (2013), en una direccion similar a la Jones and Hwang (2005b) propone utilizar los puntosideales estimados para construir un ındice de comportamiento legislativo; dicha medida se define comola diferencia absoluta promedio entre los puntos ideales estimados para los miembros de la faccion par-tidista y el punto ideal estimado para el presidente del Senado, quien es miembro del gabinete. Zucco(2013), emplea la medida de comportamiento legislativo como la variable dependiente de un modelo to-bit (Amemiya, 1984), la cual se explica a traves de variables independientes estimadas (e.g., la distanciaideologica promedio de la faccion al presidente y la proporcion de pasadas de lista en las que la faccionocupo un puesto ministerial) a partir de diferentes fuentes de datos (votaciones nominales, encuestasrealizadas por el Instituto de Ciencia Polıtica de Uruguay, entre otras).

La propuesta de un modelo tobit conlleva a pasar de un analisis a nivel de legislador a una exploracion anivel de agregado; el autor justifica esta decision en dos aspectos; (ii) la teorıa polıtica y los puntos idealesestimados senalan que el comportamiento de los legisladores de una misma faccion es muy similar; y (ii)no se dispone de datos ideologicos a nivel individual, ademas, la participacion en el gabinete se mide anivel de faccion. Jones and Hwang (2005b) argumentan que sus resultados obtenidos permiten reconocerque la ideologıa afecta la presencia de la facciones en el gabinete y que los legisladores cuyas faccionesocupan cargos ministeriales se comportan de una manera mas progubernamental de lo que su ideologıapuede predecir. Finalmente, senala que sus resultados no solo muestran que las coaliciones funcionan enterminos ejecutivos, sino que tambien sugiere que esto sucede porque los presidentes usan recursos bajosu control para atraer el apoyo de los legisladores.

2.3. Estudios en Colombia.

En el contexto Colombiano son pocos los estudios que aplican algun modelo de votacion espacial paraanalizar la conducta electoral parlamentaria; en particular, a la fecha, no hay investigaciones que em-pleen el modelo de votacion espacial Bayesiano cuadratico para estimar preferencias individuales de loslegisladores a partir de datos de votacion nominal. La literatura disponible, senala un incipiente cam-po de investigacion y es una pieza fundamental tanto para la comprension de la actividad legislativaen Colombia como para perfilar investigaciones orientadas a emplear herramientas metodologicas quepermitan obtener evidencia empırica de los determinantes del comportamiento legislativo en el paıs.

Las investigaciones dirigidas al estudio de los comites en Colombia datan de los anos 70 1 (Hoskin, 1975;Hoskin et al., 1976; Kline, 1974; Kline, 1977); estas caracterizaron el parlamento colombiano desde unpunto de vista descriptivo (e.g., Kline, 1977) y bajo un contexto previo a la Reforma Constitucionalde 1991, la cual modifico sustancialmente la reglamentacion del Congreso de la Republica y el procesode formulacion de polıticas en el paıs (Pachon and Munoz, 2020; Cardenas et al., 2008). Posterior a la

1En la decada de los 70 los estudios orientados a analizar el comportamiento partidista en Colombia evidenciaron laaplicacion de modelos espaciales para hacer analisis empıricos de la polıtica nacional; aunque estas investigaciones no secentraron en la estimacion de puntos ideales de los legisladores ni en el analisis del comportamiento de votacion en loscuerpos legislativos a partir de votaciones nominales, son un referente en el contexto colombiano de estudios que hanreportado preferencias de actores y grupos polıticos, y que han planteado una discusion acerca de la dimension del espaciopolıtico en el paıs. Un ejemplo de este tipo de estudios, es el trabajo de Hoskin and Swanson (1973), quienes aplicaronuna version modificada del modelo espacial de Downs (1957) utilizando datos de encuestas realizadas a actores polıticoscon diferentes jerarquıas y de distintos partidos polıticos. La aplicacion del modelo permitio identificar las dimensiones delconflicto en el sistema de partidos colombiano, destacando dos dimensiones sobresalientes, un polo gobierno-oposicion yun polo ideologico (izquierda-derecha); tambien senalaron que el conflicto centrado en el control del gobierno habıa sidomas contundente que el conflicto ideologico, pero que ese panorama estaba cambiando, con perspectivas de una mayorinestabilidad polıtica en el paıs. Estos mismos autores, en un trabajo posterior (Hoskin and Swanson, 1974) senalaron quela relevancia de cada dimension del conflicto difiere segun la ubicacion de los encuestados en sus respectivas jerarquıaspartidistas. Otro trabajo que aludio a las dimensiones que subyacen en las preferencias de los miembros de los partidospolıticos fue el de Hoskin (1979) quien a traves de un analisis factorial de datos suministrados por una encuesta aplicadaa lideres de partido, senalo seis dimensiones subyacentes en el conflicto partidista: religiosidad, pro-comunismo, eficacia departido polıtico, orientacion del partido polıtico, conflicto de clases y orientacion antisistema.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 42: M etodos Bayesianos para caracterizar el comportamiento ...

42 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

reforma, los estudios relacionados con el comportamiento legislativo, senalan un camino reciente; segunlos hallazgos, la mayor parte de las investigaciones sobre conducta parlamentaria datan de finales delos 90 en adelante. Estudios como los de Archer and Shugart (1997), Cardenas et al. (2008), Alemanand Pachon (2008), Pachon (2011), Carroll and Pachon (2016), Pachon and Johnson (2016), Pachonand Munoz (2020), entre otros, ofrecen una mirada de la legislatura colombiana, desde su contextoactual y algunos exponen metodos estadısticos que se han utilizado para caracterizar el comportamientode los miembros del Congreso de la Republica (e.g., Carroll and Pachon, 2016; Pachon and Johnson,2016). Especıficamente, en estos estudios se ha encontrado una caracterizacion de las instituciones quecontrolan la agenda legislativa, ası como una discusion en relacion al impacto que tiene el sistemas departidos, las coaliciones y las comisiones permanentes en la actividad del Congreso. Ası mismo, algunosde estos trabajos proveen analisis cuantitativos en relacion a la naturaleza programatica, patrones devotacion nominal y tendencias de actividad legislativa de los partidos polıticos, coaliciones y comitesconstitucionales (e.g., Carroll and Pachon, 2016; Pachon and Johnson, 2016).

En relacion a las instituciones que controlan la agenda en el Congreso, se ha identificado que tantolos diputados como el presidente de la Republica, tienen poderes constitucionales que los empoderanpara supeditar el proceso de formulacion de polıticas de Estado. En el caso de los diputados, las reglasdescentralizadas del Congreso (Pachon and Johnson, 2016; Rodrıguez, 2017), los facultan para influirtanto en la agenda como en el contenido de los proyectos de ley; los parlamentarios pueden bloquear,modificar y retrasar la legislacion desde su actividad en los comites (Carroll and Pachon, 2016; Pachonand Munoz, 2020). Al interior de las comisiones, la mesa directiva 2 decide el orden del dıa y asignaponentes a los proyectos de ley destinados a cada comite (Pachon and Munoz, 2020); en el proceso dedesignacion de relatores y elaboracion de informes sobre la viabilidad de los proyectos de ley, presidentes,vicepresidentes y miembros de las comisiones de cada camara, ejercen influencia sobre la agenda y lalegislacion. Pachon and Johnson (2016), argumentan que los presidentes de las comisiones, utilizan esteproceso no solo para establecer la agenda sino tambien para privilegiar la legislacion patrocinada porel ejecutivo y sus copartidarios. Ademas, ser asignado como ponente de un proyecto, otorga poderesinstitucionales a los legisladores, dado que, les permite proponer cambios al documento original antesde que se abra su primer debate, archivarlo sin que este haya sido discutido o retrasar su paso por lalegislatura sugiriendo ajustes para seguir su transito por el parlamento (Pachon, 2011).

Todos los proyectos de ley tienen que pasar por la etapa de comite para continuar el proceso legislativo ytener oportunidad de aprobacion, por ende, su paso por las comisiones hace de estas instituciones las masimportantes en el proceso legislativo colombiano (Carroll and Pachon, 2016). Pachon and Munoz (2020),senalan que los comites y las juntas directivas de los mismos y de las plenarias, son actores que jueganun papel preponderante en el proceso legislativo de la nacion, subordinando el papel de los lideres departido y el ejecutivo, quienes necesitan influir en los miembros de comite y sus directivas para promovero detener proyectos de ley al interior del parlamento. Tal es el poder de estas instituciones que la mayorıade los proyectos terminan su paso por la legislatura en la primera etapa de discusion, es decir, en comite(Pachon and Munoz, 2020).

Las comisiones no solo son importantes en la programacion de la agenda, su naturaleza de comitesespecializados y sus jurisdicciones internas les otorga un papel destacado en el exito legislativo de losproyectos y el fortalecimiento de la carrera polıtica de los parlamentarios. El caracter especıfico de loscomites hace que estos funcionen como “negociadores de informacion”, en el sentido, que permiten asus miembros especializarse en ciertas areas de la polıtica para luego utilizar su experticia en plenaria ypersuadir la decision de voto de los demas diputados (Pachon and Munoz, 2020), lo cual es determinantepara la aprobacion o anulacion de algunos proyectos.

Por otro lado, el caracter propio de cada comite ha llevado a establecer jerarquıas dentro del Congreso,

2Las juntas directivas de cada camara presiden los proyectos de ley en el Congreso; estas estan conformadas por unpresidente, un vicepresidente en el caso de los comites y por un presidente y dos vicepresidentes en el caso de las camaras.Los miembros de la mesa directiva son elegidos por periodos de un ano sin posibilidad de reeleccion dentro del mismocuatrienio constitucional. A pesar de los cortos periodos y de la practica de votaciones formales para reemplazar estaposiciones despues de cada ano, las partes en el Congreso llegan a un acuerdo, antes de que comience la primera sesionlegislativa, sobre quienes ocuparan estos cargos durante todo el periodo presidencial (Carroll and Pachon, 2016)

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 43: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 43

en terminos de la importancia de los topicos que se discuten al interior de las comisiones y del beneficioque pueden obtener los legisladores por su membresıa; algunos estudios argumentan que la afiliacion aciertos comites contribuye a la consolidacion de la carrera polıtica de sus miembros (Pachon and Munoz,2020), en tanto, la pertenencia de los legisladores a una u otra comision puede ser estrategica. Shepsle andWeingast (1987), indican que los legisladores buscan comisiones que sean compatibles con los interesesde sus votantes, lo cual les permite extraer recursos y administrar eficientemente su capital polıtico inde-pendientemente del partido. Tal fenomeno ha senalado algunos patrones de comportamiento legislativo anivel de Congreso, sin ser particularizados para Senado y Camara de Representantes. Por ejemplo, se haafirmado que: las comisiones, primera y tercera son las preferidas por los legisladores, y junto a la cuarta,las elegidas para consolidar su carrera polıtica; la comision primera y tercera tienen estatus de prestigio(Pachon and Johnson, 2016) y suelen se otorgarse a los parlamentarios con mas periodos de servicio(Pachon, 2011). Adicionalmente, la comision primera se caracteriza por discutir el mayor porcentaje delos proyectos de ley introducidos en los periodos legislativos (Pachon and Munoz, 2020), lo cual hace quesus miembros tengan una mayor visibilidad en la esfera polıtica y ante los ciudadanos. Por otro lado, laprimera comision junto con la sexta y septima, son las que dedican el mayor porcentaje de su agendaa discutir proyectos de orden nacional mientras que la tercera y la cuarta muestran un patron inverso;particularmente se ha mencionado que la comision cuarta ofrece mayores incentivos a sus legisladorespor discutir proyectos de ley locales/regionales que beneficien distritos electorales (Pachon, 2011).

Otro de los actores claves en la creacion y control la agenda es el ejecutivo. Al igual que en otros paısesde Latinoamerica, el presidente es la fuente primaria de legislacion nacional en Colombia y por ende elprincipal creador de la agenda (Archer and Shugart, 1997; Pachon and Munoz, 2020); un alto porcentajede los proyectos de ley introducidos en el Congreso provienen del ejecutivo (Carroll and Pachon, 2016),pero su amplia iniciativa es contrarrestada por el limitado poder que esta rama tiene sobre la agenda en elCongreso. A raız de la reforma constitucional de 1991, el poder ejecutivo en se hizo mas dependiente dellegislativo en lo concerniente a la formulacion de polıticas (Carroll and Pachon, 2016; Pachon and Munoz,2020); los cambios constitucionales no solo hicieron que el presidente perdiera su poder pro activo parapromulgar decretos bajo la declaracion de estado de emergencia y con solo la aprobacion de su gabinete,sino que tambien promovieron la perdida de su poder partidista (Archer and Shugart, 1997), el cual lepermitıa influir sobre los principales actores polıticos del paıs.

Despues de 1991, como resultado de la eliminacion de umbrales de participacion polıtica para nuevosmovimientos y partidos, se tuvo un incremento en las candidaturas independientes, lo cual a su vezaumento el numero de partidos en competencia electoral y por ende, en la arena legislativa (Pachonand Munoz, 2020). En 2002, fueron mas de 72 partidos compitiendo por curules en el Senado de laRepublica, de los cuales 45 obtuvieron representacion en dicha camara (Carroll and Pachon, 2016; Pachonand Munoz, 2020). El cambio constitucional abrio paso a la fragmentacion del sistema de partidos;fenomeno que desencadeno en la dificultad del presidente para obtener aprobacion de sus iniciativas enel Congreso. Bajo este panorama, los lideres de partido perdieron su poder para recompensar la lealtada su faccion, lo cual le acarreo dificultades al ejecutivo para otorgar incentivos que le permitieran seguircontrolando las carreras polıticas copartidistas y la agenda legislativa (Pachon and Munoz, 2020). Elproblema de la proliferacion partidista se enfrento con la reforma electoral de 2003, y aunque esta redujoel numero de partidos en el parlamento no elimino el multipartidismo y tampoco le devolvio el papelpreponderante a los partidos polıticos en la legislatura (Pachon and Munoz, 2020); el sistema de partidossigue fragmentado, con un numero efectivo de mas de 7 grupos polıticos en ambas camaras legislativas(Pachon and Johnson, 2016).

Aunque el presidente perdio un poder considerable sobre el proceso de formulacion de polıticas, auntiene algunas facultades que le permiten influir en la agenda (ver, Archer and Shugart, 1997; Carrolland Pachon, 2016; Pachon, 2011). Por ejemplo, puede acelerar las consideraciones de los proyectos deley, congelar la agenda, hacer que el congreso delibere proyectos de ley prioritarios dentro de un tiem-po establecido, convocar sesiones conjuntas de Senado y Camara para reducir tiempo de deliberacion,limitar enmiendas y evitar estrategias dilatorias; ası como utilizar sesiones extraordinarias durante elreceso legislativo para que el Congreso debata proyectos de ley prioritarios. Adicionalmente, el presiden-te tiene jurisdiccion exclusiva sobre algunos temas de la agenda legislativa como las leyes economicas

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 44: M etodos Bayesianos para caracterizar el comportamiento ...

44 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

o de desarrollo, relacionadas con proyectos del plan nacional de desarrollo y de inversiones publicas, elpresupuesto nacional, el Banco de la Republica y las funciones de su junta directiva, el credito publico,el comercio exterior, los monopolios rentısticos (Pachon, 2011), entre otras. Estos poderes le permitenal dirigente dar prioridad a sus iniciativas al interior del parlamento, sin embargo, no le permiten eludirla decisiones del Congreso e imponer un nuevo status quo, excepto en casos de extrema urgencia y bajoprevia aprobacion de la Corte Constitucional (Pachon, 2011; Pachon and Munoz, 2020).

Los vetos institucionales que la nueva constitucion impuso al ejecutivo en conjunto con la presencia de unsistema de partidos fragmentado y con un caracter regional muy distintivo ha fomentado la confirmacionde coaliciones presidenciales para facilitar la relacion ejecutivo-legislativo en el marco de una negociacionbasada en polıticas (Carroll and Pachon, 2016) Las coaliciones se han establecido con la intencion dereorganizar el sistema para lograr que el presidente tenga apoyo en la arena legislativa, sin embargo, suconsolidacion no ha generado ventajas adicionales para los mandatarios porque estas no se han traducidoen un medio para organizar el proceso legislativo, esto debido a que la polıtica personalizada sigue siendola norma en el paıs (Pachon, 2011; Pachon and Munoz, 2020). Los partidos de la coalicion no lograncontrolar la agenda y no tienen ventajas sobre otros a la hora de aprobar leyes, en tanto, los fracasosejecutivos siguen siendo frecuentes a pesar de coaliciones numerosas y cada vez mas formalizadas (Carrolland Pachon, 2016). En consecuencia, ni los partidos polıticos ni las coaliciones tiene poder absoluto sobrela agenda ni se constituyen en un medio para organizar el Congreso. Bajo este panorama, Pachon andJohnson (2016) senalan que los investigadores en el campo no deberıan preguntarse si los partidos o lascoaliciones importan o no en sistemas fragmentados y descentralizados como el de Colombia, pero sideberıan cuestionarse cuando los partidos y las coaliciones afectan la formulacion de polıticas, y comolas reglas brindan una oportunidad de control de agenda a las filas del partido y la coalicion dentro delos comites.

La caracterısticas del sistema polıtico colombiano, previamente senaladas, han servido de marco ins-titucional para el analisis cuantitativo del comportamiento parlamentario en Colombia; el cual se hadireccionado hacia la busqueda de patrones y determinantes de conducta legislativa, predominando elanalisis a nivel de partido, coalicion y comite, y dejando abierto el campo de investigacion a nivel delegislador. En esta vıa, son varios los estudios que han apoyado sus resultados en analisis descriptivosde los proyectos de ley introducidos y votados en el Congreso. Por ejemplo, Pachon and Munoz (2020)utilizando este tipo de informacion han identificado patrones en las comisiones constitucionales duranteel periodo 1998–2018; sus resultados muestran patrones porcentuales en relacion a los proyectos de leyen general y de orden nacional introducidos por cada comite en ambas camaras y las enmiendas consti-tucionales aprobadas y anuladas en los comites y en plenarias. Carroll and Pachon (2016) haciendo usode registros de votacion del Congreso de 2006 a 2014 describen los proyectos de ley de iniciativa ejecutivay legislativa introducidos y promulgados durante el periodo en cuestion. Por su parte, Pachon (2011)con el objeto de comparar el comportamiento de las comisiones constitucionales con el comportamientopromedio de la plenaria en ambas Camaras, analizan registros de la agenda legislativa (orden del dıa),entre 1998 y 2005, proporcionando resultados porcentuales sobre la autorıa de los proyectos agendados,el caracter local, regional o nacional de los proyectos discutidos, y su procedencia gubernamental o deoposicion.

Algunos metodos que han sido utilizados para analizar el comportamiento legislativo colombiano son:modelos lineales generalizados (McCullagh, 2018), el metodo de escalamiento de Aldrich-McKelvey (Hareet al., 2015) y el metodo de escalamiento de clasificacion optima (Poole, 2000). Pachon and Johnson(2016), con el proposito de determinar si los partidos o coaliciones ejercen poderes para establecer laagenda aun cuando existen pocos incentivos para la cooperacion ejecutivo–legislativo, proponen modelosde regresion logıstica de enfoque frecuentista con errores estandar robustos (Croux et al., 2004), paradeterminar cuales son los factores que hacen que el presidente de la comision elija miembros de su propiopartido o de la coalicion como ponentes y para comprobar cuales son los factores que hacen que unponente otorgue un reporte positivo o negativo a un proyecto de ley en primer debate. Las variablesindependientes en ambos casos corresponden a caracterısticas de los proyectos de ley (iniciativa, alcance,entre otros) y de sus autores (afiliacion). Utilizando el modelo de regresion logıstica, Pachon and Johnson(2016), concluyen que los presidentes de las comisiones utilizan su poder de elegir a los ponentes como

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 45: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 45

una forma de favorecer sus intereses de partido/coalicion y privilegiar la legislacion de origen ejecutivo,y de copartidarios.

Por su parte, Carroll and Pachon (2016) utilizan dos fuentes de datos y los tres metodos citados para ana-lizar el comportamiento legislativo colombiano. Para examinar la distribucion de preferencias ideologicasde los partidos, utilizan los datos de la encuesta para Colombia del Proyecto de Elites Parlamentariasde America Latina (PELA) del periodo 1998-2010 e implementan una version Bayesiana del metodode escalado de Aldrich–McKelvey en un espacio unidimensional (izquierda–derecha); con este metodoobtienen las preferencias ideologicas (autoinformadas) de los partidos polıticos de la Camara de Re-presentantes y concluyen que las distribuciones resultantes muestran una distincion ideologica confusaentre partidos para la administracion de Andres Pastrana (1998–2002) y el primer mandato de AlvaroUribe Velez (2002–2006). Sin embargo, tales distribuciones muestran una distincion ideologica mas clarapara los partidos tradicionales en el segundo mandato de Uribe (2006–2010), mientras que los partidosCambio Radical y Partido Social de Unidad Nacional evidencian heterogeneidad interna con tendencia auna posicion centrista. Por otro lado, estos autores utilizan registros de votacion nominal para examinarpatrones de votacion agregados (por partido) en el Congreso durante 2006-2014; en este caso aplican elmetodo de escalamiento de clasificacion optima. Con este obtienen los puntos ideales de los miembros dealgunos de los partidos en el Congreso (Liberal Colombiano, Conservador Colombiano, Partido Social deUnidad Nacional, Cambio Radical, Polo Democratico Alternativo, Convergencia Ciudadana y Partidode Integracion Nacional); el histograma de puntos ideales, que presentan estos autores, muestra tenden-cias mas no ubicaciones individuales y no incluye el comportamiento de las minorıas legislativas (comolos partidos AICO y ASI) ni de los partidos MIRA y Alianza Verde. Para la estimacion de los puntosideales solo consideran votos a favor y en contra, eliminan las abstenciones. Finalmente, basados en elcomportamiento grafico de los puntos ideales, senalan que el analisis de las votaciones nominales reflejainfluencia de partido sobre sus miembros e influencia indirecta de organizacion legislativa de la agenda;ası mismo manifiestan que tales efectos justifican las diferencias entre las medidas basadas en la votacionnominal y las medidas basadas en la encuesta.

Carroll and Pachon (2016), basan algunas de sus conclusiones en el contraste de los resultados obtenidoscon los dos metodos de escalamiento mencionados previamente, pero tales interpretaciones pueden serinadecuadas debido a que las mediciones obtenidas no son de la misma naturaleza, es decir, se utilizanfuentes de datos y metodos distintos, se obtienen sobre periodos de tiempo, legisladores y condicioneshistoricas diferentes, y ademas se contrastan posiciones de miembros de la Camara de Representantes convotaciones nominales del Congreso. Por otro lado, los resultados del modelo de clasificacion optima soninterpretados en una solo dimension, izquierda/oposicion–derecha/gobierno, la cual asume equivalenciaentre una dimension ideologica (izquierda–derecha) y una no ideologica (oposicion—gobierno). Esto puedereflejar resultados e interpretaciones contradictorias en terminos de la ubicacion de los partidos en laescala ası como opacar el factor latente que realmente subyace en el comportamiento de voto de loslegisladores. Se sabe que no necesariamente todos los partidos de la coalicion o de la oposicion tienen lamisma ideologıa, de hecho la consolidacion de coaliciones se fundamenta en negociaciones polıticas masno en posiciones ideologicas (Pachon and Munoz, 2020).

Finalmente, Carroll and Pachon (2016) analizan patrones de votacion legislativa a traves de modelos deregresion probit desde un enfoque frecuentista. Utilizan este modelo para examinar la tasa de aprobacionde los proyectos de ley teniendo en cuenta la iniciativa, ejecutiva o legislativa, y el alcance, nacional olocal. Los resultados al respecto, senalan que la tasa de aprobacion de los proyectos introducidos por elejecutivo, desde la administracion de Andres Pastrana hasta el primer mandato de Juan Manuel Santos,estuvo por encima del 50 % y que los proyectos de alcance local/regional, en todas las administraciones,presentan una tasa de aprobacion mas alta que la tasa correspondiente a la de los proyectos de ley deındole nacional.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 46: M etodos Bayesianos para caracterizar el comportamiento ...

46 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

3. Reporte de votaciones del Senado de la Republica de Colombia2010–2014.

Para evaluar las preferencias polıticas que subyacen al comportamiento de votacion de los diputados delSenado de la Republica de Colombia, se utilizan los registros de votacion plenaria disponibles para elperiodo presidencial 2010–2014. La eleccion de los comicios en pleno obedece a la intencion de proveerinferencias basadas en la conducta electoral observada de los diputados cuando estos actuan sobre lasmismas listas de votacion. Esta decision, tambien se soporta en el supuesto de que en votaciones plenariaslos diputados exhiben una conducta electoral consecuente con sus preferencias polıticas, esto debido aque en este tipo de votaciones los legisladores se ven obligados a exponer su postura frente a propuestasque tienen consecuencias polıticas importantes tanto para ellos como para los ciudadanos y otros actoresgubernamentales. Algunos autores justifican el analisis de los votos en pleno, en el hecho de que estosson la actividad del parlamento con mayor relevancia para diferentes colectivos; particularmente, sonvotaciones que captan la atencion de grupos polıticos, medios de comunicacion y electores, debido alimpacto de sus resultados en la polıtica estatal (Aleman, 2008).

3.1. Fuente informacion.

El reporte de votaciones de los proyectos de ley, se obtiene a traves de Congreso Visible (VCongress, porsus siglas en ingles), un proyecto academico del Departamento de Ciencia Polıtica de la Universidad delos Andes (Bogota, Colombia) que provee informacion sobre el Congreso de la Republica de Colombia ysu relacion con las demas instituciones polıticas del paıs. El reporte se solicita mediante correo electronicoal director de este proyecto, cuyo contacto esta disponible en la pagina oficial de VCongress (https://congresovisible.uniandes.edu.co/).La base suministrada, contiene datos sobre:

1. El proyecto: fecha de radicado, tema principal y secundario, codigo de identificacion, tıtulo, estadoactual (archivado, aprobado, retirado, entre otros), autores, iniciativa (gubernamental, legislativa,mixta, otras entidades, popular), numero de ley, numero de radicado en Camara de Representantesy Senado de la Republica, camara y comision en la que se llevo a cabo la votacion.

2. Los legisladores: codigo de identificacion y nombre completo, codigo y nombre del partido de afi-liacion, y su voto en cada lista de votacion.

3. La votacion: tipo (proyecto de ley, acto legislativo, impedimentos, entre otros), motivo (sıntesis delcontenido que se somete a votacion), fecha en la que se realizo, codigo de identificacion de cadalista de votacion (un proyecto puede tener varias listas de votacion), clase (nominal u ordinaria),numero total de abstenciones, votos a favor, votos en contra, inasistencias y asistencias de cadalista de votacion, resultado (aprobado, no aprobado, empate, no hubo quorum, entre otras), periodopresidencial y legislatura (cada periodo presidencial tiene cuatro periodos legislativos).

3.2. Pre-procesamiento de los datos.

El pre-procesamiento se divide en tres etapas: consolidacion, depuracion y estructuracion del conjuntode datos para analisis posteriores. A continuacion se describe cada una de ellas.

3.2.1. Consolidacion de la base de datos.

En esta etapa se consolida una base de datos para el periodo presidencial 2010–2014. Para ello, sehace el cruce de la base proporcionada por VCongress, filtrada segun el periodo de interes, con unabase auxiliar que contiene datos especıficos de los legisladores y sus respectivos reemplazos para el

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 47: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 47

cuatrienio en cuestion. Esta ultima, se construye a partir de la informacion disponible en la pagina deVCongress y la Registradurıa Nacional del Estado Civil (https://www.registraduria.gov.co/). Suelaboracion permite subsanar la ausencia de datos relacionados con las caracterısticas de los congresistasque legislaron durante el cuatrienio de interes.

La base auxiliar posibilita incluir variables como: sexo, codigo y nombre del partido de afiliacion conel que gano o reemplazo la curul, alianza del partido (coalicion, oposicion, no oposicion, minorıa), tipode curul (titular o reemplazo permanente), comision de afiliacion, circunscripcion (nacional o indıgena),numero de reemplazos y cambios de partido durante el cuatrienio. Esta base no solo permite incorporarcovariables de los miembros del Senado y sus partidos polıticos, a fin de enriquecer analisis posteriores,sino que tambien se convierte en una fuente de informacion adicional para verificar la concordanciaentre los datos proporcionados por VCongress y los datos caracterısticos de los diputados del periodo2010–2014.

El cruce de las bases se hace mediante el codigo de identificacion de los legisladores. Este procedimientocontribuye a:

1. Identificar cambios de partido polıtico durante el periodo de interes. Se reconocen casos en loscuales, la afiliacion partidista registrada en la base de VCongress no coincide con la consignadaal inicio del periodo. Tal inconsistencia se debe a que el conjunto de datos de VCongress, soloproporciona el registro de la ultima membresıa de cada diputado, mas no el historial de afiliacionesa lo largo de su trayectoria polıtica. La union de las bases, evidencia que el legislador Jorge EliecerGuevara presenta cambio de partido en dos ocasiones. Pasa del Polo Democratico Alternativo(PDA) al Movimiento Nacional Progresista (actualmente Colombia Humana) y luego, al PartidoAlianza Verde (PAV); estos cambios se dan luego de la primera legislatura (2010–2011). Estehallazgo resulta importante porque la fluctuacion partidista de este candidato indica no es adecuadotenerlo en cuenta como legislador de anclaje para la identificacion del modelo, ya que inicia su cargohaciendo parte de un partido opositor (PDA) y luego, se traslada a un partido independiente (PAV),en tanto, no se tiene claridad sobre su posicion en el espectro polıtico.

2. Reconocer cambios de nombre de partido. En el periodo de interes, el Partido Integracion Nacional(PIN) paso a ser el actual Partido Opcion Ciudadana. Este hallazgo es importante porque permiteunificar la afiliacion partidista de los miembros de una misma agrupacion, a fin de interpretarlos resultados a luz de las condiciones polıticas del periodo en cuestion. Dado que el cambio seda a finales del cuatrienio (se desconoce la fecha exacta) y solo obedece a una transformacion deimagen de cara a las elecciones presidenciales del ano 2014 (Colprensa, 2013), se decide cobijar alos integrantes de esta colectividad, bajo el partido PIN; denominacion con la que el grupo polıticofigura la mayor parte del cuatrienio.

3. Corroborar la camara y la comision en la que ejercio cada diputado durante el 2010–2014. Al igualque en el caso del partido, en la base de VCongress solo se reporta la afiliacion de la ultima curuldel diputado; esto, para algunos legisladores, no es concordante con la camara y comite registradospara el periodo en cuestion. Como los diputados pueden ser reelegidos indefinidamente, varios deellos presentan distintas afiliaciones, en terminos de camara y comision, a lo largo de su trayectoriapolıtica dependiendo del periodo presidencial.

4. Verificar que se tienen registros de votacion de todos los miembros del Senado de la Republica deColombia 2010–2014. La union de las bases, conduce a corroborar que se tienen votaciones de todoslos diputados, incluyendo titulares (102) y reemplazos permanentes (8).

5. Distinguir los registros de votacion de diputados que no legislaron durante el periodo presidencialde interes y las listas de votacion correspondientes a otro cuatrienio. El empalme de las bases, revelala presencia de senadores y listas que no corresponden a 2010–2014, mostrando inconsistencias enlas variables periodo y legislatura proporcionadas por VCongress. Registros fuera del periodo deinteres se eliminan.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 48: M etodos Bayesianos para caracterizar el comportamiento ...

48 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

En este orden de ideas, la base auxiliar permite identificar inconsistencias en el conjunto de datos pro-porcionado por VCongress. Ademas de recuperar datos caracterısticos de los legisladores y sus partidospolıticos para el 2010–2014, el cruce de las bases tambien ofrece evidencia para guiar la fase de depuracionque se describe en la siguiente seccion. Por ejemplo, a traves de este proceso, se reconocen variables queno contienen datos propios del cuatrienio de interes.

Por otro lado, la adherencia de las bases, es util para comprender el contenido de algunas de las variablesproporcionadas por VCongress. Por ejemplo, tras incorporar la informacion de los reemplazos, se puedeidentificar que los votos “no aplica” se asocian con senadores que fallecen, renuncian, son destituidos otienen alguna investigacion disciplinaria que los inhabilita para votar (ver Tabla 20).

Esta primera etapa de preprocesamiento, permite consolidar un solo conjunto de datos con 64118 registrosde votacion y 70 variables; tales registros proporcionan informacion de 1598 listas de votacion (no todascon el mismo numero de registros de votacion) y 110 senadores.

3.2.2. Depuracion de la base de datos.

La etapa de depuracion se centra en la exclusion de variables y registros de votacion cuyo contenidopresenta inconsistencias, no es informativo o no es de interes para analisis posteriores. Tambien incluyela omision de legisladores que participan en menos del 95 % de las votaciones plenarias del Senado parael 2010–2014. A continuacion se describe la forma en la que se lleva a cabo esta fase.

Inicialmente, se suprimen las variables con informacion repetida, algunas de ellas producto del cruce delas bases de datos y otras, resultado del proceso de revision del contenido de las mismas; en este ultimocaso, se identifican variables como “materia” y “motivo” cuyos datos son iguales. Tambien se excluyenvariables que no son de interes. Por ejemplo, las relacionadas con la afiliacion partidista fuera del periodo2010–2014 y las codificaciones de radicado en la Camara de Representantes y Senado de la Republica(numero de radicado, numero de acta, gaceta, entre otros).

Adicionalmente, se suprimen variables no informativas. Por ejemplo, aquellas que solo tienen datosperdidos o conteos en cero que no son coherentes con los resultados de la votacion (el 98 % de losregistros de asistencia se encontraban en cero). Dentro de este grupo, tambien se consideran aquellascuyo contenido no es variable como el periodo presidencial y la camara de votacion. Asimismo, lasvariables que senalan inconsistencias, tal es el caso de las variables relacionadas con los el numero totalde inasistencias, abstenciones, votos a favor y en contra de cada lista de votacion. En este ultimo caso,se evidencia que al seleccionar solo las listas de votacion plenaria del Senado, los conteos proporcionadospor VCrongress ya no son concordantes con los totales calculados a partir de la variable “voto”, la cualcontiene la decision individual de los legisladores en cada lista de votacion. Esta inconsistencia se debe,a que en algunos casos dichos conteos estan ligados a votaciones de la Camara de Representantes pormotivo de sesiones conjuntas. A fin de tener los conteos correspondientes a las sesiones plenarias delSenado de la Republica 2010–2014, se eliminan las variables resumen proporcionadas por VCongress yse reconstruyen a partir del registro de voto individual.

Asimismo, se excluyen los registros de votacion que no dan cuenta de la decision de voto de los legisladores,tal es el caso de los “no aplica” (671), “asistio” (809), “no voto”(1) o “voto”(1); estos representan el2.3 % del total de registros de votacion. Luego, se suprimen las listas cuyo resultado es un “empate” (1),“no hubo mayoria” (1) o “no hubo quorum”(9); la primera se elimina por ser un caso particular y lasdemas por no concluir en una votacion nominal; estas representan menos del 1 % del total de las listas devotacion. Posteriormente, se descartan las listas cuya suma de inasistencias, abstenciones, votos a favory en contra, es menor a 97. Totales inferiores a este valor son indicio de votaciones no debatidas en laplenaria del Senado. En este caso, se identifica que el 73.2 % de las listas de votacion registran un totalde decisiones de voto (si, no, abstencion) e inasistencia menor a 97 (estos totales oscilan entre 1 y 49).Con la exclusion de estas listas, quedan 417 disponibles para el analisis.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 49: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 49

Finalmente, se eliminan los registros de votacion de los legisladores que participan en menos del 95 % delas votaciones plenarias del Senado. Dicho porcentaje hace referencia a la proporcion de listas de votacionen las cuales el senador se encuentra inscrito para votar. En este sentido, el porcentaje de participacionno esta ligado a la decision de voto del legislador sino al registro de su nombre en las listas de votacion.

Los legisladores excluidos corresponden al 8 % del total de diputados que legislaron en el cuatrienioen cuestion (102 titulares y 8 reemplazos permanentes). Exactamente, se exceptuan 12 titulares y 7reemplazos permanentes. El porcentaje de participacion de estos diputados oscila entre el 4 % y 83 %,y su baja participacion obedece a diferentes causas: fallecimiento, renuncia, sanciones disciplinarias oreemplazo (ver Apendice D, Tabla 20). El 57.9 % de los senadores excluidos forman parte de la coaliciongobernante, el 31.6 % de los partidos no opositores (independientes) y el restante de la oposicion. Lasupresion de estos parlamentarios no implica la eliminacion de algun partido polıtico o comision. De los8 legisladores de reemplazo, solo se incluye 1 dentro del analisis, el diputado Lidio Arturo Garcia Turbay(LC) por tener una participacion del 96.64 %.

Luego de la depuracion descrita, se obtiene una base con 37919 registros y 31 variables (ver Seccion3.2.3). La base depurada proporciona informacion de 417 listas de votacion sometidas a escrutinio en laplenaria del Senado de la Republica de Colombia 2010–2014 y cuenta con el registro de votacion de 91de los 110 legisladores que pasaron por esta camara en el periodo en cuestion. Todos los resultados sepresentan con base en el numero de legisladores y listas citados previamente.

3.2.3. Estructuracion de los datos para analisis posteriores.

En esta ultima etapa, se utiliza la base depurada para estructurar tres conjuntos de datos:

1. Una base de dimension de 91 × 13 para caracterizar los legisladores. Sus variables son: codigo deidentificacion del congresista, nombre completo, sexo, partido de afiliacion, codigo del partido, grupopolıtico (coalicion, oposicion, independiente o minorıa), comision, circunscripcion, participacion,total inasistencias, abstenciones, votos a favor y votos en contra para cada diputado.

2. Una base de dimension de 417× 21 para describir los proyectos de ley sometidos a escrutinio. Susvariables son: codigo de identificacion del proyecto, codigo de la lista de votacion, autores, fechade radicado, fecha de votacion, tıtulo, tema principal, tema secundario, motivo, alias, aprobacion,estado actual, numero de ley, iniciativa, tipo de votacion, numero total de legisladores habilitadospara votar en cada lista, numero de votos a favor, en contra, abstenciones e inasistencias de cadalista de votacion y legislatura en la que se dio la votacion.

3. Una matriz de votos de dimension 91×417, cuyas filas corresponden a los legisladores y las columnasa los proyectos de ley deliberados. Los elementos de esta matriz son 1 (para el caso un voto a favor),0 (para el caso de un voto en contra) o NA (para inasistencias y abstenciones). Esta estructura noes inusual en estadıstica, evoca otro tipo de literatura en este campo, como e.g., minerıa de texto(e.g., Gerrish and Blei, 2012) y analisis de redes sociales (e.g., Fowler, 2006; Rodriguez, 2012). Apartir de esta matriz se pueden construir otras estructuras de datos para hacer analisis relacionales.Por ejemplo, si la matriz de votaciones, se denomina A, entonces AAT es una matriz de adyacenciaponderada cuya entrada (i, j) corresponde a el numero de proyectos de ley que votaron juntos loslegisladores i y j. Esta matriz de datos permitirıa hacer un analisis relacional de la legislatura (e.g.,Rodriguez, 2012).

Utilizando la librerıa pscl de R (version 4.0.5) y estos tres conjuntos de datos, se consolida un objeto rollcall(disponible en https://github.com/Luque-ZabalaC), que se constituye en el insumo del estimador depunto ideal Bayesiano. La estructura descrita es la que suele usarse en este tipo de analisis (ver McDonnellet al., 2019).

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 50: M etodos Bayesianos para caracterizar el comportamiento ...

50 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

En la literatura, hay investigaciones dedicadas a la recopilacion, depuracion, construccion y estructura-cion de bases de datos para el analisis de registros de votacion legislativa (ver e.g., McDonnell et al., 2019;Cifuentes-Silva et al., 2021). En este sentido, el trabajo que se reporta en esta seccion es relevante y seconstituye en si mismo en un proyecto para establecer una base de datos macro que recoja caracterısti-cas de todos los proyectos, legisladores y votaciones del Congreso de la Republica de Colombia, en lamedida de lo posible, desde sus inicios. Sin el tratamiento y la estructura adecuada de los datos, analisisposteriores no resultan viables, ya sea porque, se pueden presentar incoherencias entre el conjunto dedatos, el contexto de la legislatura y los resultados; o porque, no se cuenta con la estructura particularque permite implementar modelos como el estimador de punto ideal Bayesiano.

3.3. Analisis descriptivo.

La rama legislativa del poder publico en Colombia se consolida en un parlamento bicameral denominadoCongreso de la Republica; este se divide en Senado y Camara de Representantes. Ambas camaras sonelegidas por voto popular cada cuatro anos y su unica diferencia radica en su representatividad. Losmiembros del Senado simbolizan la circunscripcion nacional mientras que los miembros de la Camaraalguna jurisdiccion territorial (departamentos y distrito capital), especial (grupos etnicos y minorıaspolıticas) o internacional (colombianos en el exterior). La representatividad nacional del Senado, im-plica que sus miembros personalizan los intereses de los colombianos, por ello es relevante analizar elcomportamiento de votacion legislativo de sus parlamentarios.

El Sexto Congreso de la Republica de Colombia, electo para el periodo comprendido entre el 20 de juliode 2010 y el 19 de julio de 2014, se caracteriza por dos aspectos: (i) el liderazgo de la Unidad Nacional,una coalicion de partidos polıticos (ver Tabla 1) constituida para apoyar el primer gobierno del presidenteJuan Manuel Santos, y (ii) el amplio numero de mociones propuestas para deliberacion. En contraste consus antecesores, el Congreso 2010–2014 se consolida como el parlamento con el mayor numero de proyectosde ley sometidos a aprobacion (Wills-Otero, 2014). La amplia actividad legislativa registrada (ver e.g.,Wills-Otero, 2014), la configuracion partidista y la trascendencia de las de reformas constitucionales yproyectos de ley debatidos bajo el contexto del proceso de paz (ver e.g., Osorio, 2014), hacen de esteperiodo un cuatrienio de interes para analizar el comportamiento legislativo de los diputados del SenadoRepublica de Colombia, ası como estudiar patrones partidistas y de coalicion en las decisiones legislativas.

3.3.1. Caracterizacion de los senadores y sus grupos polıticos.

Las colectividades con escanos en el Senado de la Republica de Colombia 2010–2014, son: Partido Social deUnidad Nacional (PU), Conservador Colombiano (CC), Liberal Colombiano (LC), Cambio Radical (CR),Partido Integracion Nacional (PIN), Partido Alianza Verde (PAV), Movimiento MIRA, Alianza SocialIndıgena (ASI), Autoridades Indıgenas de Colombia (AICO) y Polo Democratico Alternativo (PDA).Los primeros cuatro partidos, conforman la coalicion gobernante y los demas se declaran independientes,opositores o minorıas polıticas (ver Tabla 1). El 67 % de los 91 legisladores seleccionados para el analisis,tiene afiliacion en alguno de los partidos hegemonicos del paıs (PU, CC, LC).

De los diputados seleccionados, el 74.7 % hace parte de la coalicion gobernante, el 15.4 % de los partidosindependientes, el 7.7 % del partido opositor y los restantes de las minorıas; estas ultimas, representan2 curules para la circunscripcion nacional indıgena. Se evidencia un bajo porcentaje de mujeres en elSenado (12.1 %), particularmente, no se tiene representacion de este genero en los partidos PAV, ASI yAICO.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 51: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 51

Partido polıtico Comision Total1 2 3 4 5 6 7

Coalicion Partido social de Unidad Nacional (PU) 5 2 4 4 4 3 2 24

Conservador Colombiano (CC) 4 3 4 3 3 3 1 21

Liberal Colombiano (LC) 4 2 2 3 2 1 2 16

Cambio Radical (CR) 0 1 3 2 1 0 0 7

Independientes Partido Integracion Nacional (PIN) 1 1 0 1 1 1 2 7

Partido Alianza Verde (PAV) 1 0 0 1 1 1 0 4

Movimiento MIRA 0 2 0 0 0 1 0 3

Minorıas Alianza Social Indıgena (ASI) 0 1 0 0 0 0 0 1

Autoridades Indıgenas de Colombia (AICO) 0 0 0 0 0 0 1 1

Oposicion Polo Democratico Alternativo (PDA) 1 1 0 0 1 2 2 7Total comision 16 13 13 14 13 12 10 91

Tabla 1: Distribucion de los 91 legisladores segun partido polıtico y comision. Para cada partido se muestrasu respectivo logo, abreviatura y membresıa (coalicion, independiente, minorıa u oposicion)

Figura 2: Porcentaje de participacion de cada grupo polıtico en las comisiones del Senado de la Republicade Colombia 2010-2014.

En la Figura 2 se observa que la coalicion gobernante tiene una participacion del 50 % o mas en todas lascomisiones del Senado. En particular, se evidencia su liderazgo total en la comision tercera, encargada deimpuestos y credito publico. Otra comision donde la coalicion tiene una alta representacion es la cuarta,encargada del presupuesto de la Nacion; en esta el 85.7 % de sus miembros cuenta con membresıa enalguno de los partidos del gobierno. En la comision primera, encargada de las reformas de la constituciony los derechos fundamentales, el gobierno tiene una representacion del 81.2 %. En la literatura se expone,que pertenecer a alguna de estas tres comisiones consolida la carrera polıtica de los diputados; estassuelen otorgarse a aquellos con mayor numero de periodos de servicio (Pachon, 2011) y son las preferidasde los legisladores, porque su membresıa otorga estatus de prestigio (Pachon and Johnson, 2016). Lacomision primera se caracteriza por discutir el mayor porcentaje de los proyectos de ley introducidosen los periodos legislativos (Pachon and Munoz, 2020), esto hace que sus miembros tengan una mayorvisibilidad en la esfera polıtica y ante los ciudadanos. Otros autores han senalado que la comision cuartaofrece mayores incentivos a sus legisladores por discutir proyectos de ley locales/regionales que beneficiendistritos electorales (Pachon, 2011). La distribucion de los diputados del Senado 2010–2014 por comisionse detalla en el apendice C.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 52: M etodos Bayesianos para caracterizar el comportamiento ...

52 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

Por otro lado, el partido opositor tiene representacion en cinco de los siete comites (ver Figura 2). Lascomisiones donde la oposicion tiene al menos una curul son la primera, segunda (temas internacionales yseguridad nacional), quinta (agro y de medio ambiente), sexta (servicios publicos, educacion y cultura)y septima (salud y vivienda). La oposicion tiene el porcentaje mas bajo de representacion en la comisionprimera (6.25 %) y la participacion mas alta en las comisiones sexta (16.6 %) y septima (20 %), donde elgobierno muestra los porcentajes mas bajos (58.3 % y 50 %, respectivamente). De otro lado, se evidenciaque el unico partido polıtico de la coalicion gobernante que no tiene representacion en todas las comisioneses CR.

En la Figura 2 se evidencia que los partidos independientes tienen representacion en todas las comisiones,excepto en la tercera. En la Tabla 1, se exhibe que el PIN tiene representacion en seis de las siete comi-siones; el PAV distribuye sus escanos entre la comision primera, cuarta, quinta y sexta; y el MIRA ocupados curules en la comision segunda y una en la sexta. La representacion de los partidos independientesen las comisiones oscila entre el 0.25 % y el 23 %. En cuanto a las minorıas, estas tienen presencia en lacomision segunda y septima.

PartidoMargen deabstencion

( %)

Tasa mediaabstencion

( %)CV

Margen deinasistencia

( %)

Tasa mediainasistencia

( %)CV

Coalicion PU 12 - 68 38.29 37.56 0 - 24 5.88 110CC 14 - 74 32.10 41.73 0 - 22 4.91 113LC 14 - 57 31.94 38.76 0 - 23 4.50 138CR 16 - 54 32.14 41.91 2 - 24 6.57 119

Independientes PIN 20 - 66 37.70 50.32 0 - 10 4.57 82.68PAV 9 - 65 40.75 63.18 0 - 10 5.00 174

MIRA 33 - 41 37.33 10.82 10 - 34 18.67 71.33Minorıas ASI - 30.00 - - 2 -

AICO - 28.00 - - 6 -Oposicion PDA 25 - 61 43.00 27.54 1 - 15 7.00 64.94

Tabla 2: Porcentajes de abstencion e inasistencia por partido polıtico. En cada caso, se senala el margen(delimitado por el porcentaje mınimo y maximo que se registra al interior de cada partido), la tasa media(promedio del porcentaje de abstencion e inasistencia de los miembros de cada partido) y el coeficientede variacion (CV). Para los partidos ASI y AICO no se reportan margenes ni coeficientes de variaciondebido a que estos solo cuentan con una curul en el Senado.

En terminos del porcentaje de abstencion e inasistencia, se evidencia una alta variabilidad al interiorde la mayorıa de los partidos (ver Tabla 2). En la Figura 3(a), se observa que los partidos PAV y PUtienen un amplio rango de variabilidad en sus porcentajes de abstencion, mientras que el MIRA presentael menor rango de variacion en relacion a los partidos con mas de una curul en el Senado. Tambien seevidencia que los partidos CC, CR y LC exhiben un comportamiento similar en terminos de sus tasasmedias de abstencion. Se destaca que el porcentaje de abstencion los legisladores de AICO y ASI esinferior a la tasa media de todos los partidos, en cambio la tasa media del PDA es la mas alta frente alas demas colectividades, todos sus miembros registran porcentajes de abstencion por encima del 20 %.Por otro lado, se revela que el senador Jorge Hernando Pedraza Gutierrez del partido CC, presentaun comportamiento atıpico en relacion a los de mas miembros de su colectividad, su porcentaje deabstencion es el mas alto de los miembros del Senado (73.6 %). Todos los partidos polıticos, a excepcionde las minorıas, cuentan con porcentajes de abstencion superiores al 40 % (ver Figura 3a).

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 53: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 53

(a) Porcentaje abstencion por partido polıtico. (b) Porcentaje inasistencia por partido polıtico.

Figura 3: Contraste de partidos en terminos de su porcentaje de abstencion (a) e inasistencia (b). Lospuntos rojos representan la media del partido y los negros los valores atıpicos. Estos ultimos, se asociancon el legislador correspondiente.

Por otro lado, en la Figura 4(a) se observa que la distribucion del porcentaje de inasistencia de loslegisladores es sesgada a la derecha, i.e., en el Senado de la Republica de Colombia 2010–2014 son masfrecuentes los porcentajes bajos de inasistencia que los altos. El 50 % de los miembros de esta camaralegislativa registran tasas de inasistencia a lo mas del 3.36 % y solo el 18.68 % de los legisladores presentanporcentajes de inasistencia superiores al 10 %. Los diputados con las tasas mas altas de ausencia seexhiben la Figura 4(b).

(a) Distribucion porcentaje inasisten-cia.

(b) Legisladores con mayor porcentaje de inasistencia.

Figura 4: El grafico (a) exhibe el comportamiento del porcentaje de inasistencia de los miembros delSenado de Republica de Colombia 2010-2014. El grafico (b) muestra los 10 legisladores con la tasa deinasistencia mas alta. En frente del nombre de cada diputado se especıfica su partido de afiliacion. Ningunmiembro de las minorıas, clasifica en esta seleccion.

Al contrastar el porcentaje de inasistencia por partido, se refleja que el MIRA presenta las tasas mas altasdel Senado (ver Figura 3b). El comparativo tambien permite identificar legisladores cuyo comportamientode ausentismo es atıpico frente a sus copartidarios. Los legisladores que distan de la mayorıa de los

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 54: M etodos Bayesianos para caracterizar el comportamiento ...

54 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

miembros de su partido, en terminos del porcentaje de inasistencia, son: Carlos Ramiro Chavarro Cuellardel CC (22.06 %), Juan Manuel Galan Pachon del LC (22.54 %), Fuad Ricardo Char Abdala de CR(23.98 %), John Sudarsky Rosenbaum del PAV (18.23 %), y Milton Arlex Rodriguez Sarmiento (14.15 %),Efrain Torrado Garcia (23.2 %), y Karime Mota y Morad (24.46 %) del PU.

En la Figura 5 se exhiben los 10 legisladores con las tasas mas bajas y mas altas de abstencion. El 78 %de los legisladores presentan porcentajes de abstencion entre el 20 % y el 57 %. De los legisladores de lacoalicion, el que presenta la tasa mas baja de abstencion (12.2 %) es Jorge Aurelio Iragorri Hormaza delPU y Jorge Hernando Pedraza Gutierrez del CC registra el porcentaje mas alto (73.6 %). El 76.47 % delos diputados con membresıa en alguno de los partidos del gobierno, registra porcentajes de abstencionentre el 20 % y el 50 %. En terminos de inasistencia, Karime Mota y Morat del PU, es quien registra elporcentaje mas alto (24 %) de los miembros de la coalicion. El 82.4 % de los miembros gubernamentalesmuestra tasas de inasistencias inferiores al 6 %.

(a) Legisladores con menor porcentaje de abstencion.

(b) Legisladores con mayor porcentaje de abstencion.

Figura 5: Seleccion de los 10 legisladores con las tasas mas bajas (a) y mas altas (b) de abstencion.En frente del nombre de cada diputado se especıfica su partido de afiliacion. Ningun miembro de lasminorıas, clasifica en alguno de los dos grupos.

Para el caso de los miembros de la oposicion el legislador Camilo Romero es quien exhibe el porcentajede abstencion mas bajo (25 %) y Alexander Lopez Maya es el que tiene la tasa de abstencion (61 %) einasistencia (15.35 %) mas alta. Para los demas miembros opositores el porcentaje de inasistencia estaentre el 1 % y 10 %. De los partidos independientes, John Sudarsky Rosenbaum del PAV es quien presentala tasa de abstencion (9 %) mas baja y Hector Alfonso Lopez del PIN la mas alta (66 %). En terminosde inasistencia, Alexandra Moreno Piraquive del MIRA presenta el porcentaje mas alto (33.81 %) tantodel grupo de los independientes como de los miembros del Senado (ver Figura 4b). Los parlamentarios

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 55: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 55

German Carlosama Lopez de AICO y Marco Anibal Avirama de ASI, representantes de las minorıas,revelan un comportamiento promedio (ver Tabla 2) en relacion a los demas miembros del Senado, tantoen terminos de inasistencia como de abstencion (ver Figura 3).

3.3.2. Caracterizacion de los proyectos de ley sometidos a votacion en el Senado.

El contenido de las mociones sometidas a votacion en la plenaria del Senado 2010–2014 es diverso, las 417listas de votacion se dividen en 28 temas principales. En la Figura 6, se evidencia que sobresalen temasrelacionados con: seguridad social y salud (38.37 %), justicia (16.79 %), polıtica internacional (10.55 %),seguridad, defensa y fuerza publica (6.47 %), economıa (5.76 %), conflicto armado (3.84 %), ordenamientoterritorial (3.12 %), corrupcion (2.88 %) y temas laborales (2.64 %). La tematicas de las listas de vota-cion restantes, se vinculan con temas varios: administracion publica, temas agropecuarios, comunicaciony tecnologıas de la informacion, derechos fundamentales; educacion, cultura, ciencia y tecnologıa, familia,medio ambiente, minorıas etnicas y sexuales; notariado y registro, participacion ciudadana, partidos ymovimientos, recreacion y deportes, transito y transporte, vivienda; celebraciones, honores y monumen-tos. Cada una de estas tematicas representa entre el 0.24 % y el 1.2 % del total de las listas de votacion(ver Figura 6).

Figura 6: Clasificacion de las listas de votacion segun el tema principal.

En la Figura 7 se exhibe el numero de listas de votacion por tema y legislatura. Los proyectos de seguridadsocial y salud son los mas prominentes de la tercera legislatura (20 de Julio de 2012 - 20 de junio de2013); de las 158 mociones deliberadas en el tercer ano legislativo, 111 se relacionan con este tema. Enla segunda (20 de Julio de 2011 - 20 de junio de 2012) y cuarta legislatura (20 de Julio de 2013 - 20 dejunio de 2014), el tema de seguridad social y salud no es un tema central; estos dos periodos presentan elporcentaje mas bajo de votaciones del cuatrienio (18.2 % y 6.7 %, respectivamente). De las 76 propuestasvotadas en la segunda legislatura, 33 estan asociadas con justicia, 20 con polıtica internacional y 12 conordenamiento territorial. De las 28 mociones deliberadas en la cuarta legislatura, 16 se vinculan conconflicto armado, 6 con polıtica internacional y 5 con seguridad, defensa y fuerza publica. Por otro lado,la primera legislatura (20 de Julio de 2010 - 20 de junio de 2011) presenta una mayor variedad de temasen debate (16 de 28 temas en discusion durante el cuatrienio); de las 155 mociones votadas durante delprimer ano legislativo, 48 se relacionan con seguridad social y salud, 33 con justicia, 20 con economıa,12 con corrupcion y las restantes con temas varios (ver Figura 7).

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 56: M etodos Bayesianos para caracterizar el comportamiento ...

56 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

Figura 7: Numero de listas de votacion por tema y legislatura.

En la Figura 8 se observa que el 41 % de las mociones, deliberadas en el periodo en cuestion, se sancionacomo ley. Un bajo porcentaje de las listas de votacion se acumulan (1 %) (i.e., su contenido se adjunta aotro proyecto) o se aprueban con informe de objeciones (1 %) (procedimiento por medio del cual el jefede Estado se opone y devuelve al Congreso un proyecto de ley que ya ha sido aprobado); estas ultimas, serelacionan con temas laborales y los proyectos que se acumulan hacen referencia a mociones de seguridadsocial y salud, y participacion ciudadana (ver Figura 9). El 40 % de las mociones se archiva en debate,por vencimiento de terminos (ver e.g., artıculo 182 de la Ley 5 de 1992) o transito de legislatura (artıculo162 de la Constitucion polıtica de Colombia de 1991; artıculo 190 de la Ley 5 de 1992). Las mocionesrestantes se declaran exequibles totalmente (6 %) (i.e., la Corte Constitucional manifiesta que la ley esacorde a la Constitucion Polıtica), inexequibles (6 %) o se envıan a la Corte Constitucional para control(15 %) (artıculo 199 de la Ley 5 de 1992).

Figura 8: Distribucion de las mociones deliberadas en la plenaria del Senado de la Republica de Colombia2010-2014, segun su estado actual. Esta clasificacion hace referencia a la ultima categorizacion asignadaal proyecto de ley en su paso por las camaras legislativas del Congreso.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 57: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 57

De las listas de votacion disponibles, todas las relacionadas con conflicto armado, corrupcion, transportey vivienda se sancionan como ley (ver Figura 9). Tambien se convierten en ley, el 92.3 % de las propuestasrelacionadas con ordenamiento territorial. El 51.2 % de las mociones vinculadas con seguridad social ysalud se archivan por transito de legislatura y el porcentaje restante se decreta como ley. De los proyectosde justicia el 71.4 % son archivados en debate y de los vinculados con polıtica internacional el 54.5 % sondeclarados inexequibles. Por otro lado, el 77.7 % de las mociones de seguridad, defensa y fuerza publica sonenviadas a la Corte Constitucional para control. Los proyectos sobre derechos fundamentales, educacion,cultura, ciencia y tecnologıa, son archivados por vencimiento de terminos (ver Figura 9).

Figura 9: Numero de listas de votacion segun su estado actual.

En la Figura 10 se muestra el numero de listas de votacion segun iniciativa. En esta se destaca un amplionumero de iniciativas gubernamentales; este es un patron que ya ha sido destacado en otras investigacio-nes (e.g., Archer and Shugart, 1997, Carroll and Pachon, 2016, Pachon and Munoz, 2020), en la cualesse exalta al presidente (a traves de sus ministros) como la fuente primaria de legislacion nacional enColombia, y por ende, como el principal creador de la agenda. De las 417 mociones votadas en plenaria,el 71.7 % es de iniciativa gubernamental, el 27.6 % de legislativa y el restante popular (ver artıculo 10 dela Ley 134 de 1994); estas ultimas vinculadas con temas de justicia, particularmente, con la convocatoriade un referendo constitucional para reglamentar penas en el caso de delitos sexuales con menores deedad. De las propuestas gubernamentales el 71.24 % es aprobada. El gobierno es el motor de todas lapropuestas relacionadas con conflicto armado, corrupcion, polıtica internacional, transporte, seguridad,defensa y fuerza publica. El legislativo lidera las propuestas laborales, de administracion publica, te-mas agropecuarios y agrıcolas, derechos fundamentales, educacion, cultura, ciencia y tecnologıa; medioambiente, participacion ciudadana; recreacion y deportes, industria y turismo, celebraciones, honores ymonumentos (ver Figura 10).

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 58: M etodos Bayesianos para caracterizar el comportamiento ...

58 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

Figura 10: Numero de listas de votacion segun iniciativa.

En la Figura 11, se exhiben las distribuciones del porcentaje de abstencion e inasistencia de las listasde votacion. En particular, la Figura 11(a) evidencia que la mayorıa de las listas de votacion presentanporcentajes de abstencion entre el 20 % y el 50 %, rango que coincide con lo expuesto previamente paralos legisladores. La Figura 11(a) revela un comportamiento aproximadamente simetrico alrededor de lamedia, este senala que el 50 % de las listas de votacion presenta un porcentaje de abstencion a lo masdel 36.26 %. Por otro lado, en la Figura 11(b) se exaltan una mayor frecuencia de porcentajes bajos deinasistencia en las listas de votacion. Esta distribucion al igual que en el caso de los legisladores presentasesgo a la derecha.

(a) Distribucion porcentaje abstencion. (b) Distribucion porcentaje inasistencia.

Figura 11: Distribucion del porcentaje de abstencion e inasistencia de las listas de votacion.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 59: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 59

Las tasas de abstencion por lista de votacion oscilan entre 7.69 % y 80.22 %. Porcentajes de abstencionsuperiores al 50 % se presentan en 4 de las 417 listas de votacion; estas relacionadas con comunicaciony tecnologıas de la informacion (80.22 %), laboral (60.44 %), justicia (51.65 %), y recreacion y deporte(51.65 %). Por otro lado, los porcentajes de inasistencia por lista oscilan entre el 0 % y el 20.88 %. Delas listas con inasistencia superior al 15 %, 2 ese vinculan con justicia (17.58 % y 20.88 %) y 1 conminorıas etnicas sexuales (18.68 %). Finalmente, de las 417 listas de votacion, el 21.34 % se resuelvenpor unanimidad, el 9.35 % son votaciones cerradas (i.e. margen de votacion 65 %-35 %) y el 25.9 %son comicios desequilibrados (i.e. margen de votacion 97.5 %-2.5 %). Dadas las tasas de abstencion einasistencias descritas, se tiene un 41 % de datos perdidos (abstenciones e inasistencias) en la matriz devotaciones (ver Seccion 3.2.3).

4. Hiperparametros y computacion.

En esta seccion se especifican los hiperparametros de las distribuciones previas de µj , αj y βi, tambiense dan a conocer los detalles computacionales de la implementacion del modelo de votacion espacialBayesiano unidimensional, que se ajusta a los datos de votacion nominal del Senado de la Republica deColombia 2010–2014.

Siguiendo a Clinton et al. (2004), se toman a0 = 0 y A0 = 25 como hiperparametros de la distribucionprevia de µj y αj ; esta eleccion implica previas no informativas sobre estos parametros y es reminiscentede la elicitacion de los hiperparametros asociados con los efectos fijos de un modelo de regresion cuandono se quiere utilizar alternativas mas informativas o empıricas, como la previa de informacion unitaria(Kass and Wasserman, 1996) o la previa g (Zellner, 1986). En el mismo espıritu de Jackman (2004) yLofland et al. (2017), se toma bi = 0 y Bi = 1 para los puntos ideales βi. A diferencia de los parametrosde discriminacion y aprobacion, no es necesario establecer una varianza “grande” a priori para los puntosideales, dado que, para este conjunto de parametros lo que se quiere es establecer una nocion previa deescala, ası la alternativa de una varianza unitaria se ha convertido en una opcion popular (de acuerdo conla regla empırica, este valor garantiza que a priori el 99.7 % de la masa de los puntos ideales se encuentraentre −3 y 3).

Por otro lado, como se senala en la Seccion 1.9.1, la identificabilidad de los parametros del modelo serealiza en el misma direccion de Clinton et al. (2004) y Rivers (2003), fijando la posicion de d+ 1 legisla-dores en el espacio polıtico. Dado d = 1, se anclan dos legisladores de partidos polıticos ideologicamenteopuestos (ver Carroll and Pachon, 2016). Particularmente, se delimitan las posiciones de Jorge EnriqueRobledo Castillo del PDA y Roy Leonardo Barreras Montealegre del PU, en −1 y 1, respectivamente;estos valores de anclaje definen la unidad de medida del espacio polıtico. Establecer la ubicacion dedos diputados, conlleva a que el modelo proporcione inferencias sobre los puntos ideales de 89 de los 91parlamentarios y sobre los parametros de discriminacion y aprobacion de las 417 listas de votacion. Enterminos generales, permite estimar un total de 2m+ n− 2 parametros, i.e., 923.

En el proceso de estimacion de los parametros del modelo, se utiliza la funcion de enlace logit (estaeleccion tiene fundamento en la Seccion 5.2 y en el trabajo de Lofland et al., 2017) y se eliminan losdatos faltantes. Esto ultimo, se debe a dos razones: (i) el estimador de punto ideal estandar no contempladatos perdidos y, (ii) dado que, los valores faltantes no siguen un patron completamente aleatorio (MCA,por sus siglas en ingles), no es posible hacer el proceso de imputacion de los mismos a traves de ladistribucion muestral (una discusion al respecto se encuentra en Sewell and Chen, 2015). Aunque existenmetodos de imputacion para datos faltantes con un comportamiento no aleatorio (ver e.g. Sherina et al.,2019) e incluso extensiones del modelo de votacion espacial Bayesiano que los incorporan (ver e.g., Rosaset al., 2015), estas metodologıas estan fuera del alcance de este trabajo. El estudio de simulacion, de laSeccion 5.3, muestra que los resultados son robustos a diferentes tasas de los datos faltantes.

El modelo se implementa en R (version 4.0.5) mediante el lenguaje de programacion de inferencia Bayesia-na Stan (Carpenter et al., 2017; Gelman et al., 2014) en su version 2.21.1 (https://mc-stan.org). Otroslenguajes de uso frecuente, que permiten hacer la implementacion computacional, son JAGS (Kruschke,

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 60: M etodos Bayesianos para caracterizar el comportamiento ...

60 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

2014; Denwood, 2016), BUGS (Lunn et al., 2013), INLA (Rue et al., 2017) y NIMBLE (de Valpineet al., 2017). Las inferencias posteriores sobre los parametros del modelo se obtienen utilizando algo-ritmos MCMC, especıficamente, el metodo de Monte Carlo Hamiltoniano (ver Seccion 1.5.4) basado engeometrıa diferencial (Betancourt, 2017; Betancourt, 2019; Gelman et al., 2014). Con el proposito de agi-lizar la convergencia, se inicializan los puntos ideales de los legisladores en 1 para aquellos con membresıaen alguno de los partidos de la coalicion (ver Tabla 1) y en −1 para los demas diputados; la eleccion deestos valores iniciales es arbitraria. La inicializacion de los coeficientes de discriminacion y aprobacion esaleatoria y se genera a partir de la distribucion previa. En el estudio de simulacion, el escenario 4 es elque conserva las caracterısticas bajo las cuales se hace el proceso de estimacion e inferencia del caso deestudio (ver Sesion 5).

Todas las simulaciones se realizan con 80000 iteraciones de las cuales las primeras 24000 correspondenal periodo de calentamiento. Para disminuir la influencia de los valores iniciales y reducir la autocorre-lacion entre muestras se hace un adelgazamiento por medio de un muestreo sistematico con “saltos” de5 unidades, lo cual implica que las inferencias posteriores se realizan teniendo en cuenta 11200 iteracio-nes. Este protocolo deja como resultado tamanos efectivos de muestra lo suficientemente grandes comopara realizar un proceso de inferencia adecuado (ver Seccion 1.5). Los diagnosticos de convergencia seencuentran en el apendice B.

La ejecucion se lleva a cabo con un procesador AMD Rayzen 7 4800H, de 8 nucleos y 16 procesadoreslogicos y una memoria RAM de 16GB. Esta ultima se optimiza habilitando la memoria virtual del equipo,no es necesario el uso de un servidor. Cada modelo tarda entre 2 y 4 horas en el proceso de muestreo ylas cadenas resultantes ocupan un espacio en disco entre 2GB y 4GB; la variacion en tiempo y espaciose debe a diversos factores, como por ejemplo, al porcentaje de datos faltantes de la matriz de votaciono la cantidad de jerarquıas del modelo. El codigo utilizado para la implementacion esta disponible enhttps://github.com/Luque-ZabalaC.

5. Estudio de simulacion.

Con el objeto de generar confianza en las inferencias posteriores de los parametros, el modelo unidimen-sional se ajusta a diferentes conjuntos de datos simulados. Se estudia el desempeno del mismo teniendoen cuenta distintas configuraciones de legisladores de anclaje, tasas de datos perdidos (abstenciones einasistencias), funciones de enlace y valores de hiperparametros. La simulacion permite evaluar cambiosen las inferencias bajo los diferentes escenarios en consideracion.

Se generan matrices de votacion fijando los parametros del modelo en valores aleatorios. En particular,los parametros αj y µj , se simulan de una distribucion normal con media 0 y varianza 3, mientras quelos puntos ideales, βi, se simulan de una distribucion uniforme con parametros a1 y b1. Para el caso del“parlamento equilibrado”, compuesto por dos grupos polıticos cada uno con el 50 % de los diputados, setoma a1 = −3 y b1 = 3; y para el “parlamento desequilibrado”, compuesto por cuatro grupos (distribuidosen grupo 1, 75 %; grupo 2, 15 %; grupo 3, 2 %; y grupo 4, 8 %) se considera a1 = −3 y b1 = 4. Esteultimo caso, da un margen mas amplio de valores para los puntos ideales de los diputados ubicados aderecha, dado que, estos representan un alto porcentaje del legislativo. El parlamento desequilibrado,simula proporciones y grupos acordes con los datos de estudio. Todos los conjuntos de datos se generancon 91 legisladores y 417 listas de votacion.

Los puntos ideales se recrean de tal forma que, los dos grupos del parlamento equilibrado y tres deldesequilibrado (grupos 1, 2 y 4), se ubican en una region especıfica del espectro polıtico; esto implica quelos integrantes de dichos grupos tienen puntos ideales similares. En cambio, el grupo 3 del parlamentodesequilibrado, se simula de tal manera que sus legisladores muestren puntos ideales mas distantes; enparticular, uno de los legisladores se ubica entre el grupo 1 y 4, y el otro entre el grupo 2 y 4. Esta formade reproducir los puntos ideales, busca comprobar que el modelo propuesto recupera la ubicacion de losgrupos en el espacio polıtico, independientemente de si estos muestran una baja o alta variabilidad ensu interior.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 61: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 61

Luego de simular la matriz de votacion, Y, a partir de la distribucion muestral p(Y | µ,A,B) (verSeccion 1.9, ecuacion 7), se realiza la inferencia sobre los parametros del modelo a partir de la distribucionposterior p(µ,A,B | Y) (ver Seccion 1.9.2, ecuacion 10). Las inferencias posteriores se comparan con losvalores “verdaderos”de los parametros para corroborar que el modelo produce inferencias razonables.

5.1. Analisis de sensitividad a los legisladores de anclaje.

Para evaluar la robustez de los resultados a la eleccion de las restricciones de identificabilidad del modelo,se considera la seleccion de legisladores de anclaje ubicados en diferentes posiciones del espacio polıtico.Las posiciones consideradas son: opuestos y cercanos a cero (escenario 1), izquierda - centro (escenario 2),centro - derecha (escenario 3), opuestos y a diferentes distancias del centro (escenario 4), y extremistas(escenario 5). Cada una de estas elecciones se evalua tanto para el parlamento equilibrado como parael desequilibrado, con una tasa de datos faltantes del 40 % (aproximadamente igual a de las votacionesplenarias del Senado de Colombia 2010-2014) y utilizando como enlace la funcion logit.

Equilibrado Desequilibrado

Escenario Legisladores de anclaje DIC WAIC DIC WAIC

1 Cercanos al centro 11886.95 12096.09 8688.34 8929.502 Izquierda - Centro 11798.25 11994.53 8682.17 8913.653 Centro - Derecha 11820.27 12019.34 8573.97 8802.724 Diferentes distancias al centro 11782.73 11972.11 8563.98 8775.225 Extremistas 11809.88 11993.12 8582.86 8790.65

Tabla 3: Medidas de precision predictiva para el contraste de las diferentes elecciones de legisladores deanclaje. Los valores mas bajos de DIC y WAIC, implican una mayor precision predictiva.

En la Tabla 3, se muestran los criterios de informacion DIC y WAIC para las diferentes eleccionesde identificabilidad del modelo, se evidencian valores semejantes dentro de cada cuerpo legislativo ydiscrepancias entre ellos (esto ultimo es de esperarse, dado que se trata de parlamentos distintos). Enambos casos, se observa que la opcion 4 registra el menor DIC y WAIC; sin embargo, dichos valores nopresentan una amplia diferencia en contraste con los demas escenarios. Es de resaltar, que el escenario 4favorece la eleccion de los legisladores de anclaje en la practica, puesto que, no impone condiciones queconlleven a un conocimiento previo de la ubicacion especıfica de los parlamentarios en el espacio polıtico,solo implica reconocer legisladores polıticamente opuestos.

Al comparar los valores de los puntos ideales βi con sus respectivas estimaciones, βi, bajo las cincoconfiguraciones (ver Tabla 3), se observa que las distintas selecciones de legisladores de anclaje en elparlamento equilibrado, muestran el patron de la Figura 12a, y en el parlamento desequilibrado, todos losescenarios exponen el comportamiento de la Figura 12b. Los parametros de discriminacion y aprobaciontambien senalan un patron similar al interior de cada parlamento bajo las configuraciones en consideracion(ver Figura 13), aunque en ambos casos y en contraste con los puntos ideales, las estimaciones de αj yµj , en los diferentes escenarios se muestran mas dispersas alrededor de la recta de referencia, α = α yµ = µ, respectivamente.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 62: M etodos Bayesianos para caracterizar el comportamiento ...

62 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

(a) βi contra βi para el parlamento equilibrado. (b) βi contra βi para el parlamento desequilibrado.

Figura 12: Contraste de βi y βi, bajo la eleccion de legisladores de anclaje opuestos y a diferentes dis-tancias del centro (escenario 4). (a) Muestra el comportamiento de los valores verdaderos de los puntosideales versus sus estimaciones en el contexto del parlamento equilibrado y (b) exhibe la misma relacion,pero bajo el contexto desequilibrado. Los puntos rojos senalan las ubicaciones de los legisladores de anclajey la recta azul, es la lınea de referencia β = β, r corresponde al coeficiente de correlacion de Pearson ym a la pendiente de la recta de regresion que siguen los puntos en cada caso. Los valores de anclaje son-1 (izquierda) y 1 (derecha). El patron que se evidencia en este grafico, es el mismo que se describe bajolas demas configuraciones de legisladores de anclaje.

La similitud en las medidas de precision predictiva de cada parlamento (Tabla 3) y la presencia del mismopatron en las estimaciones puntuales de los parametros del modelo, bajo las diferentes alternativas delegisladores de anclaje (Figura 12 y 13), sugiere que el desempeno del modelo no se afecta por la seleccionde estos parlamentarios. En consecuencia, sin importar el numero de grupos y las proporciones en lasque se divida el parlamento en cuestion, la eleccion de los diputados para la identificacion del modelo noafecta las estimaciones, en tanto, los senadores pueden seleccionarse de forma arbitraria. No obstante, serecomienda que estos se elijan a lados opuestos del espectro polıtico (escenario 4), para evitar el caso deseleccion de dos legisladores que compartan el mismo punto ideal y para favorecer la interpretacion de losvalores fijos (−1 y 1). Este resultado no difiere de lo expuesto por otros autores (ver, e.g., Lofland et al.,2017), sin embargo, este es el primer trabajo que provee evidencia empırica en relacion a la eleccion de loslegisladores de anclaje en parlamentos desequilibrados considerando diferentes posiciones en el espaciopolıtico.

En la Figura 12, se evidencia que los puntos ideales de los diputados no se recuperan con exactitud,esto se debe a que el modelo no es identificable (ver la Seccion 1.9.1 para mas detalles) y la estimacionse hace en una escala diferente (arbitraria) a la de los verdaderos valores de los parametros. En ambosparlamentos, las estimaciones de los βi, varıan en un rango de −2 a 2, lo cual implica que los puntos idealesse recuperan a una menor escala (ver tambien la Figura 15). Adicionalmente, se observa que los valoresde βi entre −1 y 1, son los que se recobran con mayor exactitud, en cambio, los ubicados en los extremosdel espectro polıtico se muestran mas distantes de la recta de referencia, β = β, i.e., sobre ellos hay unmayor efecto del factor de escala en contraste con los que se ubican en el intervalo [−1, 1]. En la Figura 13,tambien se revela que los valores extremos de los parametros de discriminacion y aprobacion, son los massensibles al efecto de la escala. Adicionalmente, se evidencia una mayor variabilidad en las estimacionesde µj y αj correspondientes al parlamento desequilibrado (ver Figura 13b). Dicha variabilidad se puedeconstatar equiparando el error cuadratico medio (MSE, por sus siglas en ingles) de las estimaciones deestos parametros para los dos parlamentos (ver Tabla 4).

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 63: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 63

(a) αj contra αj para el parlamento equilibrado. (b) αj contra αj para el parlamento desequilibrado.

(c) µj contra µj para el parlamento equilibrado. (d) µj contra µj para el parlamento desequilibrado.

Figura 13: Contraste αj y αj, µj y µj, bajo la eleccion de legisladores de anclaje opuestos y a diferentesdistancias del centro (escenario 4). (a) y (c) Muestran el comportamiento de los valores verdaderos delos parametros versus sus estimaciones, en el contexto del parlamento equilibrado, (b) y (d) exhiben lamisma relacion, pero bajo el contexto desequilibrado. La recta azul, es la lınea de referencia α = α yµ = µ, respectivamente. r corresponde al coeficiente de correlacion de Pearson y m a la pendiente de larecta de regresion que siguen los puntos en cada caso. El patron que se evidencia en este grafico, es elmismo que describen los parametros de discriminacion y aprobacion, bajo las demas configuraciones delegisladores de anclaje.

Contraponer los valores verdaderos de los parametros con sus respectivas estimaciones, revela una relacionlineal directa (ver coeficiente de correlacion de Pearson, r, en Figura 12 y 13). Esto indica que, paratodos los parametros, la escala real y la arbitraria (la cual se establece mediante condiciones previas, verSeccion 4) se comportan de manera proporcional con una tasa de variacion constante en promedio. Eneste sentido, la pendiente, m, de la recta de regresion que describe el dispersograma en cada escenario,permite cuantificar el cambio de escala. Para los puntos ideales, una pendiente menor que 1 (ver Figura12), corrobora que estos se estiman a una escala inferior en contraste con la escala real, y en el casode los parametros de discriminacion, una pendiente superior a 1 (ver Figura 13), evidencia que estos serecuperan a una escala mayor en relacion a la de los verdaderos valores de estos parametros. En el casode los parametros de aprobacion, la pendiente es proxima a 1, lo cual indica que estos se reproducen auna escala similar a la que se utiliza para generarlos. Es de resaltar, que ambos parlamentos exhibencoeficientes de correlacion y pendientes similares.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 64: M etodos Bayesianos para caracterizar el comportamiento ...

64 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

Estimador puntual Equilibrado Desequilibrado

β 0.49 2.29α 4.75 6.37µ 1.47 2.60

Tabla 4: MSE de las estimaciones de los parametros del modelo, teniendo en cuenta los dos parlamentos,bajo la eleccion de legisladores de anclaje opuestos y a diferentes distancias del centro.

Sin importar la distribucion del parlamento, legisladores ubicados al extremo izquierdo senalan estima-ciones por encima del verdadero valor de βi, en cambio, legisladores ubicados al extremo derecho exhibenestimaciones por debajo (ver Figura 12 y 15). El patron de sobre y sub dispersion observado a cada ladodel espectro polıtico, es el reflejo de la manera como se fijan los legisladores de anclaje, sı estos se ubicanal contrario (1 izquierda y −1 derecha), dicho patron se invierte junto con la orientacion del espaciopolıtico. En la Figura 13, tambien se evidencia un patron de sobre y sub dispersion, en los αj y µj . A di-ferencia de los puntos ideales, los parametros de discriminacion y aprobacion se muestran sobredispersosal lado derecho del espectro.

(a) Puntos ideales estimados parlamento equilibrado. (b) Puntos ideales estimados parlamento desequilibrado.

Figura 14: Puntos ideales estimados bajo la eleccion de legisladores de anclaje opuestos y a diferentesdistancias del centro (escenario 4). (a) Muestra el comportamiento de los puntos ideales estimados parael parlamento equilibrado y (b) exhibe las estimaciones del parlamento desequilibrado. En cada caso, lospuntos representan la estimacion puntual y las lıneas horizontales el intervalo de credibilidad simetricodel 95 %.

A pesar del cambio de escala que surge de la no identificabilidad del modelo (Seccion 1.9.1), este lograextraer los grupos en los cuales se divide cada parlamento, independientemente de si estos muestranuna baja o alta variabilidad en su interior (ver Figura 14). Para ambos parlamentos, las estimacionesde puntos ideales entre −1 y 1 revelan intervalos de credibilidad de menor amplitud en relacion a lasestimaciones que se encuentran fuera de este rango (ver Figura 14). En la medida que los legisladores sealejan del centro y se ubican en los extremos del espectro polıtico los intervalos de credibilidad se hacenmas amplios, indicando una mayor incertidumbre en la estimacion de los puntos ideales de diputadosextremistas. Lo anterior implica que el modelo recoge el efecto de la escala a traves del margen de erroren las estimaciones. Para el caso desequilibrado, los intervalos de credibilidad con una mayor amplitudse asocian con miembros del grupo polıtico mayoritario.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 65: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 65

Tambien se evidencia que legisladores de grupos diferentes, cuyos puntos ideales son similares, son los masproclives a quedar mezclados entre sı. Por ejemplo, en la Figura 14a, se observa que aquellos diputadoscon puntos ideales alrededor de cero son mas sensibles a quedar ubicados en la region del grupo opuesto.En particular, hay un legislador del grupo 1 que se situa en la zona del grupo 2. En tanto, en la Figura14b se evidencia que los legisladores mas sensibles a distanciarse de su grupo, son aquellos que estanentre 0.5 y 1; en esta region del espacio polıtico los legisladores de los grupos 1, 2 y 3 intercambiansus posiciones. Cabe aclarar, que la distancia entre los diputados del grupo 3 no es producto de unamala clasificacion, es el resultado de la forma como se recrearon los puntos ideales en el parlamentodesequilibrado. Los intercambios que se visualizan entre miembros de distintos grupos son resultado dela incertidumbre propia de la estimacion de los parametros, pero en terminos generales, se evidencia queel protocolo de inferencia propuesto logra recuperar los grupos tal como fueron generados inicialmente.

5.2. Analisis de sensitividad a las funciones de enlace.

(a) Puntos ideales verdaderos frente a sus estimacionesbajo los enlaces logit y probit.

(b) Diagrama de dispersion logit - probit.

Figura 15: Contraste de las funciones de enlace. En (a) se exhibe el patron de los puntos ideales verdaderos(lınea negra) frente al comportamiento que siguen sus estimaciones puntuales bajo los enlaces logit yprobit. En (b) se muestra el comparativo de las estimaciones de los puntos ideales bajo las dos funcionesde enlace. La recta azul, es la lınea de referencia probit = logit, r corresponde al coeficiente de correlacionde Pearson y m a la pendiente de la recta de regresion que siguen los puntos. En (a) no se incluyen losintervalos de credibilidad para facilitar el contraste de los graficos.

Para inspeccionar la robustez del analisis a la eleccion de las funciones de enlace (ver Seccion 1.9), serealiza la inferencia posterior de los parametros del modelo, utilizando funciones logit (5) (escenario 4) yprobit (4) (escenario 6). En ambos casos, se tiene en cuenta el parlamento desequilibrado, bajo la eleccionde legisladores de anclaje opuestos y a diferentes distancias del centro, con una tasa del 40 % de datosfaltantes.

La matriz de votacion, Y, se simula utilizando tanto el vınculo logit como el probit, y posteriormente, serealiza la inferencia teniendo en cuenta los dos enlaces en cada caso. Las diferentes combinaciones (logit-logit, logit-probit, probit-logit, probit-probit) presentan resultados analogos. A continuacion se reportanlas conclusiones que se obtienen bajo la matriz de votacion simulada con logit.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 66: M etodos Bayesianos para caracterizar el comportamiento ...

66 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

La Tabla 5, muestra el DIC y WAIC para cada escenario; estos valores reflejan resultados similares enterminos predictivos. Aunque el modelo probit senala criterios de informacion mas bajos en contrastecon el logit, dicha diferencia no exhibe una ventaja contundente de un modelo sobre otro. Al compararel valor verdadero de los puntos ideales con el patron que siguen sus estimaciones bajo las funcionesen consideracion, se observa un comportamiento similar para ambos enlaces (ver Figura 15); tanto elmodelo logit como el probit generan estimaciones de los parametros a una menor escala. Al contrastarlas estimaciones de los puntos ideales, realizados bajo estos dos vinculos, se obtiene un coeficiente decorrelacion de 1 y una pendiente cercana a 1 (ver Figura 15b), lo cual sugiere similitud en los βi estimadosbajo las dos funciones de enlace. El dispersograma de la Figura 15b, sigue el mismo patron de la Figura12, i.e., evidencia que bajo cualquiera de las dos funciones de enlace se presentan el patron de sobre ysub dispersion discutido en la seccion 5.1. La semejanza que se presenta en los resultados, es consecuentecon lo expuesto por otros autores en terminos de la eleccion de las funciones de enlace para modelos derespuesta binaria univariante (ver, Hahn and Soyer, 2005, Lofland et al., 2017).

Escenario Enlace DIC WAIC

4 Logit 8563.98 8775.226 Probit 8420.61 8670.81

Tabla 5: Medidas de precision predictiva para contrastar el desempeno del modelo a la eleccion de lafuncion de enlace. Los valores mas bajos de DIC y WAIC implican una mayor precision predictiva.

Bajo estos dos escenarios, se examina la jerarquıa de los legisladores. Para ello, se ordenan las estimacionesde los puntos ideales de manera ascendente y su rango de clasificacion (orden estimado en la Figura 16)se contrasta con el orden de los verdaderos valores de los puntos ideales βi (orden real en la Figura 16).Se detalla que el modelo logit recupera la estadıstica de orden exacta, para el 17.6 % de los legisladoresmientras que el modelo probit extrae el 19.8 % del rango de clasificacion. Es de esperar un porcentaje“bajo” (el cual resulta ser relevante, dado que, se recuperan los grupos y solo se basa en la estimacionpuntual sin tener en cuenta los intervalos de credibilidad u otras estrategias probabilısticas para constatarel orden, ver Clinton et al., 2004), dado que se identifican al menos tres factores que alteran el ordende clasificacion original: (i) las restricciones de identificabilidad del modelo (fijar dos legisladores en -1y 1), (ii) la proximidad en los puntos ideales de algunos parlamentarios y (iii) el cambio de escala. En laFigura 16a, se observa que producto del anclaje de uno de los legisladores, se altera el orden de los puntosideales del grupo 4; el diputado que esta originalmente en la segunda posicion se estima posteriormenteen la tercera. En la Figura 16b, se evidencia que algunos de los diputados del grupo 2 intercambian susposiciones debido a la homogeneidad de los puntos ideales al interior del grupo. Por ejemplo, el legisladorde la posicion 14 se traslada a la posicion 16. En esta misma figura, se muestra que uno de los integrantesdel grupo 3, se mueve cuatro posiciones a la derecha a partir de su orden de clasificacion original, esto sedebe a la similitud de su punto ideal con algunos de los parlamentarios del grupo 1. El movimiento dellegislador cuya posicion original es 23 (ver Figura 16) ya se habıa advertido en la seccion anterior (verFigura 14).

Por otro lado, en la Figura 16c, se revela un mayor intercambio en las posiciones de los parlamentariosdel grupo 1; se identifican parlamentarios que se alejan de su posicion original hasta 25 lugares. Porejemplo, el parlamentario en la posicion 59 se estima posteriormente en la posicion 84. El canje en losestadısticos de orden al interior de este grupo, ademas de atribuirse a las razones ya citadas, tambiense relaciona con el cambio de escala. El lado derecho del espectro polıtico es el que refleja una mayorcompresion en la escala, independientemente de la funcion de enlace que se utilice (ver Figura 15); estoconduce a que los puntos ideales de los miembros del grupo 1, se muestren mas proximos entre sı y enalgunos casos se exhiban mas extremistas de lo que realmente son. La Figura 16, exalta que el grupomayoritario es el que se ve mas afectado a la hora de recuperar el orden de clasificacion de sus miembrosa partir de las estimaciones puntuales de los puntos ideales.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 67: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 67

(a) Diagrama de dispersion oposicion. (b) Diagrama de dispersion independientes y minorıas.

(c) Diagrama de dispersion coalicion.

Figura 16: Contraste entre el orden de clasificacion real (eje x) y el estimado (eje y) a partir de lamedia posterior de los puntos ideales, bajo la funcion de enlace logit. (a) Revela el comparativo para losmiembros del grupo 4, (b) para el grupo 2 y 3, y (c) para el grupo 1. Los puntos negros en (a) y (c)identifican las posiciones de los legisladores de anclaje. El patron que se evidencia en este grafico, essimilar al que se describe bajo la funcion de enlace probit.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 68: M etodos Bayesianos para caracterizar el comportamiento ...

68 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

Los resultados expuestos no senalan una ventaja contundente de un enlace sobre otro, ambos exhibenun comportamiento similar en terminos de las estimaciones de los parametros del modelo, la calidadpredictiva del mismo y el orden de clasificacion de los puntos ideales, en tanto, su eleccion se deja acriterio del investigador.

5.3. Analisis de sensitividad a la tasa de datos faltantes.

Para evaluar el desempeno del modelo a diferentes tasas de datos faltantes, se contrastan tres escenarios:“optimista” con un 10 % (escenario 7), “real” con una tasa del 40 % (escenario 4) y “crıtico” con unporcentaje del 60 % (escenario 8). Para este comparativo, se utiliza el parlamento desequilibrado, bajo laeleccion de legisladores de anclaje opuestos y a diferentes distancias del centro, y utilizando como enlacela funcion logit.

En la Figura 17, se observa que un incremento en el porcentaje de datos perdidos implica un aumentoen la amplitud de los intervalos de credibilidad de los parametros del modelo, esto conlleva a una mayorincertidumbre en la estimacion de puntos ideales y parametros asociados a las listas de votacion. Porejemplo, al contrastar la amplitud de los intervalos para los puntos ideales (Figura 17, fila 1), se observaque el escenario 7 registra amplitudes entre 0.0 y 0.8, en cambio, el escenario 8 senala amplitudes entre0.2 y 1.2. El mismo patron se revela al confrontar los escenarios para el caso de los parametros dediscriminacion (Figura 17, fila 2) y aprobacion (Figura 17, fila 3).

Del analisis expuesto en la seccion 5.1, se sabe que intervalos de credibilidad de menor amplitud seasocian con estimaciones puntuales alrededor del centro, y que estimaciones mas distantes del origen, serelacionan con intervalos mas amplios. Esta acotacion, permite identificar que las amplitudes alrededorde la lınea de referencia superior de la Figura 17, estan relacionadas con estimaciones puntuales enextremos del espectro polıtico. En este sentido, los cambios que se revelan al pasar de un escenario aotro, sugieren que el porcentaje de datos faltantes tiene un mayor efecto en la amplitud de los intervalosde puntos ideales y parametros de listas de votacion cuyas estimaciones puntuales estan mas distantesde cero.

A mayor tasa de datos faltantes, mayor incertidumbre en las estimaciones de todos los parametros delmodelo, no obstante, se observa un mayor impacto en aquellas estimaciones que senalan valores en losextremos del espectro polıtico. Por otro lado, el analisis de sensitividad, bajo las diferentes configuracionesde tasas de datos faltantes, revela que prescindir de los datos perdidos no genera conclusiones erroneasen terminos de la inferencia de los parametros del modelo. En particular, no distorsiona el agrupamientode los punto ideales, estos siguen mostrando el patron de la Figura 14.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 69: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 69

Figura 17: Comportamiento de la amplitud de los intervalos de credibilidad simetricos del 95 % (AmplitudIC). Los graficos de la primera columna describen el escenario 7 (10 % datos faltantes), los de la segundael escenario 4 (40 % datos faltantes) y los de la tercera el escenario 8 (60 % datos faltantes). La rectaroja corresponde a la lınea de referencia inferior y la azul a la superior. Las lıneas de referencia sonarbitrarias y solo pretenden facilitar la visualizacion. La fila 1 permite confrontar los tres escenariospara el caso de los puntos ideales, la fila 2 para los parametros de discriminacion y la fila 3 para losparametros de aprobacion.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 70: M etodos Bayesianos para caracterizar el comportamiento ...

70 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

5.4. Analisis de sensitividad a las distribuciones previas de los puntos ideales.

Finalmente, se investiga la robustez del analisis a la eleccion de la distribucion previa e hiperparametrosde los puntos ideales. Enfocar el estudio en los βi, obedece a que analisis posteriores se centran en estosparametros. El comparativo de los escenarios que se proponen a continuacion se hace para el parlamentodesequilibrado, bajo la eleccion de legisladores de anclaje opuestos y a diferentes distancias del centro, yutilizando como enlace la funcion logit, con un 40 % de datos faltantes.

(a) Escenario 4. Modelo con previasin jerarquıas para los puntos idea-les.

(b) Escenario 9. Modelo con previajerarquica sobre la varianza de lospuntos ideales.

(c) Escenario 10. Modelo con previajerarquica sobre la media y la varianza delos puntos ideales.

Figura 18: Grafo acıclico dirigido (DAG, por sus siglas en ingles) para los diferentes escenarios delanalisis de sensitividad a las distribuciones previas de los puntos ideales.

Se contrastan tres escenarios: distribucion previa sin jerarquıas (escenario 4, ver Figura18a), i.e., bi = 0y Bi = 1; previa jerarquica con dos etapas para la varianza de los puntos ideales (escenario 9, verFigura18b), i.e., bi = 0 y Bi ∼ GI(c, d), donde c = 3, d = 2; previa jerarquica con dos etapas sobrela media y la varianza (escenario 10, ver Figura18c), i.e., bi ∼ N(a, b) y Bi ∼ GI(c, d), donde a = 0,b = 25. Los hiperparametros de los parametros de discriminacion y aprobacion son a0 = 0 y A0 = 25(ver Seccion 4). Las elecciones descritas conducen a previas difusas o no informativas sobre los puntosideales, puesto que, para c = 3 y d = 2, el coeficiente de variacion de la distribucion Gamma Inversa es1; para a = 0 y b = 25, se recae en la discusion planteada en la Seccion 4, en relacion a la elicitacion delos hiperparametros de los efectos fijos de un modelo de regresion.

La Tabla 6 senala los criterios de informacion para los tres escenarios. Se evidencia una mejor calidadpredictiva en el escenario 10. No obstante, es de resaltar que la diferencia que presenta el modelo conmayor jerarquizacion en relacion a la eleccion de hiperparametros sin jerarquıas, no es muy amplia; entanto, por parsimonia se puede prescindir dicha jerarquizacion, puesto que, bajo los tres escenarios serecuperan los grupos en una escala similar, y en todos los casos, se repite el patron de la Figura 14.

EscenarioHiperparametros

puntos idealesDIC WAIC

4 bi = 0 y Bi = 1 8563.98 8775.229 bi = 0 y Bi ∼ GI(3, 2) 8555.55 8774.0510 bi ∼ N(0, 25) y Bi ∼ GI(3, 2) 8553.48 8771.59

Tabla 6: Medidas de precision predictiva para el contaste de las diferentes elecciones de distribucionesprevias e hiperparametros para los puntos ideales. Los valores mas bajos de DIC y WAIC implican unamayor precision predictiva.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 71: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 71

5.5. Bondad de ajuste del modelo.

(a) Media (b) Curtosis

(c) Informacion de Fisher (d) Desviacion

(e) Simetrıa (f) Entropıa

Figura 19: Distribucion predictiva posterior de un conjunto de estadısticos de prueba para el escenario 4.En los graficos, las lıneas verdes representan el intervalo de credibilidad simetrico basado en percentilesal 95 %, la lınea azul la media predictiva posterior del estadıstico de prueba, y la lınea roja el estadısticocalculado a partir de las observaciones. En la esquina superior derecha de cada panel se muestra el valorp predictivo posterior (ppp).

El escenario 4 recoge los aspectos bajo las cuales se hace el proceso de estimacion e inferencia de losparametros, βi, αj y µj , para el caso del Senado de la Republica de Colombia 2010–2014. Especıficamente,este escenario exhibe el ajuste del modelo de votacion espacial Bayesiano unidimensional teniendo encuenta la eleccion de legisladores de anclaje polıticamente opuestos para la identificabilidad del modelo,opera sin datos faltantes, utiliza la funcion de enlace logit y se consideran hiperparametros sin jerarquıapara las distribuciones previas de los parametros del modelo.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 72: M etodos Bayesianos para caracterizar el comportamiento ...

72 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

En este sentido, es relevante verificar la bondad de ajuste del modelo propuesto bajo el escenario 4. Paraello, se utilizan distribuciones empıricas de estadısticos de datos predichos. En la Figura 19 se exponen loshistogramas para la media, la desviacion, la curtosis, la simetrıa, la informacion de Fisher y la entropıade los datos replicados. Los ppp de cada uno de los estadısticos se encuentran alrededor de 0.5, razonpor la cual se considera que el modelo presenta un ajuste razonable al conjunto de datos simulado conuna tasa de datos faltantes del 40 %.

6. Senado de la Republica de Colombia 2010–2014.

En esta seccion se ilustra la aplicacion del estimador unidimensional de punto ideal Bayesiano estandar,tomando como caso particular, el Senado de la republica de Colombia 2010–2014. El analisis se direccionahacia la distincion de rasgos latentes, patrones partidistas y de coalicion que subyacen en las decisioneslegislativas de los diputados. En este sentido, se hace hincapie en las regularidades que revelan los puntosideales de los legisladores, βi, los parametros de discriminacion, αj y los parametros de aprobacion,µj . Los resultados que se exponen a continuacion, se enmarcan en dos de las lıneas de la taxonomıapropuesta, en relacion con la dimension del espacio polıtico y la identificacion de legisladores pivote (verSeccion 2).

6.1. Patrones en los puntos ideales de los legisladores.

En la Figura 20, se muestran las estimaciones de los puntos ideales de los 89 diputados del Senadoque hacen parte del analisis. Los βi exhiben un comportamiento particular segun el grupo polıtico enel que se inscriben los diputados. Por ejemplo, los miembros de la oposicion revelan una ubicacion allado izquierdo del espectro polıtico; esta localizacion es opuesta a la de los miembros de la coaliciongobernante, cuyos puntos ideales estimados, en su mayorıa, son superiores a cero. Las minorıas develanuna ubicacion centro–izquierda (entre −0.5 y 0), y los partidos independientes se observan mas dispersosa lo largo del espacio polıtico.

Oposicion Minorıas Independientes Coalicion

Mın -1.51 -0.24 -0.69 -0.02Max -0.67 -0.09 1.00 1.31CV 29 62 167 42

Tabla 7: Medidas resumen de los puntos ideales estimados por grupo polıtico. En cada caso, se presentael punto ideal mınimo (Mın), maximo (Max) y el coeficiente de variacion (CV) en porcentaje.

La media posterior de los puntos ideales de los diputados del Senado, oscila entre −1.51 y 1.31. Enla Tabla 7 se muestra el mınimo, maximo y coeficiente de variacion a posteriori de los puntos idealespor grupo polıtico. Las medidas registradas senalan a la oposicion y a la coalicion como los grupospolıticos con menor variabilidad en su interior, y a los independientes y minorıas como los grupos masheterogeneos. Al contrastar los cuatro grupos, se evidencia que los independientes exhiben el mayor rangode variacion en los puntos ideales de sus miembros.

Los diputados con puntos ideales ubicados hacia los extremos del espectro y con altos porcentajes deabstencion e inasistencia, son quienes revelan intervalos de credibilidad mas amplios, por ende, mayorincertidumbre en la estimacion de sus posiciones (ver Figura 20). Tal es el caso de los senadores AlexanderLopez Maya del PDA, Jorge Hernando Pedraza Gutierrez del CC y Hector Julio Alfonso Lopez del PIN,quienes presentan porcentajes altos de abstencion (Ver Figura 5b) y ademas, exhiben puntos idealesdistantes del centro.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 73: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 73

Figura 20: Puntos ideales estimados bajo la eleccion de legisladores de anclaje opuestos y a diferentesdistancias del centro. Los puntos representan la media posterior y las lıneas horizontales el intervalo decredibilidad simetrico basado en percentiles al 95 %.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 74: M etodos Bayesianos para caracterizar el comportamiento ...

74 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

Aunque el diputado Bernabe Celis Carrillo de CR no se destaca dentro de los 10 legisladores con elmayor porcentaje de abstencion e inasistencia del Senado (ver Figura 4b y 5b), su ubicacion extremistaen conjunto con su porcentaje de datos faltantes (57.3 % entre abstenciones e inasistencias), hacen quela estimacion de su punto ideal presente una mayor incertidumbre frente a la que reflejan legisladorescontiguos como Jorge Eduardo Gechem Turbay y Jaime Alonso Zuluaga Aristizabal del PU, quienespresentan porcentajes de datos faltantes inferiores al 50 % (44.1 % y 42.67 %, respectivamente).

(a) Distribucion marginal posterior de β1 (b) Distribucion marginal posterior de β33

(c) Distribucion marginal posterior de β39 (d) Distribucion marginal posterior de β53

Figura 21: Distribucion marginal posterior de los puntos ideales de los legisladores Alexander Lopez Mayadel PDA (β1), German Bernardo Carlosama Lopez de AICO (β33), Hector Julio Alfonso Lopez del PIN(β39) y Jorge Hernando Pedraza Gutierrez del CC (β53). La lınea roja corresponde a la media posterior,y las lıneas verdes al intervalo de credibilidad simetrico basado en percentiles al 95 %.

Los intervalos de credibilidad con menor amplitud se registran para los legisladores cuyos puntos idealesestan en el rango [−0.5, 0.5], lo que refleja una menor incertidumbre en las posiciones correspondientes delos parlamentarios centristas. El legislador Jorge Eliecer Guevara del PDA, quien hace cambio de partidoen el transcurso de su cargo (finaliza el cuatrienio en el PAV), revela una ubicacion coherente con el grupopolıtico donde inicia su labor legislativa. 83 de los 89 puntos ideales estimados son significativamentediferentes de cero (i.e., el intervalo de credibilidad correspondiente no contiene a cero). Los legisladoresGerman Bernardo Carlosama Lopez de AICO, Felix Jose Varela Ibanez del PAV, Camilo ArmandoSanchez Ortega del LC, Juan Francisco Lozano Ramirez, Maritza Martınez Aristizabal y Claudia JannethWilches Sarmiento del PU, presentan puntos ideales indistinguibles de cero.

En la Figura 21 se muestra la distribucion marginal posterior de los puntos ideales de los legisladoresAlexander Lopez Maya del PDA (β1), German Bernardo Carlosama Lopez de AICO (β33), Hector JulioAlfonso Lopez del PIN (β39) y Jorge Hernando Pedraza Gutierrez del CC (β53). La distribucion marginaldel punto ideal del legislador German Bernardo Carlosama Lopez de AICO revela un comportamientosimetrico con respecto a la media, mientras que las demas distribuciones se exhiben con sesgo a laizquierda o a la derecha. Las distribuciones asimetricas se relacionan con legisladores que exhiben unamayor incertidumbre en la estimacion de su punto ideal.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 75: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 75

Los senadores con una mayor probabilidad de ubicarse en los extremos del espectro polıtico son aquellospertenecientes a la oposicion o algun partido de la coalicion. De los legisladores del PDA, quienes tienenuna alta probabilidad de tener un punto ideal menor a −1 son: Alexander Lopez Maya (99 %), CamiloRomero Galeano (98 %) y Mauricio Ernesto Ospina Gomez (75 %). De los legisladores de la coalicion,quienes tienen una alta probabilidad de tener un punto ideal mayor a 1 son: Jaime Alonso ZuluagaAristizabal (93 %) y Jorge Eduardo Gechem Turbay (92 %) del PU, Bernabe Celis Carrillo de CR (90 %)y Gabriel Ignacio Zapata Correa (89 %) del CC. Los legisladores del LC registran probabilidades a lomas del 76 % de estar en el extremo superior del espectro polıtico. Algunos miembros de las minorıasy partidos independientes presentan una alta probabilidad de ubicarse en el centro del espectro. Enparticular, los diputados con una alta probabilidad de tener un punto ideal entre −0.2 y 0.2 (i.e., detener ubicaciones cercanas a cero) son: German Bernardo Carlosama Lopez (95 %) de AICO y Felix JoseValera Ibanez (92 %) del PAV. Todos los miembros del PIN tienen probabilidades de al menos 98 % detener un punto ideal superior a 0.2; esto ultimo, senala que legisladores afiliados al PIN tienen una altatendencia a la coalicion de gobierno, puesto que distan de la oposicion y de los legisladores centristas.

Figura 22: Clasificacion por partidos de los puntos ideales estimados de los diputados. Los puntos repre-sentan la estimacion puntual y las lıneas horizontales el intervalo de credibilidad basado en percentiles al95 %.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 76: M etodos Bayesianos para caracterizar el comportamiento ...

76 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

En la Figura 22, se evidencia el comportamiento de los puntos ideales por partido polıtico. Se observa unpatron similar en los miembros de las colectividades que conforman la coalicion (CC, LC, CR, PU) y elPIN. Este ultimo, no se declara en oposicion ni con el gobierno, pero su trayectoria polıtica ha mostradoafinidad con partidos como el PU (Colprensa, 2013), en tanto, es de esperar que los puntos ideales desus miembros se alineen con los de los partidos gubernamentales. El PDA, unico partido que se declaraen oposicion, revela puntos ideales en el extremo opuesto de los partidos de gobierno y el PIN. Lospartidos con menor numero de curules en el Senado (AICO, ASI, MIRA y PAV) muestran puntos idealesalrededor de cero. La minorıas muestran una tendencia centro-izquierda (puntos ideales entre −0.5 y 0),y los partidos MIRA y PAV exhiben senadores con ubicaciones centro-izquierda y centro-derecha (puntosideales entre 0 y 0.5).

El patron que se evidencia en la Figura 22, sugiere que el rasgo latente subyacente a la votacion nominaldel Senado de la Republica de Colombia 2010–2014 no es ideologico (izquierda–derecha), dado que, aun mismo lado del espectro se encuentran partidos como el CC y LC que historicamente se han recono-cido como opuestos en terminos de los ideales que fundamentan su colectividad. Tampoco es adecuadoestablecer un rasgo latente no ideologico del tipo oposicion–gobierno, puesto que, se tienen partidos queabiertamente no se declaran en alguno de estos dos bandos. En este sentido, estos hallazgos indicanun rasgo latente no ideologico que divide el espectro en oposicion–no oposicion. Esta fragmentacion delespacio polıtico, a diferencia de otros estudios (e.g., Carroll and Pachon, 2016), no fracciona el espectroequitativamente e incluye en el lado no opositor partidos de coalicion, minorıas e independientes.

En la Tabla 8 se muestran las medidas resumen de las estimaciones puntuales de los puntos ideales porpartido. Al contrastar la media de los partidos, se evidencia similitud en el promedio estimado para elPU, CC y LC, CR y PIN tambien exhiben promedios semejantes. El PDA y el CC son los partidoscon menor variablidad en las posiciones de sus miembros, mientras que el PAV y MIRA revelan un altadispersion alrededor de su media. Esto ultimo, sugiere que estos dos partidos, a nivel de colectividad,son muy volatiles en terminos de sus decisiones legislativas. Por otro lado, al contrastar los valores de lospuntos ideales maximos y mınimos entre partidos, se evidencia que los legisladores mas extremistas, enrelacion al rasgo latente oposicion–no oposicion, se encuentran en los partidos PDA, CR y PU (lo cualesta en plena concordancia con las probabilidades presentadas previamente).

PDA MIRA ASI AICO PAV PIN CR LC CC PU

Mın −1.51 −0.69 - - −0.21 0.38 0.14 0.09 0.39 −0.02Max 0.67 0.18 - - 0.45 1.00 1.31 1.10 1.19 1.26

Media −1.03 −0.29 −0.24 −0.09 0.10 0.67 0.68 0.70 0.76 0.77CV ( %) 29 150 - - 311 39 61 46 27 47

Tabla 8: Medidas resumen de los puntos ideales estimados por partido. Para cada colectividad, se senalael punto ideal mınimo (Mın), maximo (Max), la media y el coeficiente de variacion (CV) en porcentaje.Para los partidos ASI y AICO la estimacion puntual corresponde a la media del partido, no se reportanlas demas medidas debido a que estos solo cuentan con una curul en el Senado.

En la Figura 23 se observa el comportamiento de los puntos ideales por comision a nivel de plenariamas no a nivel interno de comite. Se exhibe un patron similar en las comisiones tercera y cuarta; susmiembros revelan ubicaciones en el espectro polıtico con tendencia no opositora, lo cual es coherentecon la composicion de estos comites (ver Seccion 3). Aunque en las demas comisiones se evidencianubicaciones de legisladores en oposicion, en todas se revela un grupo mayoritario de legisladores noopositores con puntos ideales muy similares. Tal es el caso de la comision primera, cuyos puntos idealesestimados mayores a cero se muestran homogeneos. En contraste con las demas comisiones, la quinta,sexta y septima, revelan una mayor heterogeneidad en los puntos ideales de sus integrantes.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 77: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 77

Figura 23: Clasificacion por comision de los puntos ideales estimados de los diputados. Los puntos repre-sentan la estimacion puntual y las lıneas horizontales el intervalo de credibilidad basado en percentiles al95 %.

6.2. Patrones en los parametros de discriminacion y aprobacion.

En terminos de los parametros de discriminacion estimados, se identifica que 251 de los 417 son signifi-cativamente diferentes de cero (i.e., el intervalo de credibilidad correspondiente no contiene a cero). Loanterior implica, que bajo la propuesta de un modelo unidimensional, el 60.2 % de las mociones tienen lacapacidad de discriminar entre los legisladores a lo largo del espectro polıtico. El porcentaje de αj indis-tinguibles de cero que produce el modelo en una dimension, suscitan la posibilidad de ajustar un modelode dimensiones superiores en un trabajo futuro (ver Jackman, 2001), a fin de evaluar sı el incremento enlas dimensiones del estimador proporciona un mejor ajuste a los datos de votacion nominal del Senado2010–2014.

Las mociones que no discriminan entre legisladores en la dimension polıtica recuperada, estan relaciona-das con temas diversos. Especıficamente, no son discriminantes aquellos proyectos clasificados en admi-nistracion publica, asuntos administrativos, celebraciones, honores y monumentos; comercio, industria yturismo; educacion, ciencia y tecnologıa; familia, medio ambiente, participacion ciudadana, partidos ymovimientos, rama ejecutiva, recreacion y deporte, y vivienda. En cuanto a las mociones que segreganentre legisladores, se identifica que estas tambien se relacionan con temas diversos. El 49.8 % corres-ponden a seguridad social y salud, el 16.7 % a polıtica internacional, el 10.8 % se vinculan con justicia,el 7.2 % con seguridad, defensa y fuerza publica; el 6.4 % con economıa, y el 9.1 % restante, con temas

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 78: M etodos Bayesianos para caracterizar el comportamiento ...

78 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

varios. Lo anterior, sugiere que no hay un patron tematico relevante en la dimension del espacio polıtico.Por otro lado, se determina que el 81.7 % de las mociones que discriminan con respecto a una dimensionson de iniciativa gubernamental; este hallazgo es coherente con el rasgo latente propuesto (oposicion–noposicion).

(a) αj que discriminan con respecto a una dimension. (b) αj que no discriminan con respecto a una dimen-sion.

Figura 24: Contraste entre el porcentaje de votos a favor para la lista de votacion j y la estimacion puntualdel parametro de discriminacion, αj. Las lıneas verticales en gris demarcan los comicios desequilibrados,i.e., las listas de votacion con un porcentaje de votos a favor menor o igual a 2.5 %, o mayor o igual a97.5 %.

En la Figura 24 se exhibe el contraste entre el porcentaje de votos a favor para la lista de votacion j conla respectiva estimacion puntual del parametro de discriminacion, αj . Al equiparar el comportamiento delos αj que se distinguen de cero (Figura 24a) con los que no segregan en la dimension propuesta (Figura24b), se observa que las listas de votacion con porcentajes de voto a favor del 0 % y 100 % (votacionesunanimes) no distinguen entre legisladores, en tanto, no son relevantes para recuperar informacion acercade las preferencias polıticas de los diputados. Este resultado es concordante con lo expuesto por otrosautores (e.g., Jackman, 2001; Clinton et al., 2004), quienes han eliminado los comicios unanimes delanalisis. De las 166 mociones que no segregan 89 corresponden a votaciones de este tipo, mientras que,solo son 77 las que no discriminan en el continuo de polıticas recuperado y las que posiblemente guardaninformacion acerca de una segunda dimension del espacio polıtico.

Las listas de votacion que discriminan entre diputados y presentan un porcentaje de votos a favor menora 45 %, revelan parametros de discriminacion negativos (ver Figura 24a); esto implica que legisladores conpuntos ideales menores a cero incrementan su probabilidad de voto positivo, en cambio legisladores conpuntos ideales mayores a cero disminuyen esta probabilidad. Un patron inverso se resalta para las listasde votacion con porcentaje de voto a favor mayor a 70 % (ver Figura 24a). Estas senalan parametros dediscriminacion positivos, lo cual implica que legisladores con puntos ideales mayores a cero incrementansu probabilidad de voto a favor, en cambio legisladores con puntos ideales menores a cero aumentan suprobabilidad de voto en contra. Las listas de votacion con porcentaje de voto a favor entre 40 % y 70 %se muestran mas dispersas alrededor de cero.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 79: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 79

(a) Distribucion marginal posterior de α305 (b) Distribucion marginal posterior de µ305

(c) Distribucion marginal posterior de α359 (d) Distribucion marginal posterior de µ359

(e) Distribucion marginal posterior de α412 (f) Distribucion marginal posterior de µ412

Figura 25: Distribucion marginal posterior para el parametro de discriminacion y aprobacion de tres listasde votacion: una que segrega entre legisladores (α305 y µ305, respectivamente), una mocion unanime(α359 y µ359, respectivamente) y una que no discrimina en el espacio de polıticas propuesto (α412 yµ412, respectivamente). La lınea roja corresponde a la media posterior, y las lıneas verdes al intervalo decredibilidad simetrico basado en percentiles al 95 %.

En la Figura 25, se muestra a modo de ejemplo, la distribucion marginal posterior para el parametro dediscriminacion y aprobacion de tres listas de votacion: una que segrega entre legisladores (α305 y µ305,respectivamente), una mocion unanime (α359 y µ359, respectivamente) y una que no discrimina en elespacio de polıticas propuesto (α412 y µ412, respectivamente). Se observa que las densidades posterioresde los αj de las listas de votacion que segregan y no discriminan entre legisladores, se revelan asimetricascon sesgo negativo (ver Figura 25a y 25e). La lista de votacion que discrimina con respecto a la dimensionpropuesta, en comparacion con las otras dos mociones, senala una menor incertidumbre en la estimacionde su parametro de aprobacion (ver Figura 25b).

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 80: M etodos Bayesianos para caracterizar el comportamiento ...

80 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

Figura 26: Contraste entre el porcentaje de votos a favor para la lista de votacion j y la estimacion puntualdel parametro de aprobacion, µj. Las lıneas verticales en gris demarcan los comicios desequilibrados, i.e.,las listas de votacion con un porcentaje de votos a favor menor o igual a 2.5 %, o mayor o igual a 97.5 %.

En la Figura 26 se observa que los proyectos de ley con porcentaje de voto observado del 0 %, sonlas que presentan la menor estimacion puntual del parametro de aprobacion, i.e., son las que tienen laprobabilidad basal de voto positivo mas baja en el conjunto de mociones. Por otro lado, las listas devotacion con porcentaje observado de voto a favor del 100 %, son las que revelan la probabilidad basal devoto positivo mas alta del total de las mociones. De las listas de votacion no unanimes, las que reflejanuna probabilidad basal de voto positivo mas baja son las que cuentan con un porcentaje observado devotos a favor entre el 2.5 % y el 10 %, y las que exhiben una probabilidad basal de voto positivo mas altason aquellas con un porcentaje observado de votos a favor superior al 90 %.

6.3. Bondad de ajuste

En terminos de bondad de ajuste del modelo, se examinan las mismas caracterısticas del escenario 4del estudio de simulacion (ver 5.5). En la Figura 27 se expone la distribucion predictiva posterior de unconjunto de estadısticos de prueba para los datos del Senado. Todos los ppp dan razon de un buen ajuste,dado que no corresponden a valores extremos (inferiores a 0.05 o superiores a 0.95). Ademas, en todas lasdistribuciones se observa que el valor observado del estadıstico cae dentro del intervalo de credibilidadsimetrico del 95 %. En este sentido, se concluye que el modelo unidimensional propuesto revela un ajusterazonable al conjunto de datos de votacion nominal del Senado de la Republica de Colombia 2010-2014.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 81: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 81

(a) Media (b) Curtosis

(c) Informacion de Fisher (d) Desviacion

(e) Simetrıa (f) Entropıa

Figura 27: Distribucion predictiva posterior de un conjunto de estadısticos de prueba para el Senadode la Republica de Colombia 2010–2014. En los graficos, las lıneas verdes representan el intervalo decredibilidad basado en percentiles al 95 %, la lınea azul la media predictiva posterior del estadıstico deprueba, y la lınea roja el estadıstico calculado a partir de las observaciones. En la esquina superior derechade cada panel se muestra el valor p predictivo posterior (ppp).

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 82: M etodos Bayesianos para caracterizar el comportamiento ...

82 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

7. Discusion

La revision sistematica de los estudios cuantitativos sobre comportamiento legislativo en el contextonorteamericano, posibilita identificar ocho fenomenos legislativos que han sido operacionalizados a travesde la implementacion de alguna version o generalizacion del estimador de punto ideal Bayesiano. En elmarco de estos fenomenos se resaltan aspectos teoricos y metodologicos que permiten guiar el analisisde datos de votacion nominal en contextos de parlamentos desequilibrados como el de Colombia. Lataxonomıa propuesta admite puntualizar cuestiones sustantivas que se han explorado empıricamente enel escenario de los Estados Unidos y que sirven de inspiracion para ampliar la investigacion cuantitativasobre la conducta electoral parlamentaria en diferentes contextos de America Latina, en particular enColombia, donde los estudios en esta direccion son escasos. La taxonomıa se encuentra sujeta a serextendida a traves del reconocimiento de fenomenos legislativos y metodologıas adicionales.

La simulaciones realizadas, exhiben las condiciones bajo las cuales son invariantes los resultados quese obtienen tras aplicar el estimador unidimensional de punto ideal Bayesiano estandar a los datos devotacion nominal del Senado de la Republica de Colombia 2010–2014. En este sentido, se reconoce quela eleccion de los legisladores de anclaje puede ser arbitraria; sin embargo, se sugiere que estos seanpolıticamente opuestos para fines de interpretacion de los valores en los cuales se fijan y para asegurarque los diputados a eleccion no compartan el mismo punto ideal. En terminos del analisis de sensitividad alas funciones de enlace, se concluye que no hay diferencias significativas entre la eleccion de logit o probitcuando se trabaja en un contexto univariado. Corresponde a estudios posteriores analizar la sensitividadde estos vınculos cuando se trabaja en dimensiones superiores.

El analisis de sensitividad a las distribuciones previas de los puntos ideales senala que los resultadosson consistentes ante hiperparametros con y sin jerarquıas. En futuros estudios es de interes indagarsobre la sensitividad del modelo cuando se consideran otras familias parametricas o no parametricaspara los hiperparametros del modelo, incluyendo los asociados con los parametros de discriminaciony aprobacion. Por otro lado, se evidencia que prescindir de los datos perdidos no genera conclusioneserroneas en terminos de la inferencia de los parametros del modelo; no obstante, a una mayor tasa dedatos faltantes genera una mayor incertidumbre en su estimacion. La tasa de abstenciones e inasistenciasdel Senado de la Republica de Colombia 2010-2014 es alta (40 % aproximadamente), en tanto, motivaestudios posteriores que indaguen sobre el mecanismo generador de los datos perdidos. Desde un punto devista cuantitativo, se desconoce sı los datos faltantes revelan algun tipo de estrategia polıtica al interiordel Congreso de Colombia (e.g., Rosas et al., 2015). Por otro lado, se deja para estudios posteriores laexploracion y contraste de los resultados expuestos en este trabajo con otras alternativas computacionalesque permitan ajustar el modelo de manera mas eficiente. Por ejemplo, hacer la implementacion del mismousando metodos variacionales (ver Beal, 2003; Brodersen et al., 2013; Blei et al., 2017).

Este trabajo se postula como el primero en aplicar el estimador de punto ideal Bayesiano en el contextocolombiano. Los resultados que se presentan proveen aportes en dos de las lıneas de la taxonomıa senalada:dimension del espacio polıtico e identificacion de legisladores pivote. Estos aportes no implican queel estudio legislativo en la direccion de estas lıneas se agote, todo lo contrario, se demandan comomotivadores para profundizar en la caracterizacion de la dimension del espacio polıtico e identificacionde legisladores fundamentales en el contexto parlamentario de Colombia. La metodologıa propuestapermite identificar aquellos legisladores que tienen una mayor probabilidad de ubicarse en los extremoso en el centro del espectro polıtico, pero no es suficiente para determinar el orden en el que se ubicanlos parlamentarios. Esto ultimo, permitirıa ahondar en cuestiones relacionadas con la teorıa polıticapivotal (ver Krehbiel, 1998) e indagar, desde un punto de vista cuantitativo, acerca de las posibilidadesde aplicacion e interpretacion que tiene esta teorıa en el contexto de parlamentos desequilibrados como elde Colombia. El analisis legislativo a nivel individual permite personalizar patrones de conducta electorale incluir en el estudio legisladores de partidos polıticos con un bajo numero de curules en el parlamentocomo AICO, ASI, PAV y MIRA, que usualmente no se incluyen en las investigaciones cuantitativas queaplican metodos estadısticos y hacen extrapolaciones a nivel de grupo.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 83: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 83

A traves del patron que revelan los puntos ideales estimados, se reconoce un rasgo latente no ideologico(oposicion–no oposicion) subyacente a la votacion de los diputados del Senado. Esto no descarta laposibilidad de extender el estimador unidimensional de punto ideal Bayesiano estandar para evaluar lapresencia de otros factores latentes en la conducta electoral de los parlamentarios. Es de resaltar que elestimador en su version canonica opera bajo el supuesto de votacion sincera (i.e., el legislador solo votaen funcion de su punto ideal) y por ende, no permite medir efectos ideologicos, partidistas o de coalicionen la votacion de los diputados (e.g., Tsai, 2020).

El modelo unidimensional planteado exhibe un ajuste razonable a los datos de votacion nominal delSenado de la Republica de Colombia 2010–2014, sin embargo, se identifican algunas listas de votacionque no discriminan entre legisladores a lo largo del continuo de polıticas propuesto. Este hallazgo suscitala posibilidad de evaluar un modelo en dimensiones superiores para examinar sı se justifica incrementarla complejidad del modelo a fin de obtener un mejor ajuste a los datos de votacion nominal de estacamara legislativa. Tambien se deja abierta la posibilidad de evaluar el caracter estatico y colectivo dela dimension del espacio polıtico en el contexto de Colombia (e.g., Moser et al., 2021).

Finalmente, el estudio propuesto revela aspectos metodologicos y practicos utiles para direccionar fu-turos analisis de los datos de votacion nominal en el paıs. En particular, el pre–procesamiento de losdatos detalla la forma como se debe consolidar, depurar y estructurar el conjunto de datos para aplicarmetodos Bayesianos a los registros de votacion legislativa. En esta vıa, se postula como investigacionfutura la recopilacion automatizada y consolidacion de una base maestra que contemple todos los regis-tros de votacion nominal del Congreso de la Republica de Colombia, en la medida de lo posible desdesus inicios hasta la actualidad. Tambien el diseno e implementacion de una librerıa en R denominada“congresscol”, para poner a disposicion de los cientıficos sociales, tanto los datos como el softwarepara realizar la implementacion estandar y otras extensiones del modelo de punto ideal Bayesiano, queconsideren condiciones propias de parlamentos desequilibrados.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 84: M etodos Bayesianos para caracterizar el comportamiento ...

84 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

Apendices

A. Muestreador de Gibbs para el analisis de datos de votacionnominal.

La aplicacion del muestreador de Gibbs en este contexto, tiene dos alternativas. En el mismo espıritude Albert and Chib (1993), la primera se fundamenta en que cualquier modelo de la forma (4) o (5) sepuede expresar como un modelo de regresion lineal latente. Por ejemplo, en el caso de un enlace probitse puede expresar como:

y∗i,j = µj +αTj βi + εi,j donde εi,j

iid∼ N(0, 1) . (13)

Para el caso de un enlace logit, la expresion (13) es similar a la anterior, solo que los εi,j en lugar detener distribucion Normal estandar tienen una distribucion Logıstica. Ademas, en el primer paso delalgoritmo que se muestra en esta seccion, los y∗i,j no se muestrean de una distribucion Normal truncadasino de una distribucion Polya-Gamma (Polson et al., 2013). En esta alternativa, se aumenta el espaciode parametros al incluir las variables auxiliares y∗i,j , lo cual facilita muestrear los βi, αj y µj , dado quemediante la inclusion de las variables auxiliares es posible obtener una distribucion condicional completade forma cerrada para estos parametros, tal cual como se estipula en el paso 2.

La segunda alternativa no incorpora variables auxiliares, y por lo tanto, la distribucion condicionalcompleta de los βi, αj y µj no tiene forma cerrada. En este caso, se utiliza Metropolis-Hastings oMonte Carlo Hamiltoniano para muestrear la distribucion posterior de los parametros. En lo que sigue,se describe el muestreador del Gibbs teniendo en cuenta la primera alternativa y utilizando la funcionde enlace probit.

Los parametros del modelo se pueden estimar bajo la misma filosofıa de un modelo de regresion linealBayesiano semiconjugado teniendo en cuenta las distribuciones previas (8) y (9) para µj ,αj y βi. En(13), y∗i,j es una variable dependiente no observada y para su estimacion se sugiere asumirla como unparametro adicional en la ejecucion del muestreador de Gibbs (Jackman, 2009). Los pasos del algoritmose detallan a continuacion (b indexa las iteraciones).

1. Dados µ(b−1)j , α

(b−1)j y β

(b−1)i , se muestrea y

∗(b)i,j de la distribucion condicional completa

p(y∗i,j | yi,j , µj ,αj ,βi)

de la siguiente manera:

(a) Evaluar ρ(b−1)i,j = µ

(b−1)j +α

(b−1)Tj β

(b−1)i .

(b) La relacion expresada en (13) implica que la variable respuesta y∗i,j se asocia con un voto “SI”(yi,j = 1) cuando y∗i,j ≥ 0 y con un voto “NO” (yi,j = 0) en caso de y∗i,j < 0; por lo tanto, y∗i,jse debe muestrear de una distribucion Normal truncada, dependiendo del valor yi,j observado:

p(y∗i,j | yi,j , µ(b−1)j ,α

(b−1)j ,β

(b−1)i ) =

N(0,∞)(y

∗i,j | ρ

(b−1)i,j , 1), si yi,j = 1

N(−∞,0](y∗i,j | ρ

(b−1)i,j , 1), si yi,j = 0

2. Luego, dados y∗(b)i,j se muestrea µ

(b)j y α

(b)j de la distribucion condicional completa

p(µj ,αj | B, y∗i,j)

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 85: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 85

de la siguiente manera:

(a) Calcular cj y C, donde

cj = [B∗TB∗ +A−10 ]−1[B∗Ty

∗(t).j +A−1

0 a0] y C = [B∗TB∗ +A−10 ]−1

donde B∗ es una matriz n× (d+ 1) con β∗i = (1,β(b−1)i ) i-esima fila, y

∗(b).j un vector n× 1 de

muestras de diferenciales de utilidades latentes para la j-esima propuesta; a0 y A0 el vectorde medias y la matriz de varianzas y covarianzas de la distribucion normal multivariada previapara µj y αj .

(b) Muestrear (µ(b)j ,α

(b)j ) ∼ N(cj ,C).

3. Finalmente, dados µ(b)j , α

(b)j y y

∗(b)i,j , se muestrea β

(b)i de la distribucion condicional completa

p(βi | µj ,αj , y∗i,j)

para ello se reescribe el modelo de regresion lineal latente (13) de la siguiente forma

wi,j = y∗i,j − µj = αTj βi + εi,j (14)

Si wi = (wi,1, · · · , wi,m) se toma como el vector de observaciones del legislador i y A como unamatriz de informacion, las ecuaciones (14) se pueden colapsar para configurar n regresiones de laforma

wi = Aβi . (15)

Nuevamente, bajo el mismo enfoque de un analisis semiconjugado, la actualizacion de los βi selleva a cabo de la siguiente manera:

(a) Calcular hi y Hi, donde

hi = [ATA+B−1i ]−1[ATwi +B−1

i bi] y Hi = [ATA+B−1i ]−1

donde bi y Bi corresponde al vector de medias y matriz de varianzas y covarianzas de ladistribucion Normal multivariada previa para el punto ideal del i-esimo legislador.

(b) Muestrear β(b)i ∼ N(hi,Hi) .

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 86: M etodos Bayesianos para caracterizar el comportamiento ...

86 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

B. Diagnostico de convergencia.

Para cada escenario propuesto, simulaciones y Senado de Republica de Colombia 2010–2014, se llevaacabo el diagnostico de convergencia. En todos los casos se reporta una estadıstica R con valores proximosa 1, lo cual sugiere que no hay evidencia de falta de convergencia (Gelman et al., 2014). En la Figura28a, se muestra el comportamiento de esta estadıstica para el caso de los datos de estudio. La estadısticaR describe un comportamiento similar en todos los experimentos con datos sinteticos.

En los diferentes escenarios, el calculo del cociente entre el error estandar de Monte Carlo y la desviacionestandar de las estimaciones, muestra valores inferiores a 0.01. Esto indica, tanto para las simulacionescomo para los datos de estudio, que la fuente de incertidumbre en la estimacion de los parametrosproviene de los datos y no del muestreo de la distribucion posterior. En la Figura 28b, se muestra amodo de ejemplo, el comportamiento de este cociente para el caso del Senado. El patron que se reflejaen esta figura, es el mismo para todos los escenarios de simulacion.

Adicionalmente, se calcula el coeficiente de variacion de las estimaciones (cociente entre el error estandarde Monte Carlo y la media posterior); este oscila entre 0 % y 15 % aproximadamente, para las diferentesconfiguraciones de simulacion y datos de analisis. Este rango de valores es indicativo de una alta precisiona posteriori en la estimacion de los parametros del modelo. En particular, en la Figura 28d se exhibe elcomportamiento del coeficiente de variacion para las estimaciones del Senado; el histograma revela quela mayorıa de los parametros estimados presenta coeficientes de variacion a lo mas del 2 %. Al igual queen los casos anteriores, este grafico resulta analogo para los diferentes escenarios de simulacion.

(a) (b)

(c) (d)

Figura 28: Diagnostico de convergencia global, para el caso de los datos del Senado de la Republica deColombia 2010-2014. El patron que se evidencia en estos graficos, es el mismo que se describe bajo todoslos escenarios del estudio de simulacion.

En las tablas de esta seccion, se registra el mınimo y maximo del tamano efectivo de muestra, y la

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 87: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 87

media posterior de la log-verosimilitud para los distintos escenarios de simulacion. En todos los casos,se observa que el tamano efectivo de muestra de los parametros estimados, supera el 20 % del numerode iteraciones. En terminos de la log-verosimilitud posterior, se evidencian similitudes y discrepanciasentre escenarios. Por ejemplo, esta exhibe valores similares dentro de cada parlamento para el caso de lasdiversas configuraciones de los legisladores de anclaje (ver Tabla 9). Tambien revela valores semejantesbajo las diferentes funciones de enlace (ver Tabla 10) y las distintas distribuciones previas de los puntosideales (ver Tabla 12). En este ultimo caso, se observa que el escenario 10, senala un leve incremento en lalog-verosimilitud en contraste con los demas escenarios. Aunque no es un aumento sustancial, sı permiteevidenciar que incluir jerarquıas para modelar los hiperparametros de los puntos ideales puede contribuira una mejor caracterizarizacion del conjunto de datos. Las similitudes senaladas estan en concordanciacon los resultados presentados en la seccion 5. Por otro lado, en el Tabla 11 no se observan analogıasen la media posterior de la log-verosimilitud, puesto que, se trata de conjuntos de datos distintos, y entanto, estas medias no son comparables entre sı.

Equilibrado Desequilibrado

Escenario Legisladores de anclaje lp Tamano efectivo lp Tamano efectivoMın Max Mın Max

1 Cercanos al centro -5953 4023 12060 -4515 7947 122562 Izquierda - Centro -5934 5571 11882 -4536 8624 120213 Centro - Derecha -5938 5457 12154 -4427 7840 119054 Diferentes distancias al centro -5940 2809 12150 -4446 6688 122215 Extremistas -5968 2417 12261 -4457 7105 12220

Tabla 9: Media posterior de la log-versosimilitud (lp), tamano efectivo de muestra mınimo (Mın) ymaximo (Max) para los diferentes escenarios del analisis de sensitividad a los legisladores de anclaje.

Escenario Enlace lp Tamano efectivoMın Max

4 Logit -4446 6688 122216 Probit -4250 3008 12042

Tabla 10: Media posterior de la log-versosimilitud (lp), tamano efectivo de muestra mınimo (Mın) ymaximo (Max) para los diferentes escenarios del analisis de sensitividad a las funciones de enlace.

EscenarioPorcentaje

datos faltanteslp Tamano efectivo

Mın Max

7 10 -6459 5941 120724 40 -4446 6688 122218 60 -3164 8307 12117

Tabla 11: Media posterior de la log-versosimilitud (lp), tamano efectivo de muestra mınimo (Mın) ymaximo (Max) para cada uno de los escenarios considerados en el analisis de sensitividad a la tasa dedatos faltantes.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 88: M etodos Bayesianos para caracterizar el comportamiento ...

88 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

Escenario Distribucion previa lp Tamano efectivoMın Max

4 bi = 0 y Bi = 1 -4446 6688 122219 bi = 0 y Bi ∼ GI(3, 2) -4432 7515 1200510 bi ∼ N(0, 25) y Bi ∼ GI(3, 2) -4390 6224 12113

Tabla 12: Media posterior de la log-versosimilitud (lp), tamano efectivo de muestra mınimo (Mın) y maxi-mo (Max) para cada uno de los escenarios considerados en el analisis de sensitividad a las distribucionesprevias de los puntos ideales.

Para el Senado, la media posterior de la log-verosimilitud es -5151.88 con un error estandar de 0.24.El tamano efectivo de muestra para los βi oscila entre 1914 y 7961, para los αj entre 9263 y 11701, ypara los µj entre 4038 y 11803. En el caso de los puntos ideales, solo dos estimaciones registran tamanosefectivos de muestra por debajo de 2000. En la Figura 28c, se exalta la relacion entre el tamano efectivode muestra y el tamano de muestra (numero de iteraciones) para el caso del Senado. Este cociente exhibeen su mayorıa valores superiores a 0.9, lo cual indica que la cadena de Markov resultante, ofrece una altaproporcion de muestras aproximadamente independientes e identicamente distribuidas de la posterior,para hacer el proceso de inferencia sobre los parametros del modelo. La Figura 28c, es representativadel patron que exhiben los diferentes escenarios de simulacion cuando se contrasta el tamano efectivo demuestra y el tamano de muestra.

Finalmente, todas las configuraciones revelan estacionariedad en las cadenas y una distribucion aproxi-madamente normal para la log-verosimilitud posterior. En la Figura 29 se muestra a modo de ejemplo,el comportamiento de la log-verosimiltud posterior para el caso del Senado. El patron que se evidenciaen esta figura, es analogo al que se describe bajo todos los escenarios de simulacion.

(a) Cadena de Markov para la log-verosimilitud. (b) Distribucion posterior de la log-verosimilitud

Figura 29: Comportamiento de la log-verosimiltud posterior para el caso del Senado de la Republica deColombia 2010-2014. El patron que se evidencia en estos graficos, es analogo al que se describe bajotodos los escenarios de simulacion.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 89: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 89

C. Comisiones constitucionales.

Temas comision primera LegisladoresReformas constitucionales Hernan Andrade Serrano (CC) Nestor Ivan Moreno Rojas (PDA)Leyes estatutarias Luis Carlos Avellaneda Tarazona (PDA) Karime Mota y Morad (PU)Organizacion territorial Javier Enrique Caceres Leal (CR) Juan Carlos Rizzetto Luces (PIN)Reglamentos organismos de control Juan Manuel Corzo Roman (CC) Carlos Enrique Soto Jaramillo (PU)Administracion nacional central Carlos Eduardo Enrıquez Maya (CC) Luis Fernando Velasco Chaves (LC)Derechos, garantıas y deberes Manuel Mesias Enriquez Rosero (PU) Juan Carlos Velez Uribe (PU)Rama legislativa Juan Manuel Galan Pachon (LC) Roy Barreras Montealegre (PU)Estrategıas y polıticas para la paz Jesus Ignacio Garcia Valencia (LC) Juan Fernando Cristo Bustos (LC)

Roberto Victor Gerlein Echeverria (CC) *Parmenio Cuellar Bastidas (PDA)Hemel Hurtado Angulo (PIN) *Doris Clemencia Vega Quiroz (PIN)Jorge Eduardo Londono Ulloa (PAV)

Tabla 13: Descripcion de los temas que se tratan en la comision primera y listado de legisladores que laconforman en el Senado de la Republica de Colombia 2010-2014. Se incluyen titulares (19) y (*)reem-plazos (2). Fuente: Congreso Visible (https: // congresovisible. uniandes. edu. co ).

Temas comision segunda LegisladoresPolıtica internacional Marco Anibal Avirama Avirama (ASI) Juan Francisco Lozano Ramirez (PU)Defensa nacional y fuerza publica Carlos Emiro Barriga Penaranda (CC) Alexandra Moreno Piraquive (MIRA)Tratados publicos Armando Benedetti Villaneda (PU) Carlos Fernando Motoa Solarte (CR)Carrera diplomatica y consular Carlos Ramiro Chavarro Cuellar (CC) Myriam Alicia Paredes Aguirre (CC)Comercio exterior Edgar Espindola Nino (PIN) Camilo Romero Galeano (PDA)Politica portuaria Guillermo Garcıa Realpe (LC) Manuel Virguez Piraquive (MIRA)Honores y monumentos publicos Edgar Alfonso Gomez Roman (LC)

Tabla 14: Descripcion de los temas que se tratan en la comision segunda y listado de legisladores que laconforman en el Senado de la Republica de Colombia 2010-2014. Solo se incluyen titulares (13), no hayreemplazos en esta comision. Fuente: Congreso Visible (https: // congresovisible. uniandes. edu.co ).

Temas comision tercera LegisladoresHacienda y credito publico Oscar Mauricio Lizcano Arango (PU) Juan Mario Laserna Jaramillo (CC)Impuesto y contribuciones Arleth Patricia Casado de Lopez (LC) Manuel Julian Mazenet Corrales (PIN)Exenciones tributarias Bernabe Celis Carrillo (CR) Jose Dario Salazar Cruz (CC)Regimen monetario Fuad Ricardo Char Abdala (CR) Camilo Sanchez Ortega (LC)Sistema de banca central Bernardo Miguel Elias Vidal (PU) German Villegas Villegas (CC)

Antonio Guerra de la Espriella (CR) Gabriel Ignacio Zapata Correa (CC)German Darıo Hoyos Giraldo (PU) Piedad del Socorro Zuccardi de Garcıa (PU)Jorge Aurelio Iragorri Hormaza (PU) *Samuel Arrieta Buelvas (PIN)

Tabla 15: Descripcion de los temas que se tratan en la comision tercera y listado de legisladores que laconforman en el Senado de la Republica de Colombia 2010-2014. Se incluyen titulares (15) y (*)reem-plazos (1). Fuente: Congreso Visible (https: // congresovisible. uniandes. edu. co ).

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 90: M etodos Bayesianos para caracterizar el comportamiento ...

90 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

Temas comision cuarta LegisladoresLeyes organicas de presupuesto Alvaro Ashton Giraldo (LC) Martin Emilio Morales Diz (PU)Sistema de control fiscal financiero Musa Abraham Besayle Fayad (PU) Ivan Leonidas Name Vasquez (PAV)Enajenacion/destinacion bienes nacionales Efraın Jose Cepeda Sarabia (CC) Carlos Arturo Quintero Marın (PIN)Propiedad industrial, patentes y marcas Jose Ivan Clavijo Contreras (CC) Fuad Emilio Rapag Matar (PU)Contratacion administrativa Honorio Galvis Aguilar (LC) Juan Carlos Restrepo Escobar (CR)

Jorge Eduardo Gechem Turbay (PU) Rodrigo Villalba Mosquera (LC)Jose Francisco Herrera Acosta (CR) Jaime Zuluaga Aristizabal (PU)Juan Samy Merheg Marun (CC)

Tabla 16: Descripcion de los temas que se tratan en la comision cuarta y listado de legisladores que laconforman en el Senado de la Republica de Colombia 2010-2014. Solo se incluyen titulares (15), no hayreemplazos en esta comision. Fuente: Congreso Visible (https: // congresovisible. uniandes. edu.co ).

Temas comision quinta LegisladoresRegimen agropecuario Hector Julio Alfonso Lopez (PIN) Maritza Martınez Aristizabal (PU)Ecologıa Piedad Esneda Cordoba Ruiz (LC) Manuel Guillermo Mora Jaramillo (PU)Medio ambiente y recursos naturales Juan de Jesus Cordoba Suarez (CC) Jose David Name Cardozo (PU)Minas y energıa Jaime Enrique Duran Barrera (LC) Jorge Enrique Robledo Castillo (PDA)Corporaciones autonomas regionales Daira de Jesus Galvis Mendez (CR) Milton Arlex Rodrıguez Sarmiento (PU)

Nora Marıa Garcıa Burgos (CC) Luis Emilio Sierra Grajales (CC)*Lidio Arturo Garcıa Turbay (LC) Felix Jose Valera Ibanez (PAV)

Tabla 17: Descripcion de los temas que se tratan en la comision quinta y listado de legisladores que la con-forman en el Senado de la Republica de Colombia 2010-2014. Se incluyen titulares (13) y (*)reemplazos(1). Fuente: Congreso Visible (https: // congresovisible. uniandes. edu. co ).

Temas comision sexta LegisladoresComunicacion y tecnologıas de la informacion Mauricio Aguilar Hurtado (PIN) Plinio Olano Becerra (PU)Tarifas Amparo Arbelaez Escalante (LC) Jorge Pedraza Gutierrez (CC)Calamidades publicas Carlos Baena Lopez (MIRA) Eugenio Enrique Prieto Soto (LC)Servicios publicos Cesar Delgado Blandon (CC) Olga Lucia Suarez Mira (CC)Obras publicas y trasnporte Carlos Ferro Solanilla (PU) John Sudarsky Rosenbaum (PAV)Desarrollo turıstico Jorge Eliecer Guevara (PDA) Efraın Torrado Garcıa (PU)Educacion y cultura Alexander Lopez Maya (PDA) *Luis Fernando Duque Garcia (LC)

Tabla 18: Descripcion de los temas que se tratan en la comision sexta y listado de legisladores que la con-forman en el Senado de la Republica de Colombia 2010-2014. Se incluyen titulares (13) y (*)reemplazos(1). Fuente: Congreso Visible (https: // congresovisible. uniandes. edu. co ).

Temas comision septima LegisladoresEstatuto trabajador publico y particular Jorge Ballesteros Bernier (PU) Liliana Rendon Roldan (CC)Regimen salarial y prestacional publico German Carlosama Lopez (AICO) Guillermo Santos Marın (LC)Organizaciones sindicales Antonio Jose Correa Jimenez (PIN) Dilian Toro Torres (PU)Seguridad y cajas de prevision social Edinson Delgado Ruiz (LC) Claudia Wilches Sarmiento (PU)Fondos de prestaciones Teresita Garcia Romero (PIN) *Astrid Sanchez Montes de Oca (PU)Recreacion y deportes Gilma Jimenez Gomez (PAV) *Rodrigo Romero Hernandez (PAV)Organizaciones comunitarias Eduardo Merlano Morales (PU) *Arturo Yepes Alzate (CC)Economia solidaria Mauricio Ospina Gomez (PDA) Fernando Tamayo Tamayo (CC)Asuntos de la mujer y la familia Gloria Ines Ramırez Rıos (PDA)

Tabla 19: Descripcion de los temas que se tratan en la comision septima y listado de legisladores que laconforman en el Senado de la Republica de Colombia 2010-2014. Se incluyen titulares (14) y (*)reem-plazos (3). Fuente: Congreso Visible (https: // congresovisible. uniandes. edu. co ).

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 91: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 91

D. Titulares y reemplazos.

Tit

ula

rcu

ru

l.%

Moti

vo.

Reem

pla

zo

perm

an

ente

.%

Gilm

aJim

enez

Gom

ez(P

AV

)70.5

0F

allec

io.

Rod

rigo

Rom

ero

Her

nan

dez

(PA

V)

29.5

0Ju

an

Riz

zett

oL

uce

s(P

IN)

35.7

3F

allec

io.

Dori

sV

ega

Qu

iroz

(PIN

)64.3

0L

ilia

na

Ren

don

Rold

an

(CC

)82.7

0R

enu

nci

o.

Art

uro

Yep

esA

lzate

(CC

)18.0

0E

du

ard

oM

erla

no

Mora

les

(PU

)53.0

0A

stri

dS

an

chez

Monte

sD

eO

ca(P

U)

47.0

0

Ivan

More

no

Ro

jas

(PD

A)

34.5

0P

erd

ida

de

inves

tid

ura

por

trafi

cod

ein

flu

enci

as.

Parm

enio

Cu

ella

rB

ast

idas

(PD

A)

66.0

0

Ju

lian

Maze

net

Corr

ale

s(P

IN)

35.2

0S

am

uel

Arr

ieta

Bu

elvas

(PIN

)60.2

0

Am

paro

Arb

elaez

Esc

ala

nte

(CC

)35.2

0S

an

cion

dis

cip

lin

ari

ap

or

cele

bra

cion

ind

ebid

ad

eco

ntr

ato

s.L

uis

Du

qu

eG

arc

ia(C

C)

64.8

0

Pie

dad

Cord

ob

aR

uiz

(LC

)4.0

8D

esti

tuci

on

por

cola

bora

cion

con

gru

pos

al

marg

end

ela

ley.

Lid

ioG

arc

iaT

urb

ay

(LC

)96.6

4

Pie

dad

Zu

ccard

iD

eG

arc

ia(P

U)

55.2

0N

o

Dilia

nT

oro

Torr

es(P

U)

50.8

0In

ves

tigaci

on

por

sup

ues

tos

nex

os

con

gru

pos

arm

ad

os

ileg

ale

s.N

o

Fu

ad

Rap

ag

Mata

r(P

U)

34.5

No

Javie

rC

ace

res

Lea

l(C

R)

8.8

7D

eten

cion

por

sup

ues

tos

nex

os

con

gru

pos

arm

ad

os

ileg

ale

s.N

o

Tabla 20: Senadores del Congreso de la Republica 2010-2014 que por motivo de fallecimiento, renunciao sancion disciplinaria presentaron un reemplazo permanente o estuvieron inhabilitados para ejercer sucargo. Frente a cada senador se encuentra su porcentaje de participacion en las 417 listas de votaciondisponibles para el analisis.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 92: M etodos Bayesianos para caracterizar el comportamiento ...

92 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

E. Notacion

El valor absoluto de un numero real x se denota con |x|. Las matrices y los vectores se escriben connegrillas. Por ejemplo, x = (x1, . . . , xn) denota un vector columna de tamano n × 1. Ademas, se usa 0y 1 para denotar los vectores columna cuyas entradas son todas iguales a 0 y 1, respectivamente, e Ipara denotar la matriz identidad. La transpuesta de un vector x se denota con xT; analogamente paralas matrices. Ademas, si X es una matriz cuadrada, se usa X−1 para denotar su inversa. La normade un vector x, dada por

√xTx, se denota con ‖ x ‖. De otra parte, p (· | ·) se usa para denotar una

distribucion de probabilidad condicional; de manera similar con p (·), la cual denota una distribucion deprobabilidad marginal. La misma notacion se usa tanto para funciones de densidad continua como parafunciones de masa de probabilidad discreta. Aunque es un abuso de notacion, la distribucion condicionalcompleta de un parametro θ dado el resto de los parametros y los datos se denota con p (θ | resto).

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 93: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 93

Referencias

Albert, J. H. (1992). Bayesian estimation of normal ogive item response curves using gibbs sampling.Journal of educational statistics, 17(3):251–269.

Albert, J. H. and Chib, S. (1993). Bayesian analysis of binary and polychotomous response data. Journalof the American statistical Association, 88(422):669–679.

Aldrich, J. H., Montgomery, J. M., and Sparks, D. B. (2014). Polarization and ideology: Partisan sourcesof low dimensionality in scaled roll call analyses. Political Analysis, pages 435–456.

Aleman, E. (2008). Policy positions in the chilean senate: An analysis of coauthorship and roll call data.Brazilian Political Science Review (Online), 3(SE):0–0.

Aleman, E., Calvo, E., Jones, M. P., and Kaplan, N. (2009). Comparing cosponsorship and roll-call idealpoints. Legislative Studies Quarterly, 34(1):87–116.

Aleman, E., Micozzi, J. P., Pinto, P. M., and Saiegh, S. (2018). Disentangling the role of ideology andpartisanship in legislative voting: evidence from argentina. Legislative Studies Quarterly, 43(2):245–273.

Aleman, E. and Navia, P. (2016). Presidential power, legislative rules, and lawmaking in Chile. LegislativeInstitutions and Lawmaking in Latin America, pages 92–121.

Aleman, E. and Pachon, M. (2008). Las comisiones de conciliacion en los procesos legislativos de Chiley Colombia. Polıtica y gobierno, 15(1):03–34.

Alston, L. J. and Mueller, B. (2006). Pork for policy: executive and legislative exchange in Brazil. Journalof Law, Economics, and Organization, 22(1):87–114.

Amemiya, T. (1984). Tobit models: A survey. Journal of econometrics, 24(1-2):3–61.

Ames, B. (2002). Party discipline in the chamber of deputies. Legislative Politics in Latin America,pages 185–221.

Archer, R. P. and Shugart, M. S. (1997). The unrealized potential of presidential dominance in Colombia.Presidentialism and democracy in Latin America, pages 110–160.

Arrow, K. (1990). Advances in the spatial theory of voting. Cambridge University Press.

Asmussen, N. and Jo, J. (2016). Anchors away: a new approach for estimating ideal points comparableacross time and chambers. Political Analysis, pages 172–188.

Aumann, R. (1964). The bargaining set for cooperative games. M. Dresher, LS Shapley and A. W.Tucker, eds., gdvances in game theory. Princeton, NJ: Princeton University Press, pp. AA3-A76.

Bailey, M. A., Strezhnev, A., and Voeten, E. (2017). Estimating dynamic state preferences from UnitedNations voting data. Journal of Conflict Resolution, 61(2):430–456.

Barbera, P. (2015). Birds of the same feather tweet together: Bayesian ideal point estimation usingtwitter data. Political analysis, 23(1):76–91.

Bayarri, M. and Berger, J. O. (2000). P values for composite null models. Journal of the AmericanStatistical Association, 95(452):1127–1142.

Beal, M. J. (2003). Variational algorithms for approximate Bayesian inference. University of London,University College London (United Kingdom).

Benoit, K. and Laver, M. (2012). The dimensionality of political space: Epistemological and methodolo-gical considerations. European Union Politics, 13(2):194–218.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 94: M etodos Bayesianos para caracterizar el comportamiento ...

94 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

Berger, J. O. (2013). Statistical decision theory and Bayesian analysis. Chapter 3. Prior Informationand Subjective Probability. Springer Science & Business Media.

Bernabel, R. (2015). Does the electoral rule matter for political polarization? the case of brazilianlegislative chambers. Brazilian Political Science Review, 9(2):81–108.

Bernardo, J., Bayarri, M., Berger, J., Dawid, A., Heckerman, D., Smith, A., and West, M. (2003).Bayesian factor regression models in the “large p, small n” paradigm. Bayesian statistics, 7:733–742.

Betancourt, M. (2017). A conceptual introduction to Hamiltonian Monte Carlo. arXiv preprint ar-Xiv:1701.02434.

Betancourt, M. (2019). The convergence of Markov Chain Monte Carlo methods: from the Metropolismethod to Hamiltonian Monte Carlo. Annalen der Physik, 531(3):1700214.

Black, D. et al. (1958). The theory of committees and elections. Springer.

Blei, D. M., Kucukelbir, A., and McAuliffe, J. D. (2017). Variational inference: A review for statisticians.Journal of the American statistical Association, 112(518):859–877.

Borges, A., Turgeon, M., and Albala, A. (2020). Electoral incentives to coalition formation in multipartypresidential systems. Party Politics, page 1354068820953527.

Bradley, I. and Meek, R. L. (2014). Matrices and society: matrix algebra and its applications in the socialsciences. Princeton University Press.

Brazill, T. J. and Grofman, B. (2002). Factor analysis versus multi-dimensional scaling: binary choiceroll-call voting and the us supreme court. Social Networks, 24(3):201–229.

Brodersen, K. H., Daunizeau, J., Mathys, C., Chumbley, J. R., Buhmann, J. M., and Stephan, K. E.(2013). Variational Bayesian mixed-effects inference for classification studies. Neuroimage, 76:345–361.

Cahoon, L., Hinich, M. J., and Ordeshook, P. C. (1978). A statistical multidimensional scaling methodbased on the spatial theory of voting. In Graphical representation of multivariate data, pages 243–278.Elsevier.

Cardenas, M., Junguito, R., and Pachon, M. (2008). Political institutions and policy outcomes in colom-bia: The effects of the 1991 constitution. Policymaking in Latin America: how politics shapes policies,pages 199–242.

Carey, J. M. (1998). Parties, Coalitions, and the Chilean Congress in the 1990s. Latin American StudiesAssociation.

Carlin, B. P. and Louis, T. A. (2008). Bayesian methods for data analysis. CRC Press.

Carpenter, B., Gelman, A., Hoffman, M. D., Lee, D., Goodrich, B., Betancourt, M., Brubaker, M. A., Guo,J., Li, P., and Riddell, A. (2017). Stan: a probabilistic programming language. Grantee Submission,76(1):1–32.

Carroll, R., Lewis, J. B., Lo, J., Poole, K. T., and Rosenthal, H. (2009a). Comparing NOMINATE andIDEAL: Points of difference and Monte Carlo tests. Legislative Studies Quarterly, 34(4):555–591.

Carroll, R., Lewis, J. B., Lo, J., Poole, K. T., and Rosenthal, H. (2009b). Measuring bias and uncertaintyin DW-NOMINATE ideal point estimates via the parametric bootstrap. Political analysis, pages 261–275.

Carroll, R., Lewis, J. B., Lo, J., Poole, K. T., and Rosenthal, H. (2013). The structure of utility in spatialmodels of voting. American Journal of Political Science, 57(4):1008–1028.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 95: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 95

Carroll, R. and Pachon, M. (2016). The unrealized potential of presidential coalitions in Colombia.Legislative Institutions and Lawmaking in Latin America, pages 122–147.

Carvalho, C. M., Chang, J., Lucas, J. E., Nevins, J. R., Wang, Q., and West, M. (2008). High-dimensionalsparse factor modeling: applications in gene expression genomics. Journal of the American StatisticalAssociation, 103(484):1438–1456.

Castillo, I., Schmidt-Hieber, J., Van der Vaart, A., et al. (2015). Bayesian linear regression with sparsepriors. Annals of Statistics, 43(5):1986–2018.

Cheibub, J. A., Figueiredo, A., and Limongi, F. (2009). Political parties and governors as determinantsof legislative behavior in brazil’s chamber of deputies, 1988–2006. Latin American Politics and Society,51(1):1–30.

Chib, S. and Greenberg, E. (1998). Analysis of multivariate probit models. Biometrika, 85(2):347–361.

Cifuentes-Silva, F., Rivera-Polo, F., Labra-Gayo, J. E., and Astudillo, H. (2021). Describing the natureof legislation through roll call voting in the chilean national congress, a linked dataset description.Semantic web.

Clerici, P. (2021). Legislative territorialization: The impact of a decentralized party system on individuallegislative behavior in Argentina. Publius: The Journal of Federalism, 51(1):104–130.

Clinton, J., Jackman, S., and Rivers, D. (2004). The statistical analysis of roll call data. AmericanPolitical Science Review, pages 355–370.

Clinton, J. D. and Jackman, S. (2009). To simulate or nominate? Legislative Studies Quarterly, 34(4):593–621.

Clinton, J. D. and Meirowitz, A. (2001). Agenda constrained legislator ideal points and the spatial votingmodel. Political Analysis, pages 242–259.

Cohen, L. R. and Noll, R. G. (1991). How to vote, whether to vote: Strategies for voting and abstainingon congressional roll calls. Political Behavior, 13(2):97–127.

Colprensa (2013). El PIN cambio el nombre de su partido a Opcion Ciudadana. El paıs.

Congdon, P. (2007). Bayesian statistical modelling, volume 704. John Wiley & Sons.

Coughlin, P. and Nitzan, S. (1981). Electoral outcomes with probabilistic voting and nash social welfaremaxima. Journal of Public Economics, 15(1):113–121.

Cox, R. T. (1946). Probability, frequency and reasonable expectation. American journal of physics,14(1):1–13.

Cox, R. T. (1963). The algebra of probable inference. American Journal of Physics, 31(1):66–67.

Croux, C., Dhaene, G., and Hoorelbeke, D. (2004). Robust standard errors for robust estimators. CES-Discussion paper series (DPS) 03.16, pages 1–20.

Davis, O. A. and Hinich, M. J. (1965). A mathematical model of policy formation in a democratic society.Graduate School of Industrial Administration, Carnegie Institute of Technology.

Davis, O. A., Hinich, M. J., and Ordeshook, P. C. (1970). An expository development of a mathematicalmodel of the electoral process. The American Political Science Review, 64(2):426–448.

De la Horra, J. and Rodriguez-Bernal, M. T. (2001). Posterior predictive p-values: what they are andwhat they are not. Test, 10(1):75–86.

De Leeuw, J. (2006). Principal component analysis of binary data by iterated singular value decompo-sition. Computational statistics & data analysis, 50(1):21–39.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 96: M etodos Bayesianos para caracterizar el comportamiento ...

96 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

de Valpine, P., Turek, D., Paciorek, C. J., Anderson-Bergman, C., Lang, D. T., and Bodik, R. (2017).Programming with models: writing statistical algorithms for general model structures with NIMBLE.Journal of Computational and Graphical Statistics, 26(2):403–413.

De Vries, C. E. and Marks, G. (2012). The struggle over dimensionality: A note on theory and empirics.European Union Politics, 13(2):185–193.

Denwood, M. J. (2016). runjags: An R package providing interface utilities, model templates, parallelcomputing methods and additional distributions for MCMC models in JAGS. Journal of statisticalsoftware, 71(1):1–25.

Desposato, S. W. (2001). Legislative politics in authoritarian brazil. Legislative Studies Quarterly, pages287–317.

Desposato, S. W. (2003). Comparing group and subgroup cohesion scores: A nonparametric methodwith an application to Brazil. Political Analysis, pages 275–288.

Dougherty, K. L., Lynch, M. S., and Madonna, A. J. (2014). Partisan agenda control and the dimensio-nality of congress. American Politics Research, 42(4):600–627.

Downs, A. (1957). An economic theory of political action in a democracy. Journal of political economy,65(2):135–150.

Enelow, J. M. and Hinich, M. J. (1984). The spatial theory of voting: An introduction. CUP Archive.

Figueiredo, A. C. and Limongi, F. (2000). Presidential power, legislative organization, and party behaviorin Brazil. Comparative Politics, pages 151–170.

Fowler, J. H. (2006). Legislative cosponsorship networks in the us house and senate. Social Networks,28(4):454–465.

Gamm, G. and Huber, J. (2002). Legislatures as political institutions: Beyond the contemporary congress.In IraKatznelson and Milner, H. V., editors, Political science: State of the discipline, pages 313–341.New York: W.W. Norton.

Garthwaite, P. H., Kadane, J. B., and O’Hagan, A. (2005). Statistical methods for eliciting probabilitydistributions. Journal of the American Statistical Association, 100(470):680–701.

Gelman, A., Carlin, J. B., Stern, H. S., Dunson, D. B., Vehtari, A., and Rubin, D. B. (2014). Bayesiandata analysis. CRC press.

Gelman, A., Meng, X.-L., and Stern, H. (1996). Posterior predictive assessment of model fitness viarealized discrepancies. Statistica sinica, pages 733–760.

Gelman, A., Rubin, D. B., et al. (1992). Inference from iterative simulation using multiple sequences.Statistical science, 7(4):457–472.

Gerrish, S. and Blei, D. (2012). How they vote. Issue-adjusted models of legislative behavior. Advancesin neural information processing systems, 25:2753–2761.

Geweke, J. et al. (1991). Evaluating the accuracy of sampling-based approaches to the calculation of poste-rior moments, volume 196. Federal Reserve Bank of Minneapolis, Research Department Minneapolis,MN.

Geyer, C. J. (1992). Practical Markov Chain Monte Carlo. Statistical science, pages 473–483.

Gill, J. and Walker, L. D. (2005). Elicited priors for bayesian model specifications in political scienceresearch. The Journal of Politics, 67(3):841–872.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 97: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 97

Guttman, I. (1967). The use of the concept of a future observation in goodness-of-fit problems. Journalof the Royal Statistical Society: Series B (Methodological), 29(1):83–100.

Hagemann, S. (2007). Applying ideal point estimation methods to the council of ministers. EuropeanUnion Politics, 8(2):279–296.

Hahn, E. D. and Soyer, R. (2005). Probit and logit models: Differences in the multivariate realm. TheJournal of the Royal Statistical Society, Series B, pages 1–12.

Hahn, R. P., Carvalho, C. M., and Scott, J. G. (2012). A sparse factor analytic probit model forcongressional voting patterns. Journal of the Royal Statistical Society: Series C (Applied Statistics),61(4):619–635.

Hare, C., Armstrong, D. A., Bakker, R., Carroll, R., and Poole, K. T. (2015). Using bayesian Aldrich-Mckelvey scaling to study citizens’ ideological preferences and perceptions. American Journal ofPolitical Science, 59(3):759–774.

Hinich, M. J. and Munger, M. C. (1996). Ideology and the theory of political choice. University ofMichigan Press.

Hinich, M. J., Munger, M. C., et al. (1997). Analytical politics. Cambridge university press.

Hinich, M. J. and Ordeshook, P. C. (1970). Plurality maximization vs vote maximization: A spatialanalysis with variable participation. The American Political Science Review, 64(3):772–791.

Hiroi, T. and Renno, L. (2016). Agenda setting and gridlock in a multi-party coalitional presidentialsystem, the case of Brazil. Legislative institutions and lawmaking in Latin America, pages 61–91.

Hix, S., Noury, A., and Roland, G. (2005). Power to the parties: cohesion and competition in the europeanparliament 1979-2001. British Journal of Political Science, pages 209–234.

Hoff, P. D. (2009). A first course in Bayesian statistical methods, volume 580. Springer.

Hoskin, G. (1975). Dimensions of conflict in the colombian national legislature. Legislative Systems inDeveloping Countries, pages 143–178.

Hoskin, G. (1979). Belief systems of Colombian political party activists. Journal of Interamerican Studiesand World Affairs, 21(4):481–504.

Hoskin, G., Kline, H. F., and Buitrago, F. L. (1976). Legislative Behavior in Colombia. Council onInternational Studies, State University of New York at Buffalo.

Hoskin, G. and Swanson, G. (1973). Inter-party competition in Colombia: a return to la violencia?American Journal of Political Science, pages 316–350.

Hoskin, G. and Swanson, G. (1974). Political party leadership in Colombia: [a] spatial analysis. Compa-rative politics, 6(3):395–423.

Howell, W., Adler, S., Cameron, C., and Riemann, C. (2000). Divided government and the legislativeproductivity of congress, 1945-94. Legislative Studies Quarterly, pages 285–312.

Jackman, S. (2001). Multidimensional analysis of roll call data via bayesian simulation: Identification,estimation, inference, and model checking. Political Analysis, 9(3):227–241.

Jackman, S. (2004). Bayesian analysis for political research. Annu. Rev. Polit. Sci., 7:483–505.

Jackman, S. (2009). Bayesian analysis for the social sciences, volume 846. John Wiley & Sons.

Jackman, S., Tahk, A., Zeileis, A., Maimone, C., Fearon, J., and Meers, Z. (2020). The pscl package.Software. https://cran.r-project.org/web/packages/pscl/pscl.pdf.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 98: M etodos Bayesianos para caracterizar el comportamiento ...

98 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

Johnson, V. E. et al. (2007). Bayesian model assessment using pivotal quantities. Bayesian Analysis,2(4):719–733.

Jones, M. P. and Hwang, W. (2005a). Party government in presidential democracies: Extending carteltheory beyond the US congress. American Journal of Political Science, 49(2):267–282.

Jones, M. P. and Hwang, W. (2005b). Provincial party bosses: Keystone of the Argentine Congress, pages115–138. Pennsylvania State University Press University Park.

Kass, R. E. and Wasserman, L. (1996). The selection of prior distributions by formal rules. Journal ofthe American statistical Association, 91(435):1343–1370.

Kline, H. F. (1974). Interest groups in the colombian congress: Group behavior in a centralized, patri-monial political system. Journal of Interamerican Studies and World Affairs, 16(3):274–300.

Kline, H. F. (1977). Committee membership turnover in the colombian national congress, 1958-1974.Legislative Studies Quarterly, pages 29–43.

Krehbiel, K. (1988). Spatial models of legislative choice. Legislative Studies Quarterly, pages 259–319.

Krehbiel, K. (1998). Pivotal politics: A theory of US lawmaking. University of Chicago Press.

Kromer, M. K. (2005). Determinants of abstention in the United States house of representatives: ananalysis of the 102nd through the 107th sessions. Master’s thesis, Louisiana State University, BatonRouge, LA.

Kruschke, J. (2014). Doing Bayesian data analysis: A tutorial with R, JAGS, and Stan. Academic Press.

Lee, J. M. (2018). Introduction to Riemannian manifolds. Springer.

Lewis, J. B. and Poole, K. T. (2004). Measuring bias and uncertainty in ideal point estimates via theparametric bootstrap. Political Analysis, pages 105–127.

Lofland, C. L., Rodrıguez, A., Moser, S., et al. (2017). Assessing differences in legislators’ revealedpreferences: A case study on the 107th US senate. The Annals of Applied Statistics, 11(1):456–479.

Lunn, D., Jackson, C., Best, N., Thomas, A., and Spiegelhalter, D. (2013). The BUGS book. A PracticalIntroduction to Bayesian Analysis, Chapman Hall, London.

MacRae, D. (1952). The relation between roll call votes and constituencies in the Massachusetts houseof representatives. American Political Science Review, 46(4):1046–1055.

MacRae, D. (1958). Dimensions of congressional voting: A statistical study of the house of representativesin the Eighty-first congress. The Journal of Politics, 1(3).

MacRae, D. (1965). A method for identifying issues and factions from legislative votes. The AmericanPolitical science Review, 59(4):909–926.

Manski, C. F. (1977). The structure of random utility models. Theory and decision, 8(3):229.

Martin, A. D. and Quinn, K. M. (2002). Dynamic ideal point estimation via Markov Chain Monte Carlofor the US supreme court, 1953–1999. Political analysis, 10(2):134–153.

Martin, A. D., Quinn, K. M., Park, J. H., and Park, M. J. H. (2020). Package MCMCpack.

Mayhew, D. R. (1974). Congress: The electoral connection. Yale university press.

McCarty, N., Poole, K. T., and Rosenthal, H. (2001). The hunt for party discipline in congress. AmericanPolitical Science Review, pages 673–687.

McCullagh, P. (2018). Generalized linear models. Routledge.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 99: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 99

McDonnell, R. M. (2017). Formal comparisons of legislative institutions: Ideal points from brazilianlegislatures. Brazilian Political Science Review, 11(1).

McDonnell, R. M., Duarte, G. J., and Freire, D. (2019). congressbr: An R package for analyzing datafrom Brazil’s chamber of deputies and federal senate. Latin American Research Review, 54(4).

McFadden, D. L. (1976). Quantal choice analaysis: A survey. In Annals of Economic and Social Measu-rement, Volume 5, number 4, pages 363–390. NBER.

McKelvey, R. D., Ordeshook, P. C., and Winer, M. D. (1978). The competitive solution for n-persongames without transferable utility, with an application to committee games. American Political ScienceReview, 72(2):599–615.

Meng, X.-L. et al. (1994). Posterior predictive p-values. The Annals of Statistics, 22(3):1142–1160.

Meyn, S. P. and Tweedie, R. L. (2012). Markov chains and stochastic stability. Springer Science &Business Media.

Miller, G. A. (1956). The magical number seven, plus or minus two: Some limits on our capacity forprocessing information. Psychological review, 63(2):81.

Moser, S., Rodrıguez, A., and Lofland, C. L. (2021). Multiple ideal points: Revealed preferences indifferent domains. Political Analysis, 29(2):139–166.

Murray, J. S., Dunson, D. B., Carin, L., and Lucas, J. E. (2013). Bayesian gaussian copula factor modelsfor mixed data. Journal of the American Statistical Association, 108(502):656–665.

Neto, O. A. (2002). Presidential cabinets, electoral cycles, and coalition discipline in Brazil. LegislativePolitics in Latin America, pages 48–78.

Neto, O. A. (2006). The presidential calculus: Executive policy making and cabinet formation in theamericas. Comparative Political Studies, 39(4):415–440.

Norris, J. R. (1998). Markov chains. Cambridge university press.

Osorio, C. (2014). Unidad nacional: crıtica, pero muy util. Congreso Visible.

Pachon, M. (2011). ¿ que tanta polıtica nacional discute un congreso? una comparacion de las agendasde las plenarias y comisiones posterior a la constitucion de 1991. Revista latinoamericana de polıticacomparada, 4:75–98.

Pachon, M. and Johnson, G. B. (2016). When’s the party (or coalition)? agenda-setting in a highlyfragmented, decentralized legislature. Journal of Politics in Latin America, 8(2):71–100.

Pachon, M. and Munoz, M. (2020). Policy analysis and the legislature in Colombia, pages 81–98. BristolUniversity Press, first edition.

Pati, D., Bhattacharya, A., Pillai, N. S., Dunson, D., et al. (2014). Posterior contraction in sparseBayesian factor models for massive covariance matrices. Annals of Statistics, 42(3):1102–1130.

Patz, R. J. and Junker, B. W. (1999). A straightforward approach to Markov chain Monte Carlo methodsfor item response models. Journal of educational and behavioral Statistics, 24(2):146–178.

Pereira, C. and Mueller, B. (2004a). The cost of governing: Strategic behavior of the president andlegislators in Brazil’s budgetary process. Comparative Political Studies, 37(7):781–815.

Pereira, C. and Mueller, B. (2004b). A theory of executive dominance of congressional politics: thecommittee system in the brazilian chamber of deputies. The Journal of Legislative Studies, 10(1):9–49.

Polson, N. G., Scott, J. G., and Windle, J. (2013). Bayesian inference for logistic models using polya–gamma latent variables. Journal of the American statistical Association, 108(504):1339–1349.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 100: M etodos Bayesianos para caracterizar el comportamiento ...

100 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

Ponce, A. (2016). Strong presidents, weak parties, and agenda setting. Lawmaking in democratic Peru.Legislative institutions and lawmaking in Latin America, pages 175–198.

Poole, K., Lewis, J., and Lo, M. J. (2018). Package ‘wnominate’.

Poole, K. T. (2000). Nonparametric unfolding of binary choice data. Political Analysis, 8(3):211–237.

Poole, K. T. (2005). Spatial models of parliamentary voting. Cambridge University Press.

Poole, K. T. (2007). Changing minds? Not in congress! Public Choice, 131(3-4):435–451.

Poole, K. T. and Rosenthal, H. (1984). US presidential elections 1968-80: A spatial analysis. AmericanJournal of Political Science, pages 282–312.

Poole, K. T. and Rosenthal, H. (1985). A spatial model for legislative roll call analysis. American Journalof Political Science, pages 357–384.

Poole, K. T. and Rosenthal, H. (1987). Analysis of congressional coalition patterns: A unidimensionalspatial model. Legislative Studies Quarterly, pages 55–75.

Potoski, M. and Talbert, J. (2000). The dimensional structure of policy outputs: Distributive policy androll call voting. Political Research Quarterly, 53(4):695–710.

Quinn, K. M. (2004). Bayesian factor analysis for mixed ordinal and continuous responses. PoliticalAnalysis, 12(4):338–353.

Raftery, A. E. and Lewis, S. (1991). How many iterations in the gibbs sampler? Technical report,Washington University Seattle Departament of Statistics.

Rivers, D. (2003). Identification of multidimensional item-response models. Typescript. Department ofPolitical Science, Stanford University.

Robert, C. and Casella, G. (2013). Monte Carlo statistical methods. Springer Science & Business Media.

Roberts, J. M., Smith, S. S., and Haptonstahl, S. R. (2016). The dimensionality of congressional votingreconsidered. American Politics Research, 44(5):794–815.

Rodriguez, A. (2012). Modeling the dynamics of social networks using bayesian hierarchical blockmodels.Statistical Analysis and Data Mining: The ASA Data Science Journal, 5(3):218–234.

Rodrıguez, A. and Moser, S. (2015). Measuring and accounting for strategic abstentions in the US senate,1989–2012. Journal of the Royal Statistical Society: Series C: Applied Statistics, pages 779–797.

Rodrıguez, J. A. (2017). Decentralization (and centralization) without representation: On the territorialcomposition of the colombian congress. Centro Editorial Facultad de Ciencias Economicas. UniversidadNacional.

Romer, T. and Rosenthal, H. (1978). Political resource allocation, controlled agendas, and the statusquo. Public choice, 33(4):27–43.

Rosas, G. (2005). The ideological organization of latin american legislative parties: An empirical analysisof elite policy preferences. Comparative Political Studies, 38(7):824–849.

Rosas, G. and Shomer, Y. (2008). Models of nonresponse in legislative politics. Legislative StudiesQuarterly, 33(4):573–601.

Rosas, G., Shomer, Y., and Haptonstahl, S. R. (2015). No news is news: Nonignorable nonresponse inroll-call data analysis. American Journal of Political Science, 59(2):511–528.

Rubin, D. B. (1984). Bayesianly justifiable and relevant frequency calculations for the applies statistician.The Annals of Statistics, pages 1151–1172.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 101: M etodos Bayesianos para caracterizar el comportamiento ...

Legislative behavior of Colombian’s Senate 101

Rubinstein, R. Y. and Kroese, D. P. (2016). Simulation and the Monte Carlo method, volume 10. JohnWiley & Sons.

Rue, H., Riebler, A., Sørbye, S. H., Illian, J. B., Simpson, D. P., and Lindgren, F. K. (2017). Bayesiancomputing with INLA: a review. Annual Review of Statistics and Its Application, 4:395–421.

Savage, L. J. (1972). The foundations of statistics. Courier Corporation.

Schickler, E. (2000). Institutional change in the house of representatives, 1867-1998: a test of partisanand ideological power balance models. American Political Science Review, pages 269–288.

Scott, J. G. and Berger, J. O. (2006). An exploration of aspects of Bayesian multiple testing. Journal ofstatistical planning and inference, 136(7):2144–2162.

Scott, J. G. and Berger, J. O. (2010). Bayes and empirical-bayes multiplicity adjustment in the variable-selection problem. The Annals of Statistics, pages 2587–2619.

Sewell, D. K. and Chen, Y. (2015). Latent space models for dynamic networks. Journal of the AmericanStatistical Association, 110(512):1646–1657.

Shepsle, K. A. (1979). Institutional arrangements and equilibrium in multidimensional voting models.American Journal of Political Science, pages 27–59.

Shepsle, K. A. and Weingast, B. R. (1987). The institutional foundations of committee power. TheAmerican Political Science Review, pages 85–104.

Sherina, V., McCall, M. N., and Love, T. M. (2019). Fully Bayesian imputation model for non-randommissing data in qPCR. arXiv preprint arXiv:1910.13936.

Shor, B., Berry, C., and McCarty, N. (2010). A bridge to somewhere: Mapping state and congressionalideology on a cross-institutional common space. Legislative Studies Quarterly, 35(3):417–448.

Shor, B. and McCarty, N. (2011). The ideological mapping of American legislatures. American PoliticalScience Review, pages 530–551.

Snyder Jr, J. M. and Groseclose, T. (2000). Estimating party influence in congressional roll-call voting.American Journal of Political Science, pages 193–211.

Spiegelhalter, D. J., Best, N. G., Carlin, B. P., and Van Der Linde, A. (2002). Bayesian measures ofmodel complexity and fit. Journal of the royal statistical society: Series b (statistical methodology),64(4):583–639.

Spiegelhalter, D. J., Best, N. G., Carlin, B. P., and Van der Linde, A. (2014). The deviance informationcriterion: 12 years on. Journal of the Royal Statistical Society: Series B: Statistical Methodology, pages485–493.

Steinbakk, G. H. and Storvik, G. O. (2009). Posterior predictive p-values in Bayesian hierarchical models.Scandinavian Journal of Statistics, 36(2):320–336.

Stuart, A., Arnold, S., Ord, J. K., O’Hagan, A., and Forster, J. (1994). Kendall’s advanced theory ofstatistics. Wiley.

Tajfel, H. (1981). Human groups and social categories: Studies in social psychology. Cup Archive.

Talbert, J. C. and Potoski, M. (2002). Setting the legislative agenda: The dimensional structure of billcosponsoring and floor voting. Journal of Politics, 64(3):864–891.

Thurner, P. W. (2000). The empirical application of the spatial theory of voting in multiparty systemswith random utility models. Electoral Studies, 19(4):493–517.

Facultad de Estadıstica Proyecto de Grado Julio 2021

Page 102: M etodos Bayesianos para caracterizar el comportamiento ...

102 Carolina Maria Luque Zabala. & Dr. Juan Camilo Sosa Martınez.

Tierney, L. (1994). Markov chains for exploring posterior distributions. the Annals of Statistics, pages1701–1728.

Treier, S. and Jackman, S. (2008). Democracy as a latent variable. American Journal of Political Science,52(1):201–217.

Tsai, T.-h. (2020). The influence of the president and government coalition on roll-call voting in Brazil,2003–2006. Political Studies Review, page 1478929920904588.

Voeten, E. (2000). Clashes in the assembly. International organization, pages 185–215.

Voeten, E. (2013). Data and analyses of voting in the United Nations General Assembly. In Routledgehandbook of international organization, pages 80–92. Routledge.

Wainer, P. W. H. H. (1993). Differential item functioning. Psychology Press.

Watanabe, S. (2013). WAIC and WBIC are information criteria for singular statistical model evaluation.In Proceedings of the Workshop on Information Theoretic Methods in Science and Engineering, pages90–94.

Weisberg, H. F. and Rusk, J. G. (1970). Dimensions of candidate evaluation. The American PoliticalScience Review, 64(4):1167–1185.

West, M. and Harrison, J. (2006). Bayesian forecasting and dynamic models. Springer Science & BusinessMedia.

Western, B. and Jackman, S. (1994). Bayesian inference for comparative research. American PoliticalScience Review, pages 412–423.

Wills-Otero, L. (2014). Reformas constitucionales y leyes sancionadas. Congreso Visible.

Wolters, M. (1978). Models of roll-call behavior. Political Methodology, pages 7–54.

Yu, X. (2020). Spherical Latent Factor Model for Binary and Ordinal Data. PhD thesis, UC Santa Cruz.

Yu, X. and Rodriguez, A. (2019a). Spatial voting models in circular spaces: A case study of the U.S.house of representatives. Available at SSRN 3381925.

Yu, X. and Rodriguez, A. (2019b). Spherical latent factor model. Available at SSRN 3381925.

Zellner, A. (1986). On assessing prior distributions and bayesian regression analysis with g-prior distri-butions. Bayesian inference and decision techniques.

Zucco, C. (2009). Ideology or what? Legislative behavior in multiparty presidential settings. The Journalof Politics, 71(3):1076–1092.

Zucco, C. (2013). Legislative coalitions in presidential systems: the case of Uruguay. Latin Americanpolitics and society, 55(1):96–118.

Zucco, C. and Lauderdale, B. E. (2011). Distinguishing between influences on brazilian legislative beha-vior. Legislative Studies Quarterly, 36(3):363–396.

Facultad de Estadıstica Proyecto de Grado Julio 2021