Estadística Bayesiana y Elecciones en México - inegi.org.mx · Estadística Bayesiana y...

Post on 07-Oct-2018

216 views 0 download

Transcript of Estadística Bayesiana y Elecciones en México - inegi.org.mx · Estadística Bayesiana y...

Estadística Bayesiana y Elecciones en México

XXVIII Foro Nacional de Estadística Instituto Nacional de Estadística y Geografía. Aguascalientes, México. Septiembre 27, 2013.

Manuel Mendoza R. Departamento de Estadística

Instituto Tecnológico Autónomo de México

Departamento de Probabilidad y Estadística Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas, UNAM.

El sistema electoral en México se ha transformado radicalmente en los últimos 20 años.

Las elecciones federales son organizadas por un organismo autónomo, el Instituto Federal Electoral.

Existe una variedad de fuerzas políticas con posibilidades reales de ganar elecciones.

El proceso es objeto de escrutinio por distintos observadores.

El Instituto Federal Electoral (IFE),

Es dirigido por Consejo General que integra a 9 Consejeros Ciudadanos.

Opera el Registro Federal de Electores.

Recluta, cada tres años, un millón de ciudadanos que para que colaboren como funcionarios de casilla.

Es el conducto para que los Partidos Políticos reciban el financiamiento público.

Audita los informes financieros de los Partidos y supervisa las campañas electorales.

Despliega el operativo nacional para instalar las casillas de votación en todo el país.

Recibe, y acumula los votos para anunciar los resultados y,

Actúa como árbitro entre los partidos y puede imponer sanciones si alguno viola las reglas electorales.

El Instituto Federal Electoral (IFE),

Además, el IFE

Convoca Especialistas en distintas materias para proponer, diseñar, auditar u operar algunos de los procedimientos con los que desahoga sus funciones.

• Comité Asesor del Programa de Resultados Preliminares (PREP).

• Comité Técnico del Padrón Electoral.

• Comité Técnico del Conteo Rápido.

• Comité de Especialistas para el Voto en el Extranjero.

Opera el Registro Federal de Electores.

Recibe, y acumula los votos para anunciar los resultados .

Convoca Especialistas.

Los tres temas de hoy:

El Padrón Electoral es el listado donde se asientan los datos de todos los ciudadanos que tienen derecho a votar en las elecciones federales.

El registro de un ciudadano se produce a solicitud del propio interesado.

El ciudadano que concluye exitosamente su registro recibe una credencial para votar con fotografía.

El Padrón Electoral

La credencial para votar sirve como medio de identificación.

A partir del padrón se produce el Listado Nominal de votantes.

La credencial se presenta al momento de la votación, se coteja con el listado nominal y con la persona que la presenta.

Antes de una elección federal, el Padrón Electoral debe ser declarado válido por el Consejo General del IFE.

El Padrón Electoral

No existe una definición legal del concepto de Padrón Electoral Válido.

Dos características básicas:

• Que estén todos los que deben estar.

• Qué no estén los que no deben estar.

El Padrón Electoral

Se traducen en dos indicadores:

• Cobertura.

• Actualización.

No existen cotas mínimas legales para estos indicadores.

Se evalúan a través de encuestas.

El Padrón Electoral

Encuesta de Cobertura.

• Encuesta Nacional de Personas Elegibles para el Padrón.

Encuesta de Actualización.

• Muestra de Registros en el Padrón Electoral.

El Padrón Electoral

El Registro Federal de Electores cuenta con una Dirección de Estadística muy competente.

Es indispensable una opinión (auditoría) externa.

Comité Técnico del Padrón Electoral integrado por

• Demógrafos,

• Geógrafos,

• Expertos en Sistemas de Información y,

• Estadísticos.

El Padrón Electoral

Comité Técnico del Padrón Electoral

Valora la seguridad e integridad del sistema de información,

Confronta la cobertura reportada con la información demográfica.

Evalúa los instrumentos cartográficos y de georeferencia que se utlizan para asignar los módulos de empadronamiento y para levantar las encuestas;

Valora las componentes técnicas de las encuestas y contrastan sus resultados a partir de procedimientos alternativos.

El Padrón Electoral

Distintos expertos Estadísticos han participado en este Comité.

En general, los trabajos están directamente realcionados con el análisis de encuestas (muestreo de poblaciones finitas).

Existe mucha experiencia en el tema y gran cantidad de referencias bibliográficas (desde la perspectiva frecuentista).

Con un enfoque Bayesiano, el acervo disponible es mucho más limitado.

El Padrón Electoral

Objetivo: Describir la variable aleatoria X, con soporte X y función de probabilidad P( X(n) | q ) totalmente conocida, excepto por valor del parámetro fijo de dimensión finita q.

Se cuenta con una muestra de observaciones X(n) con función de probabilidad conjunta P( X(n) | q ).

Antes de los datos X(n), la información sobre q se describe con la probabilidad inicial ( a priori ) P( q ).

Análisis Bayesiano Paramétrico

Las interpretaciones de la probabilidad en el modelo de muestreo

P( X(n) | q )

y en la distribución inicial

P( q )

son distintas.

En el primer caso describen variabilidad mientras

que en segundo describen incertidumbre.

Análisis Bayesiano Paramétrico

Las inferencias sobre el parámetro, una vez observados e incorporados los datos de la muestra, se realizan a partir de la distribución final (a posteriori) P( q | X(n) )

P( q | X(n) ) P( X(n) | q ) P( q )

Análisis Bayesiano Paramétrico

Ejemplo 1. X variable aleatoria Normal con media m y varianza s2

conocida (precisión t = 1/s2).

P( X | q ) = N( X | m, t ); q = m

Si la inicial para m es P( m ) = N ( m | m, t0 )

P( m | X(n) ) P( X(n) | m ) P( m )

P( m | X(n) ) = N( m | mX, tX )

Análisis Bayesiano Paramétrico

Ejemplo 2. X variable aleatoria Normal con media m y varianza s2

desconocidas (precisión t = 1/s2).

P( X | q ) = N( X | m, t ); q = ( m, t )

Si la inicial para q es

P( q ) = P( m, t )

= P( m | t ) P( t )

= N ( m | m, ct ) Gamma ( t | a, b )

P( q | X(n) ) P( X(n) | q ) P( q )

Análisis Bayesiano Paramétrico

P( q | X(n) ) P( X(n) | q ) P( q )

P( q | X(n) ) = P( m, t | X(n) )

= P( m | t, X(n) ) P( t | X(n) )

= N ( m | mX, cX t ) Gamma ( t | aX, bX )

P( m | X(n) ) = P( m, t | X(n) ) dt

= N( m | mX, tX ) Gamma ( t | aX, bX ) dt

P( m | X(n) ) = Stu( m | mX, gX, n-1 )

Análisis Bayesiano Paramétrico

Ejemplo 3. X variable aleatoria Poisson con media l.

P( X | q ) = Poisson( X | l ); q = l

Si la inicial para l es P( l ) = Gamma ( l | a, b )

P( l | X(n) ) P( X(n) | l ) P( l )

P( l | X(n) ) = Gamma ( l | aX, bX )

Análisis Bayesiano Paramétrico

1 u1

2 u2

· ·

· ·

· ·

· ·

N uN

Unidades en la Población e identificadores

Poblaciones Finitas

1 u1

2 u2

· ·

· ·

· ·

· ·

N uN

Unidades en la Población e identificadores

1 u1 X(u1)

2 u2 X(u2)

· · ·

· · ·

· · ·

· · ·

N uN X(uN)

Valores de la variable bajo estudio

Poblaciones Finitas

Unidades en la Población e identificadores

1 u1 X(u1)

2 u2 X(u2)

· · ·

· · ·

· · ·

· · ·

N uN X(uN)

Valores de la variable bajo estudio

Poblaciones Finitas

1 u1 X(u1)

2 u2 X(u2)

· · ·

· · ·

· · ·

· · ·

N uN X(uN)

Unidades en la Población e identificadores

Valores de la variable bajo estudio

1 u1 X(u1) p1

2 u2 X(u2) p2

· · · ·

· · · ·

· · · ·

· · · ·

N uN X(uN) pN

Probabilidades de selección

Poblaciones Finitas

1 u1 X(u1) p1

2 u2 X(u2) p2

· · · ·

· · · ·

· · · ·

· · · ·

N uN X(uN) pN

Unidades en la Población e identificadores

Valores de la variable bajo estudio

Probabilidades de selección (muestreo aleatorio simple)

1 u1 X(u1) 1/N

2 u2 X(u2) 1/N

· · · ·

· · · ·

· · · ·

· · · ·

N uN X(uN) 1/N

Poblaciones Finitas

Problemas habituales:

Estimación del total poblacional T = X1 + X2 + · · · + XN

Estimación de la media poblacional M = T / N

Estimación de una proporción poblacional

Poblaciones Finitas

Variable Aleatoria X muestra ( x1, x2, …, xn ); (n < N).

P es totalmente conocida

X es desconocido

Los parámetros de interés ( T, M ) dependen de X

Espacio muestral X = { X1, X2, · · · , XN }

Función de probabilidad P = { p1, p2, · · · , pN }

El parámetro ( de dimensión finita, N ) es X

Poblaciones Finitas

Análisis Bayesiano de Poblaciones Finitas

Existen distintas posibilidades para abordar este problema como un caso del análisis paramétrico. Por ejemplo, suponga que:

X = { X1, X2, · · · , XN } es una muestra aleatoria, de tamaño N, de una variable X*.

La función de probabilidad de X*, P( X* | f ) es conocida salvo por el valor de f F.

Análisis Bayesiano de Poblaciones Finitas

X(n) = { X1, · · · , Xn } es una submuestra de X que se obtiene por un mecanismo de remuestreo.

El remuestreo tiene probabilidades P = { p1, p2, · · · , pN }.

Si las probabilidades P = { p1, p2, · · · , pN } son conocidas y no dependen de los valores de X, entonces se puede probar que

X(n) resulta una muestra aleatoria de X*.

Análisis Bayesiano de Poblaciones Finitas

A partir de una distribución inicial P( f ) para el parámetro f en el modelo P( X* | f ), y la función de verosimilitud P( X(n) | f ), se obtiene la final

P( f | X(n) ) P( X(n) | f ) P( f ).

Para T = X1 + X2 + · · · + XN, la inferencia respectiva se obtiene a través de la distribución predictiva

P( T | X(n) ) = P( T | f ) P( f ) df

Análisis Bayesiano de Poblaciones Finitas

En particular, si P( X* | f ) = Poisson ( X* | f ), entonces

P( T | f ) = Poisson ( T | Nf )

Si como inicial para f, se utiliza una distribución Gamma, entonces

P( T | X(n) ) = Poisson-Gamma

Análisis Bayesiano de Poblaciones Finitas

Si la inicial conjugada es mínimo informativa, entonces

P( T | X(n) ) es Binomial Negativa

Si se estima puntualmente el valor del total T con una función de utilidad cuadrática, entonces

E( T | X(n) ) = ( N / n )( X1 + X2 + · · · + Xn )

Análisis Bayesiano de Poblaciones Finitas

Además del valor estimado puntual, se cuenta con toda la distribución predictiva posterior de T

P( T | X(n) )

A partir de esta distribución es posible determinar intervalos de probabilidad y otras características de la cantidad de interés.

Volviendo al Padrón…

Información a través de la Encuesta de Verificación Nacional Muestral (cobertura) 2008.

Diseño estratificado y polietápico. • Vivienda Localidad Sección Estrato Entidad Federativa

• 3000 secciones en muestra de un total de 64, 619 ( 4.64% )

Información del Registro Federal Electoral Mexicano en 2008 para establecer la calidad del Padrón Electoral Mexicano.

Se estimó el Total de habitantes con edad 18 años y más, residente en el país ( TX ).

Se estimó el Total de habitantes con edad 18 años y más, residente en el país, que estaba registrado en el padrón ( TY ).

Se estimó la proporción de empadronamiento ( TY / TX ).

Volviendo al Padrón…

El país se integra con 32 entidades federativas (estados).

Todas las entidades federativas se incluyeron en el estudio.

El total nacional se estima sumando los totales estimados de todas las entidades federativas.

Esquema

Cada estado está dividido en estratos.

Todos los estratos fueron muestreados en cada estado.

El total de un estado se estima sumando los totales estimados para todos sus estratos.

Esquema

Si en el estado j cada estrato se muestrea independientemente, se obtiene una serie de distribuciones predictivas

P( Tji | X(n(ji)) ) ; i = 1, … , e(j)

de manera que la distribución de interés

P( Tj | X(n(j)) )

se puede determinar a partir de las predictivas de los estratos con la transformación

Tj = Tj1 + Tj2 + … + Tje(j)

Esquema

Si la distribución de la suma de los totales de los estratos no se puede calcular fácilmente, una alternativa es proceder por simulación.

• De la distribución para el estrato i se muestrea (simula) un valor tji, entonces

tj = tj1 + tj2 + … + tje(j)

es un valor observado de la distribución predictiva del total del estado.

• Para el nivel del país, la suma t = t1 + t2 + … + tk constituye un valor observado de la distribución predictiva del total nacional.

Esquema

Diseño estratificado y polietápico.

• Vivienda Localidad Sección Estrato Estado País

Los pasos de Estrato a Estado y Estado a País se resuelven con la suma de predictivas.

Suma de predictivas Modelo Poisson

El paso de Vivienda a Localidad utiliza el modelo Poisson.

Diseño estratificado y polietápico.

• Vivienda Localidad Sección Estrato Estado País

Lo mismo ocurre con el paso de Sección a Estrato.

El paso de Localidad a Sección utiliza probabilidades de selección no necesariamente iguales.

El estrato i incluye Ni secciones de las cuales se selecciona, mediante un mecanismo aleatorio, una muestra de tamaño ni .

Si las probabilidades de selección son: qi1, qi2, …, qiNi entonces se contará con la información de las secciones Si(1), Si(2),…Si(ni) seleccionadas con probabilidades qi(1), qi(2),…qi(ni).

De cada sección en la muestra se dispone de la distribución predictiva para el total de la sección

P( Tir | X(n(ir)) ) ; r = 1, … , ni

Expansión de Sección a Estrato

Por simulación, para la r-ésima sección en la muestra se contará con un valor tir generado de la predictiva del total de la sección,

Una posibilidad ingenua es promediar en cada simulación esos valores y multiplicar el resultado por el número de secciones en el estrato.

De esa forma, primero se obtiene un valor simulado de la predictiva para el promedio de los totales de las secciones en la muestra que, a su vez, aproxima al promedio de los totales seccionales en el estrato.

Al multiplicar ese promedio por el número de secciones en el estrato se aproxima el total del estrato.

Expansión de Sección a Estrato

Otra posibilidad es utilizar la idea de factores de expansión.

Cada valor simulado se pondera con el recíproco de la probabilidad de selección de la sección a la que corresponde

tir = tir / qir

este valor aproxima el total del estrato.

Los valores ponderados se promedian y se obtiene una valor aproximado proveniente de la distribución predictiva para el total del estrato.

Expansión de Sección a Estrato

Resultados población (TX)

Q(97.5%) = 70,958,405 Q(2.5%) = 69,612,551

70,294,068

VNM 2008 = 70,311,037

CNP 2000 = 72,284,007 CNP 2005 = 68, 985,182

Aguascalientes Baja California

Baja California Sur Campeche

Resultados

Coahuila Colima

Chiapas Chihuahua

Resultados

Distrito Federal Durango

Guanajuato Guerrero

Resultados

( % )

Resultados empadronados TY / TX

Aguascalientes Baja California

Baja California Sur Campeche

Resultados empadronados

Coahuila Colima

Chiapas Chihuahua

Resultados empadronados

Distrito Federal Durango

Guanajuato Guerrero

Resultados empadronados

Comentarios

El mecanismo subsume la población finita en un modelo paramétrico para poblaciones infinitas y aborda un problema de inferencia sobre parámetros como uno de predicción.

El mismo procedimiento puede visualizarse como inferencia paramétrica.

El modelo paramétrico P( X* | f ) equivale a la especificación de una distribución a priori sobre el parámetro N-dimensional X .

La actualización con X(n) produce la posteriori P(X | X(n) ).

A partir de P(X | X(n) ) se deriva la posteriori para la cantidad de interés R = g(X ).

El Conteo Rápido 2012

143, 495 casillas en un territorio de

2 millones de kilómetros cuadrados

Un padrón electoral con más de 70

millones de votantes

Para capturar diferencias regionales, las 143,495 casillas se organizaron en los 300 distritos electorales del país.

En cada distrito se consideraron la parte rural y la parte urbana.

El resultado fue un conjunto 483 estratos de casillas.

En cada estrato se tomó una muestra aleatoria de casillas.

En total, la muestra fue de 7,597 casillas.

El Conteo Rápido 2012

En cada casilla pueden votar alrededor de 500 ciudadanos.

La variables que se observan son el número de votos para cada uno de los candidatos.

Es la suma de variables Bernoulli.

Se consideran i.d. porque pertenecen al mismo estrato.

No es razonable suponer que son independientes.

El Conteo Rápido 2012

El número de votos se modela con una Normal con media y varianza desconocidas y no relacionadas.

El esquema es mucho más simple que en el problema del Padrón.

Al final se tiene la predictiva del número de votos a favor de cada candidato y la predictiva del total de votos válidos.

De los valores simulados de esas predictivas se obtiene una muestra de la proporción de voto efectivo en favor de cada candidato.

El Conteo Rápido 2012

Resultados

18:00

Resultados Conteo Rápido 2006

18:00

18:05

18:10

18:15

18:20

18:25

18:30

18:35

18:40

18:45

18:50

18:55

19:00

19:05

19:10

19:15

19:20

19:25

19:30

19:35

19:40

19:45

19:50

19:55

20:00

20:05

20:10

20:15

20:20

20:25

20:30

20:35

20:40

20:45

20:50

20:55

21:00

21:05

21:10

21:15

21:20

21:25

21:30

21:35

21:40

( 91.8 % )

21:45

21:50

21:55

22:00

22:05

22:10

( 95.08 % )

22:15

22:15

95.1%

Conteo Rápido Resultado Final

PAN (35.8, 36.4) 35.89

PRD (35.1, 35.6) 35.59

PRI (21,72, 22.2) 22.26

18:51

Resultados Conteo Rápido 2012

18:51

18:55

19:00

19:05

19:10

19:15

19:20

19:25

19:30

19:35

19:40

19:45

19:50

19:55

20:00

20:05

20:10

20:15

20:20

20:25

20:35

20:40

20:45

20:50

20:55

21:00

21:05

21:10

21:15

21:20

21:25

21:30

21:35

21:40

21:45

21:50

21:55

22:00

22:05

22:10

22:15

22:20

22:25

22:30

22:30

82.4%

Comentarios Finales

Estos son solamente dos ejemplos del análisis Bayesiano de muestras de poblaciones finitas.

Aún no existe una literatura abundante y concluyente sobre el tema.

Seguramente esto cambiará muy pronto.

¡Gracias!