Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una...

50
.

Transcript of Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una...

Page 1: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

.

Page 2: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestreo y Estadıstica

Indice

Directorio 2

Presentacion 3

La Varianza de la Mediana Muestral para las distribucionesNormal, Exponencial Negativa y Pareto 4

Ley de Benford. Curiosidad Estadısticadel primer Dıgito. 16

Analisis Geoespacial de la Informacion del Censo de Poblacion y Vivienday la division de Distritos Electorales Federales 33

Pluralidad y Diversidad Polıtica: ındice basado en entropıa deShannon. El caso del Distrito Fedral 42

Profesor: Numero II 1 Julio 2014

Page 3: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

DIRECTORIO

REVISTA DE ESTADISTICA Y MUESTREO

Francisco Sanchez Villarreal.Director.

Jose Oscar Rosales Vergara. Susana Barrera OcampoMesa de Redaccion y apoyo en investigacion.

Guillermo Aaron Espinosa Reyes.Diseno y Elaboracion Editorial.

REVISTA DE ESTADISTICA Y MUESTREO. Ano I, Numero 2. Julio de 2014. Es una revista electronicaeditada por un grupo de alumnos, ex-alumnos y profesores de Estadıstica de la Facultad de Ciencias dela UNAM que aborda temas de aplicacion de Estadıstica y Muestreo probabilıstico en temas diversoscomo Actuarıa, Biologıa, Control de Calidad, Demografıa, Economıa, Ecologıa, Educacion, Investigacionde Mercados, Psicologıa, Sociologıa, Salud, etc. Sus fines son la exposicion y difusion de metodos y pro-cedimientos que apoyen la ensenanza y aplicacion de la Estadıstica y el Muestreo.

Responsable de la edicion: Francisco Sanchez [email protected]

Page 4: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

PRESENTACION

La REVISTA DE ESTADISTICA Y MUESTREO es una nueva publicacion electronica de acceso gratuito,producto del entusiasmo y trabajo coordinado de un grupo de profesores, alumnos y ex-alumnos del area deEstadıstica de la Facultad de Ciencias de la UNAM, con el proposito de difundir conocimientos de las areasreferidas con una vision preponderante en la aplicacion. La Estadıstica como ciencia en la sociedad actual,autodefinida como sociedad de la informacion, ha incrementado notablemente su presencia pues proveede metodos y tecnicas cientıficamente soportados que facilitan la adquisicion, organizacion y analisis dedatos que con el apoyo de modelos formales ayudan a entender en forma sistematica y objetiva una ampliagama de fenomenos naturales y los generados por la intervencion de los seres humanos. Los datos quese recolectan de los fenomenos en general son parciales y limitados por diversas causas, sin embargo, enel supuesto de que su recoleccion se base en procedimientos formales de aleatorizacion, constituiran unamuestra aleatoria, a partir de la cual la Estadıstica permitira inferir, generalizar los resultados a toda lapoblacion de referencia y la verificacion de hipotesis de causalidad o interdependencia entre las variablesanalizadas.

La Estadıstica debe su importancia a la utilidad que significa para las disciplinas cientıficas que basanla construccion de conocimientos a partir del estudio de hechos y fenomenos sujetos a observacion o expe-rimentacion. Estas disciplinas recurren con mayor frecuencia a los metodos y modelos estadısticos paravalidar sus descubrimientos y verificar hipotesis. La tecnologıa ha impulsado exponencialmente nuevosmetodos y fuentes de datos estadısticos y simultaneamente los ha puesto al alcance de cualquier investi-gador o estudiante. La Estadıstica, excluyendola de los campos de aplicacion, tiene su interes esencial enla identificacion, medicion y eventualmente el control de los factores que contribuyen a la varianza de losaspectos relevantes de un fenomeno que se identifican genericamente como variables.

La ensenanza de la Estadıstica resulta incompleta si no incorpora ejemplos de aplicaciones que no selimiten a planteamientos simplistas y fuera de contexto que solamente ilustran la mecanica de calculo,los propios alumnos de los diferentes cursos de estadıstica reclaman continuamente la aplicacion realistade los temas abordados por los profesores, pretendemos a traves de este medio llenar parcialmente esanecesidad.

Invitamos a los lectores a enriquecer y sostener la publicacion de este medio con documentos metodologicos,reportes de investigaciones, resumenes de tesis, etc. Con agrado los incluiremos en los siguientes numerosde la revista, basta comunicarse a nuestro correo electronico para obtener detalles en el procedimiento decolaboracion.

Francisco Sanchez VillarrealJulio 2014

Page 5: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Francisco Sanchez Villarreal

La Varianza de la Mediana Muestral para lasdistribuciones Normal, ExponencialNegativa y Pareto

Page 6: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestro y Estadıstica Varianza de la Mediana en la Normal, Exp. Negativa y Pareto

LA VARIANZA DE LA MEDIANA MUESTRAL PARA LAS DISTRIBUCIONESNORMAL, EXPONENCIAL NEGATIVA Y PARETO

Francisco Sanchez Villarreal∗

Introduccion

LA MEDIANA ES UNA ESTADISTICA DE TENDENCIA central, que junto con la media aritmetica y la modase calcula de manera cotidiana en el analisis estadıstico descriptivo. Para datos agrupados existen

varios metodos para aproximar su valor. Por otra parte la mediana ocupa un lugar destacado en el analisisestadıstico no parametrico.

La estimacion de la mediana a partir de una mues-tra es relativamente facil, pues solamente bastacon ordenar las observaciones de menor a mayor.La mediana es el valor de la observacion central,si se tiene un numero impar de observaciones o elpromedio de las dos centrales si ese numero es par.

La mediana considerada como parametro de unadistribucion continua con funcion de densidad f(x)se define como el valor en el cual se acumula 0.5 dela distribucion.

0.5 =

∫ Me

−∞f(x) dx

En el caso discreto, la mediana se define de man-era analoga, respecto de la funcion de probabilidadf(x).

0.5 =

Me∑x

f(x) dx

La estimacion de la varianza de la mediana es unproblema largamente tratado, debido a que la me-diana es una estadıstica de orden o percentil y nouna estadıstica lineal como la media, sin embargouna alternativa accesible es apoyarse en el sigu-iente teorema:

Si X1, X2, . . . , Xn son variables aleatorias independientes e identicamente distribuidas confuncion de densidad f(x), y funcion de distribucion F (x), monotona y con valor unico parael percentil p. Entonces la varianza de la estadıstica que estima a dicho percentil, se distribuyenormal con media µp y tiene la siguiente expresion:

µp =p(1− p)n(fXµp)2

Teorema

∗Asesor Internacional de Muestreo y Estadıstica.Actualmente es profesor del Departamento de Matematicas en la Facultad de Ciencias, en la UNAM.

Numero II 5 Julio 2014

Page 7: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestro y Estadıstica Varianza de la Mediana en la Normal, Exp. Negativa y Pareto

2. La Mediana de una Distribucion Normal

Si X se distribuye normal con media µ y varianzaσ2, entonces su funcion de densidad tiene la sigu-iente forma:

f(x) =1

√2πσe−

(x−µ)22σ2

, −∞ < x <∞

Se valua f(x) en la mediana y por tanto, se anulael exponente, pues Me = µ en la distribucion nor-mal.

f(Me) =1√2πσ

e−(Me−µ)2

2σ2

=1√2πσ

Entonces aplicando el teorema para la mediana

p =1

2

p(1− p)n(fXµp)2

=14

n( 1√2πσ

)2

=14

( n2πσ2 )

=πσ2

2n

Ası, la expresion para la varianza de la medianaen el caso normal es la siguiente:

V (Me) =πσ2

2n

Es conocido que la varianza de la media aritmeticaes el cociente de la varianza de la variable en estu-dio dividida entre el tamano de muestra. Resultaque en el caso normal, el estimador de la medianaes menos eficiente que el de media por tener unamayor varianza.

V (µ) =σ2

n

Entonces para obtener una estimacion de la vari-anza de la mediana basta multiplicar la estimacionde la varianza de la media por el cociente π

2 =1.57080 y el error estandar de la mediana se ob-tendra al multiplicar el error estandar de la mediapor 1.25331. En terminos simples, el error estandarde la mediana es 25% mayor que el de la media ar-itmetica en el caso normal, pero este resultado no sedebe aplicar indiscriminadamente a otras distribu-ciones, como se vera a continuacion.

3. Comparacion Empırica de las Varianzas dela Media y la Mediana

Para una verificacion empırica de los resultados anteriores se procedio a simular 1,000 muestras inde-pendientes de valores normales con media µ = 300 y desviacion estandar σ = 60, cada una de tamanon = 70, cada valor normal se genero a partir de la suma de 12 uniformes en (0, 1). Para cada muestra detamano 70, se calcularon la media aritmetica y la mediana como insumos para las varianzas.

Numero II 6 Julio 2014

Page 8: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestro y Estadıstica Varianza de la Mediana en la Normal, Exp. Negativa y Pareto

Teoricamente la varianza de la media para los parametros referidos y el tamano de muestra n = 70, esV (µ) = σ2

n = 51.4286 y la varianza de la mediana muestral resultante al aplicar el teorema es V (Me) =πσ2

2n = 80.7838.

Verificacion por simulacion. El cuadro 1 resume las estadısticas obtenidas a partir de 1000 repeti-ciones de muestras de tamano 70 generadas por simulacion de Monte Carlo. Se puede observar, comoes logico, que los promedios de ambas estadısticas difieren muy poco del valor esperado 300, ello por lasimetrıa de la normal. Las varianzas calculadas a partir de las repeticiones, tambien estan muy cercanasa los valores teoricamente esperados por la aplicacion del teorema.

Estadısticas Media MedianaRepeticiones 1,000 1,000Promedio 300.36 300.45Varianza del Estimador 51.38 80.96Error Estandar 7.17 9.00Mınimo observado 275.91 270.25Maximo observado 322.73 334.70

Cuadro 1: Distribucion Normal. Estadısticas de 1000 muestras

La tabla 2 muestra las frecuencias de los valores de la media y mediana de 1000 muestras de tamano70 cada una. Se observa mayor concentracion de la media en los intervalos centrales, consistente con sumenor varianza.

Inferior Superior Media Mediana270.0 275.0 0 2275.0 280.0 5 13280.0 285.0 11 36285.0 290.0 58 74290.0 295.0 149 138295.0 300.0 259 208300.0 305.0 261 207305.0 310.0 175 178310.0 315.0 62 100315.0 320.0 17 32320.0 325.0 3 10325.0 330.0 0 1330.0 335.0 0 1Total 1000 1000

Cuadro 2:

Figura 1:

Numero II 7 Julio 2014

Page 9: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestro y Estadıstica Varianza de la Mediana en la Normal, Exp. Negativa y Pareto

4. La Mediana de una Distribucion Exponencial Negativa

Surge la duda sobre la validez del procedimiento aplicado para obtener la varianza del estimador dela mediana en el caso de una distribucion asimetrica como la distribucion exponencial negativa. Estadistribucion tambien es de frecuente aplicacion en fenomenos de espera para modelar los tiempos entrellegadas de unidades a una estacion de servicio, tiempos entre fallas, decaimiento radioactivo, etc.

Las funciones de densidad y de distribucion acumulativa de la exponencial negativa son las siguientes:

fX(x) =1

λe

−xλ x > 0, λ > 0

FX(x) = 1− e−xλ

Figura 2: Funcion de densidad exponencial negativa, λ = 3.5

La esperanza y la varianza de la mediana de una distribucion exponencial negativa:

E(X) = λ

V (X) = λ2

Numero II 8 Julio 2014

Page 10: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestro y Estadıstica Varianza de la Mediana en la Normal, Exp. Negativa y Pareto

Para obtener una expresion para la mediana, seiguala la FX(x) a 1

2 , valor que corresponde a ladefinicion de la mediana.

1

2= 1− eMeλ equivalente a

1

2= e−

Meλ

Se toma Log natural para despejar Me.

ln(1

2) = −Me

λ

De donde se concluye que la mediana de una dis-tribucion exponencial negativa es el producto delogaritmo natural de 2 por el parametro :

Me = ln(2)λ

A continuacion procedemos a obtener una ex-presion para la varianza del estimador de la medi-ana, al aplicar el teorema citado.

f(x) =1

λe−

Como la mediana es Me = ln(2)λ, se procede avaluar la funcion de densidad en ese punto.

f(Me) =1

λe−

ln(2)λλ

=1

λe−ln(2)

=1

λeln 2

Al aplicar el teorema para obtener una expresionpara la varianza del estimador se tiene:

V (Me) =p(1− p)n(fXµp)2

=14

n( 1λeln(2) )2

=14n

λ2e2ln 2

=λ2e2ln 2

4n

Entonces la varianza de la mediana muestral en elcaso de una exponencial negativa es:

V (Me) =λ2e2ln 2

4n

Por otra parte, se verifica facilmente que la mediaaritmetica es el estimador de maxima verosimilitudpara el parametro y la varianza de la media ar-itmetica de una muestra de tamano n es:

λ = X V (X) =λ2

n

De donde se concluye inmediatamente que la vari-anza del estimador de la mediana se puede expresar

como el producto: V (Me) =e2 ln 2

4V (X) pero como

e2 ln 2 = 4 se concluye que en el caso de la exponen-cial negativa, la varianza de la media coincide conla varianza de la mediana.

Numero II 9 Julio 2014

Page 11: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestro y Estadıstica Varianza de la Mediana en la Normal, Exp. Negativa y Pareto

5. Verificacion Empırica de la Varianza del estimador de laMediana de una Exponencial Negativa

Se considera ahora una distribucion exponencial negativa con parametros λ = 3.5 y muestras de tamanon = 70. Para la simulacion de valores con distribucion exponencial negativa se utilizo la siguiente formula:

x = −λln(u(0, 1)) donde u(0,1) es un numero aleatorio con distribucion uniforme en el intervalo (0, 1)

Teoricamente la media poblacional coincide con el valor del parametro. A continuacion se obtiene el valorde la mediana poblacional.

Me = ln(2)(3.5) = 2.4260

La varianza del estimador, tanto de la media, como de la mediana, de acuerdo al resultado obtenido:

V (λ) =λ2

n=

3.52

70= 0.175

Verificacion por simulacion. Se simularon 1500 muestras independientes de tamano n = 70. Enel cuadro 3 se presentan las estadısticas basicas de la simulacion para las estimaciones de la mediaaritmetica y mediana. Se observa en primer termino que los promedios adoptan valores muy cercanos alos parametros. Las varianzas calculadas para ambos estimadores, como se esperaba, son muy similares.En ambos casos se observa cierta asimetrıa positiva.

Estadısticas Mediana MediaRepeticiones 1,500 1,500Promedio 2.456 3.506Varianza del Estimador 0.170 0.172Error Estandar 0.412 0.415Mınimo observado 1.309 2.156Maximo observado 4.049 5.015Coeficiente de Asimetrıa 0.221 0.197

Cuadro 3: Distribucion Exponencial Negativa. Estadısticas de 1500 muestras

Numero II 10 Julio 2014

Page 12: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestro y Estadıstica Varianza de la Mediana en la Normal, Exp. Negativa y Pareto

Al comparar las distribuciones de ambos estimadores se ve un claro desplazamiento hacia la derecha dela distribucion de la media, consistente con sus valores esperados.

Inferior Superior Mediana Media1.0 1.4 4 01.4 1.8 71 01.8 2.2 338 12.2 2.6 561 142.6 3.0 383 1573.0 3.4 122 4563.4 3.8 19 5103.8 4.2 2 2864.2 4.6 0 644.6 5.0 0 115.0 5.4 0 1

Total 1500 1500

Cuadro 4:Figura 3:

6. La Varianza de la Mediana de la Distribucion de Pareto tipo I

La distribucion de Pareto, propuesta por el economista y sociologo italiano Vilfredo Pareto. A el se debela observacion: El 20% de la poblacion posee el 80% de los recursos, de la cual derivo lo que se conoce comoPrincipio de Pareto, con aplicaciones en diferentes ambitos, por ejemplo en el medio comercial se dice queel 20% de las productos se asocia al 80% de las ventas. En el ambito de control de calidad se afirma demanera analoga que el 80% de las fallas se debe al 20% de las causas y en muchos campos se expresa algosimilar. La distribucion de Pareto Tipo I depende de dos parametros: α es el parametro de forma y β elparametro de posicion que define el menor valor que puede adoptar la variable aleatoria. Sus funcionesde densidad y de distribucion tienen las siguientes expresiones.

f(x) =αβα

xα+10 < β ≤ x

F (x) = 1− (β

x)α

Su esperanza y varianza se presentan a continuacion:

E(X) =αβ

α− 1

V (X) = (β

α− 1)2

α

α+ 2

Numero II 11 Julio 2014

Page 13: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestro y Estadıstica Varianza de la Mediana en la Normal, Exp. Negativa y Pareto

Para obtener la mediana, se parte de la funcion de distribucion acumulativa valuada en 12 , de donde se

despeja la Mediana (Me).

1

2= 1− (

β

Me)α de donde se obtiene que Me(X) = β

α√

2

La siguiente grafica muestra la funcion de densidad para diversos valores de α y β.

Figura 4: Distribucion de Pareto α = 2, 3, 5 β = 2.0

A continuacion se valua la funcion de densidad en la expresion de la mediana para aplicar el teoremaque permite obtener la varianza del estimador de la mediana.

fX(Me) =αβα

(β α√

2)α+1

β2α+1α

V (Me) =p(1− p)n(fXµp)2

=14

n( α

β2αα+1

)

De donde se concluye una formula para calcular la varianza del estimador de la mediana de una dis-tribucion de Pareto a partir de una muestra de tamano n.

V (Me) =β222

α+1α

4nα2

Numero II 12 Julio 2014

Page 14: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestro y Estadıstica Varianza de la Mediana en la Normal, Exp. Negativa y Pareto

7. Verificacion Empırica de la Varianza del estimador de laMediana de la Distribucion de Pareto Tipo I

En primer termino se simularon valores aleatorios de una distribucion de Pareto con parametros fijos α= 3 yβ = 2. La simulacion se realizo mediante la formula:

x =β

(u(0, 1)1α

La estimacion de los parametros a partir de una muestra de tamano n se obtiene por maxima verosimil-itud. En el caso de β su estimador maximo verosımil es el menor valor observado y una vez determinadosu valor, el valor de α se estima como sigue:

β = min(xi) α =n

n∑i=1

ln(xi)− nln(β)

Se simularon 1500 muestras de tamano 70 de una distribucion de Pareto Tipo I con parametros α = 3 yβ= 2. En estas condiciones, los valores de la media, mediana y varianzas de sus respectivos estimadoresbasados en muestras de tamano 70 son los siguientes. Observe que la varianza de la media es poco masde 4 veces mayor que la de la mediana.

E(X) =αβ

α− 1= 3.00 Me(x) = β

α√

2 = 2.5198

V (X) =V (X)

n= 0.0429 V (Me) =

β222α+1α

4nα2= 0.01008

Verificacion por simulacion. Las estadısticas calculadas a partir de las 1,500 muestras se presentana continuacion en el cuadro 5. Para cada muestra se estimaron los parametros por maxima verosimilitudy en funcion de estas estimaciones los valores de la media y la mediana. Se observa que la varianza delestimador de la media mantiene la razon aproximadaq a 4 veces mayor a la varianza de la mediana, comose esperaba por la aplicacion del teorema.

Numero II 13 Julio 2014

Page 15: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestro y Estadıstica Varianza de la Mediana en la Normal, Exp. Negativa y Pareto

Estadısticas Mediana MediaRepeticiones 1,500 1,500Promedio 2.5273 2.9980Varianza del Estimador 0.0103 0.0379Error Estandar 0.1015 0.1947Mınimo observado 2.2656 2.5622Maximo observado 2.8978 3.9647Coeficiente de Asimetrıa 0.5534 36.8592

Cuadro 5: Distribucion de Pareto tipo I. Estadısticas de 1500 muestras

La diferencia entre la media y la mediana, ası como de sus varianzas se ilustra claramente en la siguientetabla de frecuencias:

Inferior Superior Media Mediana2.2 2.4 129 02.4 2.6 1044 42.6 2.8 308 1752.8 3.0 19 6723.0 3.2 0 4563.2 3.4 0 1453.4 3.6 0 373.6 3.8 0 63.8 4.0 0 5

Total 1500 1500

Cuadro 6:Figura 5:

8. Conclusiones

Los resultados encontrados nos llevan a las siguientes conclusiones:

La razon de las varianzas de los estimadores de la media y la mediana no es constante. Para diferentesdistribuciones puede ser mayor, menor o igual, por tanto no conviene adoptar a la ligera la relacion masconocida que corresponde al caso normal.

La mediana como medida de tendencia central no ha sido considerada en todo su valor, sobre todo antedistribuciones asimetricas en las cuales la media resulta un estimador poco representativo de los valoresmedios de la distribucion.

Numero II 14 Julio 2014

Page 16: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestro y Estadıstica Varianza de la Mediana en la Normal, Exp. Negativa y Pareto

Referencias

[1] Bradley Efron, The jackknife, the bootstrap and other resampling plans, Society for Industrial andApplied Mathematics, England, 1985.

[2] Robert V. Hogg, Introduction to mathematical statistics, second edition, The Macmillan Company, NewYork, 1969.

[3] Palmer A. Catalina; Eslava Gomez Guillermina; Mendez Ramırez Ignacio, Metodos de remuestreopara el calculo de varianzas en muestreos complejos. aplicacion a la enal 96, IIMAS UNAM, 2001.

Numero II 15 Julio 2014

Page 17: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Guillermo Aaron Espinosa Reyes

Ley de BenfordCuriosidad estadıstica del primer dıgito

Page 18: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestreo y Estadıstica

LEY DE BENFORD.CURIOSIDAD ESTADISTICA DEL PRIMER DIGITO

Guillermo Aaron Espinosa Reyes∗

“Una de las principales enfermedades del hombre es su inquieta curiosidad por conocer lo que no puedellegar a saber.”: Blaise Pascal

Introduccion

MARK J. NIGRINI, DISTINGUIDO profesor En esteartıculoentende-mos por elprimer dıgitosignifica-tivo de unamagnitud,o registronumerico,como aqueldıgito que,leyendolo deizquierda aderecha, esel primero,que es dis-tinto decero. En lascantidades454.24, 0.157,π, 0.0097, elprimer dıgitosignificativoen cada unaes 4, 1, 3, 9respectiva-mente.

En esteartıculoentende-mos por elprimer dıgitosignifica-tivo de unamagnitud,o registronumerico,como aqueldıgito que,leyendolo deizquierda aderecha, esel primero,que es dis-tinto decero. En lascantidades454.24, 0.157,π, 0.0097, elprimer dıgitosignificativoen cada unaes 4, 1, 3, 9respectiva-mente.

del College of Business and Economics, en Virginia del Oeste,ha tenido considerable exito aplicando una Ley Estadıstica en deteccion de fraudes. Estamos

hablando de la Ley de Benford, atribuıda al fısico norteamericano Frank Albert Benford (figura 4 ), ley quenos habla acerca del primer dıgito significativo, de que un numero elegido al azar del Farmers Alamac, odel Census Report, o de un compendio semejante, serıa inferior a 5.

2. Ley de Benford

En la practica, manejamos cotidianamente ta-bulados, registros o censos con diversos fines es-tadısticos, como por ejemplo, la optimizacion ytoma de decisiones en polıticas diversas. Algunosejemplos de estos compendios pueden ser censoseconomicos, conteo de votos de determinado partidopolıtico, precios totales en los ticket de un super-mercado, conteo de individuos de ciertas especiesen una determinada reserva ecologica, etc. En cadauno de estos tabulados, tenemos un conjunto de reg-istros numericos, con distintos niveles de unidad(unidad, decena, centena, unidad de millar, etc).¿Que pasa ahora si nos fijamos en el primer dıgitosignificativo de cada registro numerico? Senalemosque estamos considerando el conteo de solo nuevedıgitos y no diez, pues es ningun caso se considera elcero como primer dıgito significativo por definicion.

Si los dıgitos significativos son 1, . . . , 9. Nosotrosesperarıamos que si las cantidades son elegidas

al azar, tambien los 9 dıgitos aparecerıan con lamisma frecuencia, es decir, con una frecuencia de 1

9cada una, en cuyo caso la probabilidad de que unnumero fuera ≤ 3 serıa 1

9 + 19 + 1

9 = 39 ≈ 0.33, o

que la probabilidad de que un numero fuera ≤ 4serıa 1

9 + 19 + 1

9 + 19 = 4

9 ≈ 0.44. Reiteremos, estoes, lo que esperarıamos. Sin embargo la aparicionde los primeros dıgitos significativos en la practica,la frecuencia con la que aparece un numero ≤ 3 seaproxima a 0.6 y la frecuencia con la que apareceun numero ≤ 4 se aproxima a 0.7.

Lo que nos dice la Ley de Benford 4 es que enun compendio determinado de registros numericos,aquellos registros cuyo primer dıgito significativo es1, apareceran con mucho mayor frecuencia, y estadisminuye con rapidez si el dıgito es mayor. Por loque tenemos que la distribucion del primer dıgitosignificativo es bastante asimetrica.

∗Actualmente asesor en computo, en PRAGMA S.A. de C.V.Profesor Adjunto del Departamento de Matematicas de la Facultad de Ciencias de la UNAM.E-mail: [email protected]

Profesor: Numero II 17 Julio 2014

Page 19: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestro y Estadıstica Ley de Benford

3. Una rapida verificacion de la Ley de Benford

Para entender e ilustrar esta ley, tomemos un tabulado similar al que propone Benford, un cuerpode datos de caracter demografico. Como ejemplo, en el cuadro 1 tomamos los resultados del Censo dePoblacion y Vivienda 2010 [5], a nivel Entidad emitidos por el INEGI, y despues se tomo el primer dıgitosignificativo.

Entidad Poblacion Dıgito Entidad Poblacion Dıgito1. Aguascalientes 1,184,996 1 17. Morelos 1,777,227 12. Baja California 3,155,070 3 18. Nayarit 1,084,979 13. Baja California Sur 637,026 6 19. Nuevo Leon 4,653,458 44. Campeche 822,441 8 20. Oaxaca 3,801,962 35. Coahuila 2,748,391 2 21. Puebla 5,779,829 56. Colima 650,555 6 22. Queretaro 1,827,937 17. Chiapas 4,796,580 4 23. Quintana Roo 1,325,578 18. Chihuahua 3,406,465 3 24. Sn. Luis Potosı 2,585,518 29. Distrito Federal 8,851,080 8 25. Sinaloa 2,767,761 210. Durango 1,632,934 1 26. Sonora 2,662,480 211. Guanajuato 5,486,372 5 27. Tabasco 2,238,603 212. Guerrero 3,388,768 3 28. Tamaulipas 3,268,554 313. Hidalgo 2,665,018 2 29. Tlaxcala 1,169,936 114. Jalisco 7,350,682 7 30. Veracruz 7,643,194 715. Mexico 15,175,862 1 31. Yucatan 1,955,577 116. Michoacan 4,351,037 4 32. Zacatecas 1,490,668 1

Nacional 112,336,538

Cuadro 1: Censo Nacional de Poblacion y Vivienda 2010 a nivel Entidad

A primera vista en el cuadro 1 podemos ver que los dıgitos menores (1, 2, . . .) son mas frecuentes que losmayores (. . . , 8, 9), en efecto la distribucion es asimetrica cargada a los primeros dıgitos. En el cuadro 2hicimos un conteo y un breve analisis de las frecuencias de estos 32 casos, observemos que no se incluyoel total nacional.

Dıgito Casos Porcentajede Casos

1 10 31.25%2 6 18.75%3 5 15.63%4 3 9.38%5 2 6.25%6 2 6.25%7 2 6.25%8 2 6.25%9 0 0.00%

Total 32 100%

Cuadro 2: Conteo del primer dıgito del cuadro 1.

Profesor: Numero II 18 Julio 2014

Page 20: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestro y Estadıstica Ley de Benford

Vemos en el cuadro 2 que la frecuencia con queaparece el primer dıgito sea≤ 3 es 31.25%+18.75%+15.63% = 65.63% y la frecuencia de los dıgitos ≤ 4es 31.25% + 18.75% + 15.63% + 9.38% = 75.0%. Sondatos alejados de los que esperarıamos (33.33% y44.44% respectivamente).

Ahora consideremos un cuerpo de datos con unnumero mucho mayor de casos. Haremos un con-teo similar del primer dıgito significativo tambiende la poblacion del Censo Nacional de Poblacion yVivienda 2010, pero a nivel Localidad [5]. Como te-nemos 192,245 localidades, omitiremos el tabulado

desglosado por localidad, que ocuparıa demasiadaspaginas, y solo presentamos en el cuadro 3 el re-sumen del conteo de los dıgitos, que es lo que nosinteresa.

De nuevo observamos que la probabilidad deque el primer dıgito significativo sea ≤ 3 es28.57%+17.34%+12.81% = 58.72% y la probabilidadde que sea≤ 4 es 28.57%+17.34%+12.81%+10.75% =69.48%. Tambien en este ejemplo, tenemos datosalejados de las probabi-lidades teoricas que es-perarıamos (33.33% y 44.44% respectivamente), laasimetrıa se vuelve a cargar a los primeros dıgitos.

Dıgito Casos Porcentajede Casos

1 54,919 28.57%2 33,343 17.34%3 24,631 12.81%4 20,674 10.75%5 17,219 8.96%6 14,063 7.32%7 10,876 5.66%8 8,997 4.68%9 7,523 3.91%

Total 192,245 100%

Cuadro 3: Conteo del primer dıgito, en el Censo Nacional de Poblacion y Vivienda 2010 a nivel Localidad

4. Explicacion intuitiva de la Ley de Benford

Esta curiosidad estadıstica podemos justificarla dela siguiente forma. Si tenemos un cuerpo de datos,elegidos aleatoriamente, pero solo nos fijamos en elprimer dıgito significativo, nuestro sistema de re-presentacion decimal, nos impone repetir los dıgitosdesde los primeros. Es decir, escribimos sucesiva-mente (1, 2, . . . , 8, 9.). Para seguir contando, debe-mos construir los numeros con dos dıgitos, y em-pezamos a repetir el primer dıgito (10, 11, 12, . . .),el segundo (20, 21, 22, . . .), y asi sucesivamente.Para contar cantidades de tres dıgitos, nuevamenteanadimos a la izquierda un dıgito adicional, em-pezando desde los primeros (100, 101, 102, . . .), y asıse construyen las cantidades en nuestro sistema

decimal. La consecuencia estadıstica es que aunquelos numeros sean aleatorios, el primer dıgito sig-nificativo ya no lo es, pues nos auxiliamos de losprimeros dıgitos. Ası, la probabilidad del primerdıgito significativo esta cargada a los primeras can-tidades (1, 2, . . .) en mayor medida que a las ultimas(. . . , 8, 9). Observamos tambien que el segundodıgito, tambien tiene una carga en las cantidadesmenores (0, 1, 2 . . .) que en las mayores. No hablare-mos por el momento de este punto. Tambien ob-servemos que si cambiamos el sistema de repre-sentacion numerica (octal, hexadecimal, ...) cambiala probabilidad del primer dıgito significativo. Tam-poco hablaremos de ello por ahora.

Profesor: Numero II 19 Julio 2014

Page 21: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestro y Estadıstica Ley de Benford

5. Explicacion formal de la Ley de Benford

R.S. Pinkham, profesor emerito del departamentode Matematicas en el Stevens Institute of Tech-nology, nos da un metodo formal para construir laprobabilidad {pk} de aparicion de k como primerdıgito significativo, para la distribucion empırica deun gran cuerpo de datos fısicos, economicos u obser-vacionales tomados al azar.

Si tomamos un numero de estos al azar, podemosconsiderarlo como una variable aleatoria Y > 0 conalguna distribucion desconocida. El primer dıgitosignificativo desconocido es Y es igual a k si y solosi

10nk ≤ Y < 10n(k + 1)

para alguna n, lo cual significa que al tomar el lo-garitmo de base 10

n+ Log(k) ≤ X < n+ Log(k + 1)

para la variable X = LogY .

Si la dispersion de Y es muy grande, la varia-

ble X esta distribuida aproximadamente en formauniforme y entonces la probabilidad pk, de que elprimer dıgito significativo sea igual a k es proximaa

Log(k + 1)− Log(k) = pk

Ahora consideremos la probabilidad discreta queatribuye al dıgito k la probabilidad pk de esta ultimaecuacion y construyamos la tabla de probabilidadesteoricas.

Dıgito (k) Log(k+1)-Log(k)1 30.10%2 17.61%3 12.49%4 9.69%5 7.92%6 6.69%7 5.80%8 5.12%9 4.58%

Total 100.0%

Cuadro 4: Distribucion del primer dıgito, segunBenford.

Observemos en el cuadro 4 que la distribucionteorica pk difiere mucho de la distribucion uniformecon pesos pk = 1

9 que, intuıamos.

Profesor: Numero II 20 Julio 2014

Page 22: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestro y Estadıstica Ley de Benford

6. Ley de Benford en algunas sucesiones

Uno de los requerimientos que tiene el conjunto de cantidades que son de interes para la Ley de Benfordes que sea un cuerpo de datos que ocupe varios niveles de unidad, existen algunas sucesiones crecientesen matematicas que cumplen con esta propiedad. Tomaremos como ejemplos, tres de estas sucesiones, lasucesion de Fibonacci, la sucesion de Padovan, y la sucesion de Pell [7].

Sucesion de Fibonacci. Una de las sucesiones mas conocidas en las Matematicas es la sucesion deFibonacci, por su aparicion en muchos campos como el Calculo Infinitesimal, Algebra Moderna,Teorıa de Numeros e incluso en areas de la Biologıa, como por ejemplo la Filtoaxia. Se define comola funcion S : N→ N tal que

S(n) =

1 si n ∈ {1, 2}

S(n− 1) + S(n− 2) si n ∈ {3, · · · }

Consideremos un conjunto amplio de la sucesion de Fibonacci, por ejemplo los primeros 300 terminosy extraigamos el primer dıgito significativo de cada uno de los terminos.

1 // 1 // 2 // 3 // 5 // 8

��144

��

89oo 55oo 34oo 21oo 13oo

233 // 377 // 610 // · · · // 1, 346, 269 // 2, 178, 309

��165, 580, 141

��

102, 334, 155oo 63, 245, 986oo · · ·oo 5, 702, 887oo 3, 524, 578oo

267, 914, 296 // 433, 494, 437 // 701, 408, 733 // · · · // 222, 232, 244, 629, 420x1048

El primer termino es el S(1) = 1, y el ultimo termino es S(300) = 222, 232, 244, 629, 420x1048. Ha-ciendo el conteo del primer dıgito significativo nos queda:

Dıgito 1 2 3 4 5 6 7 8 9 TotalConteo 91 53 38 27 25 19 17 17 13 300Porcentaje 30.33% 17.67% 12.67% 9% 8.33% 6.33% 5.67% 5.67% 4.33% 100%Benford 30.10% 17.61% 12.49% 9.69% 7.92% 6.69% 5.8% 5.12% 4.58% 100%

Lo que distinguimos es que en general, la frecuencia del primer dıgito significativo observado en losprimeros 300 terminos de Fibonacci, es muy similar a la que nos dice Benford, la unica particulari-dad es que en el caso de los dıgitos 7 y 8, tenemos el mismo numero de casos (17) , esto es totalmentefactible, ya que solo tomamos 300 terminos.

Profesor: Numero II 21 Julio 2014

Page 23: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestro y Estadıstica Ley de Benford

Sucesion de Padovan. Esta sucesion es mucho menos conocida que la Fibonacci, la sucesion de Padovanfue nombrada por el matematico Richard Padovan, quien atribuyo su descubrimiento al arquitectoholandes Hans van der Laan. En primera instancia fue descrita por el matematico Ian Stewart ensu artıculo Mathematical Recreations de la revista Scientific American en junio de 1996. Se definecomo la funcion S : N→ N tal que

S(n) =

1 si n ∈ {1, 2, 3}

S(n− 2) + S(n− 3) si n ∈ {4, · · · }

Consideremos un conjunto amplio de la sucesion de Padovan, por ejemplo los primeros 300 terminosy extraigamos el primer dıgito significativo de cada uno de los terminos.

2, 513 // 3, 329 // · · · // 128, 801 // 170, 625 // 226, 030

��1, 897

OO

4 // 5 // 7 // 9

��

299, 426

��1, 432

OO

3

OO

1 // 1

��

12

��

396, 655

��1, 081

OO

2

OO

2oo 1oo 16

��

525, 456

��816

OO

616oo · · ·oo 28oo 21oo 696, 081

��2, 363, 282, 504, 460, 130x1021 · · ·oo 1, 618, 192oo 1, 221, 537oo 922, 111oo

El primer termino es el S(1) = 1, y el ultimo termino es S(300) = 2, 363, 282, 504, 460, 130x1021.Haciendo el conteo del primer dıgito significativo nos queda:

Dıgito 1 2 3 4 5 6 7 8 9 TotalConteo 91 54 36 30 22 20 18 15 12 300Porcentaje 31.0 % 18.0% 12.0% 10.0% 7.33% 6.67% 6.0% 5.0% 4.0% 100%Benford 30.10% 17.61% 12.49% 9.69% 7.92% 6.69% 5.8% 5.12% 4.58% 100%

De nuevo observamos que en la sucesion de Padovan la frecuencia del primer dıgito significativo enlos primeros 300 terminos, es muy similar a la que nos dice Benford.

Profesor: Numero II 22 Julio 2014

Page 24: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestro y Estadıstica Ley de Benford

Sucesion de Pell. La sucesion de Pell puede definirse como los denominadores de las sucesivas aproxi-maciones de

√2 =

1

2 +1

2 +1

2 +1

2 + · · ·Las primeras aproximaciones de

√2 con esta construcion son 1

1 ,32 ,

75 ,

1712 ,

4129 ,

9970 , . . .. La sucesion de

Pell en terminos recursivos es la funcion S : N→ N tal que

S(n) =

1 si n ∈ {1, 2}

2S(n− 1) + S(n− 2) si n ∈ {3, · · · }

De nuevo, como en las dos anteriores, consideremos un conjunto amplio de la sucesion de Pell, losprimeros 300 terminos y extraigamos el primer dıgito significativo de cada uno de los terminos.

29

��

12oo 5oo 2oo 1oo

70

��

6, 625, 109

��

2, 744, 210oo 1, 136, 689oo 470, 832oo

169

��

15, 994, 428

��

2, 405, 252, 129, 711, 620x1099 · · ·oo 195, 025

OO

408

��

38, 613, 965 // 93, 222, 358 // 225, 058, 681

OO

80, 782

OO

985 // 2, 378 // 5, 741 // 13, 860 // 33, 461

OO

El primer termino es el S(1) = 1, y el ultimo termino es S(300) = 2, 405, 252, 129, 711, 620x1099.Haciendo el conteo del primer dıgito significativo nos queda:

Dıgito 1 2 3 4 5 6 7 8 9 TotalConteo 90 55 36 28 24 19 19 14 15 300Porcentaje 30.0 % 18.33% 12.0% 9.33% 8.0% 6.33% 6.33% 4.67% 5.0% 100%Benford 30.10% 17.61% 12.49% 9.69% 7.92% 6.69% 5.8% 5.12% 4.58% 100%

De nuevo verificamos que en la sucesion de Pell, la frecuencia del primer dıgito significativo en losprimeros 300 terminos, es muy similar a la que nos dice Benford. Podemos osbervar solamente quetenemos la misma frecuencia de dıgitos 6 y 7 (19 casos), y curiosamente tuvimos un caso mas dedıgitos 9 que dıgitos 8, nuevamente son hechos factibles por tener solo 300 casos.

Profesor: Numero II 23 Julio 2014

Page 25: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestro y Estadıstica Ley de Benford

(a) Fibonacci (b) Padovan

(c) Pell

Figura 1: Comparativo de las sucesiones observadas vs. la distribucion teorica de Benford

Profesor: Numero II 24 Julio 2014

Page 26: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestro y Estadıstica Ley de Benford

7. Elecciones y Benford

Ya hemos senalado que la Ley de Benford se veri-fica para un cuerpo de registros numericos con dis-tintos niveles de unidad. Uno de los cuerpos dedatos de esta naturaleza, que manejamos cotidiana-mente, son los votos que se emiten en los procesoselectorales por las distintas fuerzas polıticas. Noentraremos al analisis polıtico del fenomeno elec-toral, pues es ajeno al objetivo del artıculo, peroharemos el ejercicio de extracion del primer dıgitosignificativo de un cuerpo datos en uno de los proce-sos electorales.

Como ejemplo, se selecciono el proceso electoralefectuado en el 2012, organizado por el entonces, In-stituto Federal Electoral, para elegir Presidente delos Estados Unidos Mexicanos [6]. En este proceso

electoral hubo cuatro candidatos a elegir: JosefinaVazquez Mota, Enrique Pena Nieto, Andres ManuelLopez Obrador y Gabriel Quadri de la Torre. Al con-cluir el proceso electoral, el Instituto Federal Elec-toral emite los resultados. Seleccionamos el tabu-lado por municipio, en el caso del Estado de Puebla,que tiene 217 municipios.

Se sumaron las alianzas y partidos en cada mu-nicipio, para tener un cuerpo de datos con cuatrocandidatos por municipio, como en el cuadro 5. Unavez hecho esto, nos dimos a la labor de extraerel primer dıgito significativo y observar lo que te-nemos. No incluimos todos los 217 municipios enestas paginas, pero sı los incluimos en el proceso,solo nos interesa ilustrar el metodo.

Municipio Votos por candidato Extraccion del dıgitoJVM EPN AMLO GQT JVM EPN AMLO GQT

1. Acajete 4,880 8,353 7,427 419 4 8 7 42. Acateno 1,161 1,440 1,460 71 1 1 1 73. Acatlan 2,027 6,316 6,996 274 2 6 6 24. Acatzingo 2,418 8,198 6,826 297 2 8 6 25. Acteopan 430 754 105 13 4 7 1 16. Ahuacatlan 1,236 1,817 2,439 105 1 1 2 17. Ahuatlan 505 440 114 11 5 4 1 18. Ahuazotepec 396 1,881 1,493 110 3 1 1 19. Ahuehuetitla 85 368 502 1 8 3 5 110. Ajalpan 5,860 9,865 4,482 993 5 9 4 911. Albino Zertuche 266 397 84 16 2 3 8 112. Aljojuca 1,235 1,040 618 53 1 1 6 513. Altepexi 2,445 2,607 2,769 92 2 2 2 914. Amixtlan 199 1,168 630 37 1 1 6 3· · · · · · · · · · · · · · · · · · · · · · · · · · ·108. Ocoyucan 2,058 2,987 3,488 139 2 2 3 1109. Olintla 2,668 2,271 318 28 2 2 3 2110. Oriental 1,933 2,571 1,720 146 1 2 1 1111. Pahuatlan 734 3,056 3,689 106 7 3 3 1· · · · · · · · · · · · · · · · · · · · · · · · · · ·211. Zaragoza 977 3,356 2,801 157 9 3 2 1212. Zautla 595 3,230 4,192 148 5 3 4 1213. Zihuateutla 1,746 2,082 1,873 74 1 2 1 7214. Zinacatepec 2,163 2,663 1,897 169 2 2 1 1215. Zongozotla 550 1,071 419 58 5 1 4 5216. Zoquiapan 344 517 205 32 3 5 2 3217. Zoquitlan 1,125 2,548 2,926 122 1 2 2 1Puebla 217 Mun

Cuadro 5: Distribucion del primer dıgito en el proceso electoral 2012 para presidente de los EstadosUnidos Mexicanos, caso de Puebla por municipio. Presentamos el cuadro por candidato.

Profesor: Numero II 25 Julio 2014

Page 27: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestro y Estadıstica Ley de Benford

En el cuadro 6, tenemos dos partes, las columnas de la izquierda (de la segunda a la sexta) tenemos elconteo de las frecuencias absolutas del primer dıgito significativo, segun las 4 ultimas columnas del cuadro5, en las columnas de la derecha tenemos los porcentajes respecto a los 217 municipios. En las columnassombreadas 6 y 11, tenemos la frecuencia teorica y el porcentaje teorico de la distribucion de Benford(pk = log(k+ 1)− log(k)), la cual ya conocemos. En base a esa ultima, construimos teoricamente la quintacolumna, de los dıgitos absultos que, esperarıamos, si las frecuencias se cumplieran igual que la Ley deBenford teorica, resultando ası 30.10%x217 = 65 dıgitos 1, 17.61%x217 = 38 dıgitos 2, 12.49%x217 = 27dıgitos 3, . . ..

Dıgito Frecuencias Absolutas PorcentajesJVM EPN AMLO GQT Benford JVM EPN AMLO GQT Benford

1 78 74 74 76 65 35.9% 34.1% 34.1% 35% 30.10%2 36 35 41 33 38 16.6% 16.1% 18.9% 15.2% 17.61%3 20 32 20 21 27 9.2% 14.7% 9.2% 9.7% 12.49%4 21 15 18 27 21 9.7% 6.9% 8.3% 12.4% 9.69%5 14 8 15 15 17 6.5% 3.7% 6.9% 6.9% 7.92%6 17 12 13 14 15 7.8% 5.5% 6.0% 6.5% 6.69%7 13 10 10 15 13 6.0% 4.6% 4.6% 6.9% 5.8%8 11 15 16 10 11 5.1% 6.9% 7.4% 4.6% 5.12%9 7 16 10 6 10 3.2% 7.4% 4.6% 2.8% 4.58%

Total 217 217 217 217 217 100% 100% 100% 100% 100%

Cuadro 6: Tabla de frecuencias del primer dıgito y comparativo con distribucion de Benford. Resumen delcuadro 5.

En el cuadro 6 podemos ver algunas particularidades. Observamos que en el caso de la candidataJosefina Vazquez Mota, se dio un caso menos del dıgito 3 que el dıgito 4 (20 y 21 respectivamente), yalgo similar se da con los dıgitos 5 y 6 (14 y 17 casos). En el caso del candidato Enrique Pena Nietose da una presencia de los ultimos dıgitos un tanto mas alta que la teorica de Benford. En el caso delcandidato Andres Manuel Lopez Obrador, hay un salto en el octavo dıgito. Finlamente en el caso delcandidato Gabriel Quadri de la Torre, se observa un leve incrememnto de los dıgitos 4 y 7, respecto alporcentaje teorico. En la practica, en los cuatro candidatos, tuvimos una mayor carga al dıgito 1 que lateorica (30.10%). Estas variaciones se dan ya que solo tenemos 217 casos.

En terminos generales vemos que efectivamente tenemos una fuerte carga del primer dıgito significativohacia los menores dıgitos y poco presente en los mayores.

Profesor: Numero II 26 Julio 2014

Page 28: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestro y Estadıstica Ley de Benford

Figura 2: Distribucion Teorica de Benford y distribuciones del primer dıgito por candidato, en las elecciones federalespara Presidente de los EUM 2012 en el estado de Puebla.

Profesor: Numero II 27 Julio 2014

Page 29: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestro y Estadıstica Ley de Benford

8. Benford y la Lluvia

Benford tambien observo que se cumplıa la tendencia del primer dıgito que ya hemos explicado, enlos cuerpos de datos metereologicos. Ası que nos dimos a la tarea de reunir un cuerpo de datos de estanaturaleza. En la tabla 7 tenemos los datos de precipitacion Pluvial en Mexico por Entidad Federativa du-rante el 2013, extraıdos del Servicio Metereologico Nacional [4] . La unidad de medida de la precipitacionpluvial son milımetros (mm).

Entidad Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic1. Aguascalientes 51.6 0 0.4 0.2 18.9 75.4 205.7 80.1 154.4 45.3 35.2 89.32. Baja California 28.9 12.2 6.3 0.4 3.4 3.8 30.6 31.6 33.6 13.4 17.4 12.33. Baja California Sur 8.6 0.5 0.8 0.1 1.2 4.1 18.3 65.8 54.8 56.3 12.8 6.34. Campeche 113.7 15.7 7 19.5 119.7 248.8 215.1 259 216.3 171.5 189 123.15. Coahuila 15.4 1.8 1.8 12.3 44.1 52.4 76.5 28 120.4 40.1 33.1 176. Colima 98 0 6.6 0.1 2.8 124.2 239.1 300 731.3 124.6 176.5 74.17. Chiapas 59 16.9 15.7 29.6 214.6 339.3 248.4 309.9 394.6 299.5 193.2 157.88. Chihuahua 18.5 1.9 1.1 0.5 7.6 52.1 204.9 99.1 102.9 33.9 45.9 49.69. Distrito Federal 2.2 1.4 2.3 15.6 52.8 107.1 113.8 130.3 169.7 64.3 36.1 2.5

10. Durango 4.6 0.1 0.1 0.3 4.7 29.7 147.4 89.4 140.4 19.3 59.9 22.911. Guanajuato 11.4 0.2 2.4 1 27 94.6 214.8 107.1 185.9 47.3 32.5 37.912. Guerrero 7 0.1 7.5 7.1 69.6 195.7 154.4 156.3 467.2 103.2 29.9 4.413. Hidalgo 7.7 8.5 8.7 9.8 53.2 100 100.5 116.7 219.6 79.4 66.7 26.814. Jalisco 46 0.1 2.2 0.1 18.4 114.4 223.6 153.9 304.4 60.2 60 7915. Mexico 4.1 0.9 7.7 11.9 56.9 124.2 161.1 133 223.2 71.7 42.1 7.616. Michoacan 17.7 0.1 10.3 0.9 24.8 122.9 234.6 160.9 355.1 74.1 37.6 32.117. Morelos 0.8 0.3 8.9 6.5 144.5 262.5 254 256.3 395.8 114.5 70.4 2.118. Nayarit 18.7 0.5 0.5 1 5.1 151.4 216.7 289.9 324.3 32.9 91.4 77.319. Nuevo Leon 28 2.5 6.5 27.2 76 47.5 72.1 51.3 294.4 29.7 50 74.520. Oaxaca 11.4 11.9 12.1 13.6 73.9 187.9 133.5 204.2 406.6 98.1 61.8 19.921. Puebla 8.3 11.7 16.3 20.5 92.5 204.5 203.2 227.9 348.8 125.2 104.9 2622. Queretaro 4.9 3.8 5.9 7.4 41.2 89.2 159.3 116.6 203.3 64.3 55.4 29.323. Quintana Roo 51.3 40.7 39.1 18.6 77.9 254.7 208.7 220.7 383.7 235.8 246 127.624. San Luis Potosı 22.5 4.8 10 2.7 42.8 87.5 102.1 134.8 260.9 61.5 75 70.925. Sinaloa 4 0.1 0.2 0.2 1.2 35.7 169.4 197.2 298.6 16.1 91.1 32.926. Sonora 19.1 5.1 2.2 1 0.9 9.7 148.3 97.3 81.1 25.1 28.6 28.427. Tabasco 185.9 34.3 48.7 37.1 141.3 266.1 230.1 297.5 276.3 378.4 455.8 460.528. Tamaulipas 30.9 3.2 9.6 28.2 55.2 100.8 94.4 132.9 403.9 43.2 88.6 100.929. Tlaxcala 4.1 7.5 8 16.3 69.1 117.7 161 96.2 203.9 81.3 42.4 17.430. Veracruz 28.7 29.3 30.8 19.1 120.3 254.6 158.7 265.2 409.3 225.6 234.7 7731. Yucatan 56.7 12.8 10.7 37 72.5 216.9 154.7 205.6 271.1 177.1 135.6 69.132. Zacatecas 27 0.4 0.8 0.8 14.2 54.6 158.5 79.6 144.5 48.9 37.6 64.1

Nacional 26.4 6.4 7.1 9 43.9 103.2 152.6 135.8 227.3 77.6 76.2 55.1

Cuadro 7: Precipitacion Pluvial (mm) en el ano 2013 por Entidad Federativa. Servicio MetereologicoNacional.

En el cuadro 8 se hizo la extraccion del primer dıgito de los registros del cuadro 7. Tenemos 30 registrosen vez de 32 del mes de Febrero, pues podemos ver en el cuadro 7 que los registros pluviometricos en elcaso de las entidades de Aguscalientes y Colima, fueron de 0mm.

Profesor: Numero II 28 Julio 2014

Page 30: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestro y Estadıstica Ley de Benford

Entidad Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic1. Aguascalientes 5 4 2 1 7 2 8 1 4 3 82. Baja California 2 1 6 4 3 3 3 3 3 1 1 13. Baja California Sur 8 5 8 1 1 4 1 6 5 5 1 64. Campeche 1 1 7 1 1 2 2 2 2 1 1 15. Coahuila 1 1 1 1 4 5 7 2 1 4 3 16. Colima 9 6 1 2 1 2 3 7 1 1 77. Chiapas 5 1 1 2 2 3 2 3 3 2 1 18. Chihuahua 1 1 1 5 7 5 2 9 1 3 4 49. Distrito Federal 2 1 2 1 5 1 1 1 1 6 3 2

10. Durango 4 1 1 3 4 2 1 8 1 1 5 211. Guanajuato 1 2 2 1 2 9 2 1 1 4 3 312. Guerrero 7 1 7 7 6 1 1 1 4 1 2 413. Hidalgo 7 8 8 9 5 1 1 1 2 7 6 214. Jalisco 4 1 2 1 1 1 2 1 3 6 6 715. Mexico 4 9 7 1 5 1 1 1 2 7 4 716. Michoacan 1 1 1 9 2 1 2 1 3 7 3 317. Morelos 8 3 8 6 1 2 2 2 3 1 7 218. Nayarit 1 5 5 1 5 1 2 2 3 3 9 719. Nuevo Leon 2 2 6 2 7 4 7 5 2 2 5 720. Oaxaca 1 1 1 1 7 1 1 2 4 9 6 121. Puebla 8 1 1 2 9 2 2 2 3 1 1 222. Queretaro 4 3 5 7 4 8 1 1 2 6 5 223. Quintana Roo 5 4 3 1 7 2 2 2 3 2 2 124. San Luis Potosı 2 4 1 2 4 8 1 1 2 6 7 725. Sinaloa 4 1 2 2 1 3 1 1 2 1 9 326. Sonora 1 5 2 1 9 9 1 9 8 2 2 227. Tabasco 1 3 4 3 1 2 2 2 2 3 4 428. Tamaulipas 3 3 9 2 5 1 9 1 4 4 8 129. Tlaxcala 4 7 8 1 6 1 1 9 2 8 4 130. Veracruz 2 2 3 1 1 2 1 2 4 2 2 731. Yucatan 5 1 1 3 7 2 1 2 2 1 1 632. Zacatecas 2 4 8 8 1 5 1 7 1 4 3 6

Dgitos 32 30 32 32 32 32 32 32 32 32 32 32

Cuadro 8: Extraccion del primer dıgito del tabulado 7.

En la tabla 9 se hicieron las frecuencias del total de los 382 dıgitos de la tabla 8) del registro pluviometricode cada una de las 32 entidades en la tabla 7, 30 en el caso de febrero.

Casos Frecuencias FrecuenciasDıgito Observados observadas teoricas

Benford1 123 32.20% 30.10%2 82 21.47% 17.61%3 38 9.95% 12.49%4 34 8.9% 9.69%5 24 6.28% 7.92%6 17 4.45% 6.69%7 30 7.85% 5.80%8 18 4.71% 5.12%9 16 4.19% 4.58%

Total 382 100% 100%

Cuadro 9: Frecuencias del cuadro 8. Conteo del primer dıgito en los datos de precipitacion pluvial 2013,cuadro 7.

Notamos un leve incremento en la presencia de dıgitos 7, pues hay mas presencia de estos que de dıgitos6 y 8. Estas variaciones se deben a que solo tenemos 382 casos. En lo general notamos que efectivamentese repite el fenomeno de mayor frecuencia de los dıgitos menores (1, 2, . . .) en comparacion de los mayores(. . . , 8, 9).

Profesor: Numero II 29 Julio 2014

Page 31: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestro y Estadıstica Ley de Benford

Figura 3: Distribucion Teorica de Benford

9. Antecedentes historicos de la Ley de Benford

En 1938, el fısico Frank Benford, observo que enlas tablas de logaritmos las primeras paginas de loslogaritmos estaban mas usadas que las finales. De-dujo que aparentemente los dıgitos iniciales de losnumeros no son equiprobables sino que el 1 aparececomo dıgito inicial mas frecuente, seguido del 2, etc.hasta el 9 que es el menos frecuente. Seguido aesto, realizo una comprobacion empırica sobre untotal de 20,229 magnitudes agrupados en 20 mues-tras de naturaleza diversa: areas fluviales, con-stantes y magnitudes fısicas y quımicas, funcionesmatematicas e incluso numeros de direcciones depersonas y tomados de portadas de revistas. Con-firmo el resultado y postulo de lo que se hablo eneste artıculo, sus observaciones.

Figura 4: Frank Benford, 1912

Profesor: Numero II 30 Julio 2014

Page 32: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestro y Estadıstica Ley de Benford

Fue desde 1881 y que de manera independiente, el astronomo y matematico Simon Newcomb ya habıaobservado el mismo fenomeno en sus tablas de logaritmos, tambien dedujo que, aparentemente los dıgitosiniciales de los numeros no son equiprobables sino que los menores eran mas probables. Medianteun breve e ingenioso razonamiento, aunque sin presentar realmente un argumento formal ni formulamatematica, Newcomb enuncio verbalmente una relacion o ley logarıtmica: “La ley de probabilidad de laocurrencia de numeros es tal que las mantisas de sus logaritmos son equiprobables”. Por sus importantescontribuciones en el campo de la astronomıa, un crater en el planeta Marte, lleva su nombre.5

Figura 5: Crater Newcomb, en el planeta Marte. GoogleMars c©

Profesor: Numero II 31 Julio 2014

Page 33: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestro y Estadıstica Ley de Benford

Referencias

[1] W. Feller. Introduccion a la Teorıa de Probabilidades y sus aplicaciones vol II. Limusa, 2007.

[2] http://es.wikipedia.org/wiki/Ley de Benford. Ley de Benford. 2014.

[3] http://es.wikipedia.org/wiki/Simon Newcomb. Simon Newcomb. 2014.

[4] http://smn.cna.gob.mx. Servicio Metereologico Nacional. Comision Nacional del Agua.

[5] http://www.inegi.org.mx. Instituto Nacional de Estadıstica y Geografıa INEGI.

[6] http://www.ine.mx. Instituto Nacional Electoral.

[7] J. M. Sanchez Chamoso. Enfoques actuales en la didactica de las matematicas. Red de BibliotecasUnversitarias. Ministerio de Educacion y Ciencia, 2006.

Profesor: Numero II 32 Julio 2014

Page 34: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Jose Oscar Rosales Vergara

Analisis Geoespacial de la Informacion delCenso de Poblacion y Vivienda y la divisionde Distritos Electorales Federales

Page 35: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestreo y Estadıstica Analisis Geoespacial del Censo y Distritos Electorales Federales

ANALISIS GEOESPACIAL DE INFORMACION DEL CENSODE POBLACION Y VIVIENDA Y LA DIVISION DE DISTRITOS

ELECTORALES FEDERALES.EL CASO DEL DISTRITO FEDERAL.

Jose Oscar Rosales Vergara∗

EN MAYO DE 2009 SE PRESENTA EL SISTEMA de Estadısticas Censales a Escalas Geo-electorales, trabajo conjunto desarrollado por el INEGI y el IFE (hoy Instituto Na-cional Electoral). Este sistema contiene la informacion sociodemografica del II Conteode Poblacion y Vivienda 2005 vinculadas a la cartografıa electoral incorporada a unaaplicacion de sistemas de informacion geografica (SIG).

Uno

Con el desarrollo por parte de INEGI deun sistema de informacion geografica pro-pio denominado “Mapa Digital” y los re-sultados del Censo de Poblacion y Vivienda2010, esta institucion presenta una versionmas reciente de las Estadısticas Censales aEscalas Geoelectorales en febrero de 2012.

Esta herramienta permite comparar car-acterısticas censales con resultados de loscomicios a un nivel mas desagregado comolo son los distritos y las secciones elec-torales, ya que anteriormente al no coin-cidir los niveles territoriales de desagre-gacion solo era posible estimar a niveles demunicipios o entidades federativas.

La delimitacion de las entidades y mu-nicipio obedece a diferentes criterios comolos lımites naturales, directivas polıticas,economicas, demograficas etc. mientrasque los distritos electorales federales estanperfectamente definidos en la Constitucionen el Artıculo 53. La demarcacion terri-torial de los 300 distritos electorales uni-nominales sera la que resulte de dividirla poblacion total del paıs entre los dis-tritos senalados. La distribucion de losdistritos electorales uninominales entre lasentidades federativas se hara teniendo encuenta el ultimo censo general de poblacion,sin que en ningun caso la representacion deun Estado pueda ser menor de dos diputa-dos de mayorıa.

∗Consultor en PRAGMA S.A. de C.V.e-mail: oscar [email protected]

Numero II 34 Julio 2014

Page 36: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestreo y Estadıstica Analisis Geoespacial del Censo y Distritos Electorales Federales

Dos

Mexico es una Republica Federal quese compone por 31 estados y un DistritoFederal; se divide en 2,417 municipios ylas 16 delegaciones del Distrito Federal.La entidad mas poblada segun el ultimocenso de 2010 es el Estado de Mexico con15,175,862 habitantes siendo Baja Califor-nia Sur la menos poblada con 637,026 per-sonas. El promedio nacional de habitanteses de 3,510,517.

La geografıa electoral se compone de 5 cir-cunscripciones, los 300 distritos y 65,747secciones electorales. El Estado de Mexicotiene el mayor numero de distritos (40)mientras que Baja California Sur solo tiene2; el promedio de habitantes por distrito esde 374,455.

Numero II 35 Julio 2014

Page 37: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestreo y Estadıstica Analisis Geoespacial del Censo y Distritos Electorales Federales

Tres

Tomemos como ejemplo el caso del Distrito Federal para realizar un analisis focalizado.

El Distrito Federal se divide polıticamente en 16 delegaciones (figura 1 ) mientras quesu division electoral corresponde a 27 distritos federales (figura 2 ).

Delegacion02 Azcapotzalco03 Coyoacan04 Cuajimalpa05 Gustavo A. Madero06 Iztacalco07 Iztapalapa08 Magdalena Contreras09 Milpa Alta10 Alvaro Obregon11 Tlahuac12 Tlalpan13 Xochimilco14 Benito Juarez15 Cuauhtemoc16 Miguel Hidalgo17 Venustiano Carranza

Figura 1: Poblacion por Delegaciones Polıticas

Distritos01 1502 1603 1704 1805 1906 2007 2108 2209 2310 2411 2512 2613 2714

Figura 2: Poblacion por Distritos Electorales Fe-derales

Numero II 36 Julio 2014

Page 38: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestreo y Estadıstica Analisis Geoespacial del Censo y Distritos Electorales Federales

En terminos de poblacion la delegacion mas poblada es Iztapalapa con 1,815,786 habi-tantes seguida de Gustavo A. Madero con 1,185,772; en el mapa tematico se observa quepara los distritos electorales, los distritos mas poblados se encuentran en 5 delegacionesAlvaro Obregon, Benito Juarez, Cuajimalpa, La Magdalena Contreras y Miguel Hidalgo.

Cuatro

La capital del paıs cuenta con 5,539 secciones electorales que es la unidad basica de lademarcacion territorial de la geografıa electoral de nuestro paıs; se integran por man-zanas urbanas o localidades rurales y pueden ser de 3 tipos: urbana (solo localidadurbana), rural (solo una o mas localidades rurales) o mixta (localidades rurales y ur-banas). Como es de suponerse, el Distrito Federal esta urbanizado casi en su totalidad,contando unicamente con 56 secciones mixtas ubicadas es su mayorıa en Milpa Alta,Tlahuac y Xochimilco y solamente una seccion rural en esta ultima delegacion.

(a) Seccion Urbana (b) Seccion Mixta (c) Seccion Rural

Figura 3: Secciones Electorales

Como cabe esperar, Iztapalapa es la delegacion que tiene el mayor numero de seccioneselectorales con 1,003 seguida de Gustavo A. Madero con 858; por otro lado Cuajimalpa deMorelos y Milpa Alta ocupan los ultimos lugares con 75 y 44 secciones respectivamente(cuadro 1 ). El distrito electoral con mas secciones es el Distrito 10 con 265 y correspondea la delegacion Miguel Hidalgo, mientras que el Distrito 21 ocupa el ultimo lugar encuanto a numero de secciones se refiere (cuadro 2 ) y cubre la totalidad de Milpa Alta ybuena parte de Xochimilco.

Numero II 37 Julio 2014

Page 39: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestreo y Estadıstica Analisis Geoespacial del Censo y Distritos Electorales Federales

Delegacion Secciones Porciento07 Iztapalapa 1,003 18.1%05 Gustavo A. Madero 858 15.5%10 Alvaro Obregon 445 8.0%03 Coyoacan 403 7.3%15 Cuauhtemoc 389 7.0%12 Tlalpan 355 6.4%02 Azcapotzalco 347 6.3%17 Venustiano Carranza 337 6.1%06 Iztacalco 299 5.4%16 Miguel Hidalgo 265 4.8%14 Benito Juarez 254 4.6%13 Xochimilco 172 3.1%08 La Magdalena Contreras 147 2.7%11 Tlahuac 146 2.6%04 Cuajimalpa de Morelos 75 1.4%09 Milpa Alta 44 0.8%

Total 5,539 100%

Cuadro 1: Secciones por Delegacion

Distrito Secciones Porciento Distrito Secciones Porciento10 265 4.78% 11 209 3.77%2 260 4.69% 24 202 3.65%26 259 4.68% 23 201 3.63%15 254 4.59% 4 189 3.41%8 251 4.53% 17 189 3.41%12 244 4.41% 18 187 3.38%3 241 4.35% 25 175 3.16%20 234 4.22% 19 164 2.96%7 222 4.01% 1 159 2.87%16 219 3.95% 22 152 2.74%6 217 3.92% 14 142 2.56%9 217 3.92% 27 133 2.40%5 214 3.86% 21 130 2.35%13 210 3.79% Total 5,539 100%

Cuadro 2: Secciones por Distrito

Cinco

Las ultimas elecciones federales fueron en 2012 para Presidente de la Republica y parala composicion del Congreso de la Union. El estado que presento mayor participacionciudadana en las votaciones para Presidente fue Yucatan con 77.42% seguido de Tabascocon 71.28%, el Distrito Federal alcanzo un 67.16% de participacion en estos comicios.

Los siguientes cuadros muestran los rangos de participacion ciudadana en las vota-ciones para presidente en 2012 por delegacion (figura 4 ) y distrito electoral (figura 5 )para el caso de la Ciudad de Mexico.

Delegacion02 Azcapotzalco03 Coyoacan04 Cuajimalpa05 Gustavo A. Madero06 Iztacalco07 Iztapalapa08 Magdalena Contreras09 Milpa Alta10 Alvaro Obregon11 Tlahuac12 Tlalpan13 Xochimilco14 Benito Juarez15 Cuauhtemoc16 Miguel Hidalgo17 Venustiano Carranza

Figura 4: Participacion Polıtica por DelegacionNumero II 38 Julio 2014

Page 40: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestreo y Estadıstica Analisis Geoespacial del Censo y Distritos Electorales Federales

Distritos01 1502 1603 1704 1805 1906 2007 2108 2209 2310 2411 2512 2613 2714

Figura 5: Participacion Polıtica por Distrito

Coyoacan y Benito Juarez son las delegaciones que presentan mayor participaciontanto a nivel delegacional como en los distritos que las integran. La region surestede la ciudad es la que exhibio menor participacion en estas elecciones y esto se reflejatanto a nivel delegacional como distrital.

Consideremos los casos de las delegaciones Benito Juarez e Iztapalapa que represen-tan altos y bajos porcentajes de participacion ciudadana respectivamente en los ambitosdelegacional y distrital.

(a) Benito Juarez (b) Iztapalapa

Numero II 39 Julio 2014

Page 41: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestreo y Estadıstica Analisis Geoespacial del Censo y Distritos Electorales Federales

Estadısticas Censales Delegaciones Distritosy Electorales Benito Juarez Iztapalapa 15 4 18 19 20 22Poblacion 385,439 1,815,786 385,439 324,691 319,641 347,957 313,724 357,379PEA 199,003 792,297 199,003 147,639 138,485 152,069 142,708 149,457PEA/Poblacion 51.63% 43.63% 51.63% 45.47% 43.33% 43.70% 45.49% 41.82%Ocupadas 191,122 752,268 191,122 139,727 132,154 144,082 135,593 141,919Ocupadas/PEA 96.04% 94.95% 96.04% 94.64% 95.43% 94.75% 95.01% 94.96%Grado de Escolaridad 13.50 9.60 13.52 10.31 9.77 9.08 10.68 8.46Secciones 254 1,003 254 189 187 164 234 152Lista Nominal* 338,602 1,365,885 338,602 248,509 248,251 248,422 267,361 261,125Participacion* 71.83% 64.36% 71.89% 67.25% 64.02% 62.82% 69.65% 58.70%Votos Partido Ganador* 77,279 287,608 77,750 53,719 50,150 52,385 55,483 51,460Partido Ganador* PAN PRD PAN PRD PRD PRD PRD PRD

La delegacion Benito Juarez tiene un solodistrito electoral que la comprende en sutotalidad: el Distrito 15; Iztapalapa estaintegrado electoralmente por los distritos4, 18, 19, 20 y 22 ademas por 77 seccionesque pertenecen al Distrito 25 que compartecon la delegacion Xochimilco.

Benito Juarez tiene el 4.4% de lapoblacion total del Distrito Federal ocu-pando la decima posicion mientras que Iz-tapalapa es la primera en este rubro consus 1,815,786 habitantes y el 20.51% deporcentaje.

El porcentaje de personas economicamenteactivas (PEA) respecto de la poblacion to-tal es mayor en Benito Juarez que en Iz-tapalapa con 51.63% para la primera y43.63 para la segunda; a nivel distrito elec-toral, el cociente del Distrito 15 es mayorque cualquiera de los 5 distritos de Izta-palapa, la menor diferencia se da entre elDistrito 15 y el Distrito 20 y la mayor entreel mismo Distrito 15 y el Distrito 22, justo

el distrito mas cercano y el mas alejado deBenito Juarez respectivamente.

En el caso del grado de escolaridad entrelas delegaciones y los distritos sucede unefecto muy parecido donde la delegacionBenito Juarez supera tanto a la delegacionIztapalapa como a los distritos que la in-tegran; el grado de escolaridad que pre-senta esta delegacion es incluso el mas ele-vado de la capital y se ha mantenido en laprimera posicion desde el censo de 2000 yel conteo de 2005.

En la delegacion Benito Juarez, el PartidoAccion Nacional fue el que recibio mas vo-tos en estas pasadas elecciones para Presi-dente de 2012 con 77,279 votos y el 31.77%de porcentaje de votacion total, siendo estajunto a la delegacion Miguel Hidalgo lasunicas delegaciones que eligieron un par-tido diferente al PRD, partido vencedor enlas demas demarcaciones.

Numero II 40 Julio 2014

Page 42: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestreo y Estadıstica Analisis Geoespacial del Censo y Distritos Electorales Federales

Conclusiones

Como se ha visto, es posible desarrollar analisis estadıstico y analisis espacial, con lacombinacion de la informacion del Censo de Poblacion y Vivenda 2010 y de la CartografıaElectoral disponible en el sistema de Estadısticas Censales a Escalas Geoelectorales, asıcomo con el apoyo de herramientas como Google Earth y la informacion disponible enlos sitios tanto del INEGI como del INE y otros apoyos de internet que permiten lainvestigacion y desarrollo de planes y polıticas publicas que mejoren las propuestas delas campanas polıticas y programas de gobierno.

Referencias

[1]Constitucion Polıtica de los Estados Unidos Mexicanos.

[2]Codigo Federal de Instituciones y Procedimientos Electorales.

[3]Guıa para el Uso e Interpretacion de los Productos Cartograficos, ABRIL 2011. Direccion Ejecutiva delRegistro Federal de Electores. IFE.

[4]http://www.historiademexicobreve.com/2012/08/consumacion-de-la-independencia-de.html

[5]http://es.wikipedia.org/wiki

[6]http://www.ife.org.mx/documentos/DECEYEC/sistemas electorales y de partid.htm

[7]http://www.inegi.org.mx/inegi/spc/doc/INTERNET/16-%20marco geoestadistico nacional.pdf

[8]http://listanominal.ife.org.mx/ubicamodulo/PHP/int est edo.php?edo=9# (Informacion bajada de Padrony Lista nominal al 1 de agosto de 2014)

[9]http://siceef.ife.org.mx/pef2012/SICEEF2012.html# (Atlas de Resultados Electorales Federales 1991-2012)

[10]http://www3.inegi.org.mx/sistemas/biinegi/default.aspx#A (Grado de escolaridad)

Numero II 41 Julio 2014

Page 43: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Francisco Sanchez Villarreal

Pluralidad y Diversidad Polıtica en elDistrito FederalIndice Basado en Entropıa

Page 44: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestreo y Estadıstica Pluralidad y Diversidad Polıtica en el Distrito Federal

PLURALIDAD Y DIVERSIDAD POLITICAINDICE BASADO EN ENTROPIA DE SHANNON

EL CASO DEL DISTRITO FEDERALFrancisco Sanchez Villarreal ∗

Introduccion

EN el artıculo del numero anterior, acerca delIndice de Shannon [4, pp 6-14], se trato la apli-

cacion de la medida de entropıa o incertidumbrecontenida en un mensaje de Elwood Shannon paramedir la diversidad polıtica de Mexico. El Indice deEntropıa tiene la siguiente expresion general:

H =

k∑i=1

Pilog2(1

pi) · · ·

k∑i=1

Pi = 1

Donde Pi representa la probabilidad del eventoi-esimo. La maxima incertidumbre o entropıa sepresenta cuando todos los valores de Pi son iguales,equivale a una distribucion uniforme. En un con-texto alternativo las probabilidades se pueden aso-ciar a proporciones de objetos o sujetos de dife-rentes clases y sus proporciones dan cuenta de sudiversidad. Si las proporciones son iguales se tienemaxima diversidad, que se interpreta como unafuerte competencia. En la medida que ciertas pro-

porciones tienden a ser dominantes, se tiene menordiversidad. En nuestro artıculo, los porcentajesde electores para los diferentes partidos en unaeleccion son las fuentes para aplicarles la medidade entropıa e interpretar esta como un Indice deDiversidad Polıtica.

En el primer artıculo [4, pp 6-14] el Indice de Di-versidad Polıtica (IDP) se calculo para las eleccionesde diputados federales electos por entidad federa-tiva por el principio de mayorıa relativa, realizadasen los anos 1997 a 2012. El Distrito Federal, en elcontexto de las 32 entidades federativas, resulto conelevados grados de diversidad polıtica en todas laselecciones, pero nos preguntamos: ¿que tanta diver-sidad polıtica hay al interior del Distrito Federal? y¿como ha evolucionado la diversidad polıtica en laselecciones recientes?

2. Eleccion de Delegados en el Distrito Federal ano 2000

Se obtuvieron los datos publicados por el InstitutoElectoral del Distrito Federal (IEDF), correspondi-entes a las elecciones de delegados del ano 2000.

Las elecciones del ano 2000 fueron las primeras

organizadas por el IEDF para la eleccion de Jefede Gobierno, 66 diputados locales y 16 jefes delega-cionales. La lista nominal para esa eleccion fue de6,256,698 ciudadanos de los cuales emitieron votoefectivo 4,238,647( 68%). En el proceso electoralparticiparon 11 partidos:

∗Francisco Sanchez Villarreal es egresado de la Licenciatura en Actuarıa, de la UNAM.Actualmente es Profesor del Departamento de Matematicas en la Facultad de Ciencias.Ha colaborado en ponencias y artıculos cientıficos en la Asociacion Mexicana de Estadıstica.Es asesor en Muestreo y Estadıstica.

Profesor: Numero II 43 Julio 2014

Page 45: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestreo y Estadıstica Pluralidad y Diversidad Polıtica en el Distrito Federal

1. PAN Partido Accion Nacional2. PRI Partido Revolucionario Institucional3. PRD Partido de la Revolucion Democratica4. PT Partido del Trabajo5. PVEM Partido Verde Ecologista de Mexico6. CDPPN Convergencia por la Democracia Partido Polıtico Nacional7. PCD Partido de Centro Democratico8. PSN Partido de la Sociedad Nacionalista9. PAS Partido Alianza Social10. PARM Partido Autentico de la Revolucion Mexicana11. DSPPN Democracia Social Partido Polıtico Nacional

El PAN y el PVEM participaron en una coalicionidentificada como Alianza por el Cambio (APC). Los6 partidos PRD, PT, DPPN, PCD, PAS y PSN pre-sentaron candidatura comun en 13 delegaciones yen las delegaciones Benito Juarez, Alvaro Obregony Tlahuac, se agrego el DSPPN. Sin embargo elIEDF presento los votos separados por partidoy delegacion, cuyos porcentajes calculamos y sepresentan en el siguiente cuadro. Se destacanlos maximos y mınimos por partido en cada dele-gacion. Ası se puede apreciar que la APC alcanzosu maxima votacion en Azcapotzalco (44.9%) y sumınima en Milpa Alta (12.3%), en tanto que el PRI

tuvo su maximo en Milpa Alta con 31.3% y mınimaen Xochimilco con 20.3%. El PRD, fue el ganadorgeneral de las elecciones.

La APC gano en 6 delegaciones: Alvaro Obregon,Azcapotzalco, Benito Juarez, Miguel Hidalgo, Cua-jimalpa y Venustiano Carranza. En la delegacionGustavo A. Madero, aunque obtuvo la maximavotacion, la delegacion la gano el PRD y sus ali-ados al sumar votos.

Delegacion APC PRI PRD PT CDPPN PCD PSN PARM PAS DSPPN Total02. Azcapotzalco 44.95% 23.34% 25.35% 1.07% 0.27% 1.17% 0.11% 0.48% 0.15% 3.12% 100%03. Coyoacan 29.86% 24.39% 37.59% 2.48% 0.45% 1.28% 0.18% 0.49% 0.23% 3.05% 100%04. Cuajimalpa de Morelos 36.80% 27.33% 31.11% 1.22% 0.26% 0.59% 0.12% 0.35% 0.13% 2.10% 100%05. Gustavo A. Madero 36.01% 23.79% 32.40% 1.79% 0.25% 1.31% 0.13% 0.58% 0.17% 3.58% 100%06. Iztacalco 32.58% 23.70% 34.60% 1.69% 0.30% 1.43% 0.15% 0.79% 0.20% 4.56% 100%07. Iztapalapa 27.39% 23.70% 40.46% 2.02% 0.35% 1.44% 0.16% 0.92% 0.16% 3.39% 100%08. Magdalena Contreras 31.16% 27.15% 33.48% 1.90% 0.31% 1.41% 0.14% 0.69% 0.13% 3.64% 100%09. Milpa Alta 12.37% 31.39% 52.09% 1.82% 0.30% 0.93% 0.17% 0.74% 0.19% 0.00% 100%10. Alvaro Obregon 37.08% 25.92% 29.28% 1.96% 0.25% 0.97% 0.11% 0.82% 0.20% 3.41% 100%11. Tlahuac 26.31% 25.58% 38.77% 2.06% 0.29% 0.87% 0.12% 3.25% 0.13% 2.62% 100%12. Tlalpan 35.26% 21.73% 35.37% 1.56% 0.31% 1.21% 0.13% 0.93% 0.15% 3.35% 100%13. Xochimilco 27.05% 20.38% 43.00% 1.84% 0.35% 1.23% 0.14% 2.85% 0.15% 3.01% 100%14. Benito Juarez 44.67% 21.98% 25.78% 1.09% 0.25% 0.89% 0.11% 1.01% 0.11% 4.11% 100%15. Cuauhtemoc 33.21% 24.62% 33.35% 1.80% 0.33% 1.12% 0.16% 0.63% 0.19% 4.60% 100%16. Miguel Hidalgo 42.89% 24.94% 25.78% 1.10% 0.32% 0.92% 0.12% 0.40% 0.15% 3.37% 100%17. Venustiano Carranza 36.82% 25.08% 30.64% 1.49% 0.27% 1.11% 0.12% 0.58% 0.15% 3.74% 100%Total 34.10% 24.04% 33.94% 1.76% 0.31% 1.20% 0.14% 0.85% 0.17% 3.49% 100%

Cuadro 1: Distribucion porcentual de votos para delegados en el Distrito Federal, ano 2000.

Profesor: Numero II 44 Julio 2014

Page 46: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestreo y Estadıstica Pluralidad y Diversidad Polıtica en el Distrito Federal

Se observa que los tres partidos APC, PRI y PRDsuman poco mas del 92% de los votos para distribuirmenos del 8% en los partidos restantes.

El valor maximo que puede tomar la medida de en-tropıa de Shannon al considerar 10 elementos o par-tidos, en este caso, es igual a max(H)= 3.321981.Ası que si se calcula H para cada delegacion y sedivide entre max(H) se tiene una medida en escala0 a 100 que permite su comparacion con diferenteselecciones y estructuras de partidos.

El calculo de IDP para la votacion total de los 10partidos considerando el total de votos en el DistritoFederal es IDP = 0.582. En la figura 1 se muestranlos valores de IDP para las 16 delegaciones. Ladelegacion con maxima diversidad es Tlahuac (IDP= 0.596). Es congruente con los porcentajes obser-vados, relativamente cercanos para los 3 partidosdominantes y el PT que alcanza su maxima votacion(2.06%) . En el otro extremo Milpa Alta con IDP= 0.482. Este resultado se torna logico al ver queel PRD tuvo su mas elevada votacion (52.09%) y laAPC su mas baja (12.37%).

Delegacion H IDP1. Tlahuac 2.003811427 0.5962. Iztacalco 1.895642171 0.5933. Cuauhtemoc 1.934963958 0.5904. Xochimilco 2.023096338 0.5905. Magdalena Contreras 1.878995755 0.5886. Coyoacan 2.041058203 0.5857. Iztapalapa 2.000518351 0.5848. Alvaro Obregon 2.051132573 0.5799. Gustavo A. Madero 2.020046289 0.57810. Tlalpan 2.033345799 0.57511. Venustiano Carranza 1.910976834 0.57412. Benito Juarez 1.666549222 0.55913. Miguel Hidalgo 2.061174171 0.55214. Azcapotzalco 1.989209521 0.54815. Cuajimalpa de Morelos 1.985640074 0.54316. Milpa Alta 2.039912973 0.482Distrito Federal 2.013821715 0.582

Figura 1: Indice de Diversidad Polıtica por delegacion. Ano 2000.

Profesor: Numero II 45 Julio 2014

Page 47: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestreo y Estadıstica Pluralidad y Diversidad Polıtica en el Distrito Federal

3. Eleccion de Delegados en el Distrito Federal ano 2012

En las elecciones para delegados de 2012, la votacion total, con la omision de votos nulos fue de 4,617,907.La participacion calculada por IEDF fue de 67 %. El PRD formo la coalicion identificada como MovimientoProgresista con la adicion del PT y MC. Por su parte el PRI junto con el PVEM integraron la coalicionCompromiso por Mexico. En esa eleccion participaron 7 partidos:

1. PAN Partido Accion Nacional2. PRI Partido Revolucionario Institucional3. PRD Partido de la Revolucion Democratica4. PT Partido del Trabajo5. PVEM Partido Verde Ecologista de Mexico6. MC Movimiento Ciudadano7. PANAL Partido Nueva Alianza

En el cuadro 2 se resumen los porcentajes de votacion por delegacion y partido. Se observa que el PRI-PVEM gano la Delegacion de Cuajimalpa, en tanto que el PAN triunfo en Benito Juarez. Las restantes14 delegaciones fueron ganadas por el PRD y sus aliados.

Indudablemente en los 12 anos que separan ambas elecciones analizadas, el PRD gano una enormepresencia con una espectacular caıda del PAN de 34.1 % en la votacion global de 2000 al 18.4 % en 2012.

Delegacion PAN PRI PRD PT PVEM MC PANAL Total02. Azcapotzalco 20.76% 22.87% 45.18% 3.53% 2.03% 2.58% 3.05% 100.0%03. Coyoacan 25.83% 15.91% 48.02% 4.19% 1.55% 2.48% 2.01% 100.0%04. Cuajimalpa de Morelos 23.60% 35.18% 33.53% 1.82% 2.75% 1.29% 1.83% 100.0%05. Gustavo A. Madero 15.53% 19.23% 53.27% 4.21% 2.32% 2.75% 2.69% 100.0%06. Iztacalco 12.49% 27.05% 48.76% 4.06% 2.61% 2.49% 2.54% 100.0%07. Iztapalapa 10.53% 18.01% 56.83% 5.82% 2.70% 3.21% 2.91% 100.0%08. Magdalena Contreras 13.64% 29.77% 46.11% 4.32% 1.80% 2.12% 2.24% 100.0%09. Milpa Alta 6.81% 39.04% 43.58% 3.72% 1.60% 1.82% 3.43% 100.0%10. Alvaro Obregon 26.07% 18.08% 45.25% 3.93% 2.09% 2.18% 2.41% 100.0%11. Tlahuac 12.98% 27.24% 44.41% 4.05% 3.35% 2.41% 5.56% 100.0%12. Tlalpan 19.75% 16.12% 51.94% 4.93% 2.15% 2.76% 2.35% 100.0%13. Xochimilco 14.09% 16.47% 53.17% 5.08% 5.10% 2.84% 3.25% 100.0%14. Benito Juarez 40.60% 16.00% 34.09% 4.03% 1.45% 2.26% 1.57% 100.0%15. Cuauhtemoc 16.75% 23.86% 47.18% 4.31% 2.39% 2.87% 2.63% 100.0%16. Miguel Hidalgo 33.82% 18.03% 40.27% 2.97% 1.49% 1.93% 1.49% 100.0%17. Venustiano Carranza 11.10% 21.31% 56.11% 3.83% 2.43% 2.80% 2.42% 100.0%Totales 18.48% 20.16% 49.37% 4.39% 2.36% 2.63% 2.61% 100.0%

Cuadro 2: Distribucion electoral de delegados en el Distrito Federal del ano 2012.

Profesor: Numero II 46 Julio 2014

Page 48: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestreo y Estadıstica Pluralidad y Diversidad Polıtica en el Distrito Federal

El incremento de concentracion de votos a favor del PRD, necesariamente debe verse reflejado en elcalculo de IDP. Con 7 partidos el valor maximo que puede alcanzar H, la medida de entropıa de Shannones max(H)=2.807355. En la imagen 2 se presentan los IDP para las 16 delegaciones. El IDP general dis-minuyo de 0.582 en 2000 a 0.346 en 2012. La delegacion con mayor diversidad nuevamente fue TlahuacIDP= 0.364 y la de menor diversidad fue nuevamente Milpa Alta ahora con IDP = 0.318.

Delegacion H IDP1. Tlahuac 1.02159 0.3642. Xochimilco 0.98751 0.3523. Azcapotzalco 0.98486 0.3514. Cuauhtemoc 0.98295 0.3505. Alvaro Obregon 0.97012 0.3466. Cuajimalpa de Morelos 0.95348 0.3407. Iztacalco 0.95248 0.3398. Tlalpan 0.95174 0.3399. Benito Juarez 0.94813 0.33810. Magdalena Contreras 0.94562 0.33711. Coyoacan 0.94412 0.33612. Gustavo A. Madero 0.94157 0.33513. Miguel Hidalgo 0.93423 0.33314. Iztapalapa 0.93098 0.33215. Venustiano Carranza 0.90319 0.32216. Milpa Alta 0.89381 0.318Distrito Federal 0.97033 0.346

Figura 2: Indice de Diversidad Polıtica por delegacion. Ano 2012.

La mayor concentracion de votos a favor del PRD y sus partidos aliados se refleja en el notable decre-mento del IDP. El ano 2015 sera nuevamente escenario de elecciones de delegados en el Distrito Federal.La experiencia muestra que si las estructuras de las coaliciones que integran los partidos permanece igual,no habra cambios sustantivos. Si por el contrario se conforman dos grandes coaliciones, la primera con-formada por el PRD y sus aliados y la segunda, una previsible alianza PAN, PRI y PVEM, aproximandosea un bipartidismo de facto, las elecciones seran mucho mas competidas.

Profesor: Numero II 47 Julio 2014

Page 49: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

Revista de Muestreo y Estadıstica Pluralidad y Diversidad Polıtica en el Distrito Federal

Referencias

[1] R. B. Ash. Information Theory. Dover Books on Mathematics. Dover Publications., 1965.

[2] J. Krebs, Charles. Ecology the Experimental Analysis of Distribution and Abundance. Ecology Series.Harper & Row, Publishers, 1978.

[3] S. Kullback. Information Theory and Statistics. Dover Books on Mathematics. John Wiley & Sons,1959.

[4] F. Sanchez Villarreal. Pluralidad y Diversidad Polıtica en Mexico. Indice basado en Entropıa de Shan-non. Revista Estadıstica y Muestreo. Ano I Num 01, pag. 6-9. Facultad de Ciencias. UNAM, 2014.

[5] H. R. W. Coding and Information Theory. Springer Undergraduate Mathematics Series. PrenticeHall, Inc, 1980.

[6] N. Wiener. Cibernetica y Sociedad. Consejo Nacional de Ciencia y Tecnologıa, 1981.

[7] N. Wiener. Cibernetica o el Control y Comunicacion en Animales y Maquinas. Turquets Editores,1985.

Profesor: Numero II 48 Julio 2014

Page 50: Revista de Estadística y Muestreo Núm 02pragmamexico.com.mx/revista/Revista02.pdfPara una verificacion emp´ ´ırica de los resultados anteriores se procedi o a simular 1,000 muestras

.