palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de...

68
.

Transcript of palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de...

Page 1: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

.

Page 2: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

palabra

Page 3: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica

Indice

Directorio 3

Presentacion 5

Sismos en MexicoDistribucion de Magnitud, Frecuencia y Localizacion 7

Ley de BenfordComportamiento del Primer Dıgito en Bases no Decimales 17

Generalidades sobre Estimadores de Cambio para MediasAnalisis de sus Fundamentos 33

Funcion de Distribucion de WeibullCaracterısticas y Estimacion de sus Parametros 49

Numero V 1 Mayo 2018

Page 4: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

palabra

Page 5: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

palabra

DIRECTORIO

REVISTA DE ESTADISTICA Y MUESTREO

Francisco Sanchez Villarreal.Director.

Jose Oscar Rosales Vergara. Susana Barrera Ocampo.Mesa de Redaccion.

Guillermo Aaron Espinosa Reyes.Diseno y Elaboracion Editorial.

REVISTA DE ESTADISTICA Y MUESTREO. Ano IV Numero 5. Mayo de 2018. Es una revista electronicaeditada por un grupo de alumnos, ex-alumnos y profesores de Estadıstica de la Facultad de Ciencias dela UNAM que aborda temas de aplicacion de Estadıstica y Muestreo probabilıstico en temas diversoscomo Actuarıa, Biologıa, Control de Calidad, Demografıa, Economıa, Ecologıa, Educacion, Investigacionde Mercados, Psicologıa, Sociologıa, Salud, etc. Sus fines son la exposicion y difusion de metodos y pro-cedimientos que apoyen la ensenanza y aplicacion de la Estadıstica y el Muestreo.

Responsable de la publicacion:Francisco Sanchez [email protected]

Page 6: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

palabra

Page 7: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

PRESENTACION

La REVISTA DE ESTADISTICA Y MUESTREO es una nueva publicacion electronica de acceso gratuito,producto del entusiasmo y trabajo coordinado de un grupo de profesores, alumnos y ex-alumnos del area deEstadıstica de la Facultad de Ciencias de la UNAM, con el proposito de difundir conocimientos de las areasreferidas con una vision preponderante en la aplicacion. La Estadıstica como ciencia en la sociedad actual,autodefinida como sociedad de la informacion, ha incrementado notablemente su presencia pues proveede metodos y tecnicas cientıficamente soportados que facilitan la adquisicion, organizacion y analisis dedatos que con el apoyo de modelos formales ayudan a entender en forma sistematica y objetiva una ampliagama de fenomenos naturales y los generados por la intervencion de los seres humanos. Los datos quese recolectan de los fenomenos en general son parciales y limitados por diversas causas, sin embargo, enel supuesto de que su recoleccion se base en procedimientos formales de aleatorizacion, constituiran unamuestra aleatoria, a partir de la cual la Estadıstica permitira inferir, generalizar los resultados a toda lapoblacion de referencia y la verificacion de hipotesis de causalidad o interdependencia entre las variablesanalizadas.

La Estadıstica debe su importancia a la utilidad que significa para las disciplinas cientıficas que basanla construccion de conocimientos a partir del estudio de hechos y fenomenos sujetos a observacion o expe-rimentacion. Estas disciplinas recurren con mayor frecuencia a los metodos y modelos estadısticos paravalidar sus descubrimientos y verificar hipotesis. La tecnologıa ha impulsado exponencialmente nuevosmetodos y fuentes de datos estadısticos y simultaneamente los ha puesto al alcance de cualquier investi-gador o estudiante. La Estadıstica, excluyendola de los campos de aplicacion, tiene su interes esencial enla identificacion, medicion y eventualmente el control de los factores que contribuyen a la varianza de losaspectos relevantes de un fenomeno que se identifican genericamente como variables.

La ensenanza de la Estadıstica resulta incompleta si no incorpora ejemplos de aplicaciones que no selimiten a planteamientos simplistas y fuera de contexto que solamente ilustran la mecanica de calculo,los propios alumnos de los diferentes cursos de estadıstica reclaman continuamente la aplicacion realistade los temas abordados por los profesores, pretendemos a traves de este medio llenar parcialmente esanecesidad.

Se recomiendan ampliamente las ediciones anteriores de la REVISTA DE ESTADISTICA Y MUESTREO, ennuestra contraportada se adjunta el codigo QR para la descarga gratuita de los ejemplares anteriores.

Invitamos a los lectores a enriquecer y sostener la publicacion de este medio con documentos metodologicos,reportes de investigaciones, resumenes de tesis, etc. Con agrado los incluiremos en los siguientes numerosde la revista, basta comunicarse a nuestro correo electronico para obtener detalles en el procedimiento decolaboracion.

Francisco Sanchez VillarrealMayo 2018

Page 8: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

palabra

Page 9: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Francisco Sanchez Villarreal

Sismos en MexicoDistribucion de Magnitud, Frecuencia y Localizacion

Page 10: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

palabra

Page 11: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Sismos en Mexico

SISMOS EN MEXICODISTRIBUCION DE MAGNITUD, FRECUENCIA Y LOCALIZACION

Francisco Sanchez Villarreal∗

1. Sismos

U N SISMO o seısmo (del griego σεισµoς) se percibe como una sacudida brusca de corta duracion de lacorteza terrestre, provocada por la liberacion de energıa en forma de ondas sısmicas. Las causas

mas comunes son los desplazamientos de las placas tectonicas y procesos volcanicos, aunque tambienpuede tener causas artificiales como las explosiones de bombas nucleares o la actividad conocida comofracturacion hidraulica o “fracking”. El punto bajo la corteza terrestre donde se origina el sismo se deno-mina hipocentro y el punto en la superficie se identifica como epicentro. Los sismos son muy frecuentes,cada dıa se registra un promedio de 16 sismos de magnitud 1 y mayores en diversos puntos del paıs.Percibimos solamente aquellos de mayor magnitud y con epicentro cercano.

La magnitud de los sismos ha sido motivo de diferentes escalas. Las de mas reciente aplicacion son lasde Mercalli con 12 grados y que se basa en los efectos y danos causados a las estructuras constructivas.Posteriormente se utilizo la escala logarıtmica de Ritcher cuya base de medicion es energıa liberada. Masreciente, para diferenciar en forma mas precisa los sismos de magnitud mayor a 6.9 se utiliza la EscalaSismologica de Magnitud de Momentos.

Mexico presenta zonas cuya estructura geologica da lugar a sismos de mediana y gran magnitud enperıodos relativamente frecuentes Los sismos han sido preocupacion de la poblacion y de los geologosespecializados. Se han efectuado multitud de investigaciones tendientes a su prediccion lo cual no hasido logrado, sin embargo, los patrones caracterısticos detectados por el sistema de sismografos, permitenalertar a la poblacion con antelacion de un minuto o menos, en funcion de su ubicacion.

Las distribuciones de los sismos por su magnitud, frecuencia y ubicacion, constituyen una interesanteoportunidad de analisis estadıstico que es el tema principal de este artıculo.

∗Asesor Internacional en Estadıstica y Muestreo.Profesor de Carrera en el Departamento de Matematicas en la Facultad de Ciencias, UNAM.E-mail: [email protected]

Numero V 9 Mayo 2018

Page 12: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Sismos en Mexico

2. Republica Mexicana

En la Republica Mexicana confluyen cinco placas tectonicas: la Placa de Norteamerica, Placa del Caribe,Placa de Cocos, Placa del Pacıfico y la Placa de Rivera. Ello provoca una elevada sismicidad. Debido asu frente directo con los lımites de las placas del Caribe, Cocos y Rivera; los estados mas expuestos sonChiapas, Oaxaca, Guerrero, Michoacan y Jalisco. Las ondas sısmicas afectan tambien a los estados deMorelos, Puebla, Mexico y desde luego a la Ciudad de Mexico.

Figura 1: Placas Tectonicas en Mexico

En la historia reciente se han registrado sismos notables, como del 28 de junio de 1957 de magnitud 7.7,recordado por la caıda del Angel de la Independencia y por la perdida de 52 vidas, el del 19 de septiembrede 1985 con una magnitud de 8.1 grados, seguido por otro sismo al dıa siguiente, 20 de septiembre, de7.6 grados, El numero de vıctimas de estos sismos se estima en alrededor de 20 mil personas. El dıa 9de septiembre de 2017 se registro un sismo de magnitud 8.2 en las costas de Chiapas que ocasiono 102vıctimas mortales en Chiapas y Oaxaca. Paradojicamente 10 dıas despues el 19 de septiembre de 2017se registro un sismo de 7.1 grados que fue la culminacion de un grupo de sismos de magnitud mayor a5. Este ultimo sismo produjo 369 vıctimas. Su efecto fue particularmente importante en la Ciudad deMexico, por la cercanıa de su epicentro situado a 120 km., en el estado de Puebla. Por fortuna el epicentrodel sismo del 7 de septiembre de 2017 se ubico a140 km. en las costas de Chiapas, de haberse situado mascerca su epicentro, la destruccion y vıctimas hubieran sido notablemente mayores.

Numero V 10 Mayo 2018

Page 13: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Sismos en Mexico

El Sistema Sismologico Nacional cuenta con una base de datos que registra, fecha, hora, magnitud, ubi-cacion del epicentro, profundidad del hipocentro y localidad de referencia cercana. A partir de esta basese extrajeron los datos de sismos del 1 de enero de 2000 al 18 de mayo de 2018. La base seleccionadacontiene 107,692 sismos con magnitudes mınima de 1.2 y maxima de 8.2.

Para mayor sencillez del analisis, se excluyeron los sismos menores de 5 grados, por considerar que lossismos de 5 y mas grados son percibidos claramente por la poblacion y desde luego pueden afectar lasestructuras. El numero de sismos seleccionado se redujo a 669.

3. Localizacion

El mapa 2 muestra los epicentros de los sismos de magnitud 5 y mayores. Claramente su dispersion sealinea en los bordes de las costas del Pacıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.Tambien se observa una serie de epicentros en el Mar de Cortes, que coinciden con una prolongacion dela famosa falla de San Andres la cual penetra en el estado de California, Estados Unidos.

Figura 2: Epicentros de sismos con magnitud 5.0 y mas

Numero V 11 Mayo 2018

Page 14: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Sismos en Mexico

4. Magnitud

Las magnitudes de los sismosmayores o iguales a 5 puntos enla escala de Richter presentanun rapido descenso. Entrelos 669 sismos de magnitudesiguales o mayores a 5 grados,se observaron 159 de magnitudigual a 5.0, esto es 24%. Elnumero de sismos de 6 o masgrados se redujo a 23. Enla figura se observa la caıdaexponencial de la frecuencia demagnitudes.

Figura 3: Frecuencias Relativas Sismos con magnitud 5.0 y mas

Para modelar la distribucion de las magnitudes de los sismos de 5 y mas grados, se probaron variasdistribuciones: Exponencial Negativa, Frechet, Weibull y Gumbel, la distribucion que mejor se ajusto fuela de Gumbel, cuyas funciones de densidad y distribucion acumulativa son las siguientes.

F (x) = e−e−x−µβ

f(x) =1

βe

(−x− µ

β− e−

x−µβ

); µ ∈ R, β > 0

Para la estimacion de los parametros β y µ se utilizo el metodo de momentos. Se partio de las formulasdel valor esperado y varianza del modelo que al ser sustituidas por la media y varianza muestrales, dieronlugar a las siguientes ecuaciones:

β =S√

6

πµ = X − γβ

donde X es la media aritmetica, S es la desviacion estandar y la constante de Euler γ = 0.577215664901532.

Numero V 12 Mayo 2018

Page 15: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Sismos en Mexico

Las estimaciones obtenidasfueron adoptadas como valoresiniciales y posteriormente opti-mizadas mediante un procesoiterativo. Los valores de losparametros obtenidos al finalson los siguientes:

β = 0.399999683897747

µ = 5.02812493741332

Figura 4: Distribuciones Acumulativas Empırica y Gumbel Ajustada

El cuadro 1 y las figuras 4 y 5 de las frecuencias observadas y calculadas de acuerdo al Modelo deDistribucion Gumbel ajustado, permiten afirmar que al registrarse un sismo de 5 grados o mayor, la pro-babilidad de que alcance 6 o mas grados se reduce a 8,5% y de que sea de 7 grados o mayor se reduce amenos de 1%.

Intervalo de Frecuencia Frecuencia F(x) F(x) Probabilidad FrecuenciaMagnitud Observada Relativa Empırica Ajustada Intervalo Calculada5.00 a 5.25 349 0.52167 0.521674 0.563126 0.563126 3775.25 a 5.50 156 0.23318 0.754858 0.735375 0.172249 1155.50 a 5.75 56 0.08371 0.838565 0.848296 0.112921 765.75 a 6.00 51 0.07623 0.914798 0.915702 0.067406 456.00 a 6.25 19 0.02840 0.943199 0.953956 0.038254 266.25 a 6.50 19 0.02840 0.971599 0.975085 0.021128 146.50 a 6.75 6 0.00897 0.980568 0.986586 0.011501 86.75 a 7.00 5 0.00747 0.988042 0.992797 0.006212 47.00 a 7.25 4 0.00598 0.994021 0.996138 0.003341 27.25 a 7.50 2 0.00299 0.997010 0.997931 0.001793 17.50 a 7.75 1 0.00149 0.998505 0.998892 0.000961 17.75 a 8.00 0 0.00000 0.998505 0.999407 0.000515 08.00 a 8.25 1 0.00149 1.000000 0.999682 0.000276 0

669 669

Cuadro 1: Distribucion de Magnitudes Observadas y Calculadas por el Modelo de Gumbel

Figura 5: Distribucion de Magnitudes de Sismos de 5 grados y mas

Numero V 13 Mayo 2018

Page 16: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Sismos en Mexico

5. Frecuencia

El intervalo de tiempo promedio entre la ocurrencia de sismos de magnitud 5.0 o mayor en cualquierparte del paıs es de 10.03 dıas, sin embargo la distribucion es asimetrica y un 50% de este tipo de sismosocurren con 5 o menos dıas de diferencia. El 30% ocurren dentro de las siguientes 24 horas. La figura 6corresponde a una lınea de tiempo de 3 anos de duracion a partir de enero de 2000 a diciembre de 2002.

Figura 6: Distribucion de Sismos en la Lınea de Tiempo durante tres anos

Los sismos no presentan una distribucion uniforme en el tiempo, se observan agrupamientos de sismosanteriores y posteriores a sismos de mayor magnitud. Es usual hablar de replicas de magnitud menor osimilar a la de un sismo de mediana o gran magnitud, pero tambien se suelen registrar sismos menores,previos a uno de mayor magnitud. Los sismografos registran varios tipos de ondas de propagacion (P,S,Love y Rayleigh), en funcion de su velocidad de desplazamiento y energıa. Con estos datos una red desismografos puede determinar en forma muy precisa el epicentro y profundidad mediante triangulacion,trilateracion y la mas moderna Global Navigation Satellite System (GNSS).

Si consideramos sismos mas fuertes y que son claramente percibidos, como los de 6.0 grados de mag-nitud o mayores, tienen un perıodo promedio de 87 dıas. Esto es en promedio cada 3 meses se presentaen alguna parte del paıs un sismo lo suficientemente fuerte para ser percibido en algunas poblaciones ycausar diversos danos a las personas y a las estructuras.

La distribucion empırica de las diferencias en dıas entre dos sismos de magnitud de 5 grados o mayoradopta una forma asimetrica con una caıda exponencial.

Numero V 14 Mayo 2018

Page 17: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Sismos en Mexico

Figura 7: Distribucion dela Diferencia de Dıas entre dos Sismos Consecutivos

Se ajusto una distribucion exponencial negativa con parametro λ = 9.24575289. Ello permite, por ejem-plo, calcular la probabilidad de que una vez que se registro un sismo de 5 grados o mas, el siguiente sismotenga una probabilidad de 80% de suceder en 15 dıas o menos.

F (x) = 1− e−xλ , x > 0, λ > 0 f(x) =

1

λe−

La principal preocupacion se centra en sismo de 6.5 o mayores, pues estos sismos, con alta probabilidadcausan danos personales y materiales. Este tipo de sismos tienen una frecuencia media de un ano. Sinembargo, como se menciono al inicio, los danos que causarıan en una localidad en particular dependen dela distancia de la localidad al epicentro y profundidad del hipocentro.

La Ciudad de Mexico fue muy afectada por el sismo de 1985, cuya magnitud alcanzo 8.1 grados, conepicentro a 380 Km. en la costa de Michoacan. El del 19 de septiembre de 2017 fue de menor magnitud,7.1 grados, pero con epicentro a solo 125 Km., al noroeste de Chiautla, Puebla. El sismo mas fuerte de losultimos 18 anos fue el del 7 de septiembre de 2017, con 8.2 grados, pero su epicentro se ubico en el OceanoPacıfico, a 100 kilometros al sur de la costa de Chiapas y a 2,150 Km. de la ciudad de Mexico. En estos18 anos se registraron 6 sismos de 7.2 a 7.6 grados con epicentros entre 350 y 892 km. de la ciudad deMexico. Afortunadamente sismos de 8 grados o mayores se han observado con una frecuencia de aproxi-madamente cada 30 anos. La probabilidad de que el siguiente sismo alcance 8 o mas grados es 0.00076,en consecuencia, no debemos vivir con un excesivo temor y no dar credito a previsiones apocalıpticas sinfundamento.

Numero V 15 Mayo 2018

Page 18: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Sismos en Mexico

Referencias

[1] Vıctor M. ; Shri Krishna I. Cruz Atienza and Mario Ordaz. ¿Que ocurrio el 19 de septiembre de 2017en Mexico? Revista Ciencia UNAM, 09 2017.

[2] Centro Nacional de Prevencion de Desastres. Sismos. http://www.cenapred.gob.mx/es/Publicaciones/archivos/131-FOLLETOSISMOS.PDF, 2014.

[3] N.;Balakrishnan N. Kotz, S.; Johnson. Aspectos Fundamentales de la Geologıa y Sismologıa paraMicrozonacion Sısmica. US Geological Service. John Wiley& Sons. New York., 2000.

[4] Servicio Sismologico Nacional. http://www.ssn.unam.mx, 2018.

[5] W. Hays Walter. Aspectos Fundamentales de la Geologıa y Sismologıa para Microzonacion Sısmica.US Geological Service. Ed. Univ. Compı. Madrid, 1989.

Numero V 16 Mayo 2018

Page 19: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Guillermo Aaron Espinosa Reyes

Ley de BenfordAplicacion en Bases No Decimales

Page 20: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

palabra

Page 21: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Ley de Benford en Bases No Decimales

LEY DE BENFORDCOMPORTAMIENTO DEL PRIMER DIGITO EN BASES NO DECIMALES

Guillermo Aaron Espinosa Reyes∗

“ ¿Como puedes tener [...] numeros? Los numeros pertenecen al mundo”: Donald Knuth

Introduccion

EL METODO CIENTIFICO AL IGUAL QUE EL CONOCIMIENTO COMUN O EMPIRISMO se auxilia de la ob-servacion que nos proporcionan los sentidos para dar interpretaciones a los fenomenos. Una diferen-

cia entre el metodo cientıfico y empirismo es que el metodo cientıfico controla, mide, cuestiona y sistema-tiza la observacion, concluyendo resultados que en ocasiones contradicen a nuestra percepcion.

En el numero II de esta edicion [Esp14] hablamos de la Ley de Benford. Esta Ley a grandes rasgosnos dice que en los registros cotidianos, o en enormes listados de datos, su primer dıgito significativotiene el siguiente comportamiento, el dıgito 1 es el mas frecuente, y mientras se incrementa el valor deldıgito la frecuencia de aparicion del dıgito observado va disminuyendo. Nuestra percepcion inicial nosharıa concluir que al extraer el primer dıgito significativo no tendrıamos algun comportamiento en sufrecuencia, pero analizando con mayor profundidad el fenomeno nos permite verificar que en realidadesta frecuencia de aparicion tiene el curioso comportamiento que ya hemos explicado (se recomiendaampliamente la lectura de la referencia para tener ubicarse en el adecuado contexto del presente artıculo).De acuerdo a lo descrito en el parrafo anterior cada vez que abordamos el tema damos mayor solidez anuestras observaciones explicando mejor el fenomeno que describimos.

El problema ha sido tratado en anteriores ediciones de esta revista y se han abordado nuevos aspectosde esta ley. En otra edicion [Esp16] se estudio acerca de la ley sobre los dıgitos de orden superior, y en estaocasion abordaremos nuevamente el problema del primer dıgito significativo pero ahora lo revisaremoscuando cambiamos a bases no decimales. Es decir, a nuestro compendio de magnitudes les aplicaremosun cambio de base y sobre estas nuevas palabras de dıgitos observaremos el primer dıgito significativo.Es evidente que este sufrira un cambio debido al cambio de base pero ¿que nos dice la Ley de Benford eneste cambio de base? Sobre esta pregunta trata el presente artıculo.

2. Primer dıgito y cambio de base

Desde la antiguedad el Hombre ha tenido lanecesidad del conteo. El hombre primitivo tuvonecesidad de contar cabezas de ganado, troncos dearboles, rocas, etc. Mientras las tribus se desarro-llaban en sociedades cada vez mejor organizadas

y mas especializadas, el conteo fue cada vez mascomplicado y las magnitudes poco a poco fueronmayores. La representacion de los numeros con eltiempo tuvo que ser sistematizada para el manejode registros.

∗Egresado de Facultad de Ciencias UNAM.E-mail: [email protected]

Numero V 19 Mayo 2018

Page 22: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Ley de Benford en Bases No Decimales

Una de las formas de sistematizar los conteos fuemediante la representacion de las magnitudes conlos sistemas de numeracion. Actualmente el masusado es el decimal, los antropologos consideranmuy probable que la relacion con los diez dedos enel hombre sea la causa de que se usen diez dıgitos.Los primeros en usar un sistema decimal fueron losegipcios, los babilonios le hicieron algunas mejoras.El sistema decimal que usamos actualmente vienede los arabes [For03] (p.28).

Existen sistemas de numeracion llamados sistemasde numeracion posicionales. A grandes rasgos eneste tipo de sistemas numericos el aporte de cadacifra o dıgito depende no solo del valor de este sinotambien de la posicion en la palabra donde se halle.El numero de dıgitos en los actuales sistemas denumeracion posicionales depende de la base delsistema. Es decir, en el caso del sistema de nu-meracion decimal tenemos diez dıgitos, en el sis-tema de numeracion octal tenemos ocho, en estossistemas cada dıgito tiene un valor dependiendo dela posicion en la palabra donde se halle.

Mientras se han desarrollado las sociedades a lapar de la ciencia y tecnologıa, el sistema decimalha sido insuficiente en el quehacer diario, se necesi-tan sistemas de numeracion diferentes al usual. Porejemplo el lenguaje binario con dos dıgitos {0, 1} nosrepresenta fielmente el papel que juega cada locali-dad de memoria fısica en un instante determinadoen una computadora, ası el sistema de numeracionbinario es mas util para simulaciones de procesosen discos duros por dar un ejemplo. Tambien u-samos sistemas numericos con mas de diez dıgitos

como el sistema de numeracion hexadecimal condieciseis valores {0, 1, . . . , 9, A,B,C,D,E, F} ya quemientras se desarrollan los campos de especializa-cion y los censos se hacen mas grandes, las valoresocupan muchos dıgitos, por ello el sistema hexade-cimal nos facilita en ocasiones el manejo de magni-tudes, sobre todo cuando son muy largas de expre-sar.

Ası tenemos en la actualidad diversidad de sis-temas de numeracion en nuestras sociedades mo-dernas, algunos son mas practicos que otros depen-diendo del uso que deseemos darles [For03] (pp.14-49).

En cuanto a la Ley de Benford debemos resaltar losiguiente. Esta ley o principio hace una afirmacionsobre el primer dıgito significativo en la magnitudobservada. Recordemos que el primer dıgito deun registro numerico [Esp14] (p.17) es aquel que,leyendolo de izquierda a derecha, aparece en primerlugar.

Se hace este recordatorio de conceptos por lo si-guiente, primero porque estamos tomando otro en-foque de la Ley de Benford y son conceptos utiles,pero ademas porque senalaremos que los conceptosbasicos en este tema solo son utiles en sistemas denumeracion posicionales. Por lo tanto si estudia-mos la Ley de Benford con un cambio de base debe-mos tener en cuenta que esta ley solo es aplicablea sistemas de numeracion posicionales. Desde estepunto en adelante en el presente artıculo cuandohablemos de cambio de base o cambio de sistema denumeracion nos referiremos a bases en sistemas denumeracion posicionales.

3. Ley de Benford o Ley del Primer Dıgito en base decimal

Recordemos lo que enuncia Ley de Benford. Esteprincipio se refiere a la frecuencia observada so-bre el primer dıgito significativo en cada una delas magnitudes en listados de registros con distin-tos niveles de unidad, es decir, unidad, decena, cen-tena, unidad de millar, decena de millar, centena

de millar, unidad de millon, etc. Estos listadospueden ser censos de poblacion de especies, votospor un partido polıtico, viviendas en localidades deun paıs, magnitudes astronomicas, perımetros demunicipios, conteos virales, . . . , etc. en nuestrasocupaciones diarias.

Numero V 20 Mayo 2018

Page 23: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Ley de Benford en Bases No Decimales

Figura 1: Compendio de Magnitudes

La Ley de Benford para el primer dıgito, la cualfue discutida en el segundo numero de esta publi-cacion [Esp14] nos dice que si extraemos el primerdıgito significativo k de cada registro, esperarıamosempıricamente que k tome con una probabilidadsimilar los valores 1, 2, . . . , 9. En terminos mas for-males creemos que la probabilidad de aparicion encada dıgito se puede expresar como una variablealeatoria uniforme, de la siguiente forma

∀ k 1 ≤ k ≤ 9; p(k) =1

9

Sin embargo, en los hechos al extraer el primerdıgito significativo de cada registro y medir su com-portamiento, hay una marcada presencia de losdıgitos menores, y son raras las apariciones de losdıgitos mayores, es decir, el comportamiento de laprobabilidad de aparicion en los dıgitos no es uni-forme [Fel07] (pp.92-93) como lo esperabamos.

La ley de Benford (cuadro 1 ) nos describe la pro-babilidad teorica de aparicion. Recordemos que elprimer dıgito significativo nunca es cero y por esono aparece en el cuadro.

Dıgito k p (k)1 30.10%2 17.61%3 12.49%4 9.69%5 7.92%6 6.69%7 5.80%8 5.12%9 4.58%

Total 100.0%

Cuadro 1: Distribucion del primer dıgito k

La probabilidad de aparicion del primer dıgitosegun Benford viene dada por

Log(k + 1)− Log(k) = p(k) (1)

En la presente edicion, segundo numero ya discuti-mos la distribucion del primer dıgito significativo yla construccion de esta tabla. Ademas se comprobocon multiples ejemplos tales probabilidades.

Un desarrollo alternativo de la expresion 1 es elsiguiente:

log(k + 1)− log(k) = p(k)

log(k + 1

k

)= p(k)

log

(1 +

1

k

)= p(k) (2)

Recordemos que el cuadro 1 y la figura 2 son cons-truidas tomando en cuenta una base decimal y soloson validos estos numeros en tal base.

Figura 2: Distribucion de Benford del Primer dıgito

Numero V 21 Mayo 2018

Page 24: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Ley de Benford en Bases No Decimales

4. Ley de Benford y cambio de base

Es en esta seccion donde abordamos la parteteorica de nuestro tema central de este artıculo..

En [Esp14] hicimos la construccion de la Ley deBenford la cual se reviso en la seccion anterior. Lacuestion central en este artıculo es ¿que cambiostendra esta ley, con el cambio desde la base deci-mal a una base no decimal? Como mencionamos enla seccion anterior las probabilidades se calcularonpartiendo de magnitudes expresadas en base deci-mal

Puntualizamos lo siguiente:

• La Ley de Benford es una medida de probabi-lidad sobre un conjunto de dıgitos.

• En [Esp14] (p.20) en esta edicion quien estoescribe se auxilio de la funcion log10(k)

• Se recurrio en [Fel07] (p.92) a la funcionlog(Y ) suponiendo 10nk < Y < 10n(k + 1) conk ∈ {1, 2, . . . , 9} Esto significa implıcitamenteque partimos desde el supuesto que, la magni-tud Y es un numero en base decimal.

• En [Hil95] (p.891) se explica que funcionlogb(k) expresada como medida de probabili-dad no varıa respecto a la base b que usemos,conserva la relacion si el cambio de base seaplica tanto al argumento como al resultado.

• En [Jam01](p.26) se explica que en los de-sarrollos matematicos de Benford, donde sehace presente la base 10 (particularmente enla funcion logaritmo), todas las propiedades ylas definiciones se conservan con el cambio debase.

En [Esp14] mostramos la Ley de Benford revisandoun valor Y10 para observar su primer dıgito signi-ficativo. Retomaremos el desarrollo considerando elnumero transformado a otra base Yb con b 6= 10:

Consideremos un listado de magnitudes quecumple la Ley de Benford. Si tomamos un numerode magnitudes al azar podemos considerar Yb > 0como una variable aleatoria con alguna distribuciondesconocida. El primer dıgito significativo descono-cido en Yb es igual a k si y solo si

bnk ≤ Yb < bn(k + 1)

para alguna n. De este modo, si tomamos logarit-mos en base b

n + Logb(k) ≤ X < n + Logb(k + 1)

para la variable X = LogbY .

Si la dispersion de Y es muy grande, la variableX esta distribuida aproximadamente en forma uni-forme, entonces la probabilidad pk, de que el primerdıgito significativo sea igual a k es proxima a

Logb(k + 1)− Logb(k) = pb(k) (3)

Un desarrollo alternativo de la expresion 3 es elsiguiente:

Logb(k + 1)− Logb(k) = pb(k)

Logb

(k + 1

k

)= pb(k)

Logb

(1 +

1

k

)= pb(k) (4)

Como vemos, la expresion 3 es la misma quetenıamos en la ecuacion 1 en base decimal, y a suvez la expresion 4 es la misma que tenıamos en laecuacion 2 en base decimal; con la salvedad que enambos casos el logaritmo ahora es expresado en unabase no decimal.

Para conocer los valores discretos de la probabili-dad pb(k) que se atribuye al dıgito k, debemos usarla ecuacion 3 pero antes se tiene que considerar labase b del sistema de numeracion.

Numero V 22 Mayo 2018

Page 25: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Ley de Benford en Bases No Decimales

Dıgito (k) Log5(k+1)-Log5(k)1 43.07%2 25.19%3 17.87%4 13.86%

Total 100.0%

Cuadro 2: Distribucion del primer dıgito segun Benford,con sistema de 5 dıgitos (pental)

Dıgito (k) Log12(k+1)-Log12(k)1 27.89%2 16.32%3 11.58%4 8.98%5 7.34%6 6.20%7 5.37%8 4.74%9 4.24%

10 3.84%11 3.50%

Total 100.0%

Cuadro 3: Distribucion del primer dıgito segun Benford,con sistema de doce dıgitos (docenal)

Dıgito (k) Log8(k+1)-Log8(k)1 33.33%2 19.50%3 13.83%4 10.73%5 8.77%6 7.41%7 6.42%

Total 100.0%

Cuadro 4: Distribucion del primer dıgito segun Benford,con sistema octal

Dıgito (k) Log10(k+1)-Log10(k)1 30.10%2 17.61%3 12.49%4 9.69%5 7.92%6 6.69%7 5.80%8 5.12%9 4.58%

Total 100.0%

Cuadro 5: Distribucion del primer dıgito segun Benford,con sistema decimal

Se muestra la distribucion de Benford para distintos sistemas de numeracion con menos de diez y conmas de diez dıgitos. El cuadro 5 nos muestra de nuevo la distribucion teorica con base decimal que yaconocemos, pero lo repetimos con los cuadros 2, 3 y 4 para fines comparativos. Se sustenta lo mencionadoen la seccion anterior de este artıculo, respecto a que existen cambios en las probabilidades de cada dıgitosegun el sistema de numeracion. Ası tenemos que la probabilidad pb(2) de aparicion del numero 2 comoprimer dıgito significativo es un valor distinto si hablamos de un sistema de cinco, ocho, diez o doce dıgito,por ello se debe conocer tambien el valor de b.

Conforme modificamos la base del sistema de numeracion tambien cambia el numero de casos. Esto sedebe a que los valores probables para el primer dıgito significativo se incrementan o decrementan segunla base elegida.

Numero V 23 Mayo 2018

Page 26: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Ley de Benford en Bases No Decimales

Senalaremos algunas similitudes en el comportamiento de los cuadros independientemente de la baseelegida:

• Es notorio que pb(k) 6= 1b , es decir la distribucion de Benford tiene un comportamiento distinto a lo

intuitivo, la distribucion discreta uniforme.

• Es notorio que pb(1) < pb(k) < pb(b− 1) donde 1 < k < b− 1, es decir que abunda la presencia de losprimeros dıgitos (significativos) y escasea la presencia de los mayores.

• Mientras crece el valor posible del dıgito (significativo) decrece su presencia, siendo el siempre 1 eldıgito mas frecuente.

Las figura 3 ilustra el comportamiento del primer dıgito significativo en distintas bases, como lo estamosdiscutiendo.

Figura 3: Distribucion del Primer Dıgito Significativo segun distintas Bases de Sistemas de Numeracion

En las secciones siguientes trataremos los aspectos practicos en la vida cotidiana aplicando cambios debase a compendios de magnitudes.

Numero V 24 Mayo 2018

Page 27: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Ley de Benford en Bases No Decimales

5. Ley de Benford en sistema octal y Poblacion Mexicana

En [Esp14] (p.19) manejamos los datos del Censo de Poblacion y Vivienda 2010 [inegi2010] para las192,245 localidades que mide el INEGI, revisamos en aquella edicion la Ley de Benford para el primerdıgito, en base decimal. Ahora revisaremos el mismo ejercicio pero en una base octal.

El cuadro 6 es solo un extracto de las 192,245 localidades que existen en el paıs. El procedimiento esel siguiente: se registra la poblacion (en base decimal) de cada localidad, se hace la conversion de cadaregistro a su equivalente octal, por ejemplo en 5007209014 Benito Juarez, delegacion ubicada en Ciudadde Mexico el INEGI reporta 385,439 habitantes, sabemos que es cantidad decimal ası que hacemos laconversion a octal teniendo un registro de 1,360,637 habitantes, de esta ultima cifra se extrae el primerdıgito significativo acorde a las reglas del numero II [Esp14] y es en este caso el 1. Ası se procede con las192,245 localidades cuyas frecuencias son las del cuadro 7, teniendo de esta manera el ejercicio en baseoctal.

No. Entidad Municipio Localidad Poblacion PrimerDecimal Octal Dıgito

1 01 Aguascalientes 001 Aguascalientes 0001 Aguascalientes 722,250 2,602,512 22 01 Aguascalientes 001 Aguascalientes 0094 Granja Adelita 14 16 13 01 Aguascalientes 001 Aguascalientes 0096 Agua Azul 37 45 44 01 Aguascalientes 001 Aguascalientes 0100 Rancho Alegre 10 12 15 01 Aguascalientes 001 Aguascalientes 0102 Los Arbolitos [Rancho] 7 7 76 01 Aguascalientes 001 Aguascalientes 0104 Ardillas de Abajo (Las Ardillas) 14 16 17 01 Aguascalientes 001 Aguascalientes 0106 Arellano 1,382 2,546 2· · · · · · · · · · · · · · · · · · · · · · · ·

50070 09 Ciudad de Mexico 013 Xochimilco 0271 Tlalmelac 50 62 650071 09 Ciudad de Mexico 013 Xochimilco 0272 Xometitla (Tlalitenco) 456 710 750072 09 Ciudad de Mexico 014 Benito Juarez 0001 Benito Juarez 385,439 1,360,637 150073 09 Ciudad de Mexico 015 Cuauhtemoc 0001 Cuauhtemoc 531,831 2,016,567 250074 09 Ciudad de Mexico 016 Miguel Hidalgo 0001 Miguel Hidalgo 372,889 1,330,231 150075 09 Ciudad de Mexico 017 Venustiano Carranza 0001 Venustiano Carranza 430,978 1,511,602 150076 10 Durango 001 Canatlan 0001 Canatlan 11,495 26,347 250077 10 Durango 001 Canatlan 0004 Colonia Anahuac (Palo Blanco) 897 1,601 150078 10 Durango 001 Canatlan 0005 Arnulfo R. Gomez (Los Sauces) 768 1,400 150079 10 Durango 001 Canatlan 0010 Benjamın Aranda (San Rafael) 332 514 550080 10 Durango 001 Canatlan 0012 Bruno Martınez (San Bartolo) 756 1,364 1· · · · · · · · · · · · · · · · · · · · · · · ·

87808 14 Jalisco 125 San Ignacio Cerro Gordo 0082 Tuna de Arriba 119 167 187809 14 Jalisco 125 San Ignacio Cerro Gordo 0083 Tuna de Enmedio 86 126 187810 14 Jalisco 125 San Ignacio Cerro Gordo 0085 El Capulin Verde 54 66 687811 14 Jalisco 125 San Ignacio Cerro Gordo 0088 Bellavista 51 63 687812 14 Jalisco 125 San Ignacio Cerro Gordo 0089 San Antonio de los Franco 49 61 687813 14 Jalisco 125 San Ignacio Cerro Gordo 0090 El Durazno 6 6 687814 14 Jalisco 125 San Ignacio Cerro Gordo 0091 La Barranca 17 21 287815 15 Mexico 001 Acambay 0001 Acambay 4,077 7,755 787816 15 Mexico 001 Acambay 0002 Agostadero (Sn Jose Agostadero) 645 1,205 187817 15 Mexico 001 Acambay 0003 Agua Limpia 202 312 387818 15 Mexico 001 Acambay 0004 Las Arenas (San Agustın) 767 1,377 187819 15 Mexico 001 Acambay 0006 Boshi Chiquito 361 551 5· · · · · · · · · · · · · · · · · · · · · · · ·

192239 32 Zacatecas 058 Santa Marıa de la Paz 0033 Los Horcones 24 30 3192240 32 Zacatecas 058 Santa Marıa de la Paz 0035 Los Trigos (Mesa de los Trigos) 114 162 1192241 32 Zacatecas 058 Santa Marıa de la Paz 0036 Marines 2 2 2192242 32 Zacatecas 058 Santa Marıa de la Paz 0037 Mesa Grande 192 300 3192243 32 Zacatecas 058 Santa Marıa de la Paz 0039 San Isidro 7 7 7192244 32 Zacatecas 058 Santa Marıa de la Paz 0041 San Miguel Tepetitlan 75 113 1192245 32 Zacatecas 058 Santa Marıa de la Paz 0042 San Rafael 4 4 4

Nacional 112,336,538

Cuadro 6: Censo Nacional de Poblacion y Vivienda 2010 a nivel Localidad, bases decimal y octal

Numero V 25 Mayo 2018

Page 28: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Ley de Benford en Bases No Decimales

Dıgito Casos Porcentaje Porcentaje TeoricoObservado registrados de casos segun Benford

1 62,134 32.32% 33.33%2 36,489 18.98% 19.50%3 26,559 13.82% 13.83%4 22,152 11.52% 10.73%5 18,241 9.49% 8.77%6 14,972 7.79% 7.41%7 11,698 6.08% 6.42%

Total 192,245 100% 100%

Cuadro 7: Conteo del presencia del primer dıgito (octal) en el cuadro 6 vs. Teorico Benford

Figura 4: Presencia del primer dıgito (octal) en el cuadro 7 vs. Teorico Benford

El cuadro 7 nos describe la frecuencia de la ultima columna del cuadro 6, sobre el primer dıgito (en baseoctal). Podemos observar en el cuadro 7 y en la figura 4 que se confirma la prediccion de la Ley de Benfordpara la base octal, nuevamente predomina la presencia de los dıgitos menores sobre la presencia de losmayores aun con el cambio de base.

Numero V 26 Mayo 2018

Page 29: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Ley de Benford en Bases No Decimales

6. Ley de Benford en Hexadecimal y la Lluvia

Anteriormente [Esp14] realizamos el ejercicio de Benford en un cuerpo de datos pluviometricos, en aquelejercicio observamos la Ley de Benford sobre los datos de precipitacion Pluvial (medidos en mm) en Mexicopor Entidad Federativa durante el 2013, extraıdos del Servicio Metereologico Nacional [smn13] de loscuales se extrajo el primer dıgito. Efectivamente revisamos que el comportamiento de ese tabulado tieneel comportamiento estadıstico que empıricamente predice Benford.

Entidad Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic1. Aguascalientes 51.6 0 0.4 0.2 18.9 75.4 205.7 80.1 154.4 45.3 35.2 89.32. Baja California 28.9 12.2 6.3 0.4 3.4 3.8 30.6 31.6 33.6 13.4 17.4 12.33. Baja California Sur 8.6 0.5 0.8 0.1 1.2 4.1 18.3 65.8 54.8 56.3 12.8 6.34. Campeche 113.7 15.7 7 19.5 119.7 248.8 215.1 259 216.3 171.5 189 123.15. Coahuila 15.4 1.8 1.8 12.3 44.1 52.4 76.5 28 120.4 40.1 33.1 176. Colima 98 0 6.6 0.1 2.8 124.2 239.1 300 731.3 124.6 176.5 74.17. Chiapas 59 16.9 15.7 29.6 214.6 339.3 248.4 309.9 394.6 299.5 193.2 157.88. Chihuahua 18.5 1.9 1.1 0.5 7.6 52.1 204.9 99.1 102.9 33.9 45.9 49.69. Ciudad de Mexico 2.2 1.4 2.3 15.6 52.8 107.1 113.8 130.3 169.7 64.3 36.1 2.5

10. Durango 4.6 0.1 0.1 0.3 4.7 29.7 147.4 89.4 140.4 19.3 59.9 22.911. Guanajuato 11.4 0.2 2.4 1 27 94.6 214.8 107.1 185.9 47.3 32.5 37.912. Guerrero 7 0.1 7.5 7.1 69.6 195.7 154.4 156.3 467.2 103.2 29.9 4.413. Hidalgo 7.7 8.5 8.7 9.8 53.2 100 100.5 116.7 219.6 79.4 66.7 26.814. Jalisco 46 0.1 2.2 0.1 18.4 114.4 223.6 153.9 304.4 60.2 60 7915. Mexico 4.1 0.9 7.7 11.9 56.9 124.2 161.1 133 223.2 71.7 42.1 7.616. Michoacan 17.7 0.1 10.3 0.9 24.8 122.9 234.6 160.9 355.1 74.1 37.6 32.117. Morelos 0.8 0.3 8.9 6.5 144.5 262.5 254 256.3 395.8 114.5 70.4 2.118. Nayarit 18.7 0.5 0.5 1 5.1 151.4 216.7 289.9 324.3 32.9 91.4 77.319. Nuevo Leon 28 2.5 6.5 27.2 76 47.5 72.1 51.3 294.4 29.7 50 74.520. Oaxaca 11.4 11.9 12.1 13.6 73.9 187.9 133.5 204.2 406.6 98.1 61.8 19.921. Puebla 8.3 11.7 16.3 20.5 92.5 204.5 203.2 227.9 348.8 125.2 104.9 2622. Queretaro 4.9 3.8 5.9 7.4 41.2 89.2 159.3 116.6 203.3 64.3 55.4 29.323. Quintana Roo 51.3 40.7 39.1 18.6 77.9 254.7 208.7 220.7 383.7 235.8 246 127.624. San Luis Potosı 22.5 4.8 10 2.7 42.8 87.5 102.1 134.8 260.9 61.5 75 70.925. Sinaloa 4 0.1 0.2 0.2 1.2 35.7 169.4 197.2 298.6 16.1 91.1 32.926. Sonora 19.1 5.1 2.2 1 0.9 9.7 148.3 97.3 81.1 25.1 28.6 28.427. Tabasco 185.9 34.3 48.7 37.1 141.3 266.1 230.1 297.5 276.3 378.4 455.8 460.528. Tamaulipas 30.9 3.2 9.6 28.2 55.2 100.8 94.4 132.9 403.9 43.2 88.6 100.929. Tlaxcala 4.1 7.5 8 16.3 69.1 117.7 161 96.2 203.9 81.3 42.4 17.430. Veracruz 28.7 29.3 30.8 19.1 120.3 254.6 158.7 265.2 409.3 225.6 234.7 7731. Yucatan 56.7 12.8 10.7 37 72.5 216.9 154.7 205.6 271.1 177.1 135.6 69.132. Zacatecas 27 0.4 0.8 0.8 14.2 54.6 158.5 79.6 144.5 48.9 37.6 64.1

Nacional 26.4 6.4 7.1 9 43.9 103.2 152.6 135.8 227.3 77.6 76.2 55.1

Cuadro 8: Precipitacion Pluvial (mm) en el ano 2013 por Entidad Federativa. Servicio Metereologico Nacional.Datos en Base Decimal

Numero V 27 Mayo 2018

Page 30: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Ley de Benford en Bases No Decimales

Repetiremos en esta ocasion el ejercicio de los datos de precipitacion Pluvial (medidos en mm) por Enti-dad Federativa, pero a los datos les aplicaremos un cambio a base hexadecimal.

Desde la publicacion de esta Revista a la fecha se han actualizado los registros de lluvias con datos deanos mas recientes pero seguiremos manejando el 2013 por comparar lo que tenemos con lo que aportare-mos en este nuevo ejercicio.

En el cuadro 8 tenemos los datos pluviometricos en base decimal y en el cuadro 9 tenemos los mismosdatos con conversiones a base hexadecimal.

Entidad Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic1. Aguascalientes 33.9 0.6 0.3 12.E4 4B.6 CD.B3 50.19 9A.6 2D.4C 23.3 59.4C2. Baja California 1C.E4 C.3 6.4C 0.6 3.6 3.C 1E.9 1F.9 21.9 D.6 11.6 C.4C3. Baja California Sur 8.9 0.8 0.C 0.19 1.3 4.19 12.4C 41.C 36.C 38.4C C.C 6.4C4. Campeche 71.B3 F.B3 7 130.8 77.B3 F8.C D7.19 103 D8.4C AB0.8 BD 7B.195. Coahuila F.6 1.C 1.C C.4C 2C.19 34.6 4C0.8 1C 78.6 28.19 21.19 116. Colima 62 6.9 0.19 2.C 7C.3 EF.19 12C 2DB.4C 7C.9 B00.8 4A.197. Chiapas 3B 10.E4 F.B3 1D.9 D6.9 153.4C F8.6 135.E4 18A.9 12B0.8 C1.3 9D.C8. Chihuahua 120.8 1.E4 1.19 0.8 7.9 34.19 CC.E4 63.19 66.E4 21.E4 2D.E4 31.99. Ciudad de Mexico 2.3 1.6 2.4C F.9 34.C 6B.19 71.C 82.4C A9.B3 40.4C 24.19 20.8

10. Durango 4.9 0.19 0.19 0.4C 4.B3 1D.B3 93.6 59.6 8C.6 13.4C 3B.E4 16.E411. Guanajuato B.6 0.3 2.6 1 1B 5E.9 D6.C 6B.19 B9.E4 2F.4C 200.8 25.E412. Guerrero 7 0.19 70.8 7.19 45.9 C3.B3 9A.6 9C.4C 1D3.3 67.3 1D.E4 4.613. Hidalgo 7.B3 80.8 8.B3 9.C 35.3 64 640.8 74.B3 DB.9 4F.6 42.B3 1A.C14. Jalisco 2E 0.19 2.3 0.19 12.6 72.6 DF.9 99.E4 130.6 3C.3 3C 4F15. Mexico 4.19 0.E4 7.B3 B.E4 38.E4 7C.3 A1.19 85 DF.3 47.B3 2A.19 7.916. Michoacan 11.B3 0.19 A.4C 0.E4 18.C 7A.E4 EA.9 A0.E4 163.19 4A.19 25.9 20.1917. Morelos 0.C 0.4C 8.E4 60.8 900.8 1060.8 FE 100.4C 18B.C 720.8 46.6 2.1918. Nayarit 12.B3 0.8 0.8 1 5.19 97.6 D8.B3 121.E4 144.4C 20.E4 5B.6 4D.4C19. Nuevo Leo 1C 20.8 60.8 1B.3 4C 2F0.8 48.19 33.4C 126.6 1D.B3 32 4A0.820. Oaxaca B.6 B.E4 C.19 D.9 49.E4 BB.E4 850.8 CC.3 196.9 62.19 3D.C 13.E421. Puebla 8.4C B.B3 10.4C 140.8 5C0.8 CC0.8 CB.3 E3.E4 15C.C 7D.3 68.E4 1A22. Queretaro 4.E4 3.C 5.E4 7.6 29.3 59.3 9F.4C 74.9 CB.4C 40.4C 37.6 1D.4C23. Quintana Roo 33.4C 28.B3 27.19 12.9 4D.E4 FE.B3 D0.B3 DC.B3 17F.B3 EB.C F6 7F.924. San Luis Potosı 160.8 4.C A 2.B3 2A.C 570.8 66.19 86.C 104.E4 3D0.8 4B 46.E425. Sinaloa 4 0.19 0.3 0.3 1.3 23.B3 A9.6 C5.3 12A.9 10.19 5B.19 20.E426. Sonora 13.19 5.19 2.3 1 0.E4 9.B3 94.4C 61.4C 51.19 19.19 1C.9 1C.627. Tabasco B9.E4 22.4C 30.B3 25.19 8D.4C 10A.19 E6.19 1290.8 114.4C 17A.6 1C7.C 1CC0.828. Tamaulipas 1E.E4 3.3 9.9 1C.3 37.3 64.C 5E.6 84.E4 193.E4 2B.3 58.9 64.E429. Tlaxcala 4.19 70.8 8 10.4C 45.19 75.B3 A1 60.3 CB.E4 51.4C 2A.6 11.630. Veracruz 1C.B3 1D.4C 1E.C 13.19 78.4C FE.9 9E.B3 109.3 199.4C E1.9 EA.B3 4D31. Yucatn 38.B3 C.C A.B3 25 480.8 D8.E4 9A.B3 CD.9 10F.19 B1.19 87.9 45.1932. Zacatecas 1B 0.6 0.C 0.C E.3 36.9 9E0.8 4F.9 900.8 30.E4 25.9 40.19

Nacional 1A.6 6.6 7.1.9 9 2B.E4 67.3 98.9 87.C E3.4C 4D.9 4C.3 37.1.9

Cuadro 9: Precipitacion Pluvial (mm) en el ano 2013 por Entidad Federativa. Servicio Metereologico Nacional.Datos en Base Hexadecimal.

En el cuadro 10 se ha extraıdo el primer dıgito significativo de las magnitudes en base hexadecimal delcuadro 9.

Numero V 28 Mayo 2018

Page 31: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Ley de Benford en Bases No Decimales

Entidad Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic1 Aguascalientes 3 6 3 1 4 C 5 9 2 2 52 Baja California 1 C 6 6 3 3 1 1 2 D 1 C3 Baja California Sur 8 8 C 1 1 4 1 4 3 3 C 64 Campeche 7 F 7 1 7 F D 1 D A B 75 Coahuila F 1 1 C 2 3 4 1 7 2 2 16 Colima 6 6 1 2 7 E 1 2 7 B 47 Chiapas 3 1 F 1 D 1 F 1 1 1 C 98 Chihuahua 1 1 1 8 7 3 C 6 6 2 2 39 Ciudad de Mexico 2 1 2 F 3 6 7 8 A 4 2 2

10 Durango 4 1 1 4 4 1 9 5 8 1 3 111 Guanajuato B 3 2 1 1 5 D 6 B 2 2 212 Guerrero 7 1 7 7 4 C 9 9 1 6 1 413 Hidalgo 7 8 8 9 3 6 6 7 D 4 4 114 Jalisco 2 1 2 1 1 7 D 9 1 3 3 415 Mxico 4 E 7 B 3 7 A 8 D 4 2 716 Michoacan 1 1 A E 1 7 E A 1 4 2 217 Morelos C 4 8 6 9 1 F 1 1 7 4 218 Nayarit 1 8 8 1 5 9 D 1 1 2 5 419 Nuevo Leon 1 2 6 1 4 2 4 3 1 1 3 420 Oaxaca B B C D 4 B 8 C 1 6 3 121 Puebla 8 B 1 1 5 C C E 1 7 6 122 Queretaro 4 3 5 7 2 5 9 7 C 4 3 123 Quintana Roo 3 2 2 1 4 F D D 1 E F 724 San Luis Potosı 1 4 A 2 2 5 6 8 1 3 4 425 Sinaloa 4 1 3 3 1 2 A C 1 1 5 226 Sonora 1 5 2 1 E 9 9 6 5 1 1 127 Tabasco B 2 3 2 8 1 E 1 1 1 1 128 Tamaulipas 1 3 9 1 3 6 5 8 1 2 5 629 Tlaxcala 4 7 8 1 4 7 A 6 C 5 2 130 Veracruz 1 1 1 1 7 F 9 1 1 E E 431 Yucatan 3 C A 2 4 D 9 C 1 B 8 432 Zacatecas 1 6 C C E 3 9 4 9 3 2 4

Total de Dıgitos 32 30 32 32 32 32 32 32 32 32 32 32Casos 382

Cuadro 10: Extraccion del primer dıgito hexadecimal del tabulado 9

En los cuadros 9 y 10 a primera vista notamos que en el primer dıgito nuevamente predomina la presenciade los valores menores {1, 2, 3, . . .} sobre los mayores {. . . , D,E, F}.

Tenemos que 12 meses multiplicados por 32 entidades nos resultarıan en principio 384 observaciones dedıgitos, mas en las entidades de Colima y Aguascalientes en el cuadro 8 se registro precipitacion cero enel mes de febrero, por lo que no existe el primer dıgito significativo en dos casos. Ası explicamos que en elcuadro 10 en el mes de febrero tenemos 30 entidades observadas en vez de 32, y en el cuadro 11 contamoscon 382 observaciones y no 384.

Numero V 29 Mayo 2018

Page 32: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Ley de Benford en Bases No Decimales

En [Esp14] (pp. 28-30) el espacio muestral consistıa de nueve casos o nueve dıgitos, mientras en esteejercicio se amplıa a quince posibles casos y la distribucion se modifica. Notamos que en la nueva dis-tribucion existe una subpresencia (respecto a la distribucion teorica) de los dıgitos 2, 3 y 5, pero a su vezhay una sobrepresencia de los dıgitos 4, 7 y C. Tales diferencias se presentan por dos factores, primero,que contamos con solamente 382 observaciones, y segundo, porque se amplıa nuestro espacio muestral alpasar de nueve a quince probabilidades (por el cambio de base). Podemos observar en el cuadro 11 y lafigura 5 que nuevamente predomina la presencia de los dıgitos menores sobre la presencia de los mayores.

Dıgito Casos Porcentaje Porcentaje TeoricoObservado Registrados de casos segun Benford

1 95 24.87% 25.00%2 41 10.73% 14.62%3 32 8.38% 10.38%4 38 9.95% 8.05%5 16 4.19% 6.58%6 23 6.02% 5.56%7 27 7.07% 4.82%8 18 4.71% 4.25%9 17 4.45% 3.80%A 9 2.36% 3.44%B 11 2.88% 3.14%C 21 5.50% 2.89%D 13 3.40% 2.67%E 11 2.88% 2.49%F 10 2.62% 2.33%

Total 382 100% 100%

Cuadro 11: Frecuencias de dıgitos hexadecimales del cuadro 10 sobre datos pluviometricos

Figura 5: Presencia de primer dıgito hexadecimal en el cuadro 10 vs. Teorico Benford

Numero V 30 Mayo 2018

Page 33: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Ley de Benford en Bases No Decimales

7. Conclusiones

Un investigador debe cuestionar el objeto de estudio, y mientras mas lo cuestionemos mas solidas serannuestras conclusiones. A veces hallamos modelos que creeemos imitan adecuadamente a nuestra inicialobservacion, pero siempre es necesario cuestionar tambien nuestros hallazgos para mejorarles y darlesmayor solidez tecnica. En nuestro trabajo el objeto de estudio es un cuerpo de datos.

En experimentos anteriores de esta publicacion [Esp14] [Esp16] , manejamos sistemas de numeraciondecimal y observabamos los dıgitos significativos, por lo que nuestros eventos posibles eran nueve (parael primer dıgito) o diez (para dıgitos de nivel superior).

Al cambiar en la presente edicion el sistema de numeracion a un sistema no decimal, podemos elegirun sistema con pocos dıgitos (como un sistema de tres o cuatro dıgitos), o uno de varios dıgitos (como elhexadecimal), por lo tanto varıa el total de posibles eventos para nuestro dıgito observado.

Si se amplıa el numero de eventos (por ejemplo, eligiendo un sistema no decimal con varios dıgitos comoel hexadecimal), los eventos del espacio muestral se multiplican. En estos casos sugerimos ampliar en loposible el total de datos observados de nuestros listados iniciales, esto con el fin de minimizar los desfasesrespecto a la distribucion teorica

Hemos mostrado otros aspectos de la distribucion de Benford para que el lector revise otras caras delfenomeno, el investigador que se apoye en la Ley de Benford decidira las tecnicas mas adecuadas pararespaldar sus hipotesis.

Numero V 31 Mayo 2018

Page 34: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Ley de Benford en Bases No Decimales

Referencias

[Esp14] Guillermo Aaron Espinosa Reyes. Ley de Benford, Curiosidad Estadıstica del Primer Dıgito.Revista Estadıstica y Muestreo, (No. 2):16–32, 2014.http://www.matematicas.unam.mx/index.php/publicaciones/revistas,

[Esp16] Guillermo Aaron Espinosa Reyes. Ley de Benford, Aplicacion en los Dıgitos de OrdenSuperior. Revista Estadıstica y Muestreo, (No. 4):22–39, 2016.http://www.matematicas.unam.mx/index.php/publicaciones/revistas,

[Fel07] William Feller. Introduccion a la Teorıa de Probabilidades y sus Aplicaciones vol II.Limusa, 2007.

[For03] A. Behrouz Forouzan. Introduccion a la Ciencia de la Computacion.Editorial Thomson, 2003.

[Hil95] Theodore P. Hill. Base-invariance implies Benford’s law. Proceedings of the American Ma-thematical Societey, 123(No. 3):891–893, 1995.

[Jam01] Adrien Jamain. Benford’s Law. PhD thesis, Imperial College of London, Dept of Mathemat-ics, 4 2001.

[inegi2010] INEGI Instituto Nacional de Estadıstica Geografıa e Informatica. Censo de Poblacion yVivienda 2010. http://www.inegi.org.mx, 2013.

[smn13] Servicio Metereologico Nacional. Precipitacion a nivel nacional y por entidad federativa2013. https://smn.cna.gob.mx, 2013.

Numero V 32 Mayo 2018

Page 35: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Francisco Sanchez Villarreal

Generalidades sobre Estimadores de Cambiopara MediasAnalisis de sus Fundamentos

Page 36: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

palabra

Page 37: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Estimadores de Cambio para Medias

GENERALIDADES SOBREESTIMADORES DE CAMBIO PARA MEDIAS

ANALISIS DE SUS FUNDAMENTOSFrancisco Sanchez Villarreal ∗

1. Introduccion

UNA ENCUESTA PROPORCIONA una especie de fotografıa instantanea de la poblacion objetivo, es labase de un analisis transversal, sin embargo existen proyectos que requieren de la recoleccion dedatos en diferentes perıodos con objeto de establecer comparaciones a lo largo del tiempo y seguir

la evolucion de un fenomeno. Para ello el investigador podra levantar una serie de encuestas sucesivascon muestras independientes, pero una forma mas eficiente de muestreo lo proporcionan muestras trasla-padas. Las muestras traslapadas recolectan informacion de las mismas unidades muestrales. La ventajaque ofrece este mecanismo es que las diferencias entre las estimaciones de los parametros de interes enmuestras sucesivas se deberan unicamente a cambios efectivos en las unidades muestrales, pero no habraperturbaciones atribuibles a las diferencias entre muestras independientes. Las diferencias entre mues-tras independientes se dan aun cuando la medicion se lleve en forma simultanea.

Las muestras destinadas a mediciones consecutivas se suelen identificar como paneles, por ejemplo losde consumidores o televidentes. Si bien su construccion inicial es en general mas costosa que una muestrapara una sola medicion, en los levantamientos posteriores se tiene un ahorro importante de recursos, unaimportante reduccion en la no respuesta y un control mas eficiente de la adquisicion de datos.

La inclusion de unidades muestrales en los perıodos consecutivos no necesariamente debe ser al 100%,de hecho se presenta una erosion natural del panel por abandono de sus elementos atribuible a diferentescausas, pero tambien se suelen disenar rotaciones programadas de las unidades muestrales para teneroportunidad de actualizaciones periodicas del panel. Las unidades muestrales permanecen k periodos yluego son sustituidas por nuevas unidades. El traslape entre dos perıodos consecutivos puede ser parcial.El porcentaje de traslape puede obedecer a razones administrativas, pero tambien a razones estadısticasy su valor estara sujeto a criterios de optimizacion.

∗Asesor Internacional en Estadıstica y Muestreo.Profesor de Carrera en el Departamento de Matematicas en la Facultad de Ciencias, UNAM.E-mail: [email protected]

Numero V 35 Mayo 2018

Page 38: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Estimadores de Cambio para Medias

2. Estimador de Cambio Simple

Supongase que se desea estimar el cambio en el parametro Y de una poblacion en dos ocasiones sucesi-vas que se designaran por t1 y t2. Considerese como parametro de interes a D la diferencia promedio, queesta dada por la diferencia de promedios de dos ocasiones consecutivas.

D = Y2 − Y1

Esta diferencia se estimara a partir de las medias muestrales calculadas para los mismos tiempos.

ˆD = y2 − y1

Se pueden tener tres opciones para estimar D en funcion de la forma como se definan las muestras paralos dos tiempos:

a) Considerar dos muestras independientes de tamanos n cada una en los dos tiempos respectivos

b) Tomar mediciones de las mismas n unidades de muestreo en los dos tiempos y formar un panel al100%

c) Tomar una primera medicion de n unidades al tiempo t1 y repetir la medicion en T unidades trasla-padas y las n-T restantes tomarlas de una muestra independiente al tiempo t2

La varianza del estimador en funcion de las medias correspondientes a las dos muestras se expresa comosigue:

V ( ˆD) = V (y2 − y1)

= V (y1) + V (y2)− 2COV (y1, y2)

Numero V 36 Mayo 2018

Page 39: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Estimadores de Cambio para Medias

3. Muestras Independientes

Si las dos muestras son independientes entonces la covarianza entre las medias de los tiempos se anulaCOV (y1, y2) = 0 y la varianza del estimador de la diferencia sera igual a la suma de las varianzas de lasmedias muestrales en los dos tiempos. Bajo el supuesto de que la varianza de la variable no cambia enlos dos tiempos observados, eliminando el factor de correccion por finitud y por simplicidad considerandomuestreo aleatorio simple, la varianza del estimador de cambio con dos muestras independientes se re-duce a:

V ( ˆD) =S2

n+

S2

n

= 2S2

n

4. Muestras en Panel

Si se consideran como un panel los n elementos observados, se tomaran mediciones repetidas sobre lasmismas unidades en los dos tiempos. Como consecuencia la varianza del estimador de cambio se reducirasi existe, como cabe esperar, correlacion positiva entre las medias de las dos mediciones y la varianza nocambia en los perıodos consecutivos.

V ( ˆD) = V (y1) + V (y2)− 2 COV (y1, y2)

= V (y1) + V (y2)− 2√

V (y1)√V (y2)r12

=S2

n+

S2

n− 2

S2

nr12

Donde r12 es el coeficiente de correlacion entre los valores correspondientes a los dos tiempos.

Por lo tanto la varianza del estimador de cambio a partir de un panel con traslape al 100% se reduce a:

V ( ˆD) = 2S2

n(1− r12)

Como se puede observar la varianza se reduce en proporcion al coeficiente de correlacion y resulta maseficiente que tomar dos muestras independientes.

Numero V 37 Mayo 2018

Page 40: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Estimadores de Cambio para Medias

5. Muestras Traslapadas

Ahora supongase la tercera posibilidad, esto es que no se repitan mediciones en todas las unidades, sinoen una parte de ellas que definen un traslape. Se denotara por p la proporcion de traslapep = T/n y q = 1-p la proporcion de unidades no traslapadas.

En cada porcion de la muestra se estima la media de modo que la media en cada tiempo se puede expresarcomo combinacion lineal de las medias de las porciones traslapadas y no traslapadas.

y1 =n− T

ny1q +

T

ny1p

y2 =n− T

ny2q +

T

ny2p

En forma equivalente:y1 = qy1q + py1p

y2 = qy2q + py2p

Numero V 38 Mayo 2018

Page 41: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Estimadores de Cambio para Medias

Para considerar validos los posteriores resultados se consideraran validos los siguientes valores espera-dos:

E(y1) = E(y1p) = E(y1q) = Y1

E(y2) = E(y2p) = E(y2q) = Y2

Si ademas se acepta que la varianza de la media no cambia en los dos perıodos y omitiendo el factor decorreccion por finitud se tiene:

V (y1) = V (y2) =S2

n(1)

A continuacion se busca una expresion para el estimador de cambio que tome en cuenta el traslape. Paraello se parte de la expresion general para la varianza de la diferencia de medias.

V (y1 − y2) = V (y1) + V (y2)− 2COV (y1, y2) (2)

Las varianzas de las medias ya estan definidas y resta expresar la covarianza. Para ello se procedera adefinir nuevas medias muestrales como desviaciones respecto de su respectiva media poblacional con locual se lograra simplificar un poco el desarrollo algebraico.

y′1 = y1 − Y1

y′2 = y2 − Y2

y′1p = y1p − Y1

y′2q = y2q − Y2

y′2p = y2p − Y2

y′1q = y1q − Y1

Ası puesto que las medias son insesgadas se tendra:

E(y′1p) = E(y′1q) = 0

E(y′2p) = E(y′2q) = 0

Como la covarianza no se ve afectada por traslaciones se cumple la siguiente igualdad:

COV (y1, y2) = COV (y′1, y′2)

Numero V 39 Mayo 2018

Page 42: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Estimadores de Cambio para Medias

Ası basta obtener la covarianza de las medias muestrales de desviaciones.

COV (y′1, y′2) = E[(qy′1q + py′1p)(qy′2q + py′2p)]

= E[(q2y′1q y′2q + qpy′1q y

′2p + pqy′1py

′2q + p2y′1py

′2p)]

= q2 E(y′1q y′2q)︸ ︷︷ ︸

0

+qpE(y′1q y′2p)︸ ︷︷ ︸

0

+pq E(y′1py′2q)︸ ︷︷ ︸

0

+ p2E(y′1py′2p)︸ ︷︷ ︸

T2

n2 COV (y′1p,y

′2p)

(3)

Las primeras tres esperanzas matematicas en la ecuacion 3 que equivalen a covarianzas se anulan,pues involucran segmentos de muestra no traslapados y por consecuencia independientes. En resumen,permanece solamente la cuarta esperanza matematica.

p2E(y′1p, y′2p) =

T 2

n2COV (y′1p, y

′2p) (4)

Se puede expresar la covarianza 4 en funcion del coeficiente de correlacion entre las medias de los dostiempos:

COV (y′1p, y′2p) = r12

√V (y′1p)

√V (y′2p)

= r12S√T

S√T

(5)

Por lo tanto de 3, 4 y 5 tenemos:

COV (y1, y2) =T 2

n2COV (y′1p, y

′2p)

=T 2

n2r12

S√T

S√T

=T

nr12

S2

n

= r12S2

nP (6)

Ası, de 1, 2 y 6 la varianza del estimador de cambio simple con una porcion P de traslape en las muestrasdependera de la correlacion entre las medias en los dos tiempos y la proporcion de traslape P.

V (y2 − y1) = V (y2) + V (y1)− 2COV (y1, y2)

=S2

n+

S2

n− 2r12

S2

nP

=2S2

n(1− r12P ) �

Numero V 40 Mayo 2018

Page 43: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Estimadores de Cambio para Medias

Como se puede notar facilmente, la varianza disminuye proporcionalmente al producto del coeficientede correlacion por la proporcion de traslape. En la siguiente tabla se calculan los efectos combinados deambos valores sobre la varianza. Ası con una r12 de 0.6 y un traslape P = 0.50 la varianza del estimadorde cambio se reduce al 83%. Si la proporcion de traslape aumenta a 0.8, la varianza disminuye al 72% desu valor inicial.

Efecto de la proporcion de traslape y coeficiente de correlacion en la varianza del estimador de cambiosimple.

rP 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9

0.05 1.00 0.99 0.99 0.99 0.99 0.98 0.98 0.98 0.980.10 0.99 0.99 0.98 0.98 0.97 0.97 0.96 0.96 0.950.15 0.99 0.98 0.97 0.96 0.96 0.95 0.94 0.93 0.930.20 0.98 0.97 0.96 0.95 0.94 0.93 0.92 0.91 0.900.25 0.98 0.96 0.95 0.94 0.93 0.91 0.90 0.89 0.880.30 0.97 0.96 0.94 0.93 0.91 0.90 0.88 0.87 0.850.35 0.97 0.95 0.93 0.91 0.90 0.88 0.86 0.84 0.830.40 0.96 0.94 0.92 0.90 0.88 0.86 0.84 0.82 0.800.45 0.96 0.93 0.91 0.89 0.87 0.84 0.82 0.80 0.780.50 0.95 0.93 0.90 0.88 0.85 0.83 0.80 0.78 0.750.55 0.95 0.92 0.89 0.86 0.84 0.81 0.78 0.75 0.730.60 0.94 0.91 0.88 0.85 0.82 0.79 0.76 0.73 0.700.65 0.94 0.90 0.87 0.84 0.81 0.77 0.74 0.71 0.680.70 0.93 0.90 0.86 0.83 0.79 0.76 0.72 0.69 0.650.75 0.93 0.89 0.85 0.81 0.78 0.74 0.70 0.66 0.630.80 0.92 0.88 0.84 0.80 0.76 0.72 0.68 0.64 0.600.85 0.92 0.87 0.83 0.79 0.75 0.70 0.66 0.62 0.580.90 0.91 0.87 0.82 0.78 0.73 0.69 0.64 0.60 0.550.95 0.91 0.86 0.81 0.76 0.72 0.67 0.62 0.57 0.531.00 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50

6. Estimador de Regresion

A continuacion se definira y analizara un estimador de regresion para la porcion traslapada de la segundaetapa:

y∗2p = y2p + b(y1 − y1p)

= by1 + (y2p − by1p)

Cuya varianza se obtendra a continuacion:

V (y∗2p) = V (by1) + V (y2p − by1p) (7)

Numero V 41 Mayo 2018

Page 44: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Estimadores de Cambio para Medias

Se obtendran expresiones separadas para cada sumando de 7. Empezemos con el segundo sumando:

V (y2p − by1p) = V (y2p) + b2V (y1p)− 2b COV (y2p, y1p)

=S2

T+ b2S

2

T− 2br12

S√T

S√T

(8)

Recuerdese la relacion que hay entre el coeficiente de regresion y el coeficiente de correlacion y que dalugar a la siguiente formula:

b = r12S1

S2= r12 si se cumple S1 = S2 (9)

Ası la varianza 8 se obtiene con 9 como sigue:

V (by2p − by1p) =S2

T+ r2

12

S2

T− 2r2

12

S√T

S√T

=S2

T(1− r2

12) (10)

Por otra parte, en cuanto al primer sumando de 7 tenemos:

V (by1) = b2V (y1)

=b2S2

n

=r212S

2

n(11)

La varianza 7 del estimador de regresion, con 10 y 11 quedara entonces

V (y∗2p) = V (by1) + V (y2p − by1p)

= r212

S2

n+

S2

T(1− r2

12)

V (y∗2p) = S2(r12

n+

1− r212

T) �

Numero V 42 Mayo 2018

Page 45: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Estimadores de Cambio para Medias

7. Estimador combinado para la media del segundo perıodo

Se pretende no solamente estimar la diferencia o cambio entre dos perıodos, sino poder aprovechar lainformacion del primer perıodo para obtener un mejor estimador de la media del segundo perıodo. Esteestimador estara en funcion de la proporcion no traslapada q de la segunda etapa y del estimador deregresion que se acaba de analizar y se denominara estimador combinado, el cual sera una combinacionlineal:

yc2 = Wy∗2p + (1−W )y2q

Puesto que las dos porciones de medias involucradas son independientes, la varianza del estimador seexpresa en forma general como sigue:

V (yc2) = W 2V (y∗2p) + (1−W )2V (y2q)

El problema que se abordara es determinar W tal que la varianza del estimador sea mınima. Para ellose considerara la expresion de la varianza como una funcion de W y se aplicara el criterio de la primeraderivada para identificar el mınimo.

f(W ) = W 2V (y∗2p) + (1−W )2V (y2q)

Se deriva la funcion y se iguala a cero.

∂f(W )

∂W= 2W V (y∗2p)− 2(1−W )V (y2q) = 0

de donde

W =V (y2q)

V (y∗2p) + V (y2q)

1−W =V (y∗2p)

V (y∗2p) + V (y2q)

Al sustituir W y 1−W en la formula del estimador de cambio se tiene:

yc2 =V (y2q)

V (y∗2p) + V (y2q)y∗2p +

V (y∗2p)

V (y∗2p) + V (y2q)y2q

Numero V 43 Mayo 2018

Page 46: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Estimadores de Cambio para Medias

La varianza de este estimador tiene como expresion general:

V (yc2) =(V (y2q))2

(V (y∗2p) + V (y2q))2V (y∗2p) +

(V (y∗2q))2

(V (y∗2p) + V (y2q))2V (y2q)

Al simplificar la formula queda reducida como sigue:

V (yc2) =V (y∗2p)V (y2q)

V (y∗2p) + V (y2q)

Al considerar una muestra en dos tiempos con una porcion de traslape se tiene:

V (yc2) =

S2

(r212

n+

1− r212

T

)S2

n− T

S2

(r212

n+

1− r212

T

)+

S2

n− T

Si se simplifica la expresion anterior se obtiene una expresion mas facil e intuitiva para la varianza delestimador combinado de la segunda etapa.

V (yc2) =S2

n

1− r212q

1− r212q

2

Se tiene ahora un estimador de la segunda etapa de varianza mınima que depende la correlacion entreambas etapas y de la porcion de traslape p = 1 − q. En las siguientes tabla y grafica se puede apreciarel efecto sobre la varianza de valores de la correlacion r y de la proporcion p. Se puede apreciar que paracada valor de r hay un valor de p que minimiza la varianza.

rP 0.600 0.700 0.800 0.900 1.000

0.05 0.975 0.958 0.928 0.857 0.5130.10 0.954 0.927 0.880 0.788 0.5260.15 0.938 0.903 0.848 0.751 0.5410.20 0.925 0.886 0.827 0.731 0.5560.25 0.915 0.873 0.813 0.721 0.5710.30 0.908 0.865 0.804 0.718 0.5880.35 0.903 0.859 0.800 0.720 0.6060.40 0.901 0.857 0.800 0.726 0.6250.45 0.900 0.858 0.804 0.734 0.6450.50 0.901 0.860 0.810 0.746 0.6670.55 0.904 0.865 0.818 0.760 0.6900.60 0.908 0.872 0.829 0.777 0.7140.65 0.914 0.881 0.842 0.795 0.7410.70 0.922 0.892 0.857 0.817 0.7690.75 0.931 0.905 0.875 0.840 0.8000.80 0.942 0.920 0.895 0.866 0.8330.85 0.954 0.937 0.917 0.895 0.8700.90 0.967 0.956 0.942 0.927 0.9090.95 0.983 0.977 0.970 0.961 0.9521.00 1.000 1.000 1.000 1.000 1.000

Numero V 44 Mayo 2018

Page 47: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Estimadores de Cambio para Medias

Es logico buscar la proporcion optima de traslape p para una correlacion r dada de modo que se minimicela varianza del estimador combinado de la segunda etapa.

De la anterior expresion de la varianza del estimador de cambio combinado se omite el cociente de S2

nque corresponde a la varianza de la media de una muestra sin traslape. Se considera al coeficiente decorrelacion como una constante. Entonces utilizando nuevamente el criterio de la primer derivada seminimiza la siguiente expresion:

f(q) =1− r2

12q

1− r212q

2

al derivar e igualar a cero se obtiene la ecuacion:

∂f(q)

∂q= 2r2

12q(1− r212q)(1− r2

12q2)−2 − r2

12(1− r212q

2)−1 = 0

Numero V 45 Mayo 2018

Page 48: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Estimadores de Cambio para Medias

Al simplificar la expresion queda una ecuacion de segundo grado en q que se resuelve facilmente.

r212q

2 − 2q + 1 = 0

Al resolver la ecuacion, se adopta la raız que queda dentro del intervalo [0, 1] pues p y q deben estarubicadas en ese intervalo.

q =1−

√1− r2

12

r212

Al multiplicar por el binomio conjugado numerador y denominador se obtiene:

q =1

1 +

√1− r2

12

de donde finalmente se obtiene p = 1 − q, la proporcion optima de traslape dado un coeficiente de cor-relacion esta dada por la siguiente expresion.

p = 1− 1

1 +

√1− r2

12

Resulta interesante evaluar el efecto en la varianza y error estandar del estimador combinado ante difer-entes valores del coeficiente de correlacion y la seleccion de la p optima. En la siguiente tabla se presentandiferentes valores de r y p optima.

Numero V 46 Mayo 2018

Page 49: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Estimadores de Cambio para Medias

Correlacion Traslape Complemento Efecto EfectoOptimo de Traslape en la en el

r p q Varianza Error Estandar0.10 0.4987 0.5013 0.9975 0.99870.15 0.4972 0.5028 0.9943 0.99720.20 0.4949 0.5051 0.9899 0.99490.25 0.4919 0.5081 0.9841 0.99200.30 0.4882 0.5118 0.9770 0.98840.35 0.4837 0.5163 0.9684 0.98410.40 0.4782 0.5218 0.9583 0.97890.45 0.4717 0.5283 0.9465 0.97290.50 0.4641 0.5359 0.9330 0.96590.55 0.4551 0.5449 0.9176 0.95790.60 0.4444 0.5556 0.9000 0.94870.65 0.4318 0.5682 0.8800 0.93810.70 0.4166 0.5834 0.8571 0.92580.75 0.3981 0.6019 0.8307 0.91140.80 0.3750 0.6250 0.8000 0.89440.85 0.3450 0.6550 0.7634 0.87370.90 0.3036 0.6964 0.7179 0.84730.95 0.2380 0.7620 0.6561 0.8100

Ası para r = 0.75 el traslape optimo es p = 0.3981 y su adopcion tendra el efecto de reducir la varianzadel estimador al 83% y su error estandar al 91% de su valor original.

Los resultados descritos, evidentemente no se limitan a estimacion de medias, sino que son validos paraestimar otros parametros y en presencia de disenos mas complejos.

Referencias

[Azo86] J.L Azorın, F ; Sanchez. Metodos y Aplicaciones del Muestreo. Alianza Editorial, 1986.

[Kis72] Leslie Kish. Metodos y Aplicaciones del Muestreo. Editorial Trillas, 1972.

[Sha00] L. Lohr Sharon. Muestreo : diseno y analisis. Thomson Editores, 2000.

[Try96] Peter Tryfos. Sampling Methods for Applied Research. John Wiley, 1996.

Numero V 47 Mayo 2018

Page 50: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

palabra

Page 51: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Francisco Sanchez Villarreal

La Funcion de Distribucion de WeibullCaracterısticas y Estimacion de sus Parametros

Page 52: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

palabra

Page 53: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Distribucion de Weibull

LA FUNCION DE DISTRIBUCION DE WEIBULLCARACTERISTICAS Y ESTIMACION DE SUS PARAMETROS

Francisco Sanchez Villarreal ∗

1. Origen

LA DISTRIBUCION DE WEIBULL fuepresentada en 1951 por el inge-niero y matematico sueco Waloddi

Weibull (1887-1979). Weibull inicio sustrabajos como ingeniero naval. Orientobuena parte de sus investigaciones alestudio de fatiga de materiales. Susprimeros trabajos sobre la distribucionque lleva su nombre, iniciaron en 1939.En 1951 los publica en forma detallada:“A statistical distribution function ofwide applicability”, J. Appl. Mech.-Trans. ASME 18 (3): 293-297 . Comoes usual hay antecedentes atribuiblesa otros autores: Maurice Frechet(1927) “Sur la loi de probabilite del’ecart maximum”, Annales de laSociete Polonaise de Mathematique,Cracovie 6: 93-116.

2. Caracterizacion de la Funcion de Distribucion

Su funcion de densidad se caracteriza por 3 parametros: α parametro de forma, β parametro de escala yγ como parametro de posicion. El parametro de posicion marca el punto de arranque de la distribucion.

f(t, α, β, γ) =

α

β

(t− γβ

)α−1e−(t− γβ

)αsi t ≥ γ

0 si t < γ

∗Asesor Internacional en Estadıstica y Muestreo.Profesor de Carrera en el Departamento de Matematicas en la Facultad de Ciencias, UNAM.E-mail: [email protected]

Numero V 51 Mayo2018

Page 54: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Distribucion de Weibull

Es evidente que si α = 1 y si γ = 0 la funcion se reduce a la conocida exponencial negativa con unparametro β. La incorporacion de dos parametros adicionales a la exponencial negativa, lo cual le pro-porciona a la distribucion de Weibull mayor flexibilidad y adaptabilidad en algunas aplicaciones muyparticulares.

Si se considera nulo el parametro de posicion γ = 0, se tiene la distribucion de Weibull estandar, sobre lacual enfocaremos nuestra atencion. Su caracterizacion reduce entonces a dos parametros: α, parametro deforma y β parametro de escala. Las formulas de las funciones de densidad y de distribucion acumulativase presentan a continuacion:

f(t, α, β) =

α

β

(t

β

)α−1e−(t

β

)αsi t ≥ 0

0 si t < 0

F (t, α, β) =

1− e

−(t

β

)αsi t ≥ 0

0 si t < 0

La funcion de supervivencia asociada a la distribucion de Weibull, usual en el ambito actuarial, tambienconocida como funcion de confiabilidad en ingenierıa R(t), es el complemento de la funcion de distribucionacumulativa.

R(t) = 1− F (t, α, β) ; R(t) = e−(t

β

La tasa de riesgo instantanea h(t) y la funcion de riesgo acumulado H(t)

h(t) =αtα−1

βα; H(t) =

(t

β

Los momentos respecto al origen se obtienen mediante la siguiente formula que depende de la funcionGamma de Euler.

E(TK) = βKΓ

(1 +

K

α

); Γ(x) =

∫ ∞0

yxe−y dy

El valor esperado y varianza se obtienen facilmente a partir de la forma de sus momentos respecto alorigen.

E(T ) = β Γ

(1 +

1

α

); V (T ) = β2 Γ

(1 +

2

α

)−[β Γ

(1 +

1

α

)]2

Numero V 52 Mayo2018

Page 55: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Distribucion de Weibull

El Coeficiente de asimetrıa se expresa ası:

CA =

Γ

(1 +

1

α

)β3 − 3E(T )V (T )− [E(T )]

3

(V (T ))3/2

La moda y la mediana tienen las siguientes expresiones:

Me = β Ln(2)1α ; Mo = β

(α− 1

α

) 1α

Las graficas de las funciones de densidad y distribucion acumulativa para diferentes valores de losparametros cambian en forma sensible su forma.

(a) Funcion de Densidad (b) Funcion de Distribucion Acumulativa

Figura 1: Funcion de Weibull

3. Simulacion de Valores

La simulacion de valores de la distribucion de Weibull se puede efectuar de manera relativamente sen-cilla mediante el metodo de la funcion inversa de la funcion de distribucion acumulativa que da lugar a laFuncion Cuantil.

P = 1− e−(t

β

)α; t = β[−ln(1− P )]

En R software se puede utilizar la siguiente funcion para obtener los cuantiles, con q ∈ (0, 1). Por ejemplo,la mediana se obtiene con q = 0.5

> qweibull(q,scale=b, shape=a)

Numero V 53 Mayo2018

Page 56: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Distribucion de Weibull

Se parte de la formula de la distribucion acumulativa, la cual se iguala a una variable aleatoria Ucon distribucion uniforme en (0, 1) y se despeja el valor de la variable t, de donde se obtiene la siguien-te formula que permite simular valores pseudoaleatorios al variar los valores de U . Esto se logra concualquier lenguaje.

U = 1− e−(t

β

)α; t = β[−ln(1− U)]

En el cuadro 1 se incluyen 120 valores simulados de la distribucion Weibull con parametros α = 2 y β = 3y con ayuda de la funcion ALEATORIO( ) de Excel.

1.89120 1.04744 0.47125 1.68111 1.38608 2.07160 3.35035 3.082852.57068 3.42136 1.13412 4.74675 3.14153 2.62699 4.20975 2.104193.09048 1.91279 4.20848 4.00029 1.04689 3.19245 2.28823 2.014492.15193 1.06782 3.50780 4.27467 1.05949 3.34855 0.27536 3.781852.61226 2.49484 1.89715 2.52902 1.90123 1.58253 3.33625 1.139792.80565 2.57506 3.73492 1.87683 0.97991 2.61121 3.32215 0.718423.60638 1.50117 2.82907 3.10826 3.36178 3.71577 6.05761 1.621482.04468 3.62735 6.01535 4.21937 2.06880 4.37997 4.14312 3.442083.29701 2.52548 1.14963 2.24651 1.82823 5.79027 1.26679 3.753002.54718 1.45814 1.04898 3.70463 0.83809 1.46030 2.47740 2.782982.22125 0.59215 1.71191 4.27933 1.26442 3.32595 2.97492 5.581873.51794 4.39660 4.59048 3.81802 2.46756 1.71547 2.17634 2.481593.06590 1.79318 2.95594 1.83687 4.66814 2.23525 1.83774 0.701492.33872 2.01660 6.09199 1.57354 3.38285 3.37743 0.71393 5.004922.85556 2.09825 2.08329 3.85027 0.92699 4.29494 1.96284 2.69325

Cuadro 1: Rango con 120 valores simulados en Excel, de una distribucion Weibull con α = 2, β = 3

En R software se cuenta con la funcion rweibull para simular valores de la distribucion que nos ocupa.El siguiente ejemplo permite obtener una muestra de 120 valores con parametros α = 2, β = 3.

> rweibull(120,scale=3, shape=2)

A continuacion se obtienen las estadısticas basicas de la muestra generada.

Estadıstica ValorMedia 2.680572Mediana 2.538100Variana S2 1.646624Desviacion Estandar 1.283208Mınimo 0.275361Maximo 6.091989Coeficiente de Asimetrıa 0.513337n 120

Cuadro 2: Estadısticas Basicas de la muestra del cuadro 1

Numero V 54 Mayo2018

Page 57: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Distribucion de Weibull

4. Estimacion de Parametros

4.1 Linealizacion

Existen varios metodos para la estimacion de sus parametros, una de las mas usuales consiste en lalinealizacion de la funcion de distribucion acumulativa, tras una doble transformacion logarıtmica y pos-teriormente estimar los parametros de la expresion linealizada por mınimos cuadrados ordinarios.

Se parte de la funcion de distribucion acumulativa 1

F (t) = 1− e−(t

β

)α(1)

Se procede a despejar la parte exponencial de 1

e

(t

β

)α=

1

1− F (t)(2)

Se toma logaritmo natural en ambos miembros de 2

Ln

(1

1− F (t)

)=

(t

β

)α(3)

Nuevamente se tomara logaritmo natural, pero ahora en ambos miembros de 3 y con el fin de obtener unaexpresion linealizada de la forma Y = A+BX

Ln

[Ln

(1

1− F (t)

)]= αLn

(t

β

)(4)

Al distribuir el logaritmo del miembro derecho en 4 se obtiene la expresion linealizada. La funcion dedistribucion acumulativa F (t) se sustituye por la funcion de distribucion acumulativa empırica que iden-tificaremos en este punto como S(t).

Ln

[Ln

(1

1− S(t)

)]= αLn(t)− αLn(β) �

Ejemplo del procedimiento de estimacion mediante linealizacionPara adaptar los datos a un procedimiento de estimacion mediante Mınimos Cuadrados Ordinarios (MCO)se debe obtener la funcion de distribucion empırica S(x) mediante un simple ordenamiento de la muestray asociacion de sus valores con su numero de orden dividido entre el tamano de muestra. A continuacionhay que efectuar las transformaciones definidas por la relacion lineal. Los primeros 10 renglones delcuadro de datos 3 y transformaciones aplicadas se incluyen a continuacion.

Numero V 55 Mayo2018

Page 58: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Distribucion de Weibull

Numero Valoresde de t X=ln(t) S(t)= i

ninin 1-S(t) 1

1−S(t)1

1−S(t)1

1−S(t) Ln(

11−S(t)

)Ln(

11−S(t)

)Ln(

11−S(t)

)Y = Ln

[Ln(

11−S(t)

)]Y = Ln

[Ln(

11−S(t)

)]Y = Ln

[Ln(

11−S(t)

)]observacion ordenados

1 158 5.062595033 0.005555556 0.994444444 1.005586592 0.005571045 -5.1901726222 161 5.081404365 0.011111111 0.988888889 1.011235955 0.011173301 -4.4942282223 172 5.147494477 0.016666667 0.983333333 1.016949153 0.016807118 -4.0859527734 182 5.204006687 0.022222222 0.977777778 1.022727273 0.022472856 -3.7954471055 185 5.220355825 0.027777778 0.972222222 1.028571429 0.028170877 -3.5694665666 194 5.267858159 0.033333333 0.966666667 1.034482759 0.033901552 -3.3842944937 198 5.288267031 0.038888889 0.961111111 1.040462428 0.039665256 -3.2272796288 198 5.288267031 0.044444444 0.955555556 1.046511628 0.045462374 -3.0908702389 201 5.303304908 0.050000000 0.950000000 1.052631579 0.051293294 -2.970195249

10 203 5.313205979 0.055555556 0.944444444 1.058823529 0.057158414 -2.861928676

Cuadro 3: Cuadro de Datos y Transformaciones para Estimacion de Parametros de Weibull

La estimacion final de los parametros de la relacion lineal mediante MCO es la siguiente:

A = −2.386989556 ; B = 2.1668240032

El parametro B de la relacion lineal corresponde al parametro de forma α y su estimacion es directa.

α = 2.1668240032

El valor del parametro de escala se obtiene al sustituir en la ordenada al origen β = e−Aα y despejarlo.

β = 3.00899908182

Se observa que los valores estimados son cercanos a los de los parametros que se utilizaron para lasimulacion, el 2 y 3.

4.2 Estimacion por Maxima Verosimilitud

A partir de la funcion de verosimilitud se obtienen las siguientes ecuaciones que son factibles de resolvermediante metodos iterativos. Ver “Continuos Univariate Distributions Volume 1 ”. Norman L.Johnson y Samuel Kotz.

Se parte de la funcion de verosimilitud.

L(t, α, β) =

n∏i=1

α

β

(tiβ

)α−1e−(tiβ

En forma alternativa se tiene

L(t, α, β) =

β

)ne

n∑i=1

(tiβ

)αn∏i=1

(tiβ

)α−1(5)

Numero V 56 Mayo2018

Page 59: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Distribucion de Weibull

Se toma logaritmo natural de la funcion de verosimilitud 5 para disponer de una funcion de soporte.

Ln[L(t, α, β)] = nLn(α)− nLn(β)− 1

βα

n∑i=1

tαi + (α− 1)

[n∑i=1

Ln(ti)− nLn(β)

](6)

Se procede a derivar la funcion 6 respecto a β e igualarla a cero

d Ln[L(t, α, β)]

dβ=n

β+

α

βα+1

n∑i=1

tαi −n(α− 1)

β= 0 (7)

Se despeja β de 7 y se obtiene:

β =

[1

n

n∑i=1

tαi

] 1α

(8)

A continuacion se derivara la funcion 5 respecto de α y sustituyendo β de 8 se obtendra la ecuacion paraα que esta en funcion del mismo parametro.

Ln[L(t, α, β)] = nLn(α)− nLn(β)− 1

βα

n∑i=1

tαi + (α− 1)

[n∑i=1

Ln(ti)− nLn(β)

]d Ln[L(t, α, β)]

dα=

n

α− 1

βα

n∑i=1

tαi Ln(ti) +

n∑i=1

Ln(ti) = 0 (9)

Mutiplicando 9 por α

= n− α

βα

n∑i=1

tαi Ln(ti) + α

n∑i=1

Ln(ti) = 0

n = α

[1

βα

n∑i=1

tαi Ln(ti) +

n∑i=1

Ln(ti)

](10)

Se sustituye en 10 el estimador β de 8 para dejar todo en terminos de α

n = α

1[

1

n

n∑i=1

tα1

] αα1

n∑i=1

tαi Ln(ti) +

n∑i=1

Ln(ti)

Finalmente se obtiene la segunda ecuacion.

α =

( n∑i=1

tαi Ln(ti)

)(n∑i=1

tαi

)−1− 1

n

n∑i=1

Ln(ti)

−1 (11)

Estas ecuaciones no tienen solucion analıtica, se debe usar un metodo numerico iterativo. La forma massencilla de resolverlas es la siguiente:

Numero V 57 Mayo2018

Page 60: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Distribucion de Weibull

• Establecer un valor inicial para αo (que cumpla con las restricciones) y sustituirlo en el segundomiembro de la ecuacion 11 y obtener un segundo valor α1

α1 =

( n∑i=1

tαoi Ln(ti)

)(n∑i=1

tαoi

)−1− 1

n

n∑i=1

Ln(ti)

−1

• Tomar el valor absoluto de la diferencia entre el valor inicial αo y el valor resultante de la estimacionα1 a traves de las sumas del segundo miembro.

D = |α1 − αo|

Considerar como valor objetivo la diferencia en valor absoluto D = |α1 − αo| y modificar iterati-vamente αo para minimizar esa diferencia. Esto se puede lograr mediante algun procedimientoiterativo de solucion no lineal como la aplicacion Solver de Excel.

• En nuestro caso, se tomo como valor inicial αo = 1 y el proceso iterativo de Solver concluyo conα1 = 2.22403483422

• Este valor de α1 se sustituye en la ecuacion 8 para obtener la estimacion del parametro de escalaβ = 3.0289073942

β =

[1

n

n∑i=1

tα1

] 1α1

El encabezado de las columnas para los calculos auxiliares con el valor inicial de αo = 1 y las primeros10 renglones.

Numero Valoresde de t tα1tα1tα1 Ln(t) Ln(t) tα1tα1tα1

observacion ordenados1 0.27536 0.05679677 -1.28967214 -0.073249222 0.47125 0.18763038 -0.75236290 -0.141166143 0.59215 0.31179870 -0.52400146 -0.163382974 0.70149 0.45450667 -0.35455501 -0.161147625 0.71393 0.47263371 -0.33697070 -0.159263716 0.71842 0.47926392 -0.33070698 -0.158495937 0.83809 0.67513686 -0.17663386 -0.119252038 0.92699 0.84484128 -0.07581109 -0.064048349 0.97991 0.95587305 -0.02029202 -0.01939660

10 1.04689 1.10729736 0.04582762 0.05074481

Una vez que el proceso iterativo concluye con α1 = 2.22403483422 los primeros 10 renglones se modificande la siguiente forma:

Numero Valoresde de t tα1tα1tα1 Ln(t) Ln(t) tα1tα1tα1

observacion ordenados1 0.27536 0.05679677 -1.28967214 -0.073249222 0.47125 0.18763038 -0.75236290 -0.141166143 0.59215 0.31179870 -0.52400146 -0.163382974 0.70149 0.45450667 -0.35455501 -0.161147625 0.71393 0.47263371 -0.33697070 -0.159263716 0.71842 0.47926392 -0.33070698 -0.158495937 0.83809 0.67513686 -0.17663386 -0.119252038 0.92699 0.84484128 -0.07581109 -0.064048349 0.97991 0.95587305 -0.02029202 -0.01939660

10 1.04689 1.10729736 0.04582762 0.05074481

Numero V 58 Mayo2018

Page 61: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Distribucion de Weibull

4.3 Metodo de Momentos

El metodo de momentos consiste fundamentalmente en sustituir los momentos poblacionales por losmomentos muestrales en las expresiones que involucren a los parametros. En nuestro caso tomaremos laesperanza de la variable y la varianza, ambas se expresan en funcion de α y β. En nuestro caso tenemosdos alternativas, la primera utilizar el valor esperado y la varianza y la segunda en base al valor esperadode T y la mediana.

E(T ) = βΓ

(1 +

1

α

); V (T ) = β2Γ

(1 +

2

α

)− (E(T ))2

Se toma el cociente del cuadrado de la esperanza entre la varianza para tener una expresion que dependeunicamente de α. La media aritmetica y la varianza muestral sustituyen a los momentos poblacionales.

E2(T )

V (T )=

Γ2

(1 +

1

α

)[

Γ

(1 +

2

α

)− Γ2

(1 +

1

α

)];X2

S2=

Γ2

(1 +

1

α

)[

Γ

(1 +

2

α

)− Γ2

(1 +

1

α

)]

Mediante un metodo de aproximacion numerica se asignan sucesivamente valores para α, de forma queminimicen la diferencia absoluta de las estadısticas. El valor de β se obtiene a traves de la expresion dela esperanza que se sustituye por la media aritmetica y el estimador de α.

β =X

Γ

(1 +

1

α

)

Al aplicar este metodo a los datos del ejemplo y con un valor inicial para α = 1.5 , la solucion final esα = 2.20574943045 y β = 3.026731049

El segundo procedimiento de momentos se basa en el cociente de las expresiones de la esperanza entre lamediana y sustituir estos parametros por las estadısticas empıricas, para tener una formula que dependeunicamente de α.

E(T )

Me=

Γ

(1 +

1

α

)Ln(2)

;X

Me=

Γ

(1 +

1

α

)Ln(2)

Una vez calculado el cociente se asigna un valor inicial al parametro α, en este caso se partio de α = 1.3 yse minimiza el valor absoluto de la diferencia entre el cociente de media entre la mediana. El valor finaldel parametro fue α = 2.0831956

La estimacion de β se logra mediante la misma formula del metodo anterior y se concluye β = 3.026338503

Numero V 59 Mayo2018

Page 62: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Distribucion de Weibull

5. Bondad de Ajuste

En la siguiente grafica se presentan las distribuciones acumulativas empırica y teorica ajustada con losparametros estimados por Maxima Verosimilitud.

(a) Distribuciones AcumulativasEmpırica y Teorica de Weibull

(b) Frecuencias Observadas y Esperadasde acuerdo al Modelo Weibull Ajustado

Figura 2: Funcion de Weibull

Para verificar que la distribucion empırica puede ser modelada adecuadamente por una distribucion deWeibull, se utilizo la prueba de Kolmogorov-Smirnov. La hipotesis de ajuste de la distribucion fue buenapara los cuatro metodos de estimacion. La estadıstica de prueba de KS resulto ligeramente mas pequenapara el metodo de Maxima Verosimilitud. Consideramos que los metodos mas sencillos de calcular son losde momentos.

METODO DE ESTIMACIONParametro Linealizado Maxima Maximos Maximos 2

VerosimilitudAlfa 2.166824 2.22403483 2.20574943 2.08319566Beta 3.00899908 3.02890739 3.02673105 3.0263385

Estadıstica KS 0.04615436 0.04275139 0.04276388 0.04528151

Cuadro 6: Metodos de Estimacion de Parametros

6. Aplicaciones

En su artıculo de 1951, Waloddi Weibull propone multiples aplicaciones para su distribucion, entre ellasexpone el analisis de fatiga de acero, resistencia de fibras de algodon, distribucion de cenizas en el aire,estaturas de varones britanicos, etc. En la actualidad es una de las distribuciones mas usadas en analisisde confiabilidad. Por ejemplo se la aplica en la determinacion del numero de productos que se espera nocumplan con una garantıa de duracion, como pueden ser neumaticos o componentes electronicos.

Numero V 60 Mayo2018

Page 63: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Distribucion de Weibull

Considere el caso de una empresa que fabrica lamparas para fotografıa. La empresa desea lanzar almercado una nueva lampara y garantizar que la duracion media sera de 200 horas o mas. Para ellose tomo una muestra de 180 lamparas que se sometieron a condiciones similares de uso en un estudiofotografico. La duracion de las 180 lamparas fue registrada (cuadro 7 ). Concretamente se desea conocerla probabilidad de que las lamparas tengan una duracion mayor a 200 horas y se desea conocer la vidamedia real de las lamparas. Se espera que esta ultima sea superior al valor garantizado, para minimizarreclamaciones.

256 245 253 198 265 265 247 227 263 221 244 222209 158 251 266 245 260 260 248 238 265 172 267252 243 278 229 235 255 250 249 273 232 236 238210 226 256 209 275 251 213 258 206 236 224 243269 182 249 260 228 260 219 278 214 211 260 240217 246 268 246 257 243 218 222 208 254 198 250275 253 246 260 265 235 224 250 246 234 252 248265 258 244 217 212 272 204 264 219 233 254 240268 245 256 246 230 254 232 259 254 267 268 237251 218 269 242 240 248 216 240 239 161 279 275239 243 209 241 250 219 224 262 228 281 221 201254 185 203 247 261 262 265 203 266 262 225 223265 230 233 272 244 256 273 240 231 260 254 240271 235 257 249 258 221 223 239 262 261 234 218248 210 250 237 274 245 270 256 230 194 259 227

Cuadro 7: Duracion en horas de 180 lamparas de fotografıa

En primer termino se realizo el analisis descriptivo(cuadro 8 ) de los datos que incluyo el calculo de es-tadısticas basicas y la distribucion de frecuencias.Los datos se ubican en un intervalo de 158 a 281horas. La media y la mediana difieren ligeramente241.6 y 245.5 horas respectivamente. Las lamparasmuestran clara asimetrıa negativa y presentan va-lores de 158 a 281 horas.

Estadıstica ValorMedia 241.572Mediana 245.500Varianza 538.838Desv. Est 23.213Mınimo 158Maximo 281Coef. Asimetrıa -0.883

Cuadro 8: Estadısticas Basicas

El cuadro 9 y graficas de distribucion ( figura 3 ) de frecuencias de los valores de la muestra permitentener un conocimiento intuitivo de la poblacion en estudio. Se observa el comportamiento asimetrico dela distribucion, con valores mas probables en torno a 250 horas.

Figura 3: Distribucion DuracionLamparas de Fotografıa

Lımites de Intervalo Marca de FrecuenciaInferior Superior Clase Absoluta Relativa

150 - 160 155 1 0.005556160 - 170 165 1 0.005556170 - 180 175 1 0.005556180 - 190 185 2 0.011111190 - 200 195 3 0.016667200 - 210 205 11 0.061111210 - 220 215 13 0.072222220 - 230 225 20 0.111111230 - 240 235 25 0.138889240 - 250 245 32 0.177778250 - 260 255 33 0.183333260 - 270 265 25 0.138889270 - 280 275 12 0.066667280 - 290 285 1 0.005556

180 1.000000

Cuadro 9: Distribucion DuracionLamparas de Fotografıa

Numero V 61 Mayo2018

Page 64: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Distribucion de Weibull

La estimacion de los parametros de la distribucion de Weibull se realizo mediante la linealizacion, conel procedimiento expuesto. En la aplicacion el metodo de maxima verosimilitud hay que tener cuidadocon datos de valores medianamente elevados como los de este ejemplo, pues en las transformacionesrequeridas se eleva el valor de la observacion a la potencia α y si esta adopta un alto valor se puedengenerar errores por rebozamiento en el calculo, para evitar ello conviene adoptar una escala menor ydividir los valores originales entre 10, 100 o el valor que considere conveniente para que las los valoresresultantes sean menores a 10.

Los valores estimados para este caso son α = 12.114482866, β = 251.661799858.

Las graficas de distribucion acumulativa empırica y ajustada, ası como las frecuencias observadas ylas calculadas de acuerdo al modelo ajustado permiten valorar intuitivamente al modelo, cuya bondad deajuste fue probada satisfactoriamente mediante la prueba de Kolmogorov Smirnov.

(a) Distribuciones Empırica y AjustadaDuracion Lamparas de Fotografıa

(b) Frecuencias Observadas y Esperadasde acuerdo al Modelo Weibull Ajustado

Figura 4: Funcion de Weibull. Duracion Lamparas de Fotografıa

El valor medio de la duracion de las lamparas estarıa dado por t, tal que P (T < t) = 0.5. Esto es el valorque separa en 50% hacia atras y 50% adelante. Para resolver esta pregunta se recurre a la distribucioninversa aplicada en P = 0.5. El valor medio que se obtiene es 244.

t = β[−Ln(P )]1α ; 244.162 = β[−Ln(0.5)]

La instruccion en R software para obtener el valor medio es: > qweibull(0.5, shape=12.114482866255,scale=251.661799858508, lower.tail=TRUE, log.p=FALSE)

[1] 244.162

Numero V 62 Mayo2018

Page 65: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Revista de Muestreo y Estadıstica Distribucion de Weibull

La empresa fabricante pretende imprimir la leyenda “Duracion 200 horas”. La pregunta obvia es ¿cuales la probabilidad de que una lampara tomada al azar dure 200 horas o menos?. La respuesta se obtieneal valuar la funcion de distribucion ajustada F (t) para t = 200. La probabilidad calculada es P = 0.060.En consecuencia la probabilidad de que una lampara dure mas de 200 horas es 0.94. La empresa decidioincluir la leyenda.

Mediante R software la instruccion para obtener la probabilidad mencionada es la siguiente.

>pweibull(200, shape=12.114482866255, scale = 251.661799858508, lower.tail = TRUE, log.p = FALSE)[1] 0.05994784

7. Conclusiones

Se concluye que la distribucion de Weibull es un modelo de gran versatilidad para ser aplicado endiferentes campos como hidrologıa, meteorologıa, analisis de confiabilidad, etc. La estimacion de susparametros se puede efectuar por diversos metodos que con la tecnologıa actual no presentan problemascomplicados.

Referencias

[1] R Documentation.The Weibull Distribution.http://stat.ethz.ch/R-manual/R-devel/library/stats/html/Weibull.html

[2] Kotz,S.; Balakrishnan,N.; Johnson, N.“Continuos Univariate Distributions”, Vol.1, Second Edition.John Wiley & Sons. New York. 2000.

[3] NIST/SEMATECH e-Handbook of Statistical Methodshttps://www.itl.nist.gov/div898/handbook/eda/section3/eda3668.htm

[4] University of Alabama in Huntsville onlinehttp://www.math.uah.edu/stat/special/Weibull.html

[5] NIST/SEMATECH e-Handbook of Statistical Methodshttp://www.itl.nist.gov/div898/handbook/apr/section1/apr162.htm

[6] MathWorld onlinehttp://mathworld.wolfram.com/WeibullDistribution.html

[7] Blueprint onlinehttp://www.weibull.com/hotwire/issue14/relbasics14.htm

Numero V 63 Mayo2018

Page 66: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

palabra

Page 67: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

Desarrollo

REVISTA DE ESTADISTICA Y MUESTREOpublicacion editada y desarrollada con comandos en software LATEX, por [email protected]

Con apoyo de PRAGMA S.A. de C.V. [email protected]

Page 68: palabra - pragmamexico.com.mxpragmamexico.com.mx/revista/Revista05.pdf · alinea en los bordes de las costas del Pac´ıfico, siguiendo bordes de las placas del Caribe, Cocos y Rivera.

2

.