Teoría elemental de muestreo CAPITULO 8 - ivanacal · PDF filede las diferencias de...

6
Teoría elemental de muestreo CAPITULO 8 TEORIA DE MUESTREO La teoría de muestreo es el estudio de las relaciones existentes entre una población y las muestras extraídas de ella. Es de gran utilidad en muchos campos; por ejemplo, para esti- mar características desconocidas de poblaciones (como la media y la varianza poblacionales), denominadas parámetros de la población o simplemente parámetros, a partir del conoci- miento de las características muéstrales correspondientes (como la media y la varianza muéstrales), nombradas estadísticos de la muestra o, en forma sencilla, estadísticos. Los problemas de estimación se estudian en el capítulo 9. La teoría de muestreo también sirve para determinar si las diferencias observadas entre dos muestras se deben a variaciones por el azar o si en realidad son significativas. Dichas cuestiones surgen, por ejemplo, al probar un nuevo suero para el tratamiento de una enfer- medad o al decidir si un proceso de producción es mejor que otro. Sus respuestas involucran el uso de las denominadas pruebas de significancia y de hipótesis, que son importantes en la teoría de decisiones, la cual se estudia en el capítulo 10. El estudio de las inferencias hechas respecto de una población, al estudiar muestras obtenidas a partir de ella, aunado a las indicaciones de la precisión de dichas inferencias con el uso de la teoría de probabilidad, se llama estadística inferencial. MUESTRAS ALEATORIAS Y NUMEROS ALEATORIOS Para que las conclusiones de la teoría de muestreo y la estadística inferencial sean válidas, se deben elegir muestras representativas de la población. El estudio de los métodos de muestreo y de los problemas relacionados se denomina diseño del experimento. Una forma de obtener una muestra representativa es por medio del proceso denomina- do muestreo aleatorio, en el cual cada miembro de una población tiene las mismas probabi- lidades de ser incluido en la muestra. Una técnica de obtención de una muestra aleatona es la asignación de números a cada miembro de la población, anotar estos números en | de papel, colocarlos en una urna y después sacar números de dicha urna, tenieado < de mezclarlos muy bien antes de cada extracción. Un método alternativo es d i tabla de números aleatorios (véase el apéndice IX) especialmente elaborados | propósito (véase el problema 8.6).

Transcript of Teoría elemental de muestreo CAPITULO 8 - ivanacal · PDF filede las diferencias de...

Page 1: Teoría elemental de muestreo CAPITULO 8 - ivanacal · PDF filede las diferencias de proporciones, a partir de dos poblaciones binomialmente distribuidas con parámetros (p,, q¡)

Teoría elemental de muestreo

CAPITULO 8 TEORIA DE MUESTREO

La teoría de muestreo es el estudio de las relaciones existentes entre una población y las muestras extraídas de ella. Es de gran utilidad en muchos campos; por ejemplo, para esti­mar características desconocidas de poblaciones (como la media y la varianza poblacionales), denominadas parámetros de la población o simplemente parámetros, a partir del conoci­miento de las característ icas muést ra les correspondientes (como la media y la varianza muéstra les) , nombradas estadísticos de la muestra o, en forma sencilla, estadísticos. Los problemas de es t imación se estudian en el capítulo 9.

La teoría de muestreo también sirve para determinar si las diferencias observadas entre dos muestras se deben a variaciones por el azar o si en realidad son significativas. Dichas cuestiones surgen, por ejemplo, al probar un nuevo suero para el tratamiento de una enfer­medad o al decidir si un proceso de producción es mejor que otro. Sus respuestas involucran el uso de las denominadas pruebas de significancia y de hipótesis, que son importantes en la teoría de decisiones, la cual se estudia en el capí tulo 10.

E l estudio de las inferencias hechas respecto de una población, al estudiar muestras obtenidas a partir de ella, aunado a las indicaciones de la precis ión de dichas inferencias con el uso de la teoría de probabilidad, se llama estadística inferencial.

MUESTRAS ALEATORIAS Y NUMEROS ALEATORIOS

Para que las conclusiones de la teoría de muestreo y la estadíst ica inferencial sean válidas, se deben elegir muestras representativas de la población. E l estudio de los métodos de muestreo y de los problemas relacionados se denomina diseño del experimento.

Una forma de obtener una muestra representativa es por medio del proceso denomina­do muestreo aleatorio, en el cual cada miembro de una población tiene las mismas probabi­lidades de ser incluido en la muestra. Una técnica de obtención de una muestra aleatona es la asignación de números a cada miembro de la población, anotar estos números en | de papel, colocarlos en una urna y después sacar números de dicha urna, tenieado < de mezclarlos muy bien antes de cada extracción. Un mé todo alternativo es d i tabla de números aleatorios (véase el apéndice I X ) especialmente elaborados | propósi to (véase el problema 8.6).

Page 2: Teoría elemental de muestreo CAPITULO 8 - ivanacal · PDF filede las diferencias de proporciones, a partir de dos poblaciones binomialmente distribuidas con parámetros (p,, q¡)

2-r . .2 £ • Teoría elemental de muestreo

MUESTREO CON Y SIN REEMPLAZAMIENTO Si se saca un número de una urna, existe la opción de reponer o no el número en la urna antes de la segunda extracción. En el primer caso, el n ú m e r o puede salir una y otra vez, mientras que en el segundo caso esto pasaría una vez. E l muestreo en que cada miembro de la población sería elegido más de una vez se denomina muestreo con re emplazamiento, mientras que si cada miembro no puede ser elegido más de una vez, se denomina muestreo sin reemplazamiento.

Las poblaciones son finitas o infinitas. Si, por ejemplo, se extraen 10 bolas sucesiva­mente sin reemplazamiento de una urna con 100 bolas, se hace un muestreo de una pobla­ción finita, mientras que si se lanza una moneda 50 veces y se cuenta el número de caras, el muestreo es de una población infinita.

Una población finita en la que se realiza un muestreo con reemplazamiento puede con­siderarse, teór icamente , infinita, ya que es posible extraer cualquier número de muestras sin agotar la población. Para muchos propósi tos práct icos, efectuar el muestreo de una pobla­ción finita muy grande llega a tomarse como muestreo de una población infinita.

DISTRIBUCIONES DE MUESTREO Cons idérense todas las muestras posibles de t amaño N que pueden obtenerse de una pobla­ción dada (con o sin reemplazamiento). En cada muestra se suele calcular un estadíst ico (como la media o la desviación estándar) , que varía de una muestra a otra. De esta forma se obtiene una distr ibución del estadíst ico denominada distribución muestral.

Si, por ejemplo, el estadíst ico utilizado es la media muestral, entonces la distribución se llama distribución del muestreo de medias o distribución muestral de la media. De forma similar, se pueden tener distribuciones muéstrales de las desviaciones estándar, las varianzas. las medianas, las proporciones, etcétera.

Para cada distr ibución muestral se pueden calcular la media, la desviación estándar, etcétera; es decir, es posible hablar de la media y la desviación es tándar de la distribución muestral de las medias, etcétera.

DISTRIBUCION MUESTRAL DE MEDIAS

Supóngase que se obtienen todas las muestras posibles sin reemplazamiento, de t amaño N, de una población finita de t amaño Np > N. Si se simbolizan la media y la desviación estándar de la distr ibución muestral de medias por y cr x, y la media y desviación estándar de la población por ¡A y cr, respectivamente, entonces

Si la poblac ión es infinita o el muestreo se hace con reemplazamiento, el resultado anterior se reduce a

M = V Y °x = - 7 = (2)

Para valores grandes de N (N > 30), la distribución muestral de medias es en forma aproximada una distr ibución normal, con media px y desviación es tándar a¡¡, independien­temente de la población (siempre y cuando la media y la varianza de la población sean finitas y el t amaño de la población sea al menos el doble que el de la muestra). Este resulta-

Page 3: Teoría elemental de muestreo CAPITULO 8 - ivanacal · PDF filede las diferencias de proporciones, a partir de dos poblaciones binomialmente distribuidas con parámetros (p,, q¡)

Distribución muestrai de diferencias y sumas • 185

do para una población infinita es un caso especial del teorema del límite central de la teoría avanzada de probabilidad, el cual demuestra que la precisión de la aproximación se incre­menta conforme N se hace más grande. En ocasiones esto se indica diciendo que la distribu­ción muestrai es asintóticamente normal.

En caso de que la población esté normalmente distribuida, la distr ibución muestrai de medias también lo está, aun con valores pequeños de N (es decir, /V < 30).

DISTRIBUCIÓN MUESTRAL DE PROPORCIONES

Supóngase que una población es infinita y que la probabilidad de ocurrencia de un even­to (llamado su éxito) es p, mientras que la probabilidad de la no ocurrencia del evento es q = 1 - p. Por ejemplo, la población pueden ser todos los lanzamientos posibles de una moneda, donde la probabilidad del evento "caras" es p = \. Cons idérense todas las muestras posibles, de t amaño A', obtenidas en esta población y de termínese para cada muestra la proporc ión P de éxi to . En el caso de la moneda, P sería la proporción de caras en ./V lanza­mientos. Así , se obtiene una distribución muestrai de proporciones cuya media p.P y desvia­ción estándar o> están dadas por

fpq jp{\ -p) r ? s l*P=P y ^ = V ^ = V If ( )

que suele obtenerse de las ecuaciones (2), haciendo fi = p y a - ^fpq. Para valores grandes dtN{N> 30), la distr ibución muestrai se aproxima mucho a la distr ibución normal. Nótese que la población está binomialmente distribuida.

Las ecuaciones (5) también son válidas para una población finita, donde el muestreo se hace con reemplazamiento. Para poblaciones finitas donde el muestreo se realiza sin reem-plazamiento, las ecuaciones (5) se sustituyen por las ecuaciones ( / ) , con (i = p y a= ^/pq.

Obsérvese que las ecuaciones (3) se obtienen más fáci lmente al d ividi r la media y la desviación estándar (Np y \/Ñpq), de la distr ibución binomial, entre N (véase el capítulo 7).

DISTRIBUCIÓN MUESTRAL DE DIFERENCIAS Y SUMAS

Supónganse dos poblaciones. Para cada muestra de t amaño /V„ obtenidas de la primera población, se calcula el estadíst ico S¡; esto produce una distr ibución muestrai del estadísti­co 5 „ cuyas media y desviación estándar se denotan por /xSÍ y as¡, respectivamente. De forma similar, para cada muestra de tamaño N2, obtenida de la segunda población, se calcu­la el estadíst ico S2, lo cual produce una distribución muestrai para el estadíst ico S2, cuyas media y desviación es tándar se denotan por p.n y aS2. De todas las posibles combinaciones de estas muestras para las dos poblaciones, se puede obtener una distribución de las diferen­cias, S¡ - S2, denominada distribución muestrai de las diferencias de los estadísticos. La media y la desviación estándar de esta distribución muestrai, denotadas respectivamente por - 5 2 y °~si -S2< están dadas por

M Í I - s i = fJ-sí - fe y O-SÍ-S2= Vo-|, + o-2^

suponiendo que las muestras elegidas no dependen, de ninguna manera, un¿ decir, las muestras son independientes).

Si 5, y S2 son las medias muéstrales de las dos poblaciones, c i ñ a s T i f c w se A a a — porX, y X2, respectivamente, entonces la distribución muestrai de hsááacaam x rwemm

Page 4: Teoría elemental de muestreo CAPITULO 8 - ivanacal · PDF filede las diferencias de proporciones, a partir de dos poblaciones binomialmente distribuidas con parámetros (p,, q¡)

CAPÍTULO 8 • Teoria elemental de muestreo

para poblaciones infinitas con medias y desviaciones es tándar (ju,,, cr¡) y (fj^, a2), respecti­vamente, está dada por

M\-xi = M\ - Px2 = Mi - M2 y ?X\-XÍ = \Ja\\ + ax2 = Jj¡¡ + N¡ ( 5 )

usando las ecuaciones (2). El resultado también es vál ido para poblaciones finitas si el muestreo se realiza con reemplazamiento. Se pueden obtener resultados similares para po­blaciones finitas en las cuales el muestreo se efectúa sin reemplazamiento, usando las ecuaciones (7).

Se pueden obtener los resultados correspondientes para las distribuciones muéstrales de las diferencias de proporciones, a partir de dos poblaciones binomialmente distribuidas con parámetros (p,, q¡) y (p2, q2), respectivamente. En este caso, S] y S2 corresponden a la proporción de éxitos, P¡ y P2, y las ecuaciones (4) producen los resultados

= PP\ - PP2 =P\-P2 y o-pi-n = \/°PÍ+°F2 = ( 6 1

Tabla 8-1 Error estándar para distribuciones muéstrales

Distribución muestral

Error estándar Observaciones especiales

Medias

Es válido para muestras grandes 0 pequeñas. La distri­bución muestral de medias es aproximadamente normal para N> 30, inclusive cuando la población no es normal.

f¿x ~ M> ' a media poblacional, para todos los casos.

Proporciones -P) \M

a F = \ N = V A

Las observaciones hechas para las medias también se aplican aquí.

fxP = p, para todos los casos.

Desviación estándar

(1) as = -4=

ivi / M 4 - M 2

( 2 ) ° > = v ^

Para N> 100, la distribución muestral de s es casi nor­mal.

<7j está dada por (7) sólo si la población es normal (0 aproximadamente normal). Si no es normal, se puede usar (2).

Nótese que (2) se reduce a (7) cuando /x2 = a2 y fj.4 = 3a 4, que es verdadero para las poblaciones normales.

Para N > 100, fxs = a de forma muy cercana.

Medianas HT 1.2533er

Para N > 30, la distribución muestral de la mediana es casi normal. El resultado es válido sólo si la población es normal (0 aproximadamente normal).

Primero y tercer cuartiles

1.3626a

Aquí también se aplican las observaciones hechas para las medianas.

Mei y M ( ? 3 s o n c a s ' iguales al primer y tercer cuartiles de la población.

Nótese que aQ2 =

Page 5: Teoría elemental de muestreo CAPITULO 8 - ivanacal · PDF filede las diferencias de proporciones, a partir de dos poblaciones binomialmente distribuidas con parámetros (p,, q¡)

Errores estándar • 187

Tabla 8-1 Error estándar para distribuciones muéstrales (continuación)

_• • :r.'?ución Error muestral estándar Observaciones especiales

1.7094a

1.4288a o D 2 - a m = ^_ Aquí también se aplican las observaciones hechas para

las medianas. : l e s 1.3180(7

^ 3 - ^ 7 = ^

MDI> M D 2 ' - . son casi iguales al primer, segundo y tercer deciles de la población.

Nótese que crDS = CT^. 1.2680a

Aquí también se aplican las observaciones hechas para

- semiintercuartilares <JQ = 0.7867(7 las medianas.

¡xQ es casi igual al rango semiintercuartilar de la pobla­0.7867(7

ción.

(7) <J# \ N Aquí también se aplican las observaciones hechas para \ N

la desviación estándar. Nótese que (2) da (1) si la población es normal.

fxs

2=o2(N-\ )/A, que es casi igual a a2 para N grandes.

Vinanzas

(2) a* = \

N-3 , la desviación estándar. Nótese que (2) da (1) si la población es normal.

fxs

2=o2(N-\ )/A, que es casi igual a a2 para N grandes.

Vinanzas

(2) a* = \ TV

la desviación estándar. Nótese que (2) da (1) si la población es normal.

fxs

2=o2(N-\ )/A, que es casi igual a a2 para N grandes.

Aquí v = cr/fi es el coeficiente de variación de la pobla-Coeñcientes de varianza av = , — v i + 21? ción. El resultado es válido para poblaciones normales (o

v aproximadamente normales) y para A > 100.

Si A', y N2 son grandes (A',, N2 > 30), las distribuciones muést ra les de las diferencias de medias o proporciones se distribuyen casi normalmente.

En ocasiones es útil hablar de la distribución muestral de la suma de estadísticos. La media y la desviación estándar de esta distribución están dadas por

MS1+S2 = A S I + AS2 Y &S\+S2 = \ / ° s i + °S2

suponiendo que las muestras son independientes.

ERRORES ESTANDAR La desviación es tándar de una distribución muestral de un estadíst ico se estándar. La tabla 8-1 muestra los errores es tándar de las distribuciones diversos estadíst icos, bajo las condiciones de muestreo aleatorio de (o muy grande) o de muestreo con reemplazamiento de una población presentan observaciones especiales que indican las condici dos son válidos y otras aclaraciones, pertinentes.

Las cantidades p, cr, p, pr y X, s, P, mT denotan, respectrvameme- fas viaciones estándar, las proporciones poblacionales y muéstrales y los con respecto a la media.

Es notorio que si el t amaño N de la muestra es lo ciones muést ra les son normales o casi normales. Por esto, los • f t n r in s se

Page 6: Teoría elemental de muestreo CAPITULO 8 - ivanacal · PDF filede las diferencias de proporciones, a partir de dos poblaciones binomialmente distribuidas con parámetros (p,, q¡)

1 - . - " . í • Teoría elemental de muestreo

métodos de muestreo grande. Cuando N < 30, las muestras se denominan pequeñas. La teoría de las muestras pequeñas o teoría exacta de muestreo, como se le llama a veces, se trata en el capítulo 11.

Cuando se desconocen los pa ráme t ros de pob lac ión , tales como a, p o p.r, pueden ser estimados con prec is ión por medio de sus es tad ís t icos mués t r a l e s correspondientes tales como s ( o í = \/N/(N-\)s), Py mr, si las muestras son lo suficientemente grandes.