8 muestreo aleatorio

15
Tema: Estadística Inferencial 1. MUESTREO ALEATORIO

description

 

Transcript of 8 muestreo aleatorio

Page 1: 8 muestreo aleatorio

Tema: Estadística Inferencial

1. MUESTREO ALEATORIO

Page 2: 8 muestreo aleatorio

Muestra y población

• Población: es el conjunto de todos los elementos que poseen una determinada

característica. En general supondremos que la población es muy grande.

• Muestra: es un subconjunto de la población.

• Muestreo: es el proceso mediante el cual se escoge una muestra de la población.• Inferencia estadística: proceso a través del cual se obtienen conclusiones sobre una

población, a través de la información que proporciona una muestra. La confianza de tal extrapolación dependerá de la representatividad de la muestra.

· Razones para usar muestras: economía, observación destructiva, etc.

La representatividad de la muestra depende de dos cosas:

a) Del mecanismo de selección: que ha de garantizar que no hay un elemento de la población con más probabilidad que otro de entrar en la muestra. Si no, sería una muestra sesgada.

b) Del tamaño de la muestra: si el mecanismo de selección es correcto, cuanto más grande sea la muestra mayor será la probabilidad de que se parezca a la población.

Page 3: 8 muestreo aleatorio

Tipos de muestreo

Muestreo aleatorio Muestreo no aleatorio

Ejemplo. Tres empresas están investigando el nivel adquisitivo de las personas que acuden a un determinado concierto de música clásica. Para ello, cada una elige una muestra de la siguiente manera:

1.- 50 primeras personas que entren en el auditorio.

2.- 50 personas elegidas al azar de las que se ubican en la platea baja.

3.- 50 personas elegidas al azar de todas las asistentes.

Ventajas y desventajas

Page 4: 8 muestreo aleatorio

Tipos de muestreo aleatorio

Muestreo aleatorio simple: todos los elementos de la población tienen la misma probabilidad de ser elegidos para formar parte de la muestra.

Muestreo aleatorio estratificado: la población se divide en grupos homogéneos que llamamos estratos. La proporción de cada estrato en la población se mantiene en la muestra. Cada uno de los estrato de la muestra se obtiene por muestreo aleatorio simple sobre el estrato correspondiente de la población.

Población

Estrato 1 Estrato 2

Muestra

Page 5: 8 muestreo aleatorio

Tipos de muestreo aleatorio (II)

Muestreo aleatorio sistemático: se selecciona al azar un elemento de la población y a partir de él se seleccionan de k en k los elementos siguientes.

Muestreo por conglomerados y áreas: se divide la población en distintas secciones o conglomerados. Se eligen al azar unas pocas de estas secciones y se toman todos los elementos de las secciones elegidas para formar la muestra.

Para dividir la población en secciones podemos usar las provincias.

Page 6: 8 muestreo aleatorio

Tipos de muestreo no aleatorio

Muestras erráticas o casuales

Muestras intencionadas o racionales

Muestras por cuotas

Muestras “bola de nieve”

Page 7: 8 muestreo aleatorio
Page 8: 8 muestreo aleatorio

Distribución en el muestreo de la media

• Los distintos valores de – xi dan lugar a una variable aleatoria que representamos

por –X y se llama media muestral. La distribución de los valores de

–X se llama

distribución en el muestreo de la media.

La variable aleatoria –X tiene las siguientes características:

1. Media :

2. Desviación típica: n

3. A medida que n crece, la distribución de –X se aproxima a la normal.

Si σ es desconocida, se aproxima con s ·√n / √(n – 1) Apuntes

Supongamos que en una población una variable aleatoria se distribuye con media μ y desviación típica σ.

• Al tomar diferentes muestras de igual tamaño en la población y calcular sus medias

y sus desviaciones típicas, obtendremos – x1, – x2, ..., – xn y s1, s2, ... , sn

Page 9: 8 muestreo aleatorio

Distribución en el muestreo de la media

Se supone que la distribución de la temperatura del cuerpo humano en la población tiene una media μ = 37º y una desviación típica σ = 0,85º. Se elige una muestra de 105 personas. Se desea obtener la probabilidad de la media de la muestra sea menor que 36,9º.

La variable aleatoria –X se distribuye como una N(

n

) = N (37, 0,083)

Se debe recordar que para una variable aleatoria continua se tiene que: p(Z a) = p(Z < a)

Al ser n = 105, consideramos que la variable aleatoria media muestral es normal.

Por tanto:

p( –X 36,9) = p

X –370,083

36,9 –37

0,083 = p( Z – 1,20) = 1 – p(Z 1,20) = 1 – 0,8849 =

= 0,115

Page 10: 8 muestreo aleatorio

Teorema central del límite: idea intuitiva

• Muchos fenómenos se pueden considerar como suma de efectos parciales independientes, pudiendo ocurrir que aunque los efectos no se ajusten a la normal, el fenómeno resultante tienda asintóticamente a la normal.

• Una simulación con ordenador nos puede ayudar a entender esto:

1000 lanzamientos de un dado 1000 medias de dos dados

1000 medias de 4 dados 1000 medias de 10 dados

Page 11: 8 muestreo aleatorio

Teorema central del límite

Sea X una variable aleatoria de una población de media y desviación típica , entonces se verifica que 1. La variable aleatoria media muestral (con muestras de tamaño n) tiene

media y desviación típica n

2. La variable aleatoria media muestral se aproxima a una normal a medida que crece el tamaño de la muestra n

¿Qué se entiende por "cuando crece n"?

• Si la población de partida es normal, la distribución de las medias muestrales es normal, cualquiera que sea n.

• Si la distribución de partida no es normal, la distribución de las medias muestrales es normal si n 30.

Ya dijimos que…

Page 12: 8 muestreo aleatorio

Teorema central del límite: visión gráfica

Normal Uniforme Sesgada

Distribución de la población de partida

Distribución de las medias muestrales para n = 5

Distribución de las medias muestrales para n = 10

Distribución de las medias muestrales para n = 30

Page 13: 8 muestreo aleatorio
Page 14: 8 muestreo aleatorio

Distribución en el muestreo de una proporción

• Supongamos que en una población la proporción de elementos con una determinada característica es p.

• En una muestra cualquiera la proporción de individuos con dicha característica será p̂. • Los distintos valores de p̂ dan lugar a una variable aleatoria que representamos por

^P, y

que recibe el nombre de proporción muestral. La distribución de ^P se llama distribución

en el muestreo de una proporción.

La variable aleatoria ^P tiene las siguientes características:

1. Media : p

2. Desviación típica: p(1 – p)

n

3. A medida que n crece, la distribución de ^P se aproxima a la normal,

siempre que p no se acerque ni a 0 ni a 1. En cualquier caso, se considera normal si n ≥ 30.

Page 15: 8 muestreo aleatorio

Distribuciones en el muestreo de una

proporciónUn nuevo medicamento ha curado al 85 % de los enfermos a los que se les ha aplicado. Determinar las distribuciones en el muestreo de la proporción de enfermos curados para muestras de tamaño 30, 100 y 1000 personas.

Tamañode la

muestra:n

Media:p

Desviación típica:

p(1 – p)n

Distribuciónmuestral

N(p, p(1 – p)

n )

30 0,85 0,85(1 – 0,85)30 = 0,065 N(0,85; 0,065)

100 0,85 0,85(1 – 0,85)100 = 0,036 N(0,85; 0,036)

1000 0,85 0,85(1 – 0,85)1000 = 0,011 N(0,85; 0,011)

En nuestro caso p = 0,85

Conviene observar cómo, a medida que el tamaño de la muestra crece, la desviación típica disminuye.