elementos de muestreo.pdf

12
14/11/2012 1 UNIDAD 5 ELEMENTOS DE MUESTREO TECNICAS DE MUESTREO ALEATORIO a) Muestreo aleatorio simple b) Muestreo sistemático c) Muestreo por conglomerado TECNICAS DE MUESTREO NO ALEATORIO a) Muestreo dirigido b) Muestreo por cuotas c) Muestreo deliberado o por conveniencia En esta unidad estudiaremos las técnicas de muestreo aleatorio Existen 2 tipos de técnicas para la selección de muestras:

Transcript of elementos de muestreo.pdf

Page 1: elementos de muestreo.pdf

14/11/2012

1

UNIDAD 5

ELEMENTOS DE MUESTREO

TECNICAS DE MUESTREO ALEATORIO

a) Muestreo aleatorio simple

b) Muestreo sistemático

c) Muestreo por conglomerado

TECNICAS DE MUESTREO NO ALEATORIO

a) Muestreo dirigido

b) Muestreo por cuotas

c) Muestreo deliberado o por conveniencia

En esta unidad estudiaremos las técnicas de muestreo aleatorio

Existen 2 tipos de técnicas para la selección

de muestras:

Page 2: elementos de muestreo.pdf

14/11/2012

2

TECNICAS DE MUESTREO ALEATORIO

Se caracterizan porque las unidades elementales se seleccionan

con probabilidades conocidas, en dichas técnicas intervienen

las leyes probabilísticas

1. MUESTREO ALEATORIO SIMPLE

Es el proceso por medio del cual se selecciona los elementos de

una población en forma aleatoria, es decir que cada uno de los

elementos tienen la misma probabilidad de formar parte de la

muestra.

Este puede ser de dos tipos:

a) Muestreo con reposición:

Los elementos que se van seleccionando vuelven a participar las

veces que se repite el experimento. No disminuye el espacio

muestral.

1. MUESTREO ALEATORIO SIMPLE

El numero de muestras se determina por medio de la formula Nn

N: Es el tamaño de la población

n: Es el tamaño de la muestra

Ejemplo 1:

N = A,B,C,D,E

N = 2 elementos

Numero de muestras que habrán: 52 =25

AA BA CA DA EA

AB BB CB DB EB

AC BC CC DC EC

AD BD CD DD ED

AE BE CE DE EE

Cada elemento (muestra)

tiene una probabilidad de

1/25=0.04

Page 3: elementos de muestreo.pdf

14/11/2012

3

a) Para los datos del ejemplo 1, determine: Cual es la

probabilidad de seleccionar una muestra que tenga

dentro de sus elementos una letra B (solamente una).

Casos favorables = 8 Casos posibles = 25

P = 8/25 =0.32

EJEMPLO 2. Dada una población de 25 elementos,

determine el numero de muestras de 5 elementos

que pueden obtenerse.

Nn = 255 = 9,765,625

1. MUESTREO ALEATORIO SIMPLE

b) Muestreo sin reposición:

Los elementos que han sido seleccionados ya no participan en el

siguiente experimento.

Por lo tanto la formula para determinar el numero de muestras

que habrán, se utilizará la formula de combinaciones (la que no

permite repetición).

N: Es el tamaño de la población

n: Es el tamaño de la muestra

Uso de la tabla de números aleatorios para seleccionar una

muestra.

Uno de los métodos que se utiliza en la selección aleatoria de

muestras, es la tabla de números aleatorios. Su uso consiste en

enumerar toda la población, en el orden que se haya dado. Luego

usamos la tabla de números aleatorios para ir seleccionando

muestras, dicha tabla nos proporciona la ubicación de la muestra

a seleccionar.

)!(!

!

nNn

NNCn

1. MUESTREO ALEATORIO SIMPLE

Page 4: elementos de muestreo.pdf

14/11/2012

4

1. ₡ 5000 6. 2500 11. 5400 16. 3750 21. 6275 26. 6775 31. 3800 36. 4320

2. 5500 7. 3200 12. 1825 17. 5000 22. 5450 27. 2820 32. 2002 37. 2480

3. 3000 8. 4000 13. 2580 18. 6575 23. 1850 28. 2525 33. 1920 38. 5200

4. 3235 9. 6700 14. 4300 19. 4034 24. 3950 29. 4432 34. 4225 39. 1925

5. 3135 10. 6200 15. 4130 20. 4124 25. 3130 30. 4452 35. 4565 40. 1785

Ejemplo: Se tiene un listado de los salarios de 40 trabajadores de los cuales se quiere escoger

aleatoriamente una muestra de 8 salarios.

Uso de la tabla de números aleatorios para seleccionar una muestra.

De estos 40 salarios queremos escoger ocho, ya están enumerados del 1 al 40, por lo tanto en la

tabla de números aleatorios vamos a buscar valores inferiores a 40.

El número máximo que podemos encontrar es 40, puede ser cualquier numero interior también,

como este valor nada mas tiene dos cifras, vamos a observar las primeras 2 cifras de cada

cantidad que aparece en la tabla de números aleatorios.

La tabla debe tener las columnas y filas enumeradas del uno al diez. Cada una de las filas-

columnas contiene cinco cantidades de cinco cifras cada una.

Para iniciar se le proporcionará la ubicación de donde comenzará a buscar sus muestras.

Por ejemplo: inicie su búsqueda en la F4- C5.

Nos ubicamos en la tabla en la fila a cuatro columna cinco a partir del primer valor de esa fila y

col. Empezamos a observar las primeras dos cifras, nuestro objetivo son aquellos valores

inferiores a 40 en este caso, vamos buscando en esa misma columna hacia abajo, hasta

encontrar ocho datos, ya que estamos buscando seleccionar ocho muestras, esos números

encontrados serán las muestras a seleccionar de los salarios. (Ver tabla. ADELANTE)

Tabla de números

aleatorios

F4- C5. Esta dirección sólo le

proporciona el punto de partida,

y debe seguir la búsqueda de

arriba hacia abajo siempre.

Si al finalizar la búsqueda en

esta columna no ha encontrado

aún todas las muestras

buscadas, entonces debe iniciar

en la siguiente columna, siempre

de arriba hacia abajo, hasta

encontrar todas las muestras

solicitadas.

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10

F1 02711

94873

54921

77640

61545

F2

F3

F4 14636

76539

92634

46991

03985

F5 21564

89845

06779

70722

45685

F6 15364

83314

93780

09799

63794

F7 51887

86412

09333

80161

88883

F8 86022

37706

95029

83532

80875

F9 92786

11172

60446

20470

34417

Las muestras a seleccionar son:

14, 03, 21, 06,15, 09, 09, 37,11.

Ubicación de los salarios a

seleccionar.

Ya tenemos las ocho muestras

que nos piden, como el 9 ya se

había escogido, se anula el

siguiente encontrado. Y se

selecciona la siguiente muestra.

Page 5: elementos de muestreo.pdf

14/11/2012

5

Cuando ya se han encontrado las muestras se hace un listado de ellas,

en el orden en que se fueron escogiendo cada una.

14, 03, 21, 06,15, 09, 37,11.

1. 5000 6. 2500 11. 5400 16. 3750 21. 6275 26. 6775 31. 3800 36. 4320

2. 5500 7. 3200 12. 1825 17. 5000 22. 5450 27. 2820 32. 2002 37. 2480

3. 3000 8. 4000 13. 2580 18. 6575 23. 1850 28. 2525 33. 1920 38. 5200

4. 3235 9. 6700 14. 4300 19. 4034 24. 3950 29. 4432 34. 4225 39. 1925

5. 3135 10. 6200 15. 4130 20. 4124 25. 3130 30. 4452 35. 4565 40. 1785

MUESTRA SELECCIONADA ALEATORIAMENTE

14. 4300

3. 3000

21. 6275

6. 2500

15. 4130

9. 6700

37. 2480

11. 5400

Las presentamos en el orden en el que las fuimos

seleccionando. Según la tabla de números

aleatorios.

MUESTREO SISTEMATICO

Este consiste en seleccionar los elementos de la población, cada cierto numero de

dichos elementos. Este numero resulta de dividir el tamaño de la población entre el

tamaño de la muestra. Este valor se conoce como razón de muestreo y

usualmente se representa por la letra k.

2. MUESTREO SISTEMATICO

n

Nk

si k tiene valores con decimales se redondea al entero siguiente o

anterior, según aproximaciones.

Cuando ya hemos encontrado el valor de K.

El primer paso a seguir es: encontrar aleatoriamente un número que éste entre 1 y K.

Para esto podemos utilizar la tabla de números aleatorios a partir de una ubicación ya

dada (en el ejercicio). Este valor encontrado será la ubicación de la primera muestra a

elegir. La población debe estar ordenada previamente.

Para seleccionar las siguientes muestras; al primer valor encontrado le vamos

sumando el valor de K, hasta obtener el número de muestras que se piden.

Ver ejemplo siguiente.

Page 6: elementos de muestreo.pdf

14/11/2012

6

2. MUESTREO SISTEMATICO

Ejemplo 1. Una empresa encontró que se habían registrado 2000 recibos de

ventas los cuales se almacenaron en cajones en un archivero y decidieron

seleccionar 100 recibos para calcular el ingreso medio en dólares.

Como los recibos están almacenados en un archivero no es necesario que los

enumere. Sino que encontramos k y vamos seleccionando de una vez del

archivero, el recibo que está en la ubicación que se determina:

N=2000

n= 100 20

100

2000k

1º. En número de inicio se elige aleatoriamente entre 1 y k, entonces

podemos seleccionar cualquier numero entre 1 y 20, esto puede ser por

medio de la tabla de números aleatorios.

Digamos que se ha sugerido iniciar la búsqueda del número aleatorio a partir

de la columna 3 fila 5,(C3-F5), entonces como nos interesa encontrar un

número menor que 20, observamos las primeras 2 cifras de cada una de las

cantidades, desde la ubicación dada (siempre en el sentido de arriba hacia

abajo) hasta encontrar un número que éste entre uno y 20.

Esta es la constante que le vamos sumando al

primer numero encontrado aleatoriamente. Para

ir seleccionando todas las muestras que se

piden.

El primer de número de esa columna y fila que aparece en la tabla es 11838, al

observar las primeras dos cifras vemos que es el número once, eso significa que la

primer factura a escoger es la que está en la posición 11, Cuando ya hemos escogido

el primer número aleatoriamente, a este valor le vamos sumando el valor de K

consecutivamente, y esto nos irá dando la ubicación de las facturas a seleccionar como

muestra.

MUESTRA ESCOGIDA POR MUESTREO SISTEMATICO

Posición de las facturas a escoger:

+K

+20 Ir sumando K, hasta completar

las 100 muestras que se piden

11 211 411

31 231 431

51 251 451

71 271

91 291

111 311

131 331

151 351

171 371

191 391

Primer número se escoge aleatoriamente,

y a este se le va sumando K

Page 7: elementos de muestreo.pdf

14/11/2012

7

3. MUESTREO POR CONGLOMERADO En este tipo de muestreo la población se divide en sub-grupos

llamados conglomerados. Los elementos dentro de cada

conglomerado se seleccionan de la forma mas heterogénea

posible con respecto a la variable estudiada, y cada

conglomerado con respecto a otro debe ser lo mas homogéneo

posible.

Cuando a usted le asignan hacer una investigación, lo primero

que hace es empezar a delimitar su población por ejemplo

haciendo grupos más pequeños.

Por ejemplo: se le pide hacer una investigación en San

Salvador sobre las familias que no poseen agua potable.

Lo primero que usted hace es hacer grupos más pequeños de

su población porque no podrá investigar a todo San Salvador

casa por casa

por ejemplo:

San salvador

colonias colonias colonias

pasajes pasajes pasajes

casas casas casas

1

2

3

1

2

3

Muestreo de una etapa

Muestreo de dos etapas

Muestreo de tres etapas

POBLACION

CONGLOMERADOS

Primero selecciona algunas colonias específicas de San Salvador:

éste sería un primer sub- grupo y le llamaremos muestreo de una

etapa.

Luego será necesario dividir otros un grupo, este será un muestreo

de dos etapas, ya que tomamos un segundo sub grupo; que podría

ser seleccionar ciertos pasajes de cada colonia.

Un tercer sub grupo podría ser seleccionar algunas casas de los

pasajes, éste sería un muestreo de tres etapas.

3. MUESTREO POR CONGLOMERADO

Page 8: elementos de muestreo.pdf

14/11/2012

8

En conclusión:

Se pretendía estudiar a San Salvador, de San

Salvador se escogen algunas colonias, de estas

colonias se selecciona algunos pasajes, y de estos

pasajes se selecciona algunas casas. Siendo estas

últimas la muestra seleccionada para nuestra

investigación.

3. MUESTREO POR CONGLOMERADO

DISTRIBUCION MUESTRAL

DISTRIBUCION MUESTRAL: Es el conjunto de estadísticos

(valores que resultan del análisis de muestreo), que pueden

obtenerse de las diferentes muestras de igual tamaño que

conforman una población determinada.

DISTRIBUCION MUESTRAL DE MEDIAS

•Es una distribución de probabilidades de todas las medias

posibles de las muestras de igual tamaño que se pueden extraer

de poblaciones dadas.

Para realizar una distribución muestral de medias es necesario

seguir los siguientes pasos:

Page 9: elementos de muestreo.pdf

14/11/2012

9

DISTRIBUCIÓN MUESTRAL DE MEDIAS. 1. Determinar el # de muestras 2. Listar todas las muestras 3. Calcular la media para cada muestra. 4. Agrupación de media y calculo de la media de medias . Completar la siguiente tabla. 5. Cálculo de la media poblacional (la media de la población dada) 6. Confirmar que 7. Calculo del error típico 8. Confirmar que

Muestreo con reposición: Muestreo sin reposición

Para: Muestreo con reposición

Error típico para muestra

Error típico para población

Tabla para encontrar la desviación

Donde:

n: son los elementos que se toman de la población

N: son el total de elementos de la población

Para: Muestreo sin reposición

Error típico para muestra

Error típico para población

se determina de la misma manera que para muestreo

con reposición.

F

( )x

( )x

x ( )F x 2( )F x x

( )x

x

( )

( )

2( )f x xx

f

2( )f x xx

f

2( )x x

DISTRIBUCION MUESTRAL DE MEDIAS

Cómo determinar el número de muestras y como listar las muestras.

1. Se tiene la siguiente población: N= A,B,C,D.

(N= 4 elementos)

Determine cuántas muestras de dos elementos (n=2) se pueden obtener y haga un

listado de esas muestras.

Utilice los dos métodos: muestreo con reposición y sin reposición.

Muestreo con reposición

Número de muestras que se obtienen al seleccionar dos elementos de cuatro.

N=4 n=2

Habrán 16 muestras de 2 elementos

N= A,B,C,D.

Listar muestras: cada elemento de la población se relaciona con todos los elementos.

24 16nN

AA BA CA DA

AB BB CB DB

AC BC CC DC

AD BD CD DD

Page 10: elementos de muestreo.pdf

14/11/2012

10

Muestreo sin reposición

Número de muestras que se obtienen al seleccionar dos elementos de cuatro.

N=4 n=2

Se tendrán 6 muestras de 2 elementos

Listar muestras: como no se permite repetición; El primer elemento de la población se

relaciona con todos los elementos que aparecen después de él. El segundo elemento

se relaciona, con todos los elementos que están después de él. El tercer elemento se

relaciona con todos los que están después de él. Y así sucesivamente.

N= A,B,C,D.

DISTRIBUCION MUESTRAL DE MEDIAS

24 6NCn C

AB BC CD

AC BD

AD

Establece que para muestras aleatorias grandes, la

distribución muestral de medias tiende en su forma a la

distribución normal, cualquiera que fuera la distribución de la

población de la cual se seleccionó la muestra.

El teorema del limite central conduce al uso del error estándar.

Si tienden a una distribución normal podemos determinar

entonces valores de Z. (Al encontrar un valor de Z, podemos utilizar la tabla de áreas bajo la

curva, del mismo modo que lo hacíamos en el en el tema de distribución normal estándar)

TEOREMA DEL LIMITE CENTRAL

x

xZ

Error estándar

Cuando no se conoce la población

Error estándar

Cuando se conoce la población

x .1

N n

Nn

x

n

Valores a

buscar en la

tabla de

áreas bajo la

curva

N: total de datos de la población

n: elementos que seleccionan la población.

: Es la media población

: Es la media de la muestra

: Es la desviación estándar de la población

: Es el error estándar de la población x

x

Page 11: elementos de muestreo.pdf

14/11/2012

11

Ejemplo1: de una población de 600 personas se selecciona una muestra de 81

personas, se sabe que el salario promedio de la población es de $3,000 con una

desviación estándar de $ 220.

a) Cuál es la probabilidad de que en dicha muestra la media sea de $ 2,980

b) cuál es la probabilidad de que en dicha muestra la media sea mayor de $2,980

c) cuál es la probabilidad que la media se encuentra entre $3,040 y $ 3,060

En el enunciado del ejercicio le darán el valor de la media poblacional, la desviación estándar, el tamaño de la

muestra y el tamaño de la población.

Y en cada uno de los literales le proporcionarán la media de la muestra, valor que tendrá que pasar a un

equivalente en Z, para poder graficar el área bajo la curva.

Del enunciado se conoce:

TEOREMA DEL LIMITE CENTRAL

3,000

220

600

81

N

n

a) Cuál es la probabilidad de que en dicha muestra la

media sea de $ 2,980

En la curva: en el punto central de la distribución en

forma de campana, se gráfica media de la población,

y la media de la muestra se grafica atrás o delante de

la media de la población, luego se encuentran los

valores de Z para poder dar la probabilidad que se

piden.

2,980x

2,980 3,000

a) Cuál es la probabilidad de que en dicha muestra la media sea de $ 2,980

Como no nos dice que sea mayor o menor a ese valor por lo tanto nos están pidiendo la probabilidad exacta que hay desde el cero

hasta el valor Z encontrado

Z= - 0.88 0

x220 600 81

. . 22.641 600 181

N n

Nn

2980 30000.88

22.64x

xZ

3,000

220

600

81

N

n

2,980x

Cuando se conoce N se usa:

Buscando un valor equivalente para la media de 2, 980

El área para Z= - 0.88 es 0.3106

Entonces la probabilidad de que la

muestra sea de 2980 es P= 0.3106

0.3106

Page 12: elementos de muestreo.pdf

14/11/2012

12

b)cuál es la probabilidad de que en dicha muestra la media sea mayor de $2,980

La media de la muestra sigue teniendo el mismo valor

Los otros datos se mantienen constantes

3,000

220

600

81

N

n

2,980x

x 22.64

2,980 3,000

Z= - 0.88 0

0.3106 Que sea mayor que 2,980

sombreamos a la derecha

de ese valor.

Ya conocíamos el valor de

Z equivalente.

0.5

Por lo tanto la Probabilidad de que sea mayor de 2980 es:

P= 0.3106 + 0.5 = 0.8106

c) cuál es la probabilidad que la media se encuentra entre $3,040 y $ 3,060 Como hay dos medias debemos encontrar dos valores de Z

3,000

220

600

81

N

n

x 22.64

3,040

3,060

x

x

0.4960

3000 3040 3060

El área total sombreada se obtiene en este

caso restando al área mayor, el área menor.

P=0.4960 – 0.4616 = 0.0334

Se sombrea el área entre

los dos valores graficados.

0 Z=1.77 Z=2.65

0.4616

3040 30001.77

22.64

3060 30002.65

22.64

x

x

xZ

xZ