1. Muestreo Aleatorio Simple€¦ · Un procedimiento de extraer una muestra aleatoria de una...

14
10/02/2015 1 UNIVERSIDAD TECNOLÓGICA DE PEREIRA FACULTAD DE INGENIERIA INDUSTRIAL Estadística III-Material 2-2012 Revisión y Cambios y Ampliación: Ing. José Alejandro Marín Fuente Primaria: Ing. César Augusto Zapata Urquijo 1. Muestreo Aleatorio Simple Muestro aleatorio simple es cuando una muestra es formulada de tal manera que cada elemento en la población tiene la misma oportunidad de ser incluido. Una forma podría ser escribir en papelitos los nombres de los elementos de la población y depositarlos en una caja, si la muestra fuera de diez elementos, entonces sacamos diez papelitos. Otra forma es usar un número de identificación para cada uno de los integrantes de la población y seleccionar la muestra mediante una tabla de números aleatorios. Como su nombre lo indican estos números han sido generados mediante un proceso aleatorio en una computadora. Para cada dígito de un número la probabilidad es la misma. Entonces la probabilidad de que el elemento 22 sea seleccionado es igual a la del elemento 382. 1. Método de selección: Un procedimiento de extraer una muestra aleatoria de una población finita es el de enumerar todos los elementos que conforman la población, escribir esos números en bolas o papelitos echarlos en una bolsa, mezclarlos bien removiéndolos y sacar uno a uno tantos como lo indique el tamaño de la muestra. En este caso los elementos de la muestra lo constituirán los elementos de la población cuyos números coincidan con los extraídos de la bolsa. Otro procedimiento para obtener una muestra de una población ya sea el muestreo con reemplazo o sin reemplazo es mediante la utilización de la tabla de números aleatorios pero solamente para poblaciones finitas, la utilización de estas tablas puede realizarse de diferentes modos pero solo expondremos el que consideramos más eficiente ya que no se

Transcript of 1. Muestreo Aleatorio Simple€¦ · Un procedimiento de extraer una muestra aleatoria de una...

10/02/2015 1

UNIVERSIDAD TECNOLÓGICA DE PEREIRA FACULTAD DE INGENIERIA INDUSTRIAL

Estadística III-Material 2-2012 Revisión y Cambios y Ampliación: Ing. José Alejandro Marín Fuente Primaria: Ing. César Augusto Zapata Urquijo

1. Muestreo Aleatorio Simple

Muestro aleatorio simple es cuando una muestra es formulada de tal

manera que cada elemento en la población tiene la misma oportunidad de ser incluido.

Una forma podría ser escribir en papelitos los nombres de los elementos

de la población y depositarlos en una caja, si la muestra fuera de diez elementos, entonces sacamos diez papelitos.

Otra forma es usar un número de identificación para cada uno de los

integrantes de la población y seleccionar la muestra mediante una tabla de números aleatorios. Como su nombre lo indican estos números han

sido generados mediante un proceso aleatorio en una computadora. Para cada dígito de un número la probabilidad es la misma. Entonces la

probabilidad de que el elemento 22 sea seleccionado es igual a la del elemento 382.

1. Método de selección:

Un procedimiento de extraer una muestra aleatoria de una población

finita es el de enumerar todos los elementos que conforman la

población, escribir esos números en bolas o papelitos echarlos en una bolsa, mezclarlos bien removiéndolos y sacar uno a uno tantos como lo

indique el tamaño de la muestra. En este caso los elementos de la muestra lo constituirán los elementos de la población cuyos números

coincidan con los extraídos de la bolsa.

Otro procedimiento para obtener una muestra de una población ya sea el muestreo con reemplazo o sin reemplazo es mediante la utilización de

la tabla de números aleatorios pero solamente para poblaciones finitas, la utilización de estas tablas puede realizarse de diferentes modos pero

solo expondremos el que consideramos más eficiente ya que no se

10/02/2015 2

necesita de la búsqueda de una gran cantidad innecesaria de números

aleatorios en la tabla, el cual será ejemplificado.

Veamos cómo se procede para la utilización de la tabla. Consideremos

que se desea extraer de una población de tamaño N una muestra de tamaño n. Se selecciona el bloque, la fila y la columna de la tabla que se

va a comenzar, a partir de esta selección se toman tantas columnas como dígitos tiene N. Comenzando por el primer número de las

columnas seleccionadas se irán incluyendo en la muestra aquellos individuos que en la lista de la población (ya sea de forma horizontal o

vertical) ocupa la posición de los n números de las columnas seleccionadas que resultan menores que N, en los casos que al

seleccionar un número en la tabla de números aleatorios sea mayor que N, puede continuarse con el siguiente numero aleatorio.

Ejemplo 1

En una compañía con 750 trabajadores se quiere obtener una muestra

aleatoria de 15 elementos para un chequeo médico. Los trabajadores

fueron numerados del 1 al 750 y mediante una tabla de números aleatorios se procedió a seleccionarlos. El punto de arranque en la tabla

se fijó mediante la hora en ese momento, 3:04, por lo tanto se inició en la columna 3, renglón 4. Como los números de los trabajadores van

desde 1 hasta 750 solo se toman en cuenta las primeras 3 cifras de cada número que se encuentren en ese rango. En seguida se muestra

una parte de la tabla, con el primer y segundo seleccionado:

Tabla de números aleatorios

18893 07211 23634 75296 86155 65832 27568 31727 90756 14268 65051 52438

69553 48743 06254 73002 34432 55737 88808 11755 42537 02294 68261 73891

74762 13168 32235 57554 35551 98909 65424 11892 20410 16332 82346 30389

86729 67167 24091 67155 17880 31659 02868 62563 53144 17494 79513 55413

43788 87547 16648 88536 77678 37739 95434 15078 80473 71844 02765 93879

83382 59617 20074 22002 35536 98298 63522 31818 84784 39280 64191 39429

De tal forma fueron seleccionados que la muestra quedó integrada por los trabajadores con los números:

240 671 178 316 28

625 531 174 554 437

166 377 150 718 27

10/02/2015 3

Este muestreo se puede realizar utilizando Microsoft Excel siguiendo los

pasos siguiente:

a) Se instala la opción de análisis de datos para ello se va a

herramienta luego a complemento y se activa en la ventana complemento la opción herramienta para análisis.

b) Se abre una hoja Excel y se introducen los datos de la población en columna.

c) Se va a herramienta y se elige análisis de datos y en esta ventana se selecciona la opción muestra.

d) En la ventana muestra se introduce el rango de entrada que sería seleccionar todos los valores de la población, si al suministrar en

la hoja Excel los datos de la población al inicio se le designan a estos alguna variable o comentario debe activarse la opción rótulo

de lo contrario no debe ser activada, se activa la casilla de muestreo aleatorio y se introduce el tamaño de muestra deseado.

e) Se selecciona el rango de salida que consiste en seleccionar una celda en la hoja Excel que no esté afectada por ninguna

información ni hacia abajo ni a la derecha de la misma.

f) Se selecciona aceptar en esta ventana y saldrá el resultado deseado que sería las muestras elegidas por el programa en la

población.

10/02/2015 4

Ejemplo 2

Dada la siguiente población formada por la edad de padres de familia de

200 núcleos familiares de una cierta región de la ciudad.

Seleccione una muestra aleatoria de tamaño 10 (use la tabla de

números aleatorios), numere la población horizontalmente.

48 49 50 51 50 46 47 56 47 38

53 50 47 46 48 47 48 46 46 50

42 51 51 49 47 51 48 47 42 49

46 48 50 47 48 47 51 56 45 49

45 54 61 46 48 46 46 47 50 34

46 46 51 39 53 55 52 49 47 46

33 40 52 46 44 52 44 54 41 33

48 49 52 42 42 49 47 47 38 48

44 43 44 40 44 45 49 44 43 42

49 49 48 41 51 51 52 42 40 47

37 48 45 46 50 45 47 53 43 47

44 40 46 46 45 48 47 42 47 46

52 53 47 49 46 47 49 42 43 42

43 38 52 50 44 52 44 53 43 45

41 57 47 48 52 53 40 49 40 50

45 42 44 53 57 46 62 47 50 47

45 51 43 45 39 39 41 44 35 41

54 48 51 53 54 42 48 51 37 38

42 37 52 50 45 55 51 46 38 43

53 43 42 39 46 52 53 39 51 40

Para extraer la muestra lo primero que hacemos es disponer dos

columnas en las cuales la primera se ubicaran los números aleatorios, es decir los números extraídos de la tabla de números aleatorios; y en la

segunda columna se encontrara los valores de la muestra.

Número aleatorio ix Muestra

10/02/2015 5

FORMULAS DE TRABAJO MUESTREO ALEATORIO

Después de desarrollado el proceso de selección de la muestra, se

procede a realizar las estimaciones necesarias para estimar los

parámetros poblaciones y determinar un limite para el error.

1. MEDIA POBLACIONAL

Estimador de la media poblacional μ:

�̂� = �̅� =∑ 𝑦𝑖

𝑛

Varianza Estimada de �̅�:

�̂�(�̅�) = 𝑠2

𝑛(

𝑁 − 𝑛

𝑁)

donde:

𝑠2 =∑(𝑦𝑖 − �̅�)2

𝑛 − 1=

∑ 𝑦𝑖2 −

(∑ 𝑦𝑖)2

𝑛𝑛 − 1

Limite para el Error de estimación:

2√�̂�(�̅�) = 2√𝑠2

𝑛(𝑁 − 𝑛

𝑁)

10/02/2015 6

Ejemplo:

Una muestra irrestricta aleatoria de n=9 registros de un hospital es seleccionada para estimar la cantidad promedio de la deuda sobre

N=484 cuentas abiertas. Los valores de la muestra par estos nueve registros están listados en la tabla siguiente. Estime μ, la cantidad promedio de la deuda, y establezca un limite para el error de estimacion.

Registro

No.

Cantidad de

dinero Adeudada

y1 33.5

y2 32.0

y3 52.0

y4 43.0

y5 40.0

y6 41.0

y7 45.0

y8 42.5

y9 39.0

Al sumar las cantidades en la columna y, obtenemos:

∑ 𝑦𝑖 = 368.0 y ∑ 𝑦𝑖

2 = 15332.5

Yi Yi2

33.5 1122.25

32 1024.00

52 2704.00

43 1849.00

40 1600.00

41 1681.00

45 2025.00

42.5 1806.25

39 1521.00

Suma 368 15332.50

Se necesitan estas dos cantidades para calcular �̅� y s2. La estimación de

μ es:

�̂� =∑ 𝑦𝑖

𝑛=

368.0

9= $40.89

10/02/2015 7

Para calcular el limite para el error de estimación, se debe calcular:

𝑠2 =∑ 𝑦𝑖

2 −(∑ 𝑦𝑖)𝟐

𝑛𝑛 − 1

=15332.5 −

(368.0)2

98 − 1

= 35.67

Utilizando las ecuaciones anteriores, se obtiene el limite para el error de

estimación,

2√�̂�(�̅�) = 2√𝑠2

𝑛(

𝑁 − 𝑛

𝑁) = 2√

35.67

9(

484 − 9

484) = 2√3.89 = 3.944 = $3.94

En resumen, la estimación de la cantidad media de dinero adeudada por

cuenta, μ, es de �̅�=$40.89. Aunque no se puede estar seguro que tan

cerca esta �̅� de μ, se puede decir que hay suficiente confianza en que el

error de estimación es menor que $3.94.

10/02/2015 8

2. TOTAL POBLACIONAL

Muchas encuestas son desarrolladas para obtener información acercas

de un total poblacional. Un auditor de las cuentas del hospital del

ejemplo anterior probablemente podría estar interesado en verificar la cifra calculada para el total de cuentas por cobrar para el total de

cuentas abiertas del hospital.

El total poblacional, es decir, la suma de todas las observaciones de la población, se denota por el símbolo 𝜏. Por lo tanto,

𝑁𝜇 = 𝜏

Estimador del Total Poblacional 𝝉:

�̂� = 𝑁�̅� =𝑁 ∑ 𝑦𝑖

𝑛

Varianza Estimada de �̂�:

�̂�(τ̂) = �̂�(𝑁�̅�) = 𝑁2 (𝑠2

𝑛) (

𝑁 − 𝑛

𝑁)

donde:

𝑠2 =∑(𝑦𝑖 − �̅�)2

𝑛 − 1=

∑ 𝑦𝑖2 −

(∑ 𝑦𝑖)2

𝑛𝑛 − 1

Limite para el Error de estimación:

2√�̂�(𝑁�̅�) = 2√𝑁2

(𝑠2

𝑛) (

𝑁 − 𝑛𝑁

)

10/02/2015 9

EJEMPLO:

Una empresa esta interesada en el tiempo por semana que los científicos emplean en ciertas tareas. Las hojas de control de tiempo de

una muestra de n=50 empleados muestran que la cantidad promedio de

tiempo empleado en esas tareas es de 10.31 horas, con una varianza muestral de s2=2.25. La compañía emplea N=750 científicos. Estime el

numero total de horas-hombre que se pierden por semana en las tareas y establezca un limite para el error de estimación.

Solución:

N=750 �̅�=10.31

N=50 s2=2.25

�̂� = 𝑁�̅� = 750 ∗ 10.31 = 7732.5 ℎ𝑜𝑟𝑎𝑠

Limite para el error:

2√𝑁2 (𝑠2

𝑛) (

𝑁 − 𝑛

𝑁) = 2√7502 (

2.25

50) (

750 − 50

750) = 307.4 ℎ𝑜𝑟𝑎𝑠

Por lo tanto la estimación del tiempo total perdido es de �̂� =7732.5 ℎ𝑜𝑟𝑎𝑠. Además se puede afirmar con un alto nivel de confianza

que el error de estimación es menor que 307.4 horas.

10/02/2015 10

3. SELECCIÓN DEL TAMAÑO DE MUESTRA

El numero de observaciones necesarias para estimar una media y/o total

poblacional con un limite para el error de estimación de magnitud B se

desarrollan a continuación:

Tamaño de muestra requerido para estimar 𝝁 con un limite de

para el error de estimación B:

𝑛 =𝑁𝜎2

(𝑁 − 1)𝐷 + 𝜎2

donde 𝐷 =𝐵2

4

Ejemplo:

La cantidad promedio de cuentas por cobrar de un hospital debe ser estimada, aunque no se cuenta con mucha información, se sabe que las

cuentas tienen una varianza de 𝜎2 = 625. Existen N=1000 cuentas

abiertas, encuentre el tamaño de muestra necesario para estimar 𝜇 con

un limite de para el error de estimación de B=$3.

Se calcula entonces D:

𝐷 =𝐵2

4=

32

4= 2.25

Reemplazando tenemos:

𝑛 =𝑁𝜎2

(𝑁 − 1)𝐷 + 𝜎2=

1000 ∗ 625

(1000 − 1)2.25 + 625= 217.56

Esto es, se necesita aproximadamente 218 observaciones para estimar 𝜇, la media de las cuentas por cobrar, con un limite para el error de

estimación de B=$3.

10/02/2015 11

Tamaño de muestra requerido para estimar 𝝉 con un limite de

para el error de estimación B:

𝑛 =𝑁𝜎2

(𝑁 − 1)𝐷 + 𝜎2

donde 𝐷 =𝐵2

4𝑁2

Ejemplo:

Un investigador esta interesado en estimar la ganancia en peso total en un periodo de 4 semanas de N=1000 pollitos alimentados con cierto

alimento. Obviamente, pesar cada uno de los pollitos seria una tarea tediosa y demorada. Se debe determinar el numero de pollitos que

serán seleccionados para estimar 𝝉 con un limite para el error de

estimación igual a 1000 gramos. Estudios previos dicen que la varianza

poblacional 𝜎2 es de aproximadamente 36 gramos. Determine el tamaño

de muestra requerido.

𝐷 =𝐵2

4𝑁2=

10002

4 ∗ 10002= 0.25

𝑛 =𝑁𝜎2

(𝑁 − 1)𝐷 + 𝜎2=

1000 ∗ 36

(1000 − 1)0.25 + 36= 125.98

Por lo tanto, el investigador necesita pesar n=126 pollitos para estimar el total poblacional 𝝉, la ganancia en peso total en las 4 semanas de

N=1000 pollitos, con un limite para el error de estimación igual a 1000

gramos.

10/02/2015 12

4. PROPORCIÓN POBLACIONAL

En varios casos, el investigador esta interesado en estimar la proporción

(porcentaje) de la población que posee una característica especifica.

Esto se deduce del un experimento binomial en el cual, una observación pertenece o no a la categoría estudiada.

Se definen entonces:

p = Proporción poblacional

�̂� = Estimador de la proporción poblacional

Sea

𝑌𝑖 = 0 No posee la característica

𝑌𝑖 = 1 Si posee la característica

∑ 𝑦𝑖 = 𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑞𝑢𝑒 𝑝𝑜𝑠𝑒𝑒𝑛 𝑙𝑎 𝑐𝑎𝑟𝑎𝑐𝑡𝑒𝑟𝑖𝑠𝑡𝑖𝑐𝑎

𝑛

𝑖=1

Estimador de la proporción poblacional �̂�:

�̂� =∑ 𝑦𝑖

𝑛= �̅�

Varianza Estimada de �̂�:

�̂�(�̂�) = 𝑝�̂�

𝑛−1(

𝑁−𝑛

𝑁) donde �̂� = 1 − �̂�

Limite para el Error de estimación:

2√�̂�(�̂�) = 2√�̂��̂�

𝑛 − 1(

𝑁 − 𝑛

𝑁)

10/02/2015 13

Ejemplo

De una muestra irrestricta aleatoria de n=100 estudiantes de ultimo año en una colegio se quiere estimar la fracción (proporción) de

estudiantes que asistirán a la universidad de un total de N=300 estudiantes. Sea entonces yi=0 si el estudiante no planea ir a la

universidad y yi=1 si el estudiante planea ir a la universidad. Usando los datos de la muestra se obtiene que:

∑ 𝑦𝑖 = 15100

𝑖=1 estudiantes respondieron afirmativamente en su intención de

ir a la universidad.

La proporción muestral esta dada por:

�̂� =∑ 𝑦𝑖

𝑛=

15

100= 0.15

El limite para el error de estimación se calcula con:

2√�̂�(�̂�) = 2√�̂��̂�

𝑛(

𝑁 − 𝑛

𝑁) = 2√

(0.15)(0.85)

(100 − 1)(

300 − 100

300) = 0.059

donde �̂� = 1 − �̂� = 1.0.15 = 0.85

Por lo tanto, se estima que 0.15 (15%) de los estudiantes de ultimo año planea ir a la universidad, con un limite para el error de estimación igual

a 0.059 (5.9%).

10/02/2015 14

Tamaño de muestra requerido para estimar �̂� con un limite de

para el error de estimación B:

𝑛 =𝑁𝑝𝑞

(𝑁 − 1)𝐷 + 𝑝𝑞

donde 𝑞 = 1 − 𝑝 𝑦 𝐷 =𝐵2

4

Si p y q son desconocidas, entonces se pueden aproximar a 0.5.

Ejemplo

En el mismo colegio, se quiere realizar una encuesta para determinar la proporción de estudiantes que están a favor de una propuesta. Se debe

determinar el tamaño de muestra (numero de estudiantes a entrevistar) para estimar p con un limite para el error de estimación de magnitud

B=0.05. Existen N=2000 estudiantes en el colegio y no se cuenta con información disponible para estimar p.

Cuando no se cuenta con información previa, se puede aproximar el tamaño de muestra estableciendo p=0.5, se tiene que:

𝑞 = 1 − 𝑝 = 1 − 0.5 = 0.5

𝐷 =𝐵2

4=

0.052

4= 0.000625

𝑛 =𝑁𝑝𝑞

(𝑁 − 1)𝐷 + 𝑝𝑞=

2000(0.5)(0.5)

(2000 − 1)(0.000625) + 0.5)(0.5)= 333.56 ≈ 334

Esto es, 334 estudiantes deberán ser entrevistados para estimar la proporción de estudiantes que están a favor de la propuesta, con un

limite para el error de estimación de magnitud B=0.05.