TLC y Distribuciones Muestrales

18
Gilma Sabina Lizama Estadística II TEOREMA DEL LÍMITE CENTRAL Se utiliza cuando se desconoce la distribución de la población. El enunciado es el siguiente: “Al seleccionar muestras aleatorias simples de tamaño n de una población, la distribución muestral de la media muestral, , se puede aproximar con una distribución de probabilidad normal, cuando el tamaño de la muestra es grande”. La distribución muestral de se puede aproximar mediante una distribución de probabilidad normal siempre que el tamaño de la muestra sea grande. Se puede suponer que la condición de muestra grande se cumple para muestras aleatorias simples de tamaño 30 ó mayor. El T.L.C. es la clave para identificar la forma aproximada de la distribución muestral de cuando se desconoce la distribución de la población. Sin embargo, nos podemos encontrar con ciertos casos de muestreo en los que se supone que la población tiene distribución normal. Cuando suceden estos casos, el siguiente resultado identifica la forma de la distribución muestral de . “Siempre que la población tiene una distribución de probabilidad normal, la distribución muestral de tiene una distribución de probabilidad normal para cualquier tamaño de muestra”. En resumen, si usamos una muestra aleatoria simple grande (n≥30) el T.L.C. permite concluir que la distribución muestral de se puede aproximar con una distribución de probabilidad normal. Cuando la muestra aleatoria simple es pequeña (n<30), sólo se puede considerar que la distribución muestral de es normal si se supone que la población tiene una distribución de probabilidad normal. Para demostrar teóricamente el T.L.C. se requieren observaciones independientes en la muestra. Esta condición se cumple en las poblaciones infinitas, y en las poblaciones finitas cuando el muestreo se efectúa con reemplazo. Aunque este teorema no menciona directamente el muestreo sin reemplazo para poblaciones finitas, la práctica general de la estadística ha sido aplicar los resultados del T.L.C. en este caso, cuando el tamaño de la población es grande. DISTRIBUCIONES MUESTRALES DISTRIBUCIÓN MUESTRAL DE LA MEDIA Cada muestra de tamaño n que podemos extraer de una población proporciona una media. Si consideramos cada una de estas medias como valores de una variable aleatoria podemos estudiar su distribución que llamaremos distribución muestral de medias. Si tenemos una población normal y extraemos de ella muestras de tamaño n, la distribución muestral de medias sigue también una distribución normal. Si la población no sigue una distribución normal pero n>30, aplicando el llamado Teorema central del límite la distribución muestral de medias se aproxima también a la normal anterior.

Transcript of TLC y Distribuciones Muestrales

Page 1: TLC y Distribuciones Muestrales

Gilma Sabina Lizama Estadística II

TEOREMA DEL LÍMITE CENTRAL Se utiliza cuando se desconoce la distribución de la población. El enunciado es el siguiente: “Al seleccionar muestras aleatorias simples de tamaño n de una población, la distribución muestral de la media muestral, , se puede aproximar con una distribución de probabilidad normal, cuando el tamaño de la muestra es grande”. La distribución muestral de se puede aproximar mediante una distribución de probabilidad normal siempre que el tamaño de la muestra sea grande. Se puede suponer que la condición de muestra grande se cumple para muestras aleatorias simples de tamaño 30 ó mayor. El T.L.C. es la clave para identificar la forma aproximada de la distribución muestral de cuando se desconoce la distribución de la población. Sin embargo, nos podemos encontrar con ciertos casos de muestreo en los que se supone que la población tiene distribución normal. Cuando suceden estos casos, el siguiente resultado identifica la forma de la distribución muestral de . “Siempre que la población tiene una distribución de probabilidad normal, la distribución muestral de tiene una distribución de probabilidad normal para cualquier tamaño de muestra”. En resumen, si usamos una muestra aleatoria simple grande (n≥30) el T.L.C. permite concluir que la distribución muestral de se puede aproximar con una distribución de probabilidad normal. Cuando la muestra aleatoria simple es pequeña (n<30), sólo se puede considerar que la distribución muestral de es normal si se supone que la población tiene una distribución de probabilidad normal. Para demostrar teóricamente el T.L.C. se requieren observaciones independientes en la muestra. Esta condición se cumple en las poblaciones infinitas, y en las poblaciones finitas cuando el muestreo se efectúa con reemplazo. Aunque este teorema no menciona directamente el muestreo sin reemplazo para poblaciones finitas, la práctica general de la estadística ha sido aplicar los resultados del T.L.C. en este caso, cuando el tamaño de la población es grande.

DISTRIBUCIONES MUESTRALES DISTRIBUCIÓN MUESTRAL DE LA MEDIA

Cada muestra de tamaño n que podemos extraer de una población proporciona una media. Si consideramos cada una de estas medias como valores de una variable aleatoria podemos estudiar su distribución que llamaremos distribución muestral de medias.

Si tenemos una población normal y extraemos de ella muestras de tamaño n, la distribución muestral de medias sigue también una distribución normal.

Si la población no sigue una distribución normal pero n>30, aplicando el llamado Teorema

central del límite la distribución muestral de medias se aproxima también a la normal anterior.

Page 2: TLC y Distribuciones Muestrales

Gilma Sabina Lizama Estadística II

En una población finita de tamaño N, podemos tener N

nC muestras diferentes de un mismo tamaño

n, suponiendo que N

nC = r y que m1, m2, m3...mn son las r muestras diferentes. Si ahora calculamos

en cada muestra la media muestral , obtenemos un conjunto de r valores promedios ( 1, 2, 3...

r), respectivamente para cada muestra m=1,2,3...r. A la distribución de este conjunto de valores se le llama “distribución de muestreo de la media”, y constituye una herramienta de la inferencia estadística. Propiedades de la Media Aritmética Entre varias propiedades matemáticas importantes de la media aritmética para una distribución normal están:

1. Imparcialidad: Implica el hecho de que el promedio de todas las medias de muestra posibles (de un tamaño de muestra dado n) será igual a la media de la población µx, E( ) =

2. Eficiencia: Se refiere a la precisión de la muestra de estadística como un estimador del parámetro de población. Para distribuciones como la normal, la media aritmética se considera más estable de muestra a muestra que otras mediciones de tendencia central. Para una muestra de tamaño n, la media de muestra se acercará más, en promedio, a la media de población que cualquier otro estimador imparcial, por lo que la media de muestra es una mejor estimación de la media de población.

3. Consistencia: Se refiere al efecto del tamaño de muestra sobre la utilidad de un estimador. Al incrementarse el tamaño de muestra, la variación de la media de muestra de la media de población se hace más pequeña, de manera que la media aritmética de muestra se vuelve una mejor estimación de la media de población.

Resultados:

La media de las medias es igual a la media poblacional

La dispersión de la distribución de las medias de la muestra es menor a la dispersión de los valores de la población.

La forma de la distribución muestral de las medias de la muestra y la forma de la distribución de frecuencia de los valores de la población es diferente.

Desviación Estándar de Para identificar la desviación estándar de la distribución muestral de , usaremos la siguiente notación: = desviación estándar de la distribución muestral de σ = desviación estándar de la población n = tamaño de la muestra N = tamaño de la población Se puede demostrar que, con muestreo aleatorio simple, la desviación estándar de , depende de si la población es finita o infinita.

Page 3: TLC y Distribuciones Muestrales

Gilma Sabina Lizama Estadística II

POBLACIÓN FINITA FACTOR DE CORRECCIÓN POBLACIÓN FINITA POBLACIÓN INFINITA

Usar: , siempre que: 1) La población sea infinita 2) La población sea finita y también el tamaño de la muestra sea menor o igual que el 5% del tamaño de la población, esto es n/N≤0.05. Cuando n/N>0.05, se debe usar la fórmula para población finita en el cálculo de . Proceso Estadístico que emplea una Media Muestral para hacer Inferencias acerca de una Media Poblacional:

Ejemplo: Se tiene una población de 4 niños 4321 ,,, wwwwN , en la que interesa investigar dos

variables: X= edad del niño, Y= número de hermanos del niño. Supongamos que se conocen todos los datos relativos a esta población, los cuales se muestran a continuación:

N X Y

W1 11 1

W2 8 2

W3 5 2

W4 3 0

Si se elige un niño al azar de esta población, para investigar las variables aleatorias X e Y, las distribuciones de probabilidades son:

X F(x)

3 ¼

5 ¼

8 ¼

11 ¼

Y F(x)

0 ¼

1 ¼

2 2/4

Población con media µ=?

Se selecciona en la población, una muestra aleatoria simple

de n elementos.

Los datos muestrales

proporcionan un valor de la

media de la muestra .

Se usa el valor de para

hacer inferencias acerca del valor de µ.

Page 4: TLC y Distribuciones Muestrales

Gilma Sabina Lizama Estadística II

Realicemos m.a.s sin reposición para muestras de tamaño n=2. A partir de los resultados de una muestra se quiere aproximar el valor de las respectivas medias de X e Y. Para ello se utiliza el promedio muestral ( ). Al realizar los cálculos para cada muestra posible, se obtiene lo siguiente:

Solución: Como es sin reposición el total de muestras es: 6)!24(!2

!4

)!(!

!

nNn

NC N

n

Las distribuciones de probabilidad son:

No Muestras X F(x) Y 1 W1,w2 9.5 1/6 1.5

2 W1,w3 8 1/6 1.5

3 W1,w4 7 1/6 0.5

4 W2,w3 6.5 1/6 2

5 W2,w4 5.5 1/6 1

6 W3,w4 4 1/6 1

Totales 40.5 1.0 7.5

Y f(y)

0.50 1/6

1 2/6

1.5 2/6

2 1/6

Total 1.0

Cálculo de las medias de las muestras:

N

n

i

xC

X = 75.6

6

5.40 25.1

6

5.7y

Un resultado muy importante de la estadística dice que xXE )( , el promedio de todos los

promedios de las muestras es igual al promedio poblacional. Cálculo de las medias poblacionales:

75.64

27x 25.1

4

5y

Ahora calculemos la varianza: 1

22

N

nN

nx , usamos el factor de corrección para población finita

porque n/N>0.05, 2/4=0.50

Page 5: TLC y Distribuciones Muestrales

Gilma Sabina Lizama Estadística II

X 2)( xiX

3 14.0625

5 3.0625

8 1.5625

11 18.0625

Total 36.75

Y 2)( yiY

1 0.0625

2 0.5625

2 0.5625

0 1.5625

Total 2.75

N

X i

2

2)(

1875.94

75.362

x 6875.04

75.22

y

0625.314

24

2

1875.92

x 2292.014

24

2

6875.02

y

La desviación estándar es 75.10625.3x 4787.02292.0y

La dispersión de las medias muestrales es menor que la dispersión poblacional. Ejemplo: Una familia tiene 5 hijos cuyas edades son: 16,13,10,7 y 4 años, respectivamente. Si se toma todas las muestras posibles de edades de tamaño n= 2 y se calcula todas las medias aritméticas de las medias, se puede comprobar que:

a) La media de todas las medias en las muestras es igual a la media poblacional ( =µ).

b) La varianza de todas las muestras es igual a:1

22

N

nN

nx ,y la desviación estándar

c) La dispersión de la distribución de las medias es menor a la dispersión en los valores de la población.

Page 6: TLC y Distribuciones Muestrales

Gilma Sabina Lizama Estadística II

d) La forma de la distribución muestral de las medias de la muestra y la forma de la distribución de frecuencia de los valores de la población son diferentes. La distribución de las medias de la muestra tiende a una forma de campana y a aproximarse a una distribución de probabilidad normal. Solución: a) Cálculo Poblacional:

X (Xi - µ)2

16 36

13 9

10 0

7 9

4 36

∑50 ∑90

µ = ∑Xi = 50/5 = 10 Existe una media poblacional de 10 años. N

b)

= ∑(Xi-µ)2 = 90/5 = 18 Varianza igual a 18 N

= 18 = 4.24 Existe una dispersión de más o menos 4.24 años con respecto a la media.

Cálculo muestral: r = (2

5) = 5! =10 Combinaciones posibles de 2 edades. 2!(5-2)!

Muestras ( - )2

16,13 14.5 20.25

16,10 13 9

16,7 11.5 2.25

16,4 10 0

13,10 11.5 2.25

13,7 10 0

13,4 8.5 2.25

10,7 8.5 2.25

10,4 7 9

7,4 5.5 20.25

∑100 ∑67.50

Page 7: TLC y Distribuciones Muestrales

Gilma Sabina Lizama Estadística II

= ∑ i = 100/10 = 10 r

2 = ( i- )2 = 67.50/10 = 6.75 r Aplicando la otra fórmula:

= 1N

nN = (18/2)/((5-2)/(5-1)) = 6.75

= 6.75 = 2.6 Es menor que la dispersión poblacional, que es de 4.2.

d) POBLACION:

X F fr

16 1 0.20

13 1 0.20

10 1 0.20

7 1 0.20

4 1 0.20

∑5 ∑1.00

MEDIAS MUESTRALES:

F fr

5.5 1 0.10

7 1 0.10

8.5 2 0.20

10 2 0.20

11.5 2 0.20

13 1 0.10

14.5 1 0.10

∑10 ∑1.00

Gráfico de la Distribución

Poblacional

0

0.05

0.1

0.15

0.2

0.25

4 7 10 13 16

Edades (Años)

Probabilidades

Gráfico de la Distribución de

Medias Muestrales

0

0.05

0.1

0.15

0.2

0.25

5.5 7 8.5 10 11.5 13 14.5

M edias M uestrales (edades en años)

Probabilidades

Page 8: TLC y Distribuciones Muestrales

Gilma Sabina Lizama Estadística II

Ejercicio: Una familia tiene 5 hijos cuyas edades son: 16,13,10,7 y 4 años, respectivamente. Si se toma todas las muestras posibles de edades de tamaño n= 3 y se calcula todas las medias aritméticas de las medias, se puede comprobar que:

a) La media de todas las medias en las muestras es igual a la media poblacional ( =µ).

b) La varianza de todas las muestras es igual a:1

22

N

nN

nx ,y la desviación estándar

c) La dispersión de la distribución de las medias es menor a la dispersión en los valores de la población. d) La forma de la distribución muestral de las medias de la muestra y la forma de la distribución de frecuencia de los valores de la población son diferentes. La distribución de las medias de la muestra tiende a una forma de campana y a aproximarse a una distribución de probabilidad normal.

ERROR DE MUESTREO: Siempre que se selecciona una muestra sencilla y se calcula el valor de la media de la muestra para estimar el valor de la media poblacional, no podemos esperar que la media de la muestra sea exactamente igual a la media de la población. Los estadísticos difieren de los parámetros poblacionales y a esa diferencia se le conoce como error de muestreo. Estos errores resultan de restar:

Ejemplo: Una empresa que quiere implementar un seguro de vida para los empleados, para lo cual necesita que 25 trabajadores estudien la propuesta. La empresa cuenta con un total de 500

trabajadores. Los valores de los parámetros poblacionales son: µ=6.3 años; 2 =11.6 años y =3.4 años. Dada la siguiente tabla que contiene los años de servicio de los 25 trabajadores de la empresa, determinar: a) El valor de los estadísticos muestrales b) Calcular los errores de muestreo

Page 9: TLC y Distribuciones Muestrales

Gilma Sabina Lizama Estadística II

Solución: a)

AÑOS DE TRABAJAR DE LOS EMPLEADOS (Xi- )2

5 0.64

7 1.44

15 84.64

1 23.04

2 14.44

6 0.04

4 3.24

3 7.84

5 0.64

10 17.64

12 38.44

8 4.84

5 0.64

3 7.84

7 1.44

3 7.84

6 0.04

9 10.24

10 17.64

1 23.04

4 3.24

2 14.44

8 4.84

7 1.44

2 14.44

∑145 ∑304.00

= ∑Xi = 145/25 = 5.8 Años promedio de trabajar en la empresa.

n S2= ∑(Xi- )2 = 304/25 = 12.16 n

S= 12.16 = 3.48 Existe una dispersión de más o menos 3.48 años, respecto de la media.

Page 10: TLC y Distribuciones Muestrales

Gilma Sabina Lizama Estadística II

b)

= 5.8 – 6.3 = 0.50

= 16.12 -11.6 = 0.56

= 48.3 -3.4 = 0.08

RESUMEN DE FORMULAS

PARAMETROS POBLACIONALES

ESTADISTICOS DE LA MUESTRA

MEDIAS MUESTRALES

N

xi

N

xi

2

2)(

N

xi

2)(

n

xx

i

Poblaciones Finitas o Pequeñas:

S2=n

2

1N

nN

S=n 1N

nN

Poblaciones Infinitas o Grandes:

nS

22

S=n

r

xi

x

r= =)!(!

!

nNn

N

r

x xi

x

2

2 )(

r

x x

x

2)(

Cuando la población finita es grande y el tamaño de la muestra es relativamente pequeño, el factor de corrección para la población finita es cercano a uno. La diferencia entre los valores de S2 y S de de la población finita grande o infinita, es insignificante. Es por esa razón que en estos casos para calcular la S2 o S, es conveniente no utilizar el factor de corrección.

Se utiliza S2= , si el tamaño de la muestra es menor o igual al 5% del tamaño de la población.

Por ejemplo: Si N=5,000 y n=75; entonces n/N=75/5,000 = 0.015; lo que es igual al 1.5% de la población, en este caso no es conveniente utilizar el factor de corrección para calcular los estimadores. La distribución muestral de las medias se puede aproximar mediante una distribución de probabilidad normal, siempre que el tamaño de la muestra sea grande, lo cual se cumple según el TLC para muestras de tamaño 30 ó mayor.

Page 11: TLC y Distribuciones Muestrales

Gilma Sabina Lizama Estadística II

A medida que aumenta el tamaño de la muestra, la muestra se convierte en una mejor estimación del parámetro poblacional, debido a que al aumentar el tamaño de la muestra disminuye la desviación estándar. La interrogante es ¿Qué tan cercano está el valor del estimador del valor del parámetro poblacional?. Para contestarnos esta pregunta, haremos uso del cálculo de probabilidades para una distribución normal, para lo cual utilizaremos la fórmula del estadístico Z, y emplearemos la tabla de

probabilidades normal estandarizada.

n

XZ , donde X= media muestral; µ= media poblacional;

= desviación estándar poblacional y n= tamaño de la muestra. Ejemplo: Suponga que el equipo de empacado de un proceso de fabricación que rellena cajas de cereal, se adaptan de tal manera que la cantidad de cereal de la caja tenga una distribución normal con media 368 g. De la experiencia anterior, se sabe que la desviación estándar de la población es de 15g. Si se selecciona una MAS de 25 cajas y se calcula el preso promedio para esta muestra, ¿Cuál es la probabilidad de que la muestra de 25 cajas tenga una media entre 365 y 368 g?. Solución: Datos: n= 25 µ= 368 = 15 P(365≤X≤368)=? Calculamos el estadístico Z:

n

XZ =

25

15

368365= -1, buscamos en la tabla de la curva normal el valor de Z=1, lo que nos da

una probabilidad de: 0.3413.

Gráficamente:

El 34.13% de todas las muestras posibles de tamaño 25 tienen una media entre 365 y 368 g. No es lo mismo decir que un cierto porcentaje de cajas individuales tendrán entre 365 y 368g.

Page 12: TLC y Distribuciones Muestrales

Gilma Sabina Lizama Estadística II

-¿Cuál es la probabilidad de que las cajas individuales tengan entre 365 y 368 g?

Para calcular esta probabilidad, modificamos la forma de calcular el estadístico Z, así: X

Z ,

entonces: Z= 20.015

368365, el valor de Z=0.20 en tabla es: 0.0793.

Se espera que el 7.93% de las cajas individuales contengan entre 365 y 368g. La probabilidad de que la media de una muestra de 25 cajas esté cerca de la media poblacional es mayor que la probabilidad de que un solo valor individual lo esté. Ejemplo 2: Se espera que el diámetro de las pelotas de ping-pong manufacturadas en una gran fábrica tengan una distribución aproximadamente normal con una media de 1.30 pulgadas y una desviación estándar de 0.04 pulgadas. a) ¿Cuál es la probabilidad de que una pelota de ping-pong seleccionada aleatoriamente tenga un

diámetro de entre 1.28 y 1.30 pulgadas? b) ¿Cuál es la probabilidad de que una pelota de ping-pong seleccionada aleatoriamente tenga un

diámetro de entre 1.31 y 1.33 pulgadas? Solución: Datos: µ=1.30 pulgadas =0.04 pulgadas a)P(1.28≤X≤1.30)=?

XZ = 50.0

04.0

30.128.1, en tabla Z=0.50= 0.1915

Existe la probabilidad de un 19.15% de que una pelota de ping-pong tenga un diámetro de entre 1.28 y 1.30 pulgadas.

Page 13: TLC y Distribuciones Muestrales

Gilma Sabina Lizama Estadística II

b)P(1.31≤X≤1.33)=? X

Z1 = 25.004.0

30.131.1Z , Z=0.25 en tabla es: 0.0987

XZ = 75.0

04.0

30.133.1Z , Z=0.75 en tabla es: 0.2734

P(1.31≤X≤1.33)= 0.2734-0.0987= 0.1747

Existe la probabilidad de un 17.47% de que una pelota de ping-pong tenga un diámetro de entre 1.31 y 1.33 pulgadas.

DISTRIBUCIÓN MUESTRAL DE LA PROPORCION ( )

En numerosas ocasiones se plantea estimar una proporción o porcentaje. En estos casos la variable aleatoria toma solamente dos valores diferentes (éxito o fracaso), es decir sigue una distribución binomial y cuando la extensión de la población es grande la distribución binomial B(n,p) se aproxima

a la normal .

Para muestras de tamaño n>30, la distribución muestral de proporciones sigue una distribución normal

, donde p es la proporción de uno de los valores que presenta la variable estadística en la población y q=1-p.

En muchos casos de la economía se usa la proporción muestral para hacer inferencias estadísticas sobre la proporción poblacional, P. Al tratar con una variable categórica en la que cada individuo o elemento de la población puede clasificarse como poseedor o no poseedor de una característica particular, a los dos resultados posibles se les podría asignar resultados de 1 ó 0 para representar la presencia o ausencia de la característica. Si sólo se dispusiera de una muestra aleatoria de n individuos, la media de muestra para X variable categórica se encontraría sumando todos los rsultados 1 y 0 y luego dividiendo entre n. Por tanto, al tratar con datos categóricos, la media de

muestra (de los resutados 1 y 0) es la misma proporción de muestra , que tiene la misma

Page 14: TLC y Distribuciones Muestrales

Gilma Sabina Lizama Estadística II

característica de interés. De esta manera, la proporción de muestra , queda definida como: = n

X

= muestraTamañodela

cesosNúmerodesu

Dicho de otra manera: Proporción es la fracción del número de éxitos con relación al número

muestreado. La proporción de muestra , tiene la propiedad especial de que debe estar entre 0 y 1.

La distribución muestral de es la distribución de probabilidad de todos los valores posibles de la

proporción muestral . Para determinar lo cercano que está la proporción muestral de la proporción poblacional P,

necesitamos comprender las propiedades de la distribución muestral de : su valor esperado, su desviación estándar y la forma de su distribución. Proceso Estadístico para usar una Proporción Muestral para hacer Inferencias acerca de una Proporción Poblacional:

Valor Esperado de

El valor esperado de , o sea la media de todos los valores posibles de , se expresa de la siguiente manera:

E( ) = P, donde: E( ) = Valor esperado de P = proporción poblacional

P = N

X , donde: i= media muestral

n = tamaño de la muestra X = número de éxitos N = tamaño de la población

La media de todos los valores posibles de es igual a la proporción P de la población.

Población con

proporción

P=?

Se selecciona una muestra aleatoria

simple de n elementos de la población.

Los datos muestrales proporcionan

un valor de la proporción de la muestra.

El valor de se usa para

hacer inferencias acerca del valor de P.

Page 15: TLC y Distribuciones Muestrales

Gilma Sabina Lizama Estadística II

Desviación Estándar de

La desviación estándar de se llama error estándar de la proporción. Al igual que en el caso de la

media de muestra , la desviación estándar de depende de si la población es finita o infinita.

POBLACIÓN FINITA FACTOR DE CORRECCIÓN

POBLACIÓN FINITA

POBLACIÓN INFINITA

= n

PP )1(

1N

nN =

n

PP )1(

Seguiremos la misma regla general que recomendamos para la media de muestra.

Si la población es finita y si n/N≤0.05, usaremos =n

PP )1(.

Si la población es finita y si n/N>0.05, se debe usar el factor de corrección para población finita. Ejemplo: X empresa tomó una muestra de 6 de sus empleados para determinar si están satisfechos o no con las prestaciones de la empresa:

Empleados X Resultados

Aviles S 1

Castro S 1

Duran N 0

Flores S 1

Gómez N 0

Portillo S 1

∑4

S= Empleados Satisfecho N= Empleados no satisfechos 1= Éxito 0= Fracaso Se pide: Calcular el valor esperado y la desviación estándar. Solución: Cálculo del valor esperado: E( ) = P

1N

nN

Page 16: TLC y Distribuciones Muestrales

Gilma Sabina Lizama Estadística II

P = N

X =

6

4 =

3

2

Ahora: E( ) = ∑ i n Primero calculamos el número de resultados posibles, y esto es:

r=n

N =

)!(!

!

nNn

N =

2

6=

)!26(!2

!6= 15

No Muestra Muestras de tamaño 2 Media Muestral

1 A,C (1+1)/2=1

2 A,D (1+0)/2=0.50

3 A,F (1+1)/2=1

4 A,G (1+0)/2=0.50

5 A,P (1+1)/2=1

6 C,D (1+0)/2=0.50

7 C,F (1+1)/2=1

8 C,G (1+0)/2=0.50

9 C,P (1+1)/2=1

10 D,F (0+1)/2=0.50

11 D,G (0+0)/2=0

12 D,P (0+1)/2=0.50

13 F,G (1+0)/2=0.50

14 F,P (1+1)/2=1

15 G,P (0+1)/2=0.50

∑10.00

E( ) =n

Xi =

15

10 =

3

2

Queda comprobado que E( ) = P. Cálculo de la desviación estándar: Como: N=6, n=2; entonces n/N=2/6=0.33, y como n/N>0.05, utilizaremos la fórmula para población finita:

= n

PP )1(

= 16

26

2

)67.01(67.0 = 0.29 Existe una dispersión de más o menos 0.29, respecto de la media.

1N

nN

Page 17: TLC y Distribuciones Muestrales

Gilma Sabina Lizama Estadística II

Forma de la Distribución Muestral de La distribución muestral de se puede aproximar con una distribución de probabilidad normal, siempre que el tamaño de la muestra sea grande; o si se cumple con la siguiente regla: nP ≥ 5 n(1-P) ≥ 5 Por ejemplo si P=0.60, en una muestra aleatoria simple de n=30: nP= 30(0.60)=18 n(1-P)= 30(1-0.60)=12 Entonces el valor Z para una distribución de probabilidades normal para proporciones que expresado de la siguiente manera:

Z =

n

PP

PP

)1(

Ejemplo: En un estudio realizado para determinar el porcentaje de automovilistas que usan el cinturón de seguridad al manejar, reveló que el 70% de los automovilistas lo usan. Si se realiza una investigación rápida con 300 conductores, se pide: a) Cuál es la probabilidad de hallar en una muestra que más de 200 automovilistas utilizan cinturón de seguridad? b) Cuál es la probabilidad de que más del 35% no utilicen cinturón de seguridad? Solución: Datos: P=0.70

=200/300=0.67 n=300 a)

Z =

n

PP

PP

)1( =

300

)70.01(70.0

70.067.0 =

0264575.0

03.0 = -1.13

En tabla Z=1.13= 0.3708 P(X≥200)= 0.3708+0.50 = 0.8708 b) 300*0.35=105

= 1-105/300 = 1-0.35= 0.65

Z =

n

PP

PP

)1( =

300

)70.01(70.0

70.065.0 = -1.89

Page 18: TLC y Distribuciones Muestrales

Gilma Sabina Lizama Estadística II

En tabla Z=1.89 = 0.4706 P(X<35%)= 0.50-0.4706 = 0.0294 2.94% Ejemplo 2: Se selecciona una MAS de tamaño 100, de una población con P=0.40. a) ¿Cuál es el valor esperado de ? b) ¿Cuál es la desviación estándar de ? c) Describa la distribución muestral de d) ¿Qué indica la distribución muestral de ? Solución: Datos: P=0.40 n=100

a) E( )=0.40, ya que E( )= P, según propiedad. b) Primero vemos si la muestra es grande o pequeña: Si np≥5 y n(1-P)≥5, entonces la muestra es

grande, entonces:100(0.40)=40 y 100(1-0.40)=60. La muestra es grande y aplicamos la siguiente fórmula:

= n

PP )1(= 049.0

100

)40.01(40.0

c) La distribución muestral es normal con media de 0.40 y desviación estándar de 0.049. d) Indica la distribución de probabilidad para todos los valores posibles de la proporción

muestral .