Mic sesión 7

40
MÉTODOS DE INVESTIGACIÓN CUANTITATIVA Sesión 7 TEST DE HIPÓTESIS (I/II) FÁTIMA PONCE REGALADO 1

Transcript of Mic sesión 7

Page 1: Mic sesión 7

MÉTODOS DE INVESTIGACIÓN CUANTITATIVA

Sesión 7

TEST DE HIPÓTESIS (I/II)

FÁTIMA PONCE REGALADO 1

Page 2: Mic sesión 7

2

PUNTOS A TRATAR

Sesión 7: TEST DE HIPÓTESISDefiniciones.Procedimiento para la toma de decisiones

empleando Test de Hipótesis.Prueba bilateral (dos colas). Muestra grande y Muestra pequeñaEjercicios.

FÁTIMA PONCE REGALADO

Page 3: Mic sesión 7

3

INFERENCIA ESTADÍSTICA

La estadística inferencial requiere explicitar el vínculo que hay entre población y muestra (a través de un modelo probabilístico). El análisis estadístico nos permite reducir el nivel de incertidumbre en la toma de decisiones.

Con frecuencia el propósito de una investigación es probar hipótesis y generalizar los resultados obtenidos en la muestra a la población.

La estimación y la prueba de hipótesis son aspectos complementarios.

Recolección dedatos de la

muestra

Cálculo de estadísticosmuestrales

Inferencia de losParámetros

a la población

FÁTIMA PONCE REGALADO

Page 4: Mic sesión 7

4FÁTIMA PONCE REGALADO

PRUEBA DE HIPÓTESIS Herramienta analítica efectiva para obtener

información valiosa, bajo una variedad de circunstancias.

Indica el proceso mediante el cual decidimos si una proposición respecto de un parámetro de la población es congruente con los datos observados en la muestra.

Por ejemplo: Para probar hipótesis respecto de la media (µ), el investigador evalúa si es alta o baja la probabilidad de que la media muestral ( ) esté cerca de µ: Si prob. es alta, se podrá hacer generalizaciones.

X

Page 5: Mic sesión 7

5FÁTIMA PONCE REGALADO

¿≠?¿La diferencia

es estadísticamente significativa?

PRUEBA DE HIPÓTESIS

POBLACIÓN Muestra

Estimación

Estadístico Muestral

_ (X, s, p)

Parámetro Poblacional

(,, P)

Hipótesis: Enunciado acerca de la población (parámetros) elaborado con el propósito de ponerlo a prueba.

Page 6: Mic sesión 7

6FÁTIMA PONCE REGALADO

CONTRASTANDO UNA HIPÓTESISLa edad

promedio es 29 años...

años 21X

¡Es una gran diferencia!

Rechazo la hipótesis

Muestra aleatoria

Page 7: Mic sesión 7

7FÁTIMA PONCE REGALADO

CONTRASTANDO UNA HIPÓTESIS

Supuesto sobre la Población

H0: µ = 29 H1: µ ≠ 29

Tome una muestra

¿Es probable que obtengamos una muestra con media = 21procedente de una población con media = 29?

ES MUY POCO PROBABLE

Se RECHAZA la Hipótesis Nula

Se ACEPTA la Hipótesis Alternativa

21x

Page 8: Mic sesión 7

8FÁTIMA PONCE REGALADO

ALGUNASDEFINICIONES

Page 9: Mic sesión 7

9FÁTIMA PONCE REGALADO

Es una declaración relativa a un parámetro (o varios) de la población sujeta a verificación.

Ejemplos de hipótesis son:El salario mensual promedio de un gerente es S/.

15,500.70% de todos los que asisten a “La Feria del libro de

Lima” regresan todos los años.El número promedio de horas de estudio dedicadas al

curso de MIC a la semana es 7 horas.Diez minutos de video se sube a youtube en 2

segundos en promedio.

¿QUÉ ES UNA HIPÓTESIS?

Page 10: Mic sesión 7

10FÁTIMA PONCE REGALADO

ALGUNAS DEFINICIONES

Hipótesis Nula (H0): Enunciado acerca del valor de un parámetro poblacional o combinación de parámetros.

Hipótesis Alternativa (H1 ó Ha): Enunciado que se aceptará si los datos muestrales proporcionan amplia evidencia de que la H0 es falsa.

Nivel de significancia () ó Tamaño de la Prueba: Es la probabilidad de rechazar la H0 cuando es verdadera. ¿Con qué grado de confianza vas a decidir lo que vas a contrastar?.

La Hipótesis nula se rechaza o no se rechaza.

Page 11: Mic sesión 7

11FÁTIMA PONCE REGALADO

TIPO DE ERRORES

Nunca estaremos completamente seguros de nuestra estimación… Aunque el riesgo pueda ser mínimo, tendremos un error.

Error tipo I: Rechazar H0 cuando en realidad es verdadera. La probab. de cometer un error tipo I = seleccionado.

Error tipo II: Aceptar la H0 cuando en realidad es falsa.

Hipótesis No se rechaza H0 Se rechaza H0 NulaH0 es V Decisión correcta

H0 es F Error Tipo II

Error Tipo I

Decisión correcta

Page 12: Mic sesión 7

12FÁTIMA PONCE REGALADO

SIMILITUDES EN LA VIDA REALEj.: Se juzga a un individuo por la presunta comisión de un delito

H0: Es inocente

Los datos pueden refutarla. La H0 se acepta si las

pruebas no indican lo contrario.

No debería ser aceptada sin una gran evidencia a favor.

H0: Esta sano H1: Está enfermo

Los datos pueden refutarla. La H0 se acepta si las

pruebas no indican lo contrario.

Ej.: Se analiza a una persona por la presunta enfermedad

H1: Es culpable

Page 13: Mic sesión 7

13FÁTIMA PONCE REGALADO

SELECCIÓN DEL NIVEL DE SIGNIFICANCIA ()

Nivel de significancia () es la probabilidad de rechazar la H0 cuando es verdadera (tamaño de la prueba = Error tipo I).

Es un nivel de probabilidad de equivocarse y se fija de manera a priori.

Una hipótesis puede ser probada a cualquier , su elección depende del que tomará la decisión: ¿Cuanto riesgo se quiere tener al rechazar una hipótesis nula cuando esta es verdadera?.

No existe un estándar, por lo general se emplea más el 5% (0.05), aunque algunos emplean el 1% (0.01) ó 10% (0.10).

Si queremos equivocarnos poco =0.01, si queremos equivocarnos más =0.10. El valor que generalmente se usa es 0.05.

Page 14: Mic sesión 7

14FÁTIMA PONCE REGALADO

DETALLES ACERCA DE H0 Y H1

Hipótesis Nula Ho

La que contrastamos. Se dice que es cierta a

menos que se demuestre lo contrario.

Los datos de la muestra pueden refutarla.

No debería ser rechazada sin una buena razón.

Incluirá el signo =.

Hipótesis Alternativa H1

Niega a H0 . Los datos pueden

mostrar evidencia a favor.

No debería ser aceptada sin una gran evidencia a favor.

H0 y H1 son mutuamente excluyentes. Se usa una muestra aleatoria (n) para “rechazar o no rechazar a H0”

Page 15: Mic sesión 7

15FÁTIMA PONCE REGALADO

PRUEBA DE HIPÓTESIS

Procedimiento basado en la evaluación muestral y en la teoría de probabilidad, se emplea para determinar si la hipótesis que se está evaluando es un enunciado razonable y debería ser aceptada, o si no es razonable y por tanto debería ser rechazada.

Su propósito es hacer un juicio respecto de la diferencia entre el estadístico muestral (valor Z muestral) y un parámetro hipotético de la población.

El aspecto principal es determinar si esa diferencia se debe razonablemente a la variabilidad del muestreo, o, si la discrepancia es demasiado grande (es estadísticamente significativa).

Page 16: Mic sesión 7

16FÁTIMA PONCE REGALADO

PRUEBA DE HIPÓTESIS Cuando se acepta una H0 como V, no prueba que esa H0

sea cierta, sólo no estamos teniendo evidencia estadística suficiente para rechazarla. La única forma de probar que la H0 es V es si conociésemos el verdadero valor del parámetro poblacional.

Muestra aleatoria proporciona evidencias que permiten rechazar o no rechazar la hipótesis nula.

Si la evidencia de la muestra es inconsistente con la hipótesis planteada Se rechaza la H0

Si la evidencia de la muestra es consistente y apoya la hipótesis planteada No se rechaza la H0.

Page 17: Mic sesión 7

17FÁTIMA PONCE REGALADO

PROCEDIMIENTO DE UNA PRUEBA

DE HIPÓTESIS

Page 18: Mic sesión 7

18FÁTIMA PONCE REGALADO

PASOS PARA PROBAR UNA HIPÓTESIS

Plantear H0 e H1

Paso 1

Seleccionar el nivel

Paso 2

Calcular el valor del estadísticode prueba

Paso 3

Formular reglapara tomar decisión

Paso 4

Tomar unadecisión

Paso 5No se rechaza H0

Se rechaza H0 y “se acepta” H1

Page 19: Mic sesión 7

19FÁTIMA PONCE REGALADO

1) Plantear H0 y H1 H0: µ = 50 H1: µ ≠ 50

2) Seleccionar el nivel de significancia ().3) Calcular el valor estadístico de prueba. por ej. estadístico

de prueba Z será: _ X - µ Z= --------- / n 4) Formular la regla de decisión: Valor crítico, región de

rechazo y región de aceptación de la H0.5) Tomar una decisión.

A continuación veamos los pasos con detalle.

Cere

al

Real

PROCEDIMIENTO PARA PROBAR UNA HIPÓTESIS

Page 20: Mic sesión 7

20FÁTIMA PONCE REGALADO

PROCEDIMIENTO PARA PROBAR UNA HIPÓTESIS

1) Plantear H0 y H1

H0: µ = 50 “El productor dice que el peso promedio es 50 grs”

NOTAR: La H0 siempre incluirá el signo “igual”, es el enunciado a probar.

H1: µ ≠ 50 representa que la H0 no es verdadera.

NOTAR: Tiene el signo ≠ la prueba se realiza a 2 colas.

2) Seleccionar el nivel de significancia: = 0.053) Calcular el valor estadístico de prueba obtenido a partir

de los datos de la muestra. Se supone una distribución de probabilidad de la VA.

_ Por ej.: Con n=60, X=52, =4, el valor Z estimado será:

Page 21: Mic sesión 7

21FÁTIMA PONCE REGALADO

PROCEDIMIENTO PARA PROBAR UNA HIPÓTESIS

_ Por ej.: Con n=60, X=52, =4, el valor Z estimado será:

4) Formular la regla de decisión. Definir la región de rechazo y la región de aceptación de la H0 a partir del valor crítico de tabla: Zα/2 = 1.96

_ X - µ Z est= --------- = 3.87

/ n

5) Tomar una decisión: No Rechazar o rechazar la H0.

Si Zest. = 3.87 Dado que Zest. > Ztabla Se rechaza la H0, se aceptaría que no hay suficiente evidencia muestral para aceptar que el peso promedio es 50 grs.

Page 22: Mic sesión 7

22FÁTIMA PONCE REGALADO

REGIÓN DE RECHAZO y ACEPTACIÓN DE H0

50

50 50

H0: µ = 50H1: µ ≠ 50

Si Zest. = 3.87 Se rechaza H0

Valor crítico = 0.05

gramos

Page 23: Mic sesión 7

23FÁTIMA PONCE REGALADO

TIPOS DE PRUEBAS

Page 24: Mic sesión 7

24FÁTIMA PONCE REGALADO

PRUEBA DE HIPÓTESIS DE DOS COLAS (BILATERAL)

Una prueba de dos colas: Tiene una zona de rechazo en ambas colas de la distribución: /2 a cada lado.

4 años

Valor crítico

H0: µ = 4H1: µ ≠ 4

Page 25: Mic sesión 7

25FÁTIMA PONCE REGALADO

PRUEBA DE HIPÓTESIS DE UNA COLA: A LA IZQUIERDA

Tiene una zona de rechazo sólo en una de las colas de la distribución: Prueba de la cola izquierda o inferior.

Valor crítico

H0: µ 5H1: µ < 5 Indica una sola dirección: La media

poblacional es menor que 5.

0 Escala de Z

Page 26: Mic sesión 7

26FÁTIMA PONCE REGALADO

PRUEBA DE HIPÓTESIS DE UNA COLA: A LA DERECHA

Tiene una zona de rechazo sólo en una de las colas de la distribución: Prueba de la cola derecha o superior.

Valor crítico

H0: µ 5H1: µ > 5 Indica una sola dirección: La media

poblacional es mayor que 5.

0 Escala de Z

Page 27: Mic sesión 7

27FÁTIMA PONCE REGALADO

EJERCICIOS PRUEBA PARA LA MEDIA DE LA

POBLACIÓN A 2 COLAS

Page 28: Mic sesión 7

28FÁTIMA PONCE REGALADO

EJERCICIO 1 (Levin y Rubin 8.12)

1. Una tienda de abarrotes ha empacado naranjas en bolsas especiales y asegura que una bolsa rinde 2.5 litros de jugo. Después de seleccionar al azar 42 bolsas, el empacador encontró que la producción promedio de jugo por bolsa era 2.2 litros. Datos históricos establecen que la desviación estándar de la población es de 0.2 litros. Usando esta muestra ¿se puede concluir que la afirmación de la tienda es correcta?

a. Use un criterio de decisión de 2.5 errores estándar.

b. Usando un = 0.05 (5%).

Page 29: Mic sesión 7

29FÁTIMA PONCE REGALADO

Paso 1: Se establecen hipótesis nula (H0) y alternativa (H1)

H0: = 2.5

H1: ≠ 2.5

Paso 2: Seleccionar criterio de decisión o nivel de significancia. En este caso nos dan criterio de decisión = 2.5

Paso 3: Calcular el estadístico de prueba: Se usa la Z.

EJERCICIO 1a

_ X - µ 2.2 – 2.5 Zest= --------- = -------------- Zest=-9.72 / n 0.2 / 42

Page 30: Mic sesión 7

30FÁTIMA PONCE REGALADO

Paso 4: Se formula la regla de decisión: Rechazar H0 si |Zest| > Z/2

EJERCICIO 1a

µ= 2.5

Valor crítico

litros

2.5-2.5

. .

Paso 5: Se toma una decisión: Como -9.72 < -2.5 H0 se rechaza La evidencia de la muestra indica que la afirmación no es correcta. La producción promedio de jugo por bolsa ha cambiado.

Page 31: Mic sesión 7

31FÁTIMA PONCE REGALADO

Paso 1: Se establecen hipótesis nula (H0) y alternativa (H1)

H0: = 2.5

H1: ≠ 2.5

Paso 2: Seleccionar = 0.05 Z α/2 =±1.96Paso 3: Estadístico de prueba Z=-9.72Paso 4: Se formula la regla de decisión: Rechazar H0 si |

Zest| > Z/2

Paso 5: Se toma una decisión: Como -9.72 < -1.96 H0 se rechaza La evidencia de la muestra indica que la afirmación no es correcta. La producción promedio de jugo por bolsa ha cambiado.

EJERCICIO 1b

Page 32: Mic sesión 7

32FÁTIMA PONCE REGALADO

EJERCICIO 22. El gerente de una empresa desea probar la hipótesis de

que el gasto en energía promedio mensual de su empresa es S/. 312. Selecciona una muestra de 200 meses, dando una media de S/. 298.1 con s=S/. 97.3. Para minimizar la probabilidad de un error tipo I, selecciona un valor =1%.

1er paso: Definir las hipótesis: H0: µ= 312 ^ H1: µ ≠ 3122do paso: Seleccionar nivel = 0.01.Un =1% a dos colas valores críticos de Zα/2=±2.58.3er paso: Calcular el Zest. No se conoce solo s: _ X - µ Zest= --------- s / n 298.1 - 312 Zest= ----------------- Zest = -2.02

97.3 / 200

Page 33: Mic sesión 7

33FÁTIMA PONCE REGALADO

EJERCICIO 2

soles

4to paso: Formular Regla de decisión: No rechazar H0 si -2.58Zest 2.58. Rechazar H0 si Zest<-2.58 ó Zest> 2.58.

5to paso Tomar una decisión: ¿Rechazar o no H0?

Zest=-2.02: Dado que -2.58Zest2.58No se rechaza la H0, el resultado muestral no permite rechazar que el gasto en energía promedio mensual de su empresa es S/. 312. La diferencia entre el valor de la media poblacional bajo la H0 de S/. 312 y el valor de la media muestral S/. 298.1 es estadísticamente insignificante, podría resultar simplemente del error de muestreo. Si µ=312, el 99% de todas las muestras de tamaño n=200 producirán valores Z entre ±2.58.

Page 34: Mic sesión 7

34FÁTIMA PONCE REGALADO

PRUEBAS DE HIPÓTESIS PARA MUESTRAS GRANDES

Se emplea la distribución Normal Estándar: Z como valor estadístico de prueba.

Hay dos casos: Se conoce : _

X - µ Z= --------- / n

No se conoce , por lo que se requiere estimarla (s) con los datos de la muestra grande (> 30 obs).

_ X - µ Z= --------- s / n

Page 35: Mic sesión 7

35FÁTIMA PONCE REGALADO

PRUEBAS DE HIPÓTESIS PARA MUESTRAS PEQUEÑAS

Se emplea la distribución t de Student: t como valor estadístico de prueba.

En general la t se emplea cuando: la muestra es pequeña. es desconocida Se emplea s. la población es normal o casi normal.

El estadístico t se calcula como: _

X - µ s_ x

t =

Page 36: Mic sesión 7

36FÁTIMA PONCE REGALADO

3. Una empresa que brinda el servicio de Internet ha estimado que el gasto promedio mensual de una familia en este servicio es S/. 60, el gerente desea verificar esto pues esa información la usará en sus proyecciones de ingresos para el próximo año. Para ello seleccionó una muestra de 26 recibos y encontró que la media muestral era S/. 57 con una desviación estandar de S/10. Se puede concluir que la diferencia de S/. 3 entre la media muestral y la media poblacional puede atribuirse al azar?.

Ejercicio 3

1° Definir las Hipótesis: H0: µ = 60 H1: µ 60

2° Seleccionar = 0.05.

Page 37: Mic sesión 7

37FÁTIMA PONCE REGALADO

3° Estadístico de Prueba: Como no se conoce y n=26 < 30 se emplea la t.

Ejercicio 3

4° Formular la regla de decisión: Aceptar la H0 si t < t/2 n-1 g.l.= 2.06

Rechazar la H0 si t > t/2 n-1 g.l.= 2.06

_

X - µ =

s / n

t =

57 - 60 10/26

= -1.53 _

X = media muestral = 57. = media poblacional hipotética = 60 n = tamaño de la muestra = 26 s = desviación estándar de la muestra = 10

Page 38: Mic sesión 7

38FÁTIMA PONCE REGALADO

DISTRIBUCIÓN t

2.060

g.l.

Prueba de dos colas

Valor IC

Para el caso de la media muestral: n-1

Page 39: Mic sesión 7

39FÁTIMA PONCE REGALADO

Región de aceptación de la H0: µ = 60

95%

DISTRIBUCIÓN t

-2.06 0 2.06

Valor crítico

Región de rechazode la H0.

Región de rechazode la H0.

5) Tomar una decisión: Rechazar o no la H0?Dado que t= -1.53 < t/2

n-1 g.l.= 2.06 se acepta H0. Se acepta que la diferencia de S/.3 entre la media muestral y la media poblacional se debe al azar.

Page 40: Mic sesión 7

40FÁTIMA PONCE REGALADO

Anderson, D., Sweeney, D. y Williams T. (2008). Cap 9.

Levin, R. y Rubin, D. (2010). Cap. 8.

BIBLIOGRAFIA