PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA · un promedio muestral de 72,3 minutos. ¿Cuál ......

16
PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA Pruebas de hipótesis es una parte de la ESTADISTICA INFERENCIAL y tiene su analogía con los pasos que se realizan en un JUICIO. Objetivo : Aquí no se busca Estimar el parámetro sino determinar cuál de las hipótesis contrapuestas propuestas por el investigador es la correcta para cierto nivel. Procedimiento de Prueba de Hipótesis El investigador establecerá las hipótesis en base a la teoría que quiere verificar, para un parámetro . Tomar una muestra aleatoria de la población en estudio. Comparar lo observado con su teoría, si lo observado se contrapone a su teoría se rechaza su hipótesis en caso contrario se dice que no se observó cambio.

Transcript of PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA · un promedio muestral de 72,3 minutos. ¿Cuál ......

PRUEBA DE HIPOTESIS BASADA EN UNA SOLA MUESTRA

Pruebas de hipótesis es una parte de la ESTADISTICA INFERENCIAL y

tiene su analogía con los pasos que se realizan en un JUICIO.

Objetivo:

Aquí no se busca Estimar el parámetro 𝜃 sino determinar cuál de

las hipótesis contrapuestas propuestas por el investigador es la

correcta para cierto nivel.

Procedimiento de Prueba de Hipótesis

El investigador establecerá las hipótesis en base a la teoría

que quiere verificar, para un parámetro 𝜃.

Tomar una muestra aleatoria de la población en estudio.

Comparar lo observado con su teoría, si lo observado se

contrapone a su teoría se rechaza su hipótesis en caso

contrario se dice que no se observó cambio.

Primero definiremos los elementos necesarios para lleva adelante

una Prueba de hipótesis.

a) El investigador debe establecer las hipótesis contrapuestas

de interés para 𝜃, llamadas Hipótesis Nula (𝑯𝟎) e Hipótesis

Alternativa (𝑯𝒂).

𝑯𝟎 hipótesis de no cambio, no diferencia, no mejoría, etc.

𝑯𝒂 hipótesis que el investigador pretende validar.

Si 𝜃 es el parámetro de interés y 𝜃0 un valor fijado por el

investigador entonces en nuestro tratamiento de Prueba de

hipótesis consideraremos estas posibles hipótesis alternativas

𝑯𝒂 ∶

𝜽 ≠ 𝜽𝟎 𝑷𝒓𝒖𝒆𝒃𝒂 𝒃𝒊𝒍𝒂𝒕𝒆𝒓𝒂𝒍

𝜽 > 𝜽𝟎 𝑷𝒓𝒖𝒆𝒃𝒂 𝒖𝒏𝒊𝒍𝒂𝒕𝒆𝒓𝒂𝒍 𝒂 𝒄𝒐𝒍𝒂 𝒔𝒖𝒑𝒆𝒓𝒊𝒐𝒓𝜽 < 𝜽𝟎 𝑷𝒓𝒖𝒆𝒃𝒂 𝒖𝒏𝒊𝒍𝒂𝒕𝒆𝒓𝒂𝒍 𝒂 𝒄𝒐𝒍𝒂 𝒊𝒏𝒇𝒆𝒓𝒊𝒐𝒓

b) Estadístico de Prueba: estadístico con distribución conocida

bajo hipótesis nula, sobre el cual se basará la decisión a

tomar.

c) Región de Rechazo (RR): conjunto de valores del estadístico

de prueba para los cuales 𝑯𝟎 será rechazada.

d) Luego 𝑯𝟎 será rechazada si el valor observado o alcanzado

del estadístico pertenece a la RR, en cuyo caso diremos que

la 𝑯𝒂 es la correcta. En caso contario diremos que no se

encontró evidencia suficiente para rechazar 𝑯𝟎.

Al tomar una decisión se pueden cometer dos tipos de errores.

Error tipo I: Rechazar 𝑯𝟎 cuando 𝑯𝟎 es verdadera.

Error tipo II: Aceptar 𝑯𝟎 cuando 𝑯𝟎 es falsa.

Denotaremos con 𝛼 𝑦 𝛽 a las probabilidades de cometer los Errores

tipo I y tipo II respectivamente.

Llamaremos nivel de significación de una prueba al valor

𝜶 = 𝐦𝐚𝐱𝜽𝝐𝜴𝟎𝜶 𝜽 , 𝒅𝒐𝒏𝒅𝒆 𝑯𝟎: 𝜽𝝐𝜴𝟎.

La RR determina las probabilidades de cometer cada uno de los

errores.

En resumen los pasos a seguir para realizar una Prueba de

Hipótesis son:

a) Identificar el parámetro de interés.

b) Determinar las Hipótesis nula y alternativa para el

problema.

c) Determinar el Estadístico de Prueba adecuado, con

distribución conocida bajo 𝑯𝟎 .

d) Fijado un nivel de significancia 𝜶 determinar la

Región de Rechazo.

e) Calcular el valor observado o alcanzado del

estadístico de prueba con la muestra obtenida.

f) Determinar si 𝑯𝟎 debe ser rechazada o no para el

nivel de significación dado, estableciendo una

conclusión en el contexto del problema.

PROBLEMA:

Supongamos que el 10% de las tarjetas de circuito producidas por

cierto fabricante son defectuosas.

Con el fin de reducir la proporción de tarjetas defectuosas se ha

sugerido un nuevo proceso de producción.

En este caso 𝜃 = 𝑝 es la verdadera proporción de tarjetas

defectuosas con este nuevo método de producción.

a) Establecer las hipótesis de interés.

b) Se tomó una muestra aleatoria de n=200 tarjetas producidas

con este nuevo método. Determinar el Estadístico de Prueba.

c) Dada la 𝑅𝑅 = 𝑥 ∶ 𝑥 ≤ 15 , calcular el nivel de significancia

aproximado y hallar una expresión para la probabilidad

aproximada de cometer el Error de tipo II.

d) Si ahora la 𝑅𝑅 = 𝑥 ∶ 𝑥 ≤ 12 , calcular el nivel de

significancia aproximado.

e) Si en la muestra aleatoria se obtuvo x=13 ¿cuál sería su

conclusión? Usando la región de rechazo dada en el ítem c).

Observaciones:

i) 𝛽 𝑝 crece cuando 𝑝 se aproxima a 0,10.

ii) 𝛼 = max𝑝≥0,10 𝛼 𝑝 = 𝛼 0,10 . Luego esta prueba sigue

teniendo el mismo nivel de significancia para la hipótesis

simplificada 𝐻0: 𝑝 = 0,10.

Por lo tanto de ahora en más nuestra hipótesis nula será:

𝑯𝟎 ∶ 𝜽 = 𝜽𝟎

Pruebas de Hipótesis para la media poblacional

Así como hicimos en IC consideraremos diferentes situaciones para

plantear Prueba de Hipótesis.

Hipótesis Nula:

𝑯𝟎 ∶ 𝝁 = 𝝁𝟎

Caso A:

Sea 𝑋1, 𝑋2, … , 𝑋𝑛 una m.a. de 𝑁(𝜇, 𝜎2) con 𝜎2 conocido.

Bajo estos supuestos sabemos que

𝑿 ~ 𝑵 𝝁,𝝈𝟐

𝒏 ⇔

𝑿 − 𝝁

𝝈 𝒏 ~ 𝑵(𝟎, 𝟏)

Estadístico de Prueba

𝑿 −𝝁𝟎

𝝈 𝒏 ~ 𝑵(𝟎, 𝟏) , bajo 𝑯𝟎

Si la Hipótesis alternativa fuese:

𝑯𝒂 ∶ 𝝁 < 𝜇𝟎

Fijado un nivel de significancia 𝛼 entonces veamos cómo

definir la Región de Rechazo (𝑅𝑅𝛼 ) y estudiemos el

comportamiento de la función 𝛽.

𝑹𝑹𝜶 = 𝒙 ≤ 𝒌𝜶 = −𝒛𝜶

𝝈

𝒏 + 𝝁𝟎 = 𝒛 ≤ −𝒛𝜶

La probabilidad de cometer el error tipo II es:

𝜷 𝝁′ = 𝟏 − 𝜱 −𝒛𝜶 + ( 𝝁𝟎−𝝁′)

𝝈 𝒏 , ∀ 𝝁′ < 𝝁𝟎.

Observaciones sobre esta función:

i) lim𝜇→𝜇0− 𝛽 𝜇 = 1 − 𝛼 y lim𝜇→−∞ 𝛽 𝜇 = 0.

ii) 𝛽 es una función creciente con punto de inflexión en

𝑘𝛼 .

Ahora si queremos determinar el tamaño de muestra

necesario para que una prueba de nivel 𝛼 sea tal que

𝜷 𝝁′ ≤ 𝜷𝟎

Entonces:

𝒏 ≥ 𝒛𝜷𝟎 + 𝒛𝜶

( 𝝁𝟎−𝝁′) 𝝈

𝟐

.

Ejercicio (8.18)

Se sabe que el tiempo de secado de cierto tipo de pintura, bajo

ciertas condiciones de prueba, está normalmente distribuido con

valor medio de 75 minutos y una desviación estándar de 9 minutos.

Unos químicos han diseñado un nuevo aditivo para reducir el

tiempo medio de secado de la pintura. Se supone que el tiempo de

secado para la pintura con el nuevo aditivo seguirá teniendo

distribución normal con desviación estándar de 9 minutos.

Debido al gasto asociado con el aditivo, la evidencia debe sugerir de

forma contundente una disminución en el tiempo medio de secado

(𝜇) para su aceptación.

a) Plantear las hipótesis pertinentes.

b) Dar el estadístico de prueba y su distribución bajo hipótesis

nula.

c) Se tomó una muestra aleatoria de tamaño 25 obteniéndose

un promedio muestral de 72,3 minutos. ¿Cuál sería su

conclusión usando un nivel de significancia de 0,01? Justifique

su respuesta.

d) ¿Cuál es el nivel de significación para la 𝑅𝑅= 𝑧 ≤ −2,88 ?

e) Para la RR dada en el ítem d), dar el valor de la probabilidad

de cometer el error tipo II cuando 𝜇 =70.

f) Para la RR dada en el ítem d), ¿cuál es el menor tamaño de

muestra que debería tomar para asegurar que 𝛽 70 ≤ 0,01?

Nivel de significación y P(error tipo II cuando μ=70)

68 69 70 71 72 73 74 75 76 77 78 79 80 81 820,00

0,02

0,04

0,07

0,09

0,11

0,13

0,16

0,18

0,20

0,22

De

nsid

ad

P(errortipo I)=0,0020

68 69 70 71 72 73 74 75 76 77 78 79 80 81 820,00

0,02

0,04

0,07

0,09

0,11

0,13

0,16

0,18

0,20

0,22

De

nsid

ad

P(error tipo II en 70)=0,5398

De igual forma se puede trabajar con las otras dos hipótesis

alternativas y que se pueden resumir como sigue.

Supuestos:

Sea 𝑿𝟏 , 𝑿𝟐, … , 𝑿𝒏 una m.a. de 𝑵(𝝁, 𝝈𝟐) con 𝝈𝟐 conocido.

Hipótesis Nula:

𝑯𝟎 ∶ 𝝁 = 𝝁𝟎

Estadístico de Prueba:

𝒁 = 𝑿 −𝝁𝟎

𝝈 𝒏 ~ 𝑵(𝟎, 𝟏) , bajo 𝑯𝟎

𝑯𝒂 𝑹𝑹𝜶 𝜷 𝝁 𝝁 < 𝜇𝟎

𝒛 ≤ −𝒛𝜶 𝟏 − 𝜱 −𝒛𝜶 +

( 𝝁𝟎 − 𝝁)

𝝈 𝒏

𝝁 > 𝜇𝟎

𝒛 ≥ 𝒛𝜶 𝜱 𝒛𝜶 + ( 𝝁𝟎 − 𝝁)

𝝈 𝒏

𝝁 ≠ 𝝁𝟎

𝒛 ≥ 𝒛𝜶𝟐

𝜱 𝒛𝜶

𝟐 + ( 𝝁𝟎 − 𝝁)

𝝈 𝒏 − 𝜱 −𝒛𝜶

𝟐 +( 𝝁𝟎 − 𝝁)

𝝈 𝒏

El mínimo tamaño de muestra necesario para que una

prueba de nivel 𝛼 sea tal que

𝜷 𝝁′ ≤ 𝜷𝟎 tomar 𝒏 ≥ 𝒛𝜷𝟎 + 𝒛𝜶

( 𝝁𝟎−𝝁′) 𝝈

𝟐

si la hipótesis es

unilateral y poner 𝑧𝛼

2 en lugar de 𝑧𝛼 si la hipótesis es

bilateral. Problemas 8.10 y 8.11

Caso B:

Sea 𝑋1, 𝑋2, … , 𝑋𝑛 una m.a. con media y varianza 𝜇 𝑦 𝜎2 . Si

el tamaño de muestra es suficientemente grande entonces

por TCL:

𝑿 ~ 𝑵 𝝁,𝝈𝟐

𝒏 ⇔

𝑿 − 𝝁

𝝈 𝒏 ~ 𝑵(𝟎, 𝟏)

Pedir 𝑛 ≥ 30 si la varianza es conocida y si es desconocida

reemplazar 𝜎 por S y pedir 𝑛 ≥ 40, luego todo es igual que

en el Caso A.

Hipótesis Nula:

𝑯𝟎 ∶ 𝝁 = 𝝁𝟎

Estadístico de Prueba:

𝒁 = 𝑿 −𝝁𝟎

𝝈 𝒏 ~ 𝑵(𝟎, 𝟏) , bajo 𝑯𝟎

𝑯𝒂 𝑹𝑹𝜶 𝜷 𝝁 𝝁 < 𝜇𝟎

𝒛 ≤ −𝒛𝜶 𝟏 − 𝜱 −𝒛𝜶 +

( 𝝁𝟎 − 𝝁)

𝝈 𝒏

𝝁 > 𝜇𝟎

𝒛 ≥ 𝒛𝜶 𝜱 𝒛𝜶 + ( 𝝁𝟎 − 𝝁)

𝝈 𝒏

𝝁 ≠ 𝝁𝟎

𝒛 ≥ 𝒛𝜶𝟐

𝜱 𝒛𝜶𝟐 +

( 𝝁𝟎 − 𝝁)

𝝈 𝒏 − 𝜱 −𝒛𝜶

𝟐 +( 𝝁𝟎 − 𝝁)

𝝈 𝒏

Si el 𝜎 es desconocido reemplazarlo por S, siempre que

𝑛 ≥ 40.

El mínimo tamaño de muestra necesario para que una

prueba de nivel aproximado 𝛼 sea tal que 𝜷 𝝁′ ≤ 𝜷𝟎

tomar 𝒏 ≥ 𝒛𝜷𝟎 + 𝒛𝜶

( 𝝁𝟎−𝝁′) 𝝈

𝟐

si la hipótesis es unilateral y

poner 𝑧𝛼

2 en lugar de 𝑧𝛼 si la hipótesis es bilateral.

Caso C:

Sea 𝑋1, 𝑋2, … , 𝑋𝑛 una m.a. de 𝑁(𝜇, 𝜎2) con 𝜎2

desconocido.

Bajo estos supuestos sabemos que

𝑿 − 𝝁

𝑺 𝒏 ~ 𝒕𝒏−𝟏

Hipótesis Nula:

𝑯𝟎 ∶ 𝝁 = 𝝁𝟎

Estadístico de Prueba:

𝑻 = 𝑿 −𝝁𝟎

𝑺 𝒏 ~ 𝒕𝒏−𝟏 , bajo 𝑯𝟎

𝑯𝒂 𝑹𝑹𝜶 𝝁 < 𝜇𝟎

𝒕 ≤ −𝒕𝜶

𝝁 > 𝜇𝟎

𝒕 ≥ 𝒕𝜶

𝝁 ≠ 𝝁𝟎

𝒕 ≥ 𝒕𝜶𝟐

,𝒏−𝟏

En este caso es muy complicado dar la expresión de la

probabilidad de cometer el Error Tipo II y determinar el

valor de n.

Problema 8.29

Pruebas de Hipótesis para la Proporción poblacional

Supuestos:

Sea 𝑋1, 𝑋2, … , 𝑋𝑛 una m.a. de Bernoulli de parámetro 𝑝,

entonces la variable 𝑋 = 𝑋𝑖 ~ B(n, p) 𝑛𝑖=1 . Aquí

tendremos dos casos a considerar:

i) Si n es suficientemente grande.

ii) Si n es pequeño.

Caso i)

Por TCL sabemos que

𝑝 =𝑋

𝑛 ~ 𝑁 𝑝,

𝑝 𝑞

𝑛

Hipótesis Nula:

𝑯𝟎 ∶ 𝒑 = 𝒑𝟎

Estadístico de Prueba:

𝒁 = 𝑝 − 𝒑𝟎

𝒑𝟎 𝒒𝟎 𝒏 ~ 𝑵(𝟎, 𝟏) , bajo 𝑯𝟎

𝑯𝒂 𝑹𝑹𝜶 𝜷 𝒑′ 𝒑 < 𝒑𝟎

𝒛 ≤ −𝒛𝜶

𝟏 − 𝜱

−𝒛𝜶 𝒑𝟎 𝒒𝟎

𝒑′𝒒′+

( 𝒑𝟎 − 𝒑′)

𝒑′𝒒′𝒏

𝒑 > 𝒑𝟎

𝒛 ≥ 𝒛𝜶 𝜱

𝒛𝜶 𝒑𝟎 𝒒𝟎

𝒑′𝒒′+

( 𝒑𝟎 −𝒑′)

𝒑′𝒒′𝒏

𝒑 ≠ 𝒑𝟎

𝒛 ≥ 𝒛𝜶𝟐

𝜱

𝒛𝜶𝟐

𝒑𝟎 𝒒𝟎

𝒑′𝒒′+

( 𝒑𝟎 −𝒑′)

𝒑′𝒒′𝒏

−𝜱

−𝒛𝜶𝟐

𝒑𝟎 𝒒𝟎

𝒑′𝒒′+

( 𝒑𝟎 − 𝒑′)

𝒑′𝒒′𝒏

Si 𝑛 𝑝0 ≥ 10 y 𝑛 𝑞0 ≥ 10.

El tamaño de muestra necesario para que una prueba de

nivel aproximado 𝛼 sea tal que 𝜷 𝒑′ ≤ 𝜷𝟎 tomar

𝒏 ≥ 𝒛𝜷𝟎 𝒑′ 𝒒′+ 𝒛𝜶 𝒑𝟎 𝒒𝟎

( 𝒑𝟎−𝒑′)

𝟐

si la hipótesis es unilateral y

poner 𝑧𝛼

2 en lugar de 𝑧𝛼 si la hipótesis es bilateral.

Problema 8.35.

ii) Si n es pequeño la prueba estadística estará basada

en

Hipótesis Nula:

𝑯𝟎 ∶ 𝒑 = 𝒑𝟎

Estadístico de Prueba:

𝑿 = 𝑿𝒊 ~ 𝐁(𝐧, 𝒑𝟎) 𝒏𝒊=𝟏 bajo 𝑯𝟎

Problema 8.9

p-valor para una prueba de Hipótesis

Definición:

Se llama p-valor o nivel de significancia alcanzado al

mínimo nivel de significancia a partir del cual rechazaría la

hipótesis nula para un conjunto dado.

Una vez calculado el p-valor la conclusión a un nivel de

significancia 𝛼 será

Si p − valor ≤ α entonces rechazar 𝐻0 a un nivel 𝛼

Si p − valor > α entonces diremos que no hay evidencia

suficiente para rechazar 𝐻0 a un nivel 𝛼 .

¿Cómo calcular el p-valor?

Distribución del Estadístico de

Prueba

Hipótesis alternativa

p-valor

Z

Cola superior Cola inferior Bilateral

𝟏 − 𝜱(𝒛𝒐𝒃𝒔) 𝜱(𝒛𝒐𝒃𝒔) 𝟐 𝟏 − 𝜱( 𝒛𝒐𝒃𝒔 )

T

Cola superior Cola inferior Bilateral

P( T > 𝒕𝒐𝒃𝒔) P( T < 𝒕𝒐𝒃𝒔) 2 P( T > 𝒕𝒐𝒃𝒔 )