12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de...

107
1 "Es una verdad muy cierta que, cuando no esté a nuestro alcance determinar lo que es verdad, deberemos seguir lo que es más probable". Descartes, en su Discurso del Método 12. Contraste de hipótesis

Transcript of 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de...

Page 1: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

1

"Es una verdad muy cierta que, cuando no esté a nuestro alcance determinar lo que es verdad, deberemos seguir lo que es más probable".

Descartes, en su Discurso del Método

12. Contraste de hipótesis

Page 2: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

2

Contraste de hipótesis: ¿Qué es una hipótesis estadística?

• Es una conjetura o creencia acerca de una o varias poblaciones. Normalmente en referencia a sus parámetros: la media, la varianza o una proporción, por ejemplo.

• Si queremos contrastarla, debe establecerse antes del análisis. Después se utilizan los datos de las muestras para obtener evidencias que confirmen o no la hipótesis propuesta.

Page 3: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

3

Hipótesis científica: Escuchar la música de Mozart tiene un efecto sobre el CI diferente al de la música de El Fari.

Experimento: De la población española seleccionamos 20 niños al azar en dos grupos de 10. Un grupo escuchará Mozart antes de hacer el test de CI. El otro escuchará a El Fari. Después de realizar los test, se calculan las medias y cuasivarianzas en cada uno de los dos grupos.

Veamos un ejemplo:

El efecto "Mozart vs. El Fari":

Se sospecha que los individuos rinden más en un test de

inteligencia tras escuchar música de Mozart que cuando han

escuchado música de El Fari.

Page 4: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

4

Supongamos que la media del CI del grupo de Mozart fue 110 con cuasivarianza = 100, mientras que la media del grupo de El Fari fue de 102 y cuasivarianza = 64. Entonces: ¿Podemos decir que hay diferencias a nivel poblacional entre ambos grupos? Para tomar tal decisión necesitaremos plantear DOS hipótesis estadísticas:

Page 5: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

5

Hipótesis estadísticas: -Hipótesis nula. Es la que proporciona la solución "más

sencilla". En nuestro ejemplo sería que la media poblacional de ambos grupos es la misma. Es decir, que no hay un efecto de la música sobre el CI.

H0: µ1 = µ2 -Hipótesis alternativa. Es la hipótesis complementaria (y

"más compleja"). En nuestro caso sería que la media poblacional de ambos grupos es diferente. Es decir, que hay un efecto de la música sobre el CI.

H1: µ1 ≠ µ2 ¿Cómo decidimos entre ambas hipótesis?

Veamos otros ejemplos.

Page 6: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

6

Otro ejemplo: Sometamos a la reina de Inglaterra al siguiente experimento: Se le presentan 8 tazas de té con leche, idénticas en su aspecto. En 4 de ellas la leche se añadió a la taza con anterioridad al té. Y en las 4 restantes, se añadió la leche después.

La reina las prueba y dictamina, acertadamente, las tazas en las que se sirvió primero la leche. ¿Chiripa?

Page 7: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

7

¿Cuántas posibilidades había?

La reina debía escoger 4 tazas de las 8. Sin tener en cuenta el orden tenía 70 posibilidades distintas (Combinaciones de 8 elementos tomados de 4 en 4). Si supusiéramos que respondió al azar, su probabilidad de acertar hubiera sido de 1/70.

¿Cuáles son aquí las hipótesis estadísticas?

-Hipótesis nula: La reina acertó por chiripa.

H0: p = 1/70

-Hipótesis alternativa: La reina tiene un paladar sobrenatural.

H1: p ≠ 1/70

Page 8: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

8

Parece razonable en este caso rechazar la hipótesis nula. ¿Por qué nos parece razonable rechazarla? Hemos supuesto que la reina juzgaba al azar (hipótesis nula). Por tanto hemos supuesto una distribución de probabilidad : cualquier combinación de las cuatro tazas tenía la misma probabilidad de ser elegida: p = 1/70 (una distribución uniforme). Con esa distribución la reina tenía 69/70 de probabilidad de no acertar. Y sin embargo la reina acertó…

Page 9: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

“The title comes from the "lady tasting tea", an example from the famous book, The Design of Experiments, by Ronald A. Fisher”. Wikipedia

Page 10: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

10

Otro ejemplo más (lo tenéis en detalle en el libro de Marta y Jose): Pasados 2 años cierta vacuna solo es eficaz en un 25% de los casos. Se experimenta con una nueva vacuna que tal vez prolongue la eficacia. Se inyecta a 20 sujetos experimentales. Si más de 8 sujetos superan el periodo de dos años sin contraer el virus, la nueva vacuna se considera mejor que la anterior. El número 8 es un tanto arbitrario, pero parece razonable teniendo en cuenta que esperaríamos 5 casos para la vacuna anterior.

Page 11: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

11

¿Quién es H0?

• Hipótesis nula H0 : ambas vacunas son iguales. • Hipótesis alternativa H1: la nueva vacuna es mejor. Con la vacuna antigua cada paciente tiene una probabilidad p = 1/4 de no contraer la enfermedad pasados 2 años. H0: p = 1/4 y H1: p > 1/4

¿Podemos rechazar la hipótesis nula, que las dos vacunas son igualmente eficaces? El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años. Y se distribuye como X = B(20, p).

Page 12: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

12

Dividiremos los posibles valores de X (de 0 a 20) en dos grupos: (1) Menores o iguales a 8 (Región de aceptación). (2) Mayores a 8 (Región crítica o de rechazo). 8 es el valor crítico en este caso.

Si x es el número de pacientes experimentales que no se han infectado después de 2 años, entonces: Si x > 8 rechazamos H0 a favor de la hipótesis alternativa H1. Si x ≤ 8, se acepta H0.

Page 13: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

13

El procedimiento descrito nos puede conducir a las siguientes conclusiones erróneas: (1) La nueva vacuna realmente no es mejor que la antigua (hemos rechazado la hipótesis nula y cometido un error de tipo I ). (2) Concluimos que la nueva vacuna no es mejor que la anterior, cuando realmente sí lo es (hemos aceptado la hipótesis nula y cometido un error de tipo II ).

Page 14: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

14

La probabilidad de cometer un error de tipo I se llama nivel de significación o tamaño de la región crítica y se representa por α. En nuestro ejemplo: Se dice que la hipótesis nula, p = 1/4, se está probando con un nivel de significación de α = 0.0409. Nivel de significación bastante pequeño, por tanto poco probable que hayamos cometido un error de tipo I.

∑=

=

==>

===20

9

2000

0409.043

4120

)4/1|8(

)ciertaesH|HRechazar()Itipodeerror(

x

xx

xpXP

PPα

Page 15: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

15

La probabilidad de cometer un error de tipo II se representa por β. Sólo podemos calcularla si tenemos una hipótesis alternativa “concreta”. Por ejemplo en nuestro caso podíamos haber tomado como hipótesis alternativa: p = 0.5. En nuestro ejemplo: 2517.0

21

2120

)2/1|8(

)falsaesH|HAceptar()IItipodeerror(8

0

2000

∑=

=

==≤

===

x

xx

xpXP

PPβ

Page 16: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

16

Page 17: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

17

Page 18: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

18

Contraste de hipótesis: Los tres pasos básicos para contrastar una hipótesis serán: 1- Formular dos hipótesis H0 y H1. 2- Derivar un estadístico de contraste a partir de la muestra de observaciones e identificar su distribución muestral bajo la hipótesis nula. 3- Derivar una regla de decisión y elegir una de las dos hipótesis en base a la evidencia de una muestra. Una regla de decisión que selecciona una de las dos sentencias siguientes: “rechace H0” o “no rechace H0”.

Page 19: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

19

Contrastes para la media de una población Población normal (o n > 30) y σ conocida. Hipótesis bilateral

Ho: µ = µ0 H1: µ ≠ µ0

Estadístico:

nxz

σµ−

=

- zα/2 + zα/2

1 - α

ασ

µαα −=

<−

<− 1/ 2/

02/ z

nxzP

Si la media muestral está fuera de este intervalo rechazamos H0. No rechazamos H0 en caso contrario.

+− 2/02/0 , αασµσµ zn

zn

Región de aceptación.

Región de aceptación

Page 20: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

20

• Hipótesis: • Estadístico y distribución:

03μ:Hy 30μ:H 1o ≠=

Ejemplo: Sea una población normal con σ2 = 20 µ0 = 30, n = 10 , y α = 0.05.

)1,0(Nn

xz ≡−

µ

27=x

95.0/ 2/2/ =

<−

<− αα σµ zn

xzP

- zα/2 + zα/2

1 - α = 0.95 α/2 = 0.025 α/2 = 0.025

95.02/2/ =

+<<− αασµσ zn

xzn

xP

Para calcular intervalo de confianza:

Conociendo el tamaño de la muestra, la desviación poblacional y la media muestral, podemos determinar un intervalo de confianza al 95%.

Page 21: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

21

Valor crítico del estadístico de prueba: Se busca en la tabla z, y nos preguntamos qué valor de z tiene una probabilidad igual a α/2 = 0.025 y resulta ser z = -1.96.

- 1.96 + 1.96

1 - α = 0.95 α/2 = 0.025 α/2 = 0.025

Page 22: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

22

Pero ahora estamos haciendo una hipótesis: que la media poblacional es µ0 = 30, e intentando contrastarla a partir de la media muestral que es 27.

12.24142.1

310/203027

−=−

=−

=z

- 2.12

- 1.96 + 1.96

1 - α = 0.95

Región de aceptación Regla de decisión: Ho se rechaza si z cae en la zona de rechazo (fuera de la zona de aceptación), utilizando α = 0.05 (error de tipo I) que está dividida en dos partes iguales (α/2 = 0.025).

Decisión estadística: Se puede rechazar Ho porque -2.12 está en la región de rechazo con un nivel de significación de α = 0.05. Conclusión: Se concluye que µ no igual a 30.

Page 23: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

HIPOTESIS A CONTRASTAR

datos de la muestra

Se definen: medida de discrepancia con una distribución de probabilidad conocida

Regla de decisión(nivel de significación α)

Valor crítico o tabulado

Se calcula una medida de discrepancia

Valor calculado

Se comparan los valores calculado con tabulado

¿se rechaza Ho?

NO SI H1

Se extraen conclusiones

Page 24: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

24

Contrastes para la media de una población Población normal (o n > 30) y σ conocida. Hipótesis unilateral por la izquierda.

Ho: µ = µ0 H1: µ < µ0

Estadístico

nxzc σ

µ−= α

σµ

α −=

−>− 1/

0 zn

xP

Si la media muestral está fuera de este intervalo, rechazamos H0. Aceptamos H0 en caso contrario.

∞+− ,0 ασµ zn

Región de aceptación:

- zα

1 - α

Page 25: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

25

• Los datos y suposiciones se mantienen. • Hipótesis:

(hipótesis nula e hipótesis alternativa) • Cálculo del estadístico de prueba:

• Regla de decisión: Si el zcalc cae en la zona de rechazo se rechaza Ho. Como es una prueba de una cola o unilateral, se busca en la tabla qué valor de z tiene una probabilidad de 0.05 y es igual a -1.645.

• Decisión estadística y conclusión: Como -2.12 es menor

que -1.645 se rechaza Ho y se concluye que la media de la población es menor de 30.

03μ:Hy 30μ:H ao <≥

12.210/203027

/0 −=

−=

−=

nxzσ

µ

Page 26: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

26

Región crítica y nivel de significación Región crítica • Valores ‘improbables’ si... • Es conocida antes de realizar el

experimento: resultados experimentales que refutarían H0

Nivel de significación: α • Número pequeño: 1% , 5%, ... • Fijado de antemano por el

investigador • Es la probabilidad de rechazar H0

cuando es cierta

No rechazo H0

Reg. Crit. Reg. Crit.

α=5%

Η0: µ = 40

Page 27: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

27

Contrastes: unilateral y bilateral La posición de la región crítica depende de la hipótesis alternativa

Unilateral Unilateral

Bilateral

H1: µ < 40 H1: µ > 40

H1: µ ≠ 40

Page 28: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

La variable aleatoria poblacional X de nuestro interés es la duración de un componente. Esta variable se distribuye en la población como una exponencial: X = Exp(λ). (a) Nos piden como contraste de hipótesis: H0: µ=300 H1: µ<300 Disponemos de una muestra de n = 100 elementos. Para cada componente se ha medido su duración: {x1, x2, ... , x100}. Y sabemos que la media muestral, que la vida media de los 100 componentes es:

∑=

==100

1260

1001

iixx

Page 29: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

29

Usaremos como estimador a la media muestral: ∑=

=n

iix

nx

1

1

Recuerda que es una variable aleatoria, de la que nosotros disponemos de un valor particular: el que nos da nuestra muestra. ¿Qué distribución tiene nuestro estimador? El de la suma de 100 variables aleatorias distribuidas exponencialmente. En principio sería una Erlang, pero puesto que el número de variables es mayor que 30, podemos utilizar una aproximación normal:

( )nNx /,σµ≡Observa que para el caso particular de la exponencial, la media coincide con la desviación típica y podemos escribir:

( )nNx /, µµ≡Tipifiquemos el estimador para que se distribuya como una N(0,1):

)1,0(Nn

xz ≡−

µ

Page 30: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

30

a = 250.65

1 - α

)1,0(Nn

xz ≡−

µRegión de aceptación

Región crítica

α

05.0100/300

300)300|(

cierta) H|HRechazar (05.0 0 0

=

−≤==≤=

===

azPaxP

P

µ

α

65.250645.1100/300

300=⇒−=

−= aazcrit

0H rechazamos Noaceptación deRegión 65.250260

⇒∈⇒>= xx

Page 31: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

31

Si en realidad µ = 250 y la hipótesis nula es que µ = 300, "detectarlo" supondría rechazar la hipótesis:

( ) 512.003.0100/250

25065.250

)250|()250|HRechazar ( 0

=≤=

−≤=

==≤==

zPzP

axPP µµ

Si queremos elevar esta última probabilidad hasta el 70%:

−≤==≤===

−≤==≤===

nbzPbxPP

nbzPbxPP

/300300)300|()300|HRechazar (05.0

/250250)250|()250|HRechazar (70.0

0

0

µµ

µµ

157125.156645.1

/300300

525.0/250250

≈=⇒

−=−

=−

n

nb

nb

Page 32: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

32

La variable aleatoria poblacional X de nuestro interés es el número de accidentes de tráfico en una semana. Esta variable se distribuye en la población como una poisson: X = P(λ=2.5). (a) Nos piden como contraste de hipótesis: H0: λ=10 (reducir el límite de velocidad no influye) H1: λ<10 (reducir el límite de velocidad disminuye el número de accidentes) Pero observa que contrastaremos las hipótesis con la variable aleatoria Y = número de accidentes en cuatro semanas

Page 33: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

33

∑= =

−==≤=

=≥

a

x

x

ItipoError

xeaYP

P

0 10

0 0

!)10|(

)cierta H|HRechazar (1.0

λ

λ λλ

Mirando en las tablas encontramos que a = 5. Si el número de accidentes observado en las cuatro semanas es menor o igual que 5, entonces rechazamos H0.

∑= =

− =−=−=

==≤−==>=

==

5

0 8

1

81.019.01!

1

)8|5(1)8|5(

)8|HRechazar (

x

x

IItipoError

xe

YPYP

P

λ

λ λ

λλ

λ

Si el número de accidentes disminuyó a 2 por semana, entonces disminuyó a 8 accidentes por cada cuatro semanas

Page 34: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

Ejemplo: Se tiene interés en la rapidez de combustión de un agente propulsor para los sistemas de salida de emergencia en aeronaves. Esta rapidez es una variable aleatoria con alguna distribución de probabilidad. Especialmente interesa decidir si la rapidez de combustión promedio, que es un parámetro µ de dicha distribución es o no 50 cm/seg.

Hipótesis Nula: H0: µ = 50 cm/seg Hipótesis Alternativa: H1: µ ≠ 50 cm/seg

48.5 50 51.5

Región Crítica Región de aceptación Región Crítica Se acepta H1 Se acepta H0 Se acepta H1

µ ≠ 50 µ = 50 µ ≠ 50

Valores Críticos

Page 35: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

Condición real Decisión H0 verdadera H0 falsa

Rechazar H0 Error Tipo I ok Aceptar H0 ok Error Tipo II

α = P(error Tipo I)= P(rechazar H0 | H0 es verdadera) Si calculamos α para el ejemplo de la rapidez de combustión para una muestra de n = 10 datos, suponiendo que σ = 2.5 cm/seg, obtenemos:

α = P( x caiga en la región crítica | µ = 50 )= = P( x < 48.5) + P( x > 51.5) = 0,0576

Esto significa que el 5,76% de las muestras de tamaño 10 conducirán al rechazo de la Hipótesis H0: µ = 50 cm/seg, cuando ésta es verdadera.

Page 36: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

β = P(error Tipo II) = P(aceptar H0 | H0 es falsa) Recordemos que no es posible calcular β si no se tiene una hipótesis alternativa específica, es decir, un valor particular del parámetro bajo prueba en lugar de un rango de valores.

Por ejemplo, supongamos que es importante rechazar H0 si la rapidez promedio de combustión µ es mayor que 52 cm/seg o menor que 48 cm/seg. Dada la simetría sólo se requiere evaluar la probabilidad de aceptar H0: µ = 50 cuando el valor verdadero es µ = 52.

45 46 47 48 49 50 51 52 53 54 55 0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

H0: µ = 50

H1: µ = 52

De acuerdo a la figura: β = P(48.5 ≤ x ≤ 51.5 | µ = 52) = 0.2643 La probabilidad de obtener un error de tipo II aumenta muy rápido a medida que el valor verdadero µ tiende al valor Hipotético. Por ejemplo, si suponemos que µ=50.5, y recalculamos β, obtenemos 0,8923.

β también depende del tamaño de la muestra, por ejemplo, si n = 16 obtenemos, cuando µ = 52:

σ = 0.625, por lo tanto β = 0,2119. Es decir, β disminuye cuando n aumenta, excepto si el valor real de µ está muy cerca del hipotético.

Page 37: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

Es por eso que el rechazo de H0 siempre se considera como una Conclusión Fuerte (los datos aportan fuerte evidencia de que H0 es falsa).

Como uno puede elegir los valores críticos del intervalo de aceptación, controlamos el valor de α, controlamos la probabilidad de rechazar de manera errónea H0.

La decisión de aceptar H0 se considera una Conclusión Débil, a menos que se sepa que β es considerablemente pequeño. Por esto en lugar de decir: “se acepta H0”, se prefiere decir “no rechazamos H0”, es decir, no se ha encontrado evidencia suficiente para rechazar H0. No quiere decir que exista gran evidencia de que H0 sea cierta, sino que no hay gran evidencia de que sea falsa.

Page 38: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

Hipótesis Unilaterales

H0: µ = 50 cm/seg H1: µ < 50 cm/seg

En el ejemplo, supongamos que si la rapidez media de combustión es menor que 50 cm/seg se desea demostrar esto con una conslusión fuerte. ¿Cómo deben plantearse las hipótesis?

Nótese que, aunque H0 está planteada como una igualdad, se sobrentiende que incluye cualquier valor de µ no especificado por H1. Es decir, la incapacidad de rechazar H0, no significa que µ = 50, sino que no se tiene evidencia fuerte que apoye a H1. Es decir, pudiera ser que µ = 50 o que µ > 50.

Page 39: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

Ejemplo: Un embotellador de refresco desea estar seguro de que las botellas que usa tienen en promedio un valor que supera el mínimo de presión de estallamiento de 200 psi. El embotellador puede formular una prueba de hipótesis de dos maneras:

H0: µ = 200 psi H0: µ = 200 psi H1: µ > 200 psi H1: µ < 200 psi (1) (2)

Con el planteamiento (1) Como el rechazo de H0 es una conclusión fuerte, esto obliga al fabricante a demostrar (aportar evidencia) de que las botellas soportan mayor presión que 200 psi. Con el planteamiento (2) si se rechaza H0 se concluye que las botellas no soportan los 200 psi, es decir, se concluye que las botellas son satisfactorias a menos que haya evidencia fuerte en sentido contrario. ¿Cuál planteamiento es el correcto? En la Hipótesis alternativa se debe poner la proposición sobre la cuál es importante llegar a una conclusión fuerte.

Page 40: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

Conclusiones Fuerte y Débil

Es por eso que el rechazo de H0 siempre se considera como una Conclusión Fuerte: los datos aportan fuerte evidencia de que H0 es falsa.

Como uno puede elegir los valores críticos del intervalo de aceptación, i.e. controlamos el valor de α. Uno puede entonces controlar la probabilidad de rechazar de manera errónea H0.

La decisión de aceptar H0 se considera una Conclusión Débil, a menos que se sepa que β es considerablemente pequeño. Por esto en lugar de decir “se acepta H0” se prefiere decir “incapaz de rechazar H0”, es decir, no se ha encontrado evidencia suficiente para rechazar H0. O sea, no quiere decir que exista gran evidencia de que H0 sea cierta sino que no hay gran evidencia de que sea falsa.

Page 41: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

41

Ejemplo 1: Se juzga a un individuo por la presunta comisión de un delito

• H0: Hipótesis nula – Es inocente

• H1: Hipótesis alternativa – Es culpable

Los datos pueden refutarla. La que se acepta si las pruebas no indican lo contrario. Rechazarla por error tiene graves consecuencias.

Riesgos al tomar decisiones

No debería ser aceptada sin una gran evidencia a favor. Rechazarla por error tiene consecuencias consideradas menos graves que la anterior.

Page 42: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

42

Tipos de error al tomar una decisión (Ejemplo 1)

Realidad Inocente Culpable

Veredicto

Inocente OK Error Menos grave

Culpable Error Muy grave

OK

Page 43: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

43

Ejemplo 2: Se cree que un nuevo tratamiento ofrece buenos resultados Ejemplo 3: Parece que hay una incidencia de enfermedad más alta de lo normal

• H0: Hipótesis nula – (Ej.1) Es inocente – (Ej.2) El nuevo tratamiento no tiene efecto – (Ej.3) No hay nada que destacar

• H1: Hipótesis alternativa

– (Ej.1) Es culpable – (Ej.2) El nuevo tratamiento es útil – (Ej. 3) Hay una situación anormal

Riesgos al contrastar hipótesis

No especulativa

Especulativa

Page 44: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

44

Tipos de error al contrastar hipótesis

Realidad

H0 cierta H0 falsa

No rechazo H0

Correcto El tratamiento no tiene efecto y así se determina.

Error de tipo II El tratamiento sí tiene efecto pero no lo percibimos.

Probabilidad β

Rechazo H0

Acepto H1

Error de tipo I El tratamiento no tiene efecto pero se decide que sí.

Probabilidad α

Correcto El tratamiento tiene efecto y el experimento lo confirma.

Page 45: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

45

Para cualquier tipo de test de contraste hay 3 resultados posibles: (1) - Se toma una decisión correcta. Es decir se rechaza una hipótesis falsa o no se rechaza una hipótesis verdadera.

(2) - Se rechaza una hipótesis verdadera. El error de rechazar H0 cuando es verdadera se denomina ERROR DE TIPO I (con probabilidad α).

(3) - No se rechaza una hipótesis falsa. El error de no rechazar H0 cuando es falsa se denomina ERROR DE TIPO II (con probabilidad β).

Page 46: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

46

Page 47: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

47

Page 48: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

48

Page 49: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

Contrastes para la media de una población Población normal y σ desconocida.

Hipótesis bilateral

Ho: µ = µ0 H1: µ ≠ µ0

Estadístico

1−≡

−= nc t

nsxt µ

αµαα −=

<−

<− 1/ 2/

02/ t

nsxtP

Si la media muestral está fuera de este intervalo rechazamos H0. Aceptamos en caso contrario.

−>=− − ns

xtP n0

1pValor µ

+− 2/02/0 , αα µµ znsz

ns

Región de aceptación.

Page 50: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

50

• Hipótesis:

• Estadístico de prueba: dado que se desconoce la varianza de la población, utilizaremos s2.

• Distribución del estadístico de prueba es una t de Student con n-1 grados de libertad.

• Regla de decisión: A un nivel de significancia de α = 0.05, si el valor de tcalc es mayor que tcrítico (2.1604) entonces se rechaza H0.

• Cálculo del estadístico de prueba:

• Decisión estadística: -1.58 cae en la zona de no rechazo, por lo tanto no se rechaza H0.

35μ:Hy 35μ:H ao ≠=

58.114/64.10

355.30−=

−=t

Page 51: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.
Page 52: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.
Page 53: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.
Page 54: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.
Page 55: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.
Page 56: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.
Page 57: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.
Page 58: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.
Page 59: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.
Page 60: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.
Page 61: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.
Page 62: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.
Page 63: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.
Page 64: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.
Page 65: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

65

Page 66: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

66

Page 67: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

67

Page 68: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

Ejemplo para contraste en poblaciones normales y de varianza conocida

Se quiere saber si hay diferencias en la concentración de ácido úrico en sujetos normales y con síndrome de Down. Se realizó la medición en 12 pacientes con Down y su media fue de 4.5 mg/ml y en 15 individuos sanos cuya media fue de 3.4 mg/ml. • Datos: •Supuestos: los datos provienen de poblaciones con distribuciones normales y se conocen sus varianzas. • Hipótesis:

15ny 12n 1.5;,4.3;1 ,5.4 21222

211 ====== σσ xx

0:Hy 0: 21A210 ≠−=− µµµµH

Page 69: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

• Estadístico de prueba:

• Distribución del estadístico: normal estándar. • Regla de decisión: H0 se rechaza a menos que el valor de

zcalc entre los valores críticos, si zcrítico está entre ±1.96, es decir, que -1,96 < zcalc< 1,96.

• Decisión estadística: Se rechaza H0 porque 2,57 > 1,96. • Conclusión: Con los datos disponibles es posible detectar

diferencias estadísticamente significativas entre las dos concentraciones de ácido úrico de ambas poblaciones (Down y normal).

57.2

155.1

121

0)4.35.4()()(

2

22

1

21

02121 =+

−−=

+

−−−=

nn

xxzσσ

µµ

Page 70: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

Ejemplo con poblaciones normales y varianzas desconocida.

Se quiere saber si los fumadores sufren mas daños pulmonares que los no fumadores. • Datos:

•Supuestos : la destrucción pulmonar sigue una distribución normal y no se conocen las varianzas poblacionales, pero se suponen que son iguales.

16,8492.4,4.12

;9,4711.4,5.17

===

===

nfnfnf

fff

nsx

nsx

Page 71: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

• Hipótesis:

• Estadística de prueba:

Y la varianza combinada se calcula como.

nffnffH µµµµ >≤ :H , : A0

6573.2

92165.21

162165.21

0)4.125.17()()(

2

2

1

202121 =

+

−−=

+

−−−=

ns

ns

xxtpp

µµ

2)1()1(

21

222

2112

−+−+−

=nn

snsnsp

Page 72: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

• Distribución de la estadística de prueba: Sigue una distribución t de Student con n1+ n2 - 2 grados de libertad.

• Regla de decisión: Se rechaza H0 a menos que el tcalc esté entre los valores críticos. En este caso, si tcrítico es ±1.7139, luego -1.7139 < tcalc< 1.7139.

• Decisión estadística: Se rechaza H0 porque 2.6573 > 1.7139 y cae en la zona de rechazo.

• Conclusión: Con los datos experimentales se puede concluir que sí hay más daño pulmonar en los fumadores que en los no fumadores.

Page 73: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

73

Page 74: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

74

(Recordatorio)

Page 75: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

75

Ejemplo:

Page 76: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

76

Page 77: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

77

Page 78: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

78

Page 79: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

79

Page 80: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

80

Page 81: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

81

Page 82: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

82

Page 83: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

83

Page 84: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

84

Page 85: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

85

Page 86: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.
Page 87: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.
Page 88: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.
Page 89: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.
Page 90: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.
Page 91: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.
Page 92: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.
Page 93: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.
Page 94: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.
Page 95: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.
Page 96: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

96

Page 97: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

Valor-p de un contraste Observa que el resultado de un test depende fuertemente de α...

El valor-p es la probabilidad de obtener un resultado de la muestra que sea al menos tan improbable como lo que se observa. Este valor corresponde al valor de la probabilidad asignada al z calculado a partir del valor numérico sometido a la prueba de hipótesis. Si p es menor al nivel de significación predefinido se debe rechazar H0

Dos posibles valores de un estadístico (puntos en la gráfica) que conducen a rechazar la hipótesis nula, aunque la evidencia del rechazo es muy distinta según el caso.

En una prueba bilateral se determina el valor-p duplicando el área en la cola, para poder comparar el valor de p directamente con α y mantener así la misma regla de rechazo.

Page 98: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.
Page 99: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

Significación: p

H0: µ=40

α

Page 100: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

Significación: p

43=X

No se rechaza H0: µ = 40

H0: µ = 40

α

Page 101: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

Significación: p

43=X

No se rechaza H0: µ=40

Es la probabilidad que tendría una región crítica que comenzase exactamente en el valor del estadístico obtenido de la muestra. Es la probabilidad de tener una muestra que discrepe aún más que la nuestra de H0. Es la probabilidad de que por puro azar obtengamos una muestra “más extraña” que la obtenida. p es conocido después de realizar el experimento aleatorio El contraste es no significativo cuando p>α

P

P

α

α

Page 102: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

Significación : p

α

50=X

Se rechaza H0: µ = 40 Se acepta H1: µ > 40

Page 103: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

Significación : p

P α

50=X

Se rechaza H0: µ=40 Se acepta H1: µ>40

El contraste es estadísticamente significativo cuando p < α. Es decir, si el resultado experimental discrepa más de “lo tolerado” a priori.

Page 104: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.

Resumen: α, p y criterio de rechazo

• Sobre α – Es número pequeño,

preelegido al diseñar el experimento.

– Conocido α sabemos todo sobre la región crítica.

• Sobre p – Es conocido tras realizar el

experimento. – Conocido p sabemos todo

sobre el resultado del experimento.

• Sobre el criterio de rechazo – Contraste significativo = p menor que α

Page 105: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.
Page 106: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.
Page 107: 12. Contraste de hipótesis - matap.dmae.upm.es · El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años.