Curso de Bioestadística.

34
Curso de Bioestadística. Pruebas de hipótesis MGA/DEO

description

Curso de Bioestadística. Pruebas de hipótesis. MGA/DEO. Curso de Bioestadística. Pruebas de hipótesis Etapas de las pruebas estadísticas Las pruebas estadísticas incluyen algunos pasos específicos previos a la inspección de los datos: 1. Formulación de supuestos y sistema de hipótesis - PowerPoint PPT Presentation

Transcript of Curso de Bioestadística.

Page 1: Curso de Bioestadística.

Curso de Bioestadística.

Pruebas de hipótesis

MGA/DEO

Page 2: Curso de Bioestadística.

Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticasLas pruebas estadísticas incluyen algunos pasos

específicos previos a la inspección de los datos:

1. Formulación de supuestos y sistema de hipótesis

2. Definición de la distribución de muestreo

3. Selección del nivel de significación estadística y la región crítica

4. Cálculo de los estadísticos de la prueba

5. Toma de decisiones y conclusiones

Page 3: Curso de Bioestadística.

Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticas:3) selección del nivel de la significación estadística y la región crítica

• Cuando obtenemos una muestra muy improbable como en ejemplo (14- y 3+) podemos tomar dos decisiones: rechazar o no rechazar la hipótesis nula.

• Ya sea que se rechace o no la hipótesis nula, la decisión puede ser correcta o incorrecta

Page 4: Curso de Bioestadística.

Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticas:3) selección del nivel de la significación estadística y la región crítica

No rechazada RechazadaHipótesis nula Verdadera Decisión correcta Error tipo I

Falsa Error tipo II Decisión correcta

Hipótesis nula

Page 5: Curso de Bioestadística.

Curso de Bioestadística.

• Antes de efectuar una prueba, debemos decidir qué magnitud permitiremos de error tipo I, sabiendo que siempre podrá haber muestras muy desviadas.

• Pregunta: En la tabla siguiente ¿a partir de qué combinación de muestras rechazamos la hipotesis nula si hubiéramos fijado nuestro error tipo I en 5% ? ¿Y en 1% ?

Pruebas de hipótesis

Etapas de las pruebas estadísticas:3) selección del nivel de la significación estadística y la región crítica

Page 6: Curso de Bioestadística.

Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticas: formulación de supuestos y sistema de hipótesis

| Ho: p = q Ho: p = 2qCon microorganismo Sin microorganismo Frecuencia relativa Frecuencia relativa

17 0 0.0000076 0.001015016 1 0.0001297 0.008627215 2 0.0010376 0.034508814 3 0.0051880 0.086271913 4 0.0181580 0.150975612 5 0.0472107 0.196267911 6 0.0944214 0.196267610 7 0.1483765 0.15421019 8 0.1854706 0.09638118 9 0.1854706 0.04819057 10 0.1483765 0.01927626 11 0.0944214 0.00613335 12 0.0472107 0.00153334 13 0.0181580 0.00029493 14 0.0051880 0.00004212 15 0.0010376 0.00000421 16 0.0001297 0.00000030 17 0.0000076 0.0000000

1%5%

Page 7: Curso de Bioestadística.

Curso de Bioestadística.

• Si especificamos un = 0.01, no rechazamos la H0 para todas las muestras que tienen 13 o menos elementos del mismo tipo. Cerca de 99 % de las muestras son así.

• Pero, ¿qué tal si la H0 es falsa y la H1 es correcta?

• Observemos las distribuciones.

Pruebas de hipótesis

Etapas de las pruebas estadísticas:3) selección del nivel de la significación estadística y la región crítica

Page 8: Curso de Bioestadística.

Curso de Bioestadística.

Pruebas de hipótesis

/ 2 1 - / 2

1 -

Page 9: Curso de Bioestadística.

Curso de Bioestadística.

• Se hace evidente que al reducir el error aumentamos simultánea y necesariamente el error que consiste en no rechazar la hipótesis nula siendo falsa, el error tipo II.

• El error tipo II expresado como porcentaje es .

• En el ejemplo que hemos visto, la muestra de 17 elementos es insuficiente para distinguir entre las dos hipótesis.

Pruebas de hipótesis

Etapas de las pruebas estadísticas:3) selección del nivel de la significación estadística y la región crítica

Page 10: Curso de Bioestadística.

• En el ejemplo dado, hemos visto que con un error = 0.01 aceptaremos la hipótesis nula para todas las muestras de 17 observaciones con 13 o menos individuos con o sin la característica estudiada.

• Pero, si la hipótesis fuera p = 2q = 0.6667, igualmente no rechazamos los resultados con 13 o menos individuos con o sin la característica. ¿Qué probabilidad tenemos que esto suceda?

Pruebas de hipótesis

Etapas de las pruebas estadísticas:3) selección del nivel de la significación estadística y la región crítica

Curso de Bioestadística.

Page 11: Curso de Bioestadística.

Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticas: formulación de supuestos y sistema de hipótesis

| Ho: p = q Ho: p = 2qCon microorganismo Sin microorganismo Frecuencia relativa Frecuencia relativa

17 0 0.0000076 0.001015016 1 0.0001297 0.008627215 2 0.0010376 0.034508814 3 0.0051880 0.086271913 4 0.0181580 0.150975612 5 0.0472107 0.196267911 6 0.0944214 0.196267610 7 0.1483765 0.15421019 8 0.1854706 0.09638118 9 0.1854706 0.04819057 10 0.1483765 0.01927626 11 0.0944214 0.00613335 12 0.0472107 0.00153334 13 0.0181580 0.00029493 14 0.0051880 0.00004212 15 0.0010376 0.00000421 16 0.0001297 0.00000030 17 0.0000076 0.0000000

0.6%

87%

0.6%

Page 12: Curso de Bioestadística.

Pruebas de hipótesisPruebas de hipótesis

/ 2 1 - / 2

1 -

Curso de Bioestadística.

Page 13: Curso de Bioestadística.

• ¿Qué proporción de la distribución de la H1 se traslapa con la de la H0 ?

• R. 0.8695.

• O sea que si la H1 es la hipótesis correcta no rechazaremos erróneamente la H0 en el 86.95 % de las veces.

• Esta proporción es .

Pruebas de hipótesis

Etapas de las pruebas estadísticas:3) selección del nivel de la significación estadística y la región crítica

Curso de Bioestadística.

Page 14: Curso de Bioestadística.

• Se hace claro por qué mientras más parecidas son las dos hipótesis (menor el error, o la diferencia) mayor es .

• Y también cómo a medida que disminuye, aumenta .

Pruebas de hipótesis

Etapas de las pruebas estadísticas:3) selección del nivel de la significación estadística y la región crítica

Curso de Bioestadística.

Page 15: Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticas:3) selección del nivel de la significación estadística y la región crítica

Curso de Bioestadística.

• La magnitud de depende de la cercanía de la media de la H1, con respecto a la de la H0 .

•El valor de cambia de acuerdo con la naturaleza de la hipótesis alternativa.

•El valor máximo de es 1 - .

Page 16: Curso de Bioestadística.

• Poder es una propiedad importante en una prueba estadística.

• Se define como 1 - , el complemento de , o sea la probabilidad de rechazar la hipótesis nula cuando ésta es falsa y la alternativa es la correcta.

• Es deseable que el poder de una prueba sea tan grande como sea posible.

Pruebas de hipótesis

Etapas de las pruebas estadísticas:3) selección del nivel de la significación estadística y la región crítica

Curso de Bioestadística.

Page 17: Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticas:3) selección del nivel de la significación estadística y la región crítica

Curso de Bioestadística.

• Como generalmente no podemos especificar una hipótesis alternativa, describimos o 1 - , para un intervalo continuo de valores posibles.

Page 18: Curso de Bioestadística.

Curso de Bioestadística.

• Una gráfica que resulta de dicha relación se denomina curva de poder.

• Observemos que el poder cae rápidamente cuando la H1 se acerca a H0 .

• Para mejorar el poder de una prueba, debemos aumentar el tamaño de la muestra.

Pruebas de hipótesis

Etapas de las pruebas estadísticas:3) selección del nivel de la significación estadística y la región crítica

Page 19: Curso de Bioestadística.

Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticas:3) selección del nivel de la significación estadística y la región crítica

• A veces necesitamos analizar sólo un lado (una cola) de la curva.

• En ese caso, la hipótesis alternativa es de la forma H1 : 1 < , o también H1 : 1 > 0 .

Page 20: Curso de Bioestadística.

Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticas:4) cálculo de estadísticos de la prueba

• Probemos ahora el conocimiento que hemos adquirirdo aplicándolo en algunos ejemplos de pruebas con las distribuciones normal y t .

Page 21: Curso de Bioestadística.

Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticas:4) cálculo de estadísticos de la prueba

• Problema: Asumiendo que conocemos la media paramétrica, ¿Cuán probable es que una medición de 43 unidades venga de una población de = 45.5 y = 3.90?(H0 : = 45.5, H1 : 45.5)

• Aplicar:

01 Y

Page 22: Curso de Bioestadística.
Page 23: Curso de Bioestadística.

Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticas:4) cálculo de estadísticos de la prueba

• Conclusión: en cualquiera de los niveles convencionales de significación estadística (5% o 1%), no rechazamos la hipótesis nula y concluimos que la muestra de 43 unidades pertenece a la población indicada.

Page 24: Curso de Bioestadística.

Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticas:4) cálculo de estadísticos de la prueba

• Problema: Si obtenemos una muestra que tiene un promedio de 70.05 unidades, ¿pertenece dicha muestra a una población cuya media y desviación estándar son = 66.61 y = 11.1597 (n = 100)?(H0 : = 66.61, H1 : 66.61)

• Aplicar: (70.05 es una media)__

0

__

Y

Y

Page 25: Curso de Bioestadística.
Page 26: Curso de Bioestadística.

Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticas:4) cálculo de estadísticos de la prueba

• La media de la muestra se encuentra a 3.08 desviaciones estándar sobre la media paramétrica (p < 0.0010)

• Conclusión: rechazamos la hipótesis nula. La media de 70.05 unidades no parece venir de la población especificada.

Page 27: Curso de Bioestadística.

Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticas:4) cálculo de estadísticos de la prueba

• Problema: 10 tabletas de una preparación farmacológica tienen una media y desviación estándar de 592.5 11.2 mg. ¿Cumplen las muestras una especificación de 600mg? No conocemos la media paramétrica.(H0 : = 0, H1 : 0)

• Aplicar:

__

0

__

Y

s

s

Yt

12.2

542.36005.592 st

Page 28: Curso de Bioestadística.
Page 29: Curso de Bioestadística.

Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticas:4) cálculo de estadísticos de la prueba

• El valor ts calculado de la muestra es -2.12.

• Este valor es comparado con los valores correspondientes para .

Page 30: Curso de Bioestadística.

Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticas:4) cálculo de estadísticos de la prueba

• Para una prueba de dos colas el valor ts = -2.12 se encuentra entre 0.05 y 0.10. No se rechaza la H0 .

• Sin embargo, para una prueba de una cola, dicho valor se encuentra entre 0.025 y 0.05. Se rechaza la H0 .

• Discusión sobre este caso particular.

Page 31: Curso de Bioestadística.

Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticas:5) Toma de decisiones y conclusiones

• Tradicionalmente las pruebas estadísticas escogen el valor = 0.05, aunque en la literatura se encuentran ocasionalmente valores de 0.01 y 0.001.

• Sin embargo, es deseable que el tipo de estudio sea cuidadosamente analizado antes de escoger los valores aceptables tanto para como para .

Page 32: Curso de Bioestadística.

Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticas:5) Toma de decisiones y conclusiones

• Cuando se ha rechazado una H0 para un nivel especificado de , decimos que la muestra es significativamente diferente de la población a una probabilidad P .

Page 33: Curso de Bioestadística.

Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticas:5) Toma de decisiones y conclusiones

• El enunciado “(no) es significativamente diferente de” debe ser siempre respaldado por un valor probabilístico.

• Un ejemplo de presentación apropiada es

0.10 > P > 0.05.

Page 34: Curso de Bioestadística.

Curso de Bioestadística.

Pruebas de hipótesis

Etapas de las pruebas estadísticas:5) Toma de decisiones y conclusiones

• A veces se usa una simbología con asteriscos

* = 0.05 P > 0.01

** = 0.01 P > 0.001

*** = P 0.001

en cuyo caso debe aclararse el significado de los asteriscos.

NS suele usarse para indicar “no significativo”.