Prueba de Hipotesis minitab
Transcript of Prueba de Hipotesis minitab
Prueba de hipótesis
Uno de los objetivos de la estadística es hacer inferencias con respecto a los parámetros de
la población desconocidos, basadas en la información obtenida mediante datos muéstrales.
Estas inferencias se expresan en una de dos maneras, como estimaciones de los parámetros
respectivos o como pruebas de hipótesis referentes a sus valores.
El procedimiento de toma de decisión que conduce a la aceptación o rechazo de hipótesis
estadísticas es llamado prueba de hipótesis.
La hipótesis estadística es una proposición sobre los parámetros de una o más poblaciones,
su objetivo es verificar una hipótesis con respecto a los valores de uno ó más parámetros
poblacionales.
El investigador propone una teoría relativa a los valores específicos de uno o más
parámetros poblacionales. Luego obtiene una muestra de la población y compara la
observación con la teoría. Si las observaciones se contraponen a la teoría, el investigador
rechaza la hipótesis. En caso contrario concluye con que la teoría es válida o bien que la
muestra no detectó la diferencia entre los valores reales y los valores de la hipótesis
respecto a los parámetros poblacionales. Las pruebas de hipótesis se realizan en todos los
ámbitos en los cuales puede contrastarse la teoría frente a la observación.
Elementos de una prueba de Hipótesis:
La hipótesis nula es H0
La hipótesis alternativa es H1
El estadístico de la prueba
La región de rechazo y aceptación
Hipótesis nula H0.
Es la suposición que queremos probar. Una hipótesis nula referida a un parámetro de la
población será siempre enunciada de tal forma que se especifique un valor exacto.
Hipótesis alternativa H1.
Cada vez que se rechaza la hipótesis nula, la conclusión que se acepta se llama hipótesis
alternativa. Dicha hipótesis es enunciada de tal forma que permite la posibilidad de muchos
valores del parámetro poblacional.
Rechazar una hipótesis, significa concluir que H0 es falsa, se dice que es una conclusión
fuerte.
Aceptar una hipótesis, solamente implica que no se tiene suficiente información para
rechazar H0, además no implica necesariamente que sea verdadera. Se dice que es una
conclusión débil ya que se es incapaz de rechazar la hipótesis nula.
Estadístico de prueba.
Es una función de las mediciones muéstrales en el cual se fundamenta la decisión
estadística.
Región de rechazo.
Especifica los valores del estadístico de la prueba para los cuales se rechaza la hipótesis
nula, en esta región existe una diferencia significativa entre el estadístico de la muestra y el
supuesto parámetro de la población.
Región de aceptación.
Es la región donde no existe diferencia significativa entre el estado de la muestra y el
supuesto parámetro de la población. Aceptaremos H0 si el estadístico muestral cae en esta
región.
Tipos de pruebas de hipótesis
Prueba de hipótesis de dos extremos o de dos colas
Esto aplica si:
H0: Ө = Ө H0
H1: Ө ≠ Ө H0
Prueba de hipótesis de un extremo
Extremo inferior o cola izquierda
Esto aplica si:
H0: Ө = Ө H0
H1: Ө < Ө H0
Región de aceptación
Región de rechazo Región de rechazo
1 – αSe acepta H0
Se rechaza H0
α/2Se rechaza H0
α/2
Se rechaza
H0
α
1 – αSe acepta H0
1 – αSe acepta H0
Se rechaza H0
α
Extremo superior o cola derecha
Esto aplica si:
H0: Ө = Ө H0
H1: Ө > Ө H0
Matriz de decisión
Situaciones posibles
Decisión
H0 ES VERDADERA H0 ES
FALSA
ACEPTAR H0
Decisión correcta
(1 – α)
ERROR II (β)
RECHAZAR H0 ERROR I (α)
Decisión correcta
(1 – β) potencia de la prueba
El error tipo I (α) es la probabilidad de que el valor del estadístico de la prueba se localice
en la región de rechazo cuando es verdadera H0. También se le denomina nivel de
significancia. Por costumbre se elige dicho nivel en un rango de 0.01 a 0.05.
Error tipo II (β) es la probabilidad de que el valor del estadístico de la prueba no este en la
región de rechazo siendo verdadera H1 se recomienda que sea un valor menor de 0.2.
La potencia de la prueba es la cantidad 1 - β se conoce como el poder de la prueba, es la
probabilidad de rechazar H0 cuando es falsa, cuando en realidad debe ser rechazada. Se
utiliza para “detectar diferencias” entre un valor hipotético y el verdadero valor del
parámetro. Se recomienda que sea un valor mayor de 0.8.
Procedimiento general para una prueba de hipótesis
1. Identificar el parámetro de interés del problema.
2. Establecer la hipótesis nula (H0)
3. Especificar una apropiada hipótesis alternativa (H1)
4. Seleccionar un nivel de significancia α.
5. Establecer un estadístico de la prueba apropiado (Z, t, x2, F)
6. Establecer la región de rechazo para el estadístico.
7. Calcular todas las cantidades muéstrales necesarias, sustituirlas en la ecuación para
el estadístico de prueba y calcular el valor correspondiente.
8. Decidir si debe o no rechazar H0 y notificar en el contexto del problema.
Al formular hipótesis alternativas H1 debe recordarse que el rechazo de H0 siempre es una
conclusión fuerte. En consecuencia, en la hipótesis alternativa H1 debe ponerse la
proposición sobre la que es importante llegar a una conclusión fuerte. Nos deberá importar
rechazar H0 para plantear H1.
Nivel de significancia “p”
El valor “p” es el nivel de significación más pequeño que conduce al rechazo de la
hipótesis nula, se calcula de la siguiente manera:
Sea Z0 el estadístico de prueba.
*Prueba de dos extremos (solo para curvas simétricas)
P = 2 [1 – P (Z< Z0)]
*Prueba de extremo superior
P = 1 – P (Z < Z0)
*Prueba de extremo inferior
P= P (Z < Z0)
Se rechaza H0 cuando α ≥ p
Prueba de Hipótesis para μ con muestras grandes y σ2 conocida
Estadístico de prueba:
Esta prueba se puede aplicar a muestras pequeñas que se toman de poblaciones con
distribución normal y conocida.
Determinación del tamaño de la muestra “n” en una prueba de hipótesis para .
Por fórmula (para el estadístico de prueba Z):
Para una prueba bilateral
Para una prueba unilateral
Para el estadístico de prueba t solo sustituya en la fórmula a Z por t.
Ejercicio
Un fabricante vende ejes traseros de camiones al Servicio Postal. Los ejes han de soportar
80,000 libras por pulgada cuadrada en las pruebas de esfuerzo, los ejes demasiado fuertes
elevan de modo considerable los costos de producción. La experiencia indica que la
desviación estándar de la resistencia de los ejes es de 4,000 libras por pulgada cuadrada. El
fabricante selecciona una muestra de 100 ejes en la última serie de producción, los somete
a pruebas y averigua que la capacidad media de resistencia de la muestra es de 79,600
libras por pulgada cuadrada. Si el fabricante de ejes usa un nivel de significancia de 0.05
en las pruebas, ¿cumplirán los ejes con los requisitos de esfuerzo?. Si la desviación del
soporte de los ejes es de 1000 libras por pulgada cuadrada, la probabilidad de detectar esta
diferencia no debe ser menor de 0.80 (o sea =0.2) ¿cuál deberá ser el tamaño muestral
para ésta prueba?
Solución
1.-
2.-
3.-
4.- =0.05
5.-
6.- RR
7.- =80 000 =4000 n = 100 = 79600
8.- = Z 0.025 = 1.96
Por lo tanto se acepta
Cálculo de “p”
p = 2 [1 – P (Z< )] = 2 [1 – P (Z< 1)] = 2 (1 – 0.8413) = 0.3174
< p por lo tanto se acepta
Intervalo de confianza
P [ ] = 0.95 =80 000 está en el intervalo
Para el cálculo de “n“
Por fórmula:
Si =0.2 y
Entonces 784
n = 784
Solución Minitab
Abrimos el programa Minitab, en el menú de opciones colocamos el cursor donde dice
“Stat” y desplegamos las opciones, seleccionamos “Basic Statistics” y damos un clic en la
opción “1-Simple z”
En el siguiente cuadro seleccionamos la opción “sample size” y tecleamos el tamaño de la
muestra, en “mean” la
media de la muestra, y en la
opción “standar
deviation” la desviación
estándar como muestra la
siguiente ventana.
Una vez realizado el paso anterior Minitab nos despliega un menú, damos clic en el botón
“options” y tecleamos el nivel de confianza en el cuadro “confidence level” y damos clic
en “ok”
Una vez realizados los pasos anteriores, Minitab automáticamente nos genera los cálculos
que le solicitamos, como muestra la siguiente imagen:
El programa nos muestra los siguientes datos:
Numero de datos=100
Media de la muestra= 79600
Desviación de la muestra=400
Intervalo de confianza del 95% 78816 a 80384.
Relacionando el intervalo de confianza con la prueba de hipótesis se concluye que como el
Parámetro planteado en esta prueba, o sea el valor de la media de la hipótesis nula =
80000, cae dentro de los limites del intervalo de confianza.
Por lo tanto se acepta la hipótesis nula.
El valor de la variable aleatoria calculada con los datos de la muestra de
Z=-1
El valor de P=0.317 el valor “P” es el valor de significancia mas pequeño
Que conduce al rechazo de la hipótesis nula.
Criterio de decisión;
Se rechaza la hipótesis nula cuando alfa es mayor o igual a P.
En este caso alfa = 0.05 es menor que P=0.317 por lo que se acepta la
Hipótesis nula.
Para contestar la pregunta:
¿Cual deberá ser el tamaño de la muestra para esta prueba?
Nuevamente en Minitab nos posicionamos en Stat > power and simple size > 1-sample Z
Y se desplegara en siguiente cuadro de dialogo donde se tendrá que especificar 2 de los 3
valores que se presentan, esto significa que el valor que dejemos el blanco, Minitab lo
calculara automáticamente. Y seleccionamos el botón “options”
En el siguiente cuadro se presentan diferentes opciones, la única que se seleccionara es
“siginificance level” o nivel de significancia del problema a resolver, y finalmente dar clic
en “ok”
Ahora se muestra el resumen de los datos que proporcionamos a minitab para poder
calcular el tamaño de la muestra del problema anterior y su poder de la prueba
correspondiente. Nótese que el valor que se muestra en Minitab en la ventana “Session”,
“Sample size” es idéntico al efectuado anteriormente con las formulas. Todo esto se
realiza para efectuar rápidamente los cálculos necesarios.
Prueba de Hipótesis para P con muestras grandes y σ2 conocida.
Estadístico de prueba:
Prueba de Hipótesis para con muestras pequeñas y desconocida.
Supuestos: X1, X2,..., Xn es una muestra aleatoria de una distribución normal con E
(Xi)=
Estadístico de prueba:
Prueba de Hipótesis para con Varianzas Conocidas.
Consideraciones:
1. Dos poblaciones con y desconocidas y y conocidas.
2. Se supone que las dos poblaciones son normales o si no lo son se aplican las
condiciones del Teorema del límite central.
3. El interés recae en probar la hipótesis de que las dos medias poblacionales y
son iguales.
4.
Supuestos:
Es una muestra aleatoria de tamaño y es una
muestra aleatoria de tamaño . Las muestras son independientes y ,
además las observaciones están distribuidas de manera independiente para cada
muestra con y para y y para .
Estadístico de prueba:
Si
Determinación del tamaño de la muestra “n” en una prueba de hipótesis para
.
Para
Para una prueba bilateral
Para una prueba unilateral
Prueba de Hipótesis para con muestras grandes.
Estadístico de prueba:
Si
Prueba de Hipótesis sobre de dos distribuciones normales con varianzas
desconocidas.
Supuestos: Muestras independientes de poblaciones normales con
Estadístico de prueba:
Prueba de Hipótesis sobre de dos distribuciones normales con varianzas
desconocidas.
Supuestos: Muestras independientes de poblaciones normales con
Estadístico de prueba:
;
Prueba de Hipótesis sobre de dos distribuciones normales con varianzas
desconocidas (observaciones pareadas).
Estadístico de prueba: ;
Donde
Prueba de Hipótesis para una Varianza Poblacional
Estadístico de prueba:
Prueba de Hipótesis para la igualdad de dos varianzas
Estadístico de prueba:
¿Qué es una prueba de hipótesis aplicada en Minitab?
Una prueba de hipótesis usa datos de ejemplo para probar una hipótesis acerca de la
población de cual el ejemplo es tomado. El “one-sample t-test” es uno de los muchos
procedimientos disponibles para la prueba de una hipótesis en MINITAB.
¿Cuándo usar una prueba de hipótesis?
Se usa una prueba de hipótesis cuando se tienen datos de ejemplo y se quiera hacer
inferencias acerca de una o más poblaciones.
¿Por qué usar una prueba de hipótesis?
La prueba de hipótesis puede ayudar a contestar preguntas como:
¿Esta el proceso correctamente centrado?
¿Es el producto de un proveedor mejor que el producto de otro?
¿Hay diferencias entre el tratamiento de los grupos y los experimentos?
Por ejemplo,
¿Es tu surtido de tu papel en media de 8.5 pulgadas de ancho?
¿La gasolina del proveedor es de mejor octanaje que la del proveedor B?
¿El cliente prefiere una formulación de una bebida sobre otra?
Probando la hipótesis nula
Se necesita determinar si la media de un proceso de empaque difiere significativamente del
peso correcto que es 365 gramos. En Términos estadísticos, el proceso de la media es
también llamado la población de la media.
Hipótesis de estadística
Hay 2 posibilidades, µ es igual a 365 o no lo es. Estas alternativas pueden ser usadas como
2 hipótesis:
La hipótesis nula (H0): µ es igual a .365 gramos
La hipótesis alternativa(H1): µ no es igual a 35 gramos
Por que no se puede medir cada caja en la población, nunca se podrá saber con exactitud
cual hipótesis es correcta. Sin embargo una prueba de hipótesis apropiada puede ayudar a
hacer un cálculo formal. Para estos datos la prueba apropiada es la “one-sample t-test”
Escoger Stat > Basic Statistics > 1-Sample t. Y luego llenar el cuadro de dialogo como se
muestra a continuación:
Interpretando los resultados.
La lógica de la prueba de hipótesis
Todas las pruebas de hipótesis siguen los mismos pasos:
Asumir que H0 es verdadera.
Determinar que tan diferente es tu muestra de lo que esperas dado que H0 es verdad.
Si tu muestra es diferente dado que H0 es verdad, entonces descarta H0.
Por ejemplo, los resultados de “t-test” indican que la muestra es 366.704. De esta manera
el examen contestara la pregunta, "Si µ es igual a 365, como se obtiene una muestra de
366.704(o mayor). La respuesta es dada como una probabilidad que vale (P), que para esta
prueba es igual a 0.143.
Tomando una decisión
Para tomar una decisión, se necesita Escoger el nivel de Importancia o Significancia, α
(alpha), antes de la prueba:
Si P es menor o igual a α, se rechaza H0.
Si P es mayor que α, si fallas al rechazar H0 (Técnicamente, nunca se acepta H0,
simplemente fallas al rechazarlo).
Un valor típico para α es 0.05, pero valores mayores o menores pueden ser escogidos
dependiendo de la exactitud requerida para la prueba. Asumiendo que escojas un α-Nivel
de 0.05 para los datos del peso de la caja no se tendrá suficiente evidencia para rechazar
H0. P (0.143) es mayor que α.
Evaluando el Poder de la Prueba
No se esta seguro con en el resultado del análisis del peso de los empaques del ejemplo
anterior. Se requerirá el análisis del Poder de la prueba para determinar si se recolectaron
suficientes datos.
Se pretende asegurar que el llenado de las cajas no difiera del objetivo del peso de 365
gramos no más de 2.5 gramos. Basándose el análisis del Poder de la prueba en los
resultados del “t-test” del ejemplo anterior.
Stat> Power and Sample Size> 1-Sample t
¿Que es un análisis del Poder de la prueba?
Power o Poder de la prueba es la habilidad de una prueba para detectar un efecto cuando
existe. Cuando se conduce una prueba de hipótesis, hay 4 posibles resultados:
Decisión correcta
p =1-α
Error tipo II
p = β
Error tipo I
p = α
Decisión correcta
p = 1- α
(Power)
El Poder de la prueba es la probabilidad que rechazara la hipótesis nula correctamente,
dado que la hipótesis nula es falsa. Se Puede usar un análisis Power para determinar cuanto
poder tiene dicha prueba, o ayudar a designar una nueva prueba para que tenga el poder
adecuado.
¿Por qué usar un análisis del Power?
El análisis del Power puede ayudar a responder preguntas como:
¿Es una muestra lo suficiente grande?
¿Qué diferencia se puede detectar en una prueba?
¿Se debería confiar en los resultados insignificantes de la prueba?
Por ejemplo,
¿Cuántas muestras se necesitan recolectar para determinar si el papel de proveedor
es más delgado que el de otro por 0.0015 pulgadas?
¿Qué tan grande es la diferencia que se puede detectar entre la resistencia de una
viga de acero y un historial de la media si reúnes 8 muestras?
¿Se podría confiar en los resultados de una prueba “t-test” que indica la resistencia
de 2 fórmulas de pegamento que no tienen diferencia?
Valores
Si se especifica valores para cualquiera de los 2 parámetros de la prueba, MINITAB
calculará el parámetro restante:
Sample size----- el número de observaciones en la muestra
Differences----- un significado cambio en el alejamiento del objetivo que se este
interesado en detectar con alta probabilidad.
Power values----- el poder (probabilidad de rechazar H0 cuando es falso) que fuera
el apto que tuviera la prueba.
Sigma
Porque el poder de una prueba es parcialmente determinada por la variabilidad en los
datos, se deberá proveer un estimado para σ. Usa un estimado del historial o la desviación
estándar de la muestra.
Escoger: Stat > Power and Sample Size > 1-Sample t.
Interpretando los resultados
Por ejemplo: Con 6 observaciones, una desviación estándar de 2.043 y un α de 0.05, el
Power solo es de .5376. Esto significa que µ esta fuera del objetivo por 2.5, solo tienes un
53.76% de oportunidad para detectarlo.
De otra manera, hay un 46.24% de probabilidad que se falle al rechazar H0 e
incorrectamente concluye que el proceso está en el objetivo.
¿Qué sigue?
De manera que se incremente la probabilidad de detectar un cambio si existe, es
incrementar el tamaño de la muestra. Determinar él número de observaciones requeridas
para lograr el Power adecuado.
“Power and Sample Size”
1-Sample t Test
Testing mean = null (versus not = null)
Calculating power for mean = null + difference
Alpha = 0.05 Assumed standard deviation = 2.403
Determinando el Power
Con 6 observaciones el Power de la prueba fue solo de 0.5376. Para tener mejores
posibilidades de detectar un efecto si es que existe, se deberás incrementar el poder de la
prueba, que por lo menos sea de 0.80 (como regla general).
Ejemplo: Calcular el tamaño de la muestra requerida para llegar los niveles de Power de
0.80, 0.85, 0.95, y 0.95.
Seleccionar: Stat > Power and Sample Size > 1-Sample t.
Llenar los campos con los datos que se pretenda solucionar. Y después clic en “ok”
Interpretando los resultados
Para tener un Power de al menos 0.80 (objetivo del Power) para detectar una diferencia de
2.5 gramos al nivel α de 0.05, se necesitara una muestra de tamaño 10.
Porque el tamaño de las muestras debe ser siempre un numero entero. El Power actual de
la prueba con 10 observaciones (0.8327) es escasamente mayor que el objetivo Power.
Observaciones adicionales que dan más Power:
Con 11 observaciones, el Power es de 0.8739.
Con 12 observaciones, el Power es de 0.9058.
Con 15 observaciones, el Power es de 0.9625.
Al duplicar el tamaño de la muestra de 6 a 12, incrementas tus posibilidades de detectar
una diferencia de 2.5 (sí es que existe) de 53.76% a 90.58%.
Tal vez no se requiera incrementar el Power demasiado. Si el Power es demasiado alto, se
podrá empezar a detectar cambios que son demasiado pequeños para ser parcialmente
importantes.
Power and Sample Size
1-Sample t Test
Testing mean = null (versus not = null)
Calculating power for mean = null + difference
Alpha = 0.05 Assumed standard deviation = 2.403
Métodos y Formulas de Minitab
Hipótesis
La hipótesis nula de un 1-sample t-test es: H0: = 0
Donde:
= La media de la población
0 = La hipótesis nula
Donde se escoge una de los siguientes tres tipos de pruebas de hipótesis:
H1: > 0 Prueba de una cola
H1: < 0 Prueba de una cola
H1: ≠ 0 Prueba de dos colas
Estadístico de Prueba
t = ( 0) / (s /√n)
Donde:
= La media de la muestra
0 = la media dé la población de la hipótesis
s = La desviación estándar de la muestra
n = El tamaño de la muestra
Intervalo de confianza
t/ 2 (s /√n) to + t/ 2 (s /√n)
Donde:
= La media de la muestra
t /2 = La probabilidad acumulativa inversa de una distribución t con n-1 grados de
libertad con 1/2; = 1 nivel de confianza/100
s = the sample standard deviation
n = the sample size
Prueba de hipótesis
Hypotheses
La hipótesis nula para una prueba t es: H0: d = 0
Donde:
d = Diferencia de medias poblacionales
0 = Diferencia de medias de las hipótesis
Donde se escoge una de los siguientes tres tipos de pruebas de hipótesis:
H1: d > 0 Prueba de una cola
H1: d < 0 Prueba de una cola
H1: d ≠ 0 Prueba de dos colas
Estadístico de Prueba
Donde:
0 = La diferencia de las medias de la población de las hipótesis
= La media de las diferencias de las poblaciones
Sd = La desviación estándar de las diferencias de las poblaciones
n = Tamaño de la muestra
Intervalo de confianza
To
Donde:
Sd =
= d / n, Donde d = x1 x2 y x1 y x2 son pares de observaciones de sus poblaciones 1
y 2, respectivamente
t/2 = La probabilidad inversa acumulativa de una distribución t con n1 grados de
libertad con 1/2; = 1 nivel de confianza/100
Sd = La desviación estándar de las diferencias
n = numero de muestras pareadas
Bibliografía:
Manual de Entrenamiento Estadísticas Básicas - Manual del usuario
Minitab TM - Making Data Analysis Easier - Versión 13, Lic. Cecilia C. Díaz García
Noviembre 2008, http://www.monografias.com/trabajos35/manual-minitab/manual-
minitab.zip
Meet Minitab 15 – Para Windows, Enero 2007, www.minitab.com