Prueba de hipotesis_1

9
PRUEBA DE HIPÓTESIS INTRODUCCIÓN En este capítulo, en lugar de determinar un intervalo de valores en el que se espera que se encuentre el parámetro poblacional, se desarrolla un procedimiento para probar la validez de una aseveración acerca de un parámetro poblacional. Ejemplos de estas aseveraciones cuya validez se desea probar son: Este capítulo nos ocuparemos del estudio de las pruebas de hipótesis estadísticas. Se empieza por definir lo que significa una hipótesis estadística y una prueba de hipótesis estadística. A continuación se describen los pasos para realizar una prueba de hipótesis estadística. Después se realizan pruebas de hipótesis para medias y proporciones. En la última sección del capítulo se describen posibles errores en las pruebas de hipótesis, debidos al muestreo. ¿Qué es una hipótesis? Una hipótesis es una aseveración acerca de una población. Para verificar si la afirmación es razonable se usan datos. Para empezar es necesario definir la palabra hipótesis. En el sistema legal de Estados Unidos una persona es inocente hasta que se demuestre que es culpable. Un jurado sostiene la hipótesis de que la persona acusada de un crimen es inocente y somete esta hipótesis a verificación revisando las evidencias y escuchando los testimonios antes de llegar a un veredicto. En un sentido similar, un paciente acude a un médico y le informa de varios síntomas. Besándose en éstos, el médico ordenará ciertos análisis, La velocidad media de los automóviles al pasar por la kilómetro 150 de la autopista del Sol México-Acapulco es 120 kilómetros por hora. La cantidad media de kilómetros recorridas por las personas que rentan un Chevy Blazer, por 3 años, es 50 000 kilómetros. El tiempo medio en el que una familia típica vive en su casa (en EUA) es 11.8 años. El sueldo inicial medio de los egresados de una licenciatura de administración de cuatro años es 5,500 pesos mensuales. Treinta y cinco por ciento de los jubilados, en no más de un año después de jubilarse, vende su casa y se muda a un clima cálido. El 80% de los que juegan regularmente a la lotería nacional nunca ganan más de $100 en un sorteo.

Transcript of Prueba de hipotesis_1

PRUEBA DE HIPÓTESIS

INTRODUCCIÓN

En este capítulo, en lugar de determinar un intervalo de valores en el que se espera que se encuentre el parámetro poblacional, se desarrolla un procedimiento para probar la validez de una aseveración acerca de un parámetro poblacional.

Ejemplos de estas aseveraciones cuya validez se desea probar son:

Este capítulo nos ocuparemos del estudio de las pruebas de hipótesis estadísticas. Se empieza por definir lo que significa una hipótesis estadística y una prueba de hipótesis estadística. A continuación se describen los pasos para realizar una prueba de hipótesis estadística. Después se realizan pruebas de hipótesis para medias y proporciones. En la última sección del capítulo se describen posibles errores en las pruebas de hipótesis, debidos al muestreo.

¿Qué es una hipótesis?

Una hipótesis es una aseveración acerca de una población. Para verificar si la afirmación es razonable se usan datos. Para empezar es necesario definir la palabra hipótesis. En el sistema legal de Estados Unidos una persona es inocente hasta que se demuestre que es culpable. Un jurado sostiene la hipótesis de que la persona acusada de un crimen es inocente y somete esta hipótesis a verificación revisando las evidencias y escuchando los testimonios antes de llegar a un veredicto. En un sentido similar, un paciente acude a un médico y le informa de varios síntomas. Besándose en éstos, el médico ordenará ciertos análisis,

La velocidad media de los automóviles al pasar por la kilómetro 150 de la autopista del Sol México-Acapulco es 120 kilómetros por hora.

La cantidad media de kilómetros recorridas por las personas que rentan un Chevy Blazer, por 3 años, es 50 000 kilómetros.

El tiempo medio en el que una familia típica vive en su casa (en EUA) es 11.8 años.

El sueldo inicial medio de los egresados de una licenciatura de administración de cuatro años es 5,500 pesos mensuales.

Treinta y cinco por ciento de los jubilados, en no más de un año después de jubilarse, vende su casa y se muda a un clima cálido.

El 80% de los que juegan regularmente a la lotería nacional nunca ganan más de $100 en un sorteo.

después, con base en los síntomas y en los resultados de los análisis, determinará el tratamiento a seguir.

En un análisis estadístico se hace una aseveración, es decir, se plantea una hipótesis, después se hacen pruebas para verificar la aseveración o para determinar que no es verdadera. Una prueba de hipótesis se define como sigue:

En la mayor parte de los casos la población es tan grande que por diversas razones no sería factible estudiar todos los elementos, objetos o personas en la población.

Por ejemplo:

Sería prácticamente imposible entrevistar a todos los sociólogos en México, para averiguar su ingreso mensual.

Un departamento de aseguramiento de calidad no puede verificar la resistencia a la ruptura de cada ampolleta producida, para determinar si está entre 5 y 20 psi (libras por pulgada cuadrada).

¿Qué es una prueba de hipótesis?

Las expresiones prueba de hipótesis y probar una hipótesis se usan indistintamente. La prueba de hipótesis comienza con una afirmación, o suposición, acerca de un parámetro poblacional, como la media poblacional. Como se ha dicho, a esta afirmación se le denomina hipótesis.

Una hipótesis podría ser que la comisión mensual media de vendedores de computadoras es $2,000 dólares. No es posible entrevistar a todos los agentes para determinar si le media es en realidad $2,000. El costo de localizar e interrogar a cada vendedor de computadoras en Estados Unidos, sería exorbitante. Para probar la validez de la afirmación (μ = $2,000), debe seleccionarse una muestra de la población formada por todos los vendedores de computadoras, calcular valores estadísticos muestrales y, con base en determinadas reglas de decisión, aceptar o rechazar la hipótesis. Una media muestral de $1,000 para los vendedores de computadoras, claramente provocaría el rechazo de la hipótesis. Sin embargo, supóngase que la media muestral es $1,995 ¿Se aproxima, este valor, lo suficiente a $2,000 para aceptar la suposición que la media poblacional sea $2,000? ¿Puede atribuirse la diferencia de $5 entre las dos medias a error de muestreo, o es estadísticamente significativa?

Hipótesis Enunciado acerca de una población elaborado con el propósito de ponerlo a

prueba.

Prueba de hipótesis Procedimiento basado en la evidencia muestral y la teoría de

probabilidad; se emplea para determinar si la hipótesis es una afirmación razonable.

Procedimiento de cinco pasos para probar una hipótesis

Existe un procedimiento de cinco pasos que sistematiza la prueba de hipótesis; al llegar al paso 5, ya se puede rechazar o no la hipótesis. Sin embargo, una prueba de hipótesis según la usan los estadísticos, no proporciona evidencia de que algo sea verdadero, en la misma forma que un matemático “prueba” una afirmación. Una prueba de hipótesis aporta una clase de “prueba más allá de una duda razonable”, en forma similar a un proceso judicial. Por tanto, hay reglas específicas de evidencia, o procedimientos, que se siguen. Los pasos se muestran en el siguiente diagrama. Posteriormente se analizará cada paso en detalle.

Paso 1 Paso 2 Paso 3 Paso 4 Paso 5

Se plantean las Se selecciona Se identifica Se formula Se toma

hipótesis nula el nivel de el estadístico la regla una muestra

y alternativa significancia de prueba de decisión y se decide.

No se rechaza la hipótesis nula (H0)

Paso 5

Se rechaza la hipótesis nula (H0) y se acepta la hipótesis alternativa (H1)

Paso 1: Plantear la hipótesis nula (H0) y la hipótesis alternativa (H1).

El primer paso es plantear la hipótesis que ha de ser probada. A esta hipótesis se le denomina hipótesis nula, se designa mediante H0 y se lee “H subíndice cero”. La letra H significa hipótesis y el subíndice cero indica “no hay diferencia”. Por lo general hay un “no” en la hipótesis nula, que indica que “no hay cambio”. Por ejemplo, la hipótesis nula es que la cantidad media de millas que se recorren utilizando la llanta de acero especial, no difiere de 60,000. La hipótesis nula se escribiría Ho: μ= 60,000. En términos generales, la hipótesis nula se plantea con el objetivo de realizar una prueba. Podemos rechazarla o aceptarla. La hipótesis nula es una afirmación que no se rechaza a menos que los datos muestrales proporcionen evidencia convincente de que es falsa.

Hay que subrayar que si la hipótesis nula no se rechaza con base en los datos muestrales, no es posible afirmar que sea verdadera. En otras palabras, el no poder rechazar la hipótesis nula no prueba que H0 sea verdadera, más bien significa que no se pudo rechazar H0. Para probar sin duda alguna que la hipótesis

nula es verdadera, tendría que conocerse el parámetro poblacional. A fin de determinarlo verdaderamente, se tendría que probar, revisar o contar cada elemento de la población. Por lo general, esto no es posible. La alternativa es tomar una muestra de la población.

También hay que observar que, con frecuencia, la hipótesis nula principia afirmando que: “No hay una diferencia significativa entre...”, o “La resistencia media al impacto, del vidrio, no es significativamente diferente de…” . Cuando se selecciona una muestra de una población, el valor estadístico muestral por lo general es numéricamente distinto del parámetro poblacional hipotético. Como ejemplo, supóngase que la resistencia hipotética al impacto de una placa de vidrio es 70 psi (libras por pulgada cuadrada), y la resistencia media al impacto de una muestra de 12 placas de vidrio es 69.5 psi. Hay que decidir si la diferencia de 0.5 psi es una diferencia verdadera, es decir, una diferencia significativa, o la diferencia entre el estadístico muestral (69.5) y el parámetro poblacional hipotético (70.0) se debe al azar (muestreo). Como se observó, para contestar a esta pregunta se realiza una prueba de significancia, comúnmente denominada prueba de hipótesis. Para determinar lo que se quiere dar a entender mediante una hipótesis nula es:

La hipótesis alternativa describe lo que se concluirá si se rechaza la hipótesis nula. Se designa por H1 y se lee “H subíndice uno”. Se le conoce también como la hipótesis de investigación. La hipótesis alternativa se acepta si los datos muestrales proporcionan suficientes evidencias estadísticas de que la hipótesis nula es falsa.

El siguiente ejemplo ayudará a entender el significado de las hipótesis nula y alternativa.

Un artículo reciente indicó que la edad media de las aeronaves comerciales en Estados Unidos es 15 años. Para realizar una prueba estadística respecto a esta afirmación, el primer paso es determinar la hipótesis nula y la hipótesis alternativa. La hipótesis nula representa la condición actual o reportada. Se escribe H0: μ = 15. La hipótesis alternativa es que la afirmación no es verdadera, esto es H1: μ ≠ 15. Es importante recordar que sin importar cómo se haya planteado el problema, la hipótesis nula siempre incluirá el

Hipótesis nula Una afirmación acerca del valor de un parámetro poblacional.

Hipótesis alternativa Una afirmación que se acepta si los datos muestrales proporcionan evidencia suficiente de que la hipótesis nula es falsa.

signo “igual”. El signo “igual” (=) nunca aparecerá en la hipótesis alternativa. ¿Por qué? Porque la hipótesis nula es la afirmación a probar, y al realizar los cálculos se requiere de un valor específico. Se recurre a la hipótesis alternativa sólo si se prueba que la hipótesis nula es falsa.

Paso 2: Seleccionar el nivel de significancia

Después de establecer la hipótesis nula y la hipótesis alternativa el siguiente paso es determinar el nivel de significancia.

El nivel de significancia se denota mediante α, le letra griega alfa. Algunas

veces también se denomina nivel de riesgo. Este último es un término más adecuado, ya que es el riesgo que se corre da rechazar la hipótesis nula cuando, en realidad es verdadera.

No hay un nivel de significancia que se aplique a todas las pruebas. Se usa el nivel 0.05 (que con frecuencia se enuncia como nivel de 5%), el nivel 0.01, el 0.10 o cualquier otro nivel entre 0 y 1. Tradicionalmente se selecciona el nivel 0.05 para proyectos de investigación sobre consumo, el nivel 0.01 para el aseguramiento de calidad y el 0.10 para encuestas políticas. El investigador debe decidir qué nivel de significancia usar antes de formular una regla de decisión y recopilar los datos muestrales.

A fin de ilustrar cómo se puede rechazar una hipótesis verdadera, supóngase que una compañía que fabrica computadoras personales utiliza un gran número de tarjetas de circuito impreso. Los proveedores ofrecen sus tarjetas, y al que presenta la oferta de menor precio se le concede un contrato con un volumen de venta considerable. En tal contrato se específica que el departamento de aseguramiento de calidad del fabricante de computadoras las someterá a un muestreo todos los envíos de tarjetas de circuito que se reciban. Si más del 6% de las tarjetas muestreadas están por debajo de un valor estándar, se rechazará el envío. La hipótesis nula es que la remesa de tarjetas que se recibe contiene 6% o menos productos que no cumplen con el estándar. La hipótesis alternativa es que más de 6% de las tarjetas de circuito impreso están defectuosas.

Nivel de significancia Probabilidad de rechazar la hipótesis nula cuando es verdadera.

Una muestra de 50 tarjetas de circuito impreso que se recibieron, reveló que 4 de éstas -es decir 8%- estaban fuera de especificaciones. El embarque se rechazó porque excedía el máximo de 6% de tarjetas abajo del estándar. Si la remesa era en realidad fuera de especificaciones, entonces la decisión de devolver las tarjetas al proveedor fue adecuada. Sin embargo, supóngase que las 4 tarjetas fuera de especificaciones que se encontraron en la muestra de 50, eran las únicas que estaban abajo del Estándar, en el envío de 4,000 tarjetas. Entonces sólo 0.1% eran defectuosas (4/4000= 0.001). En este caso, menos de 6% de todo el envío estaba abajo del estándar y fue un error rechazar lo remesa. En términos de una prueba de hipótesis se rechazó la hipótesis nula de que el envío no estaba abajo del estándar cuando debió haberse aceptado. Al rechazar une hipótesis nula verdadera, se cometió un error tipo I. La probabilidad de cometer un error de tipo 1

es α.

La probabilidad de cometer otra clase de error, denominado error de tipo II, se

denota con la letra griega β.

El fabricante de computadoras personales cometería un error de tipo II sí, dado un envío de circuitos impresos en el que hubiera 15% de tarjetas abajo del estándar, se acepta el envío. ¿Cómo podría suceder esto? Supóngase que 2 de las 50 tarjetas de la muestra (4%) estuvieron abajo del estándar, y que 48 de las 50 tarjetas de circuito impreso fueron aceptables. De acuerdo con el procedimiento establecido, como la muestra contenía menos del 6% de tarjetas abajo del estándar, se aceptó al envío. ¡Podría ser que debido al azar, las 48 tarjetas en buen estado que se seleccionaron en la muestra fueran las únicas aceptables en la remesa completa, integrada por miles de tarjetas!

Visto en retrospectiva, el investigador no puede estudiar cada elemento o individuo de la población. Por tanto, existe la posibilidad de incurrir en dos tipos de error, un error de tipo I en el que se rechaza la hipótesis nula cuando debería haber sido aceptada, y un error de tipo II, en el que se acepta la hipótesis nula cuando debería haberse rechazado.

La probabilidad de cometer estos dos errores se denominan alfa α y beta β. Alfa

es la posibilidad de cometer un error de tipo I y beta es la posibilidad de cometer un error de tipo II.

Error tipo I Rechazar la hipótesis nula, H0, cuando es verdadera.

El error tipo II Aceptar la hipótesis nula cuando es falsa

En la siguiente tabla se resumen las decisiones que pueden tomar el investigador y las consecuencias posibles:

HIPÓTESIS NULA

INVESTIGADOR

SE ACEPTA H0 SE RECHAZA H0

H0 ES VERDADERA DECISIÓN CORRECTA ERROR TIPO I

H0 ES FALSA ERROR TIPO II DECISIÓN CORRECTA

Paso 3: Calcular el valor estadístico de prueba

En las pruebas de hipótesis para la media (μ), cuando se conoce σ, o cuando el

tamaño de la muestra es grande, el valor estadístico de prueba z se determina a

partir de:

DISTRIBUCION z COMO ESTADISTICO DE PRUEBA

n

xz

/

El valor z se basa en la distribución muestral de x , que se distribuye de manera

normal cuando la muestra es razonablemente grande con una media ( x ) igual a

μ, y una desviación estándar x , que es igual a n/ . De esta manera se puede

determinar si la diferencia entre x y μ es estadísticamente significativa,

encontrando el número de desviaciones estándar a las que se encuentra x de μ

aplicando la fórmula anterior.

Estadístico de prueba Valor determinado a partir de la información muestral, que se usa para determinar si se rechaza la hipótesis nula.

Paso 4: Formular la regla de decisión

Una regia de decisión establece las condiciones específicas en las que se rechaza la hipótesis nula y las condiciones en las que no se rechaza la hipótesis nula. La región de rechazo define la ubicación de todos los valores que son tan grandes o tan pequeños, que la probabilidad de que se presenten bajo la suposición de que la hipótesis nula es verdadera, es muy remota.

En el diagrama siguiente se muestra la región de rechazo para una prueba de signíficancia que se realizará más adelante en este capitulo.

Obsérvese en el diagrama que:

1. La región en la que la hipótesis nula no se rechaza se encuentra a la izquierda de 1.65 (Más adelante se explicará cómo llegar al valor da 1.65).

2. El área de rechazo está a la derecha de 1.65.

3. Se está realizando una prueba de una cola. (Esto también se explicará más adelante.)

4. Se eligió el nivel de significancia 0.05

5. La distribución muestral del valor estadístico z es una distribución normal.

6. El valor 1.65 separa las regiones de rechazo y de aceptación de la hipótesis nula.

7. El valor 1 .65 se denomina valor crítico.

0 1 1.65 Escala de z

0.95 de probabilidad 0.05 de probabilidad

Valor crítico

No se rechaza H0

Región de

rechazo

Paso 5: Tomar una decisión

El quinto y último paso en una prueba de hipótesis es calcular el estadístico de prueba, compararlo con el valor crítico, y tornar la decisión de rechazar o no la hipótesis nula. Respecto al diagrama anterior sí, con base en la información muestral, el valor que se obtiene para z es 2.34, la hipótesis nula se rechaza en el nivel de significancia 0.05. Se tomó la decisión de rechazar H0 debido a que 2.34 se encuentra en la región de rechazo, es decir más allá de 1.65. Se rechaza la hipótesis nula según el razonamiento de que resulta poco probable obtener un valor z tan grande como este, debido a la variación muestral (a la casualidad).

Si el valor calculado hubiera sido igual o menor que 1.65, por ejemplo 0.71, la hipótesis nula no se habría rechazado. Se pensaría que obtener un valor así de pequeño podría ser atribuido al azar, es decir, a la variación muestral.

Como se observó, en una prueba de hipótesis sólo se puedo tomar una de dos decisiones: aceptar o rechazar la hipótesis nula. En lugar de “aceptar” tal hipótesis, H0, algunos investigadores prefieren enunciar la decisión como: “No se rechaza H0, o „Los resultados muestrales no permiten rechazar H0”.

Debe subrayarse de nuevo que siempre existe la posibilidad de rechazar la hipótesis nula cuando no debería haberse rechazado (error de tipo I). También, hay una posibilidad definible de que la hipótesis nula se acepte cuando debería haberse rechazado (error de tipo II).

Valor crítico Punto de división entre la región en la que se rechaza la hipótesis nula y la región en la que no se rechaza la hipótesis nula.