Prueba de hipótesis

23
PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO PRUEBA DE HIPÓTESIS La estadística inferencial es el proceso de usar la información de una muestra para describir el estado de una población. Sin embargo es frecuente que usemos la información de una muestra para probar un reclamo o conjetura sobre la población. El reclamo o conjetura se refiere a una hipótesis. El proceso que corrobora si la información de una muestra sostiene o refuta el reclamo se llama prueba de hipótesis. HIPÓTESIS Y NIVELES DE SIGNIFICANCIA En la prueba de hipótesis se pone a prueba un reclamo hecho sobra la naturaleza de una población a base de la información de una muestra. El reclamo se llama hipótesis estadística. Hipótesis Estadística: Una hipótesis estadística es un reclamo hecho sobre la naturaleza de una población. Por ejemplo, la premisa formulada por un productor de baterías para autos de que su batería dura en promedio 48 meses, es una hipótesis estadística porque el manufacturero no inspecciona la vida de cada batería que él produce. Si surgieran quejas de parte de los clientes, entonces se pone a prueba el reclamo del manufacturero. La hipótesis estadística sometida a prueba se llama la hipótesis nula, y se denota como H 0 . COMO ESTABLECER LA HIPÓTESIS NULA Y LA ALTERNA Hipótesis Nula (H 0 ): premisa, reclamo, o conjetura que se pronuncia sobre la naturaleza de una o varias poblaciones. Por ejemplo, para probar o desaprobar el reclamo pronunciado por el productor de baterías debemos probar la hipótesis estadística de que 48. Por lo tanto, la hipótesis nula es: H 0 : 48. Luego se procede a tomar una muestra aleatoria de baterías y medir su vida media. Si la información obtenida de la muestra no apoya el reclamo en la hipótesis nula ( H 0 ), entonces otra cosa es cierta. La premisa alterna a la hipótesis nula se llama hipótesis alterna y se representa por H 1 . Hipótesis Alterna: Una premisa que es cierta cuando la hipótesis nula es falsa. Por ejemplo, para el productor de baterías H 0 : 48 y H 1 : < 48 Para probar si la hipótesis nula es cierta, se toma una muestra aleatoria y se calcula la información, como el promedio, la proporción, etc. Esta información muestral se llama estadística de prueba. Estadística de Prueba: Una estadística de prueba se basa en la información de la muestra como la media o la proporción. ERROR TIPO 1 Y ERROR TIPO 2 A base de la información de una muestra nosotros podemos cometer dos tipos de errores en nuestra decisión. 1. Podemos rechazar un H 0 que es cierto.

Transcript of Prueba de hipótesis

Page 1: Prueba de hipótesis

PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO

PRUEBA DE HIPÓTESIS

La estadística inferencial es el proceso de usar la información de una muestra para describir el estado de una población. Sin embargo es frecuente que usemos la información de una muestra para probar un reclamo o conjetura sobre la población. El reclamo o conjetura se refiere a una hipótesis. El proceso que corrobora si la información de una muestra sostiene o refuta el reclamo se llama prueba de hipótesis.

HIPÓTESIS Y NIVELES DE SIGNIFICANCIA En la prueba de hipótesis se pone a prueba un reclamo hecho sobra la naturaleza de una

población a base de la información de una muestra. El reclamo se llama hipótesis estadística.

Hipótesis Estadística: Una hipótesis estadística es un reclamo hecho sobre la naturaleza de una población.

Por ejemplo, la premisa formulada por un productor de baterías para autos de que su batería dura en promedio 48 meses, es una hipótesis estadística porque el manufacturero no inspecciona la vida de cada batería que él produce.

Si surgieran quejas de parte de los clientes, entonces se pone a prueba el reclamo del manufacturero. La hipótesis estadística sometida a prueba se llama la hipótesis nula, y se denota como H0.

COMO ESTABLECER LA HIPÓTESIS NULA Y LA ALTERNA

Hipótesis Nula (H0): premisa, reclamo, o conjetura que se pronuncia sobre la naturaleza de una o varias poblaciones.

Por ejemplo, para probar o desaprobar el reclamo pronunciado por el productor de baterías debemos probar la hipótesis estadística de que 48. Por lo tanto, la hipótesis nula es:

H0 : 48.

Luego se procede a tomar una muestra aleatoria de baterías y medir su vida media. Si la información obtenida de la muestra no apoya el reclamo en la hipótesis nula (H0), entonces otra cosa es cierta. La premisa alterna a la hipótesis nula se llama hipótesis alterna y se representa por H1.

Hipótesis Alterna: Una premisa que es cierta cuando la hipótesis nula es falsa.

Por ejemplo, para el productor de baterías

H0 : 48 y

H1 : < 48

Para probar si la hipótesis nula es cierta, se toma una muestra aleatoria y se calcula la información, como el promedio, la proporción, etc. Esta información muestral se llama estadística de prueba.

Estadística de Prueba: Una estadística de prueba se basa en la información de la muestra como la media o la proporción.

ERROR TIPO 1 Y ERROR TIPO 2

A base de la información de una muestra nosotros podemos cometer dos tipos de errores en nuestra decisión.

1. Podemos rechazar un H0 que es cierto.

Page 2: Prueba de hipótesis

PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO

2. Podemos aceptar un H0 que es falso.

El primero se llama error Tipo 1

Error Tipo 1: Cuando rechazamos una Hipótesis Nula que es cierta cometemos error tipo 1.

Y el segundo error se llama error Tipo 2.

Error Tipo 2: Cuando aceptamos una Hipótesis Nula que es falsa cometemos error tipo 2.

NIVEL DE SIGNIFICANCIA ( )

Para ser muy cuidadosos en no cometer el error tipo 1, debemos especificar la probabilidad de rechazar H0, denotada por . A ésta se le llama nivel de significancia.

Nivel de Significancia: La probabilidad ( más alta de rechazar H0 cuando H0 es cierto se llama nivel de significancia.

Comentario: Para mantener la probabilidad de cometer el error tipo 1 baja, debemos escoger un valor pequeño de .

Usando un valor preasignado de se construye una región de rechazo o región crítica en la curva normal estándar o en la curva t que indica si debemos rechazar H0.

Región Crítica o de Rechazo: Una región crítica o de rechazo es una parte de la curva de z o de la curva t donde se rechaza H0.

La región puede ser de una cola o de dos dependiendo de la hipótesis alterna.

Ejemplos Para H1: > valor aceptado, la región de rechazo está dada por:

(cola derecha, z ó t)

Para H1 : < valor aceptado, la región de rechazo está dada por:

(cola izquierda, z ó t)

Para H1 : valor aceptado, la región de rechazo es de dos colas y está dada

por:

(2-colas, z ó t)

Ejemplo 1: Determine si la región de rechazo es de la cola derecha, de la cola izquierda o de dos colas.

a. H0 : = 15, H1 : 15, =.05

b. H0 : p 0.7, H1 : p > 0.7, =.02

/2 /2

Page 3: Prueba de hipótesis

PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO

Solución: La forma de la región de rechazo está determinada por la hipótesis alterna.

a. H1 : 15 significa que la región está en ambas colas.

b. H1 : p > 7 significa que la región está en la cola derecha.

Ejemplo 2: En el Ejemplo 1a, presumamos que la región de rechazo es parte de la curva

normal estándar. Complete el dibujo de la región crítica para los valores siguientes:

a. = .05

Solución:

a. Del ejemplo 1(a), tenemos:

Ejemplo 3: En el ejemplo 1a, presumamos que la región de rechazo es parte de la curva t.

Complete el dibujo de la región de rechazo para:

a. = .05 y = 14

Solución: a. Del ejemplo 1(a), = .05, y = 14, tenemos:

Ejemplo 4: Establezca las hipótesis nula y alterna.

a. Las millas por galón (mpg) promedio de un nuevo modelo de automóvil es 32.

b. Más del 65% de los empleados de un colegio aportan a Fondos Unidos.

c. En promedio, los empleados de cierta compañía viven a no más de 15 millas de la misma.

.05/2 .05/2

.02

.05/2=0.025 .05/2=0.025 De la tabla de la distribución normal, la P(Z z) =.025 corresponde a un valor Z= -1.96. Por simetría la P(Z>z)=.025 corresponde a Z= 1.96. 1.96 -1.96

.05/2=0.025 .05/2=0.025 De la tabla de la distribución t, la P(T t) =.025 corresponde a un valor t= -2.086. Por simetría la P(T>t)=.025 corresponde a t= 2.086. 2.086 -2.086

Page 4: Prueba de hipótesis

PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO

d. Al menos un 60% de la población adulta de una comunidad votará en las próximas elecciones Presidenciales.

e. El peso promedio de un pollo para asar es de al menos cuatro libras.

Solución: a. H0 : = 32 b. H0 : p .65 c. H0 : 15

H1 : 32 H1 : p .65 H1 : > 15

d. H0 : p .6 e. H0 : 4

H1 : p < .6 H1 : < 4

EJERCICIOS

En los ejercicios (1-6) determine si la región de rechazo para la hipótesis nula está en la cola izquierda, en la cola derecha, o ambas colas. Para el nivel de significancia dibuje la región de rechazo.

1. H0 : 11; H1 : > 11 2. H0 5.8; H1 : < 5.8

3. H0 : p = 0.4; H1 : p 0.4 4. H0 : = 110; H1 : 110

5. H0 : p 0.3; H1 : p < 0.3 6. H0 : p 0.8; H1 : p < 0.8

En los ejercicios (7 - 18) complete la región de rechazo (encuentre el valor de z y t).

7. a) z, si = .05 b) t, si = .025 y = 9

8. a) z, si = .01 b) t, si = .05 y = 13

9. a) z, si = .02 b) t, si = .01 y = 5

10. a) z, si = .025 b) t, si = .01 y = 9

11. a) z, si = .05 b) t, si =.05 y = 10

/2 /2

Page 5: Prueba de hipótesis

PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO

12. a) z, si = .01 b) t, si =0.1 y = 7

En los ejercicios (13 - 18) establezca las hipótesis nula y alterna.

13. Los automóviles estacionados en el estacionamiento de periodo prolongado del aeropuerto internacional de Bogotá permanecen un promedio de 2.5 días.

14. Una nueva marca de llantas radiales dura en promedio más de 48,000 millas.

15. El balance promedio de una cuenta de cheques en el First State Bank es de al menos $150 dólares.

16. Se reclama que al menos el 60% de las compras realizadas en cierta tienda por departamentos son artículos de especiales.

17. Se reclama que el 20% de los graduados de cierto colegio privado solicitan admisión a escuelas de medicina.

18. Un dentista reclama que el 5% de sus pacientes sufren enfermedades en las encías.

PRUEBA DE HIPÓTESIS PARA UNA MUESTRA INTRODUCCION Dentro del estudio de la inferencia estadística, se describe como se puede tomar una muestra aleatoria y a partir de esta muestra estimar el valor de un parámetro poblacional en la cual se puede emplear el método de muestreo y el teorema del valor central lo que permite explicar cómo a partir de una muestra se puede inferir algo acerca de una población, lo cual nos lleva a definir y elaborar una distribución de muestreo de medias muestrales que nos permite explicar el teorema del límite central y utilizar este teorema para encontrar las probabilidades de obtener las distintas medias maestrales de una población. Pero es necesario tener conocimiento de ciertos datos de la población como la media, la desviación estándar o la forma de la población, pero a veces no se dispone de esta información. En este caso es necesario hacer una estimación puntual que es un valor que se usa para estimar un valor poblacional. Pero una estimación puntual es un solo valor y se requiere un intervalo de valores a esto se denomina intervalo de confianza y se espera que dentro de este intervalo se encuentre el parámetro poblacional buscado. También se utiliza una estimación mediante un intervalo, el cual es un rango de valores en el que se espera se encuentre el parámetro poblacional En nuestro caso se desarrolla un procedimiento para probar la validez de una aseveración acerca de un parámetro poblacional este método es denominado Prueba de hipótesis para una muestra. HIPOTESIS Y PRUEBA DE HIPOTESIS Tenemos que empezar por definir que es una hipótesis y que es prueba de hipótesis. Hipótesis es una aseveración de una población elaborado con el propósito de poner a prueba, para verificar si la afirmación es razonable se usan datos. En el análisis estadístico se hace una aseveración, es decir, se plantea una hipótesis, después se hacen las pruebas para verificar la aseveración o para determinar que no es verdadera. Por tanto, la prueba de hipótesis es un procedimiento basado en la evidencia muestral y la teoría de probabilidad; se emplea para determinar si la hipótesis es una afirmación razonable.

/2 /2

Page 6: Prueba de hipótesis

PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO

Prueba de una hipótesis: se realiza mediante un procedimiento sistemático de cinco paso:

Siguiendo este procedimiento sistemático, al llegar al paso cinco se puede o no rechazar la hipótesis, pero debemos de tener cuidado con esta determinación ya que en la consideración de estadística no proporciona evidencia de que algo sea verdadero. Esta prueba aporta una clase de prueba más allá de una duda razonable. Analizaremos cada paso en detalle Objetivo de la prueba de hipótesis. El propósito de la prueba de hipótesis no es cuestionar el valor calculado del estadístico (muestral), sino hacer un juicio con respecto a la diferencia entre estadístico de muestra y un valor planteado del parámetro. Procedimiento sistemático para una prueba de hipótesis de una muestra Paso 1: Plantear la hipótesis nula Ho y la hipótesis alternativa H1. Cualquier investigación estadística implica la existencia de hipótesis o afirmaciones acerca de las poblaciones que se estudian. La hipótesis nula (Ho) se refiere siempre a un valor especificado del parámetro de población, no a una estadística de muestra. La letra H significa hipótesis y el subíndice cero no hay diferencia. Por lo general hay un "no" en la hipótesis nula que indica que "no hay cambio" Podemos rechazar o aceptar Ho. La hipótesis nula es una afirmación que no se rechaza a menos que los datos maestrales proporcionen evidencia convincente de que es falsa. El planteamiento de la hipótesis nula siempre contiene un signo de igualdad con respecto al valor especificado del parámetro. La hipótesis alternativa (H1) es cualquier hipótesis que difiera de la hipótesis nula. Es una afirmación que se acepta si los datos maestrales proporcionan evidencia suficiente de que la hipótesis nula es falsa. Se le conoce también como la hipótesis de investigación. El planteamiento de la hipótesis alternativa nunca contiene un signo de igualdad con respecto al valor especificado del parámetro. Paso 2: Seleccionar el nivel de significancia. Nivel de significancia: Probabilidad de rechazar la hipótesis nula cuando es verdadera. Se le denota mediante la letra griega α, también es denominada como nivel de riesgo, este término es más adecuado ya que se corre el riesgo de rechazar la hipótesis nula, cuando en realidad es verdadera. Este nivel esta bajo el control de la persona que realiza la prueba. Si suponemos que la hipótesis planteada es verdadera, entonces, el nivel de significación indicará la probabilidad de no aceptarla, es decir, estén fuera de área de aceptación. El nivel de confianza (1-α), indica la probabilidad de aceptar la hipótesis planteada, cuando es verdadera en la población.

Page 7: Prueba de hipótesis

PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO

La distribución de muestreo de la estadística de prueba se divide en dos regiones, una región de rechazo (conocida como región crítica) y una región de no rechazo (aceptación). Si la estadística de prueba cae dentro de la región de aceptación, no se puede rechazar la hipótesis nula. La región de rechazo puede considerarse como el conjunto de valores de la estadística de prueba que no tienen posibilidad de presentarse si la hipótesis nula es verdadera. Por otro lado, estos valores no son tan improbables de presentarse si la hipótesis nula es falsa. El valor crítico separa la región de no rechazo de la de rechazo. Tipos de errores Cualquiera sea la decisión tomada a partir de una prueba de hipótesis, ya sea de aceptación de la Ho o de la H1, puede incurrirse en error: Un error tipo I se presenta si la hipótesis nula Ho es rechazada cuando es verdadera y debía ser aceptada. La probabilidad de cometer un error tipo I se denomina con la letra alfa α Un error tipo II, se denota con la letra griega β se presenta si la hipótesis nula es aceptada cuando de hecho es falsa y debía ser rechazada. En cualquiera de los dos casos se comete un error al tomar una decisión equivocada. En la siguiente tabla se muestran las decisiones que pueden tomar el investigador y las consecuencias posibles. Tabla 1. Consecuencias de las Decisiones en Pruebas de Hipótesis.

Decisiones Posibles

Situaciones Posibles La hipótesis nula es verdadera La hipótesis nula es falsa

Aceptar la Hipótesis Nula Se acepta correctamente

Error tipo II

Rechazar la Hipótesis Nula Error tipo I Se rechaza correctamente

Para que cualquier ensayo de hipótesis sea bueno, debe diseñarse de forma que minimice los errores de decisión. En la práctica un tipo de error puede tener más importancia que el otro, y así se tiene a conseguir poner una limitación al error de mayor importancia. La única forma de reducir ambos tipos de errores es incrementar el tamaño de la muestra, lo cual puede ser o no ser posible. La probabilidad de cometer un error de tipo II denotada con la letra griega beta β, depende de la diferencia entre los valores supuesto y real del parámetro de la población. Como es más fácil encontrar diferencias grandes, si la diferencia entre la estadística de muestra y el correspondiente parámetro de población es grande, la probabilidad de cometer un error de tipo II, probablemente sea pequeña. El estudio y las conclusiones que obtengamos para una población cualquiera, se habrán apoyado exclusivamente en el análisis de una parte de ésta. De la probabilidad con la que estemos dispuestos

Page 8: Prueba de hipótesis

PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO

a asumir estos errores, dependerá, por ejemplo, el tamaño de la muestra requerida. Las contrastaciones se apoyan en que los datos de partida siguen una distribución normal Existe una relación inversa entre la magnitud de los errores α y β: conforme a aumenta, β disminuye. Esto obliga a establecer con cuidado el valor de a para las pruebas estadísticas. Lo ideal sería establecer α y β. En la práctica se establece el nivel α y para disminuir el Error β se incrementa el número de observaciones en la muestra, pues así se acortan los limites de confianza respecto a la hipótesis planteada .La meta de las pruebas estadísticas es rechazar la hipótesis planteada. En otras palabras, es deseable aumentar cuando ésta es verdadera, o sea, incrementar lo que se llama poder de la prueba (1- β) La aceptación de la hipótesis planteada debe interpretarse como que la información aleatoria de la muestra disponible no permite detectar la falsedad de esta hipótesis. Paso 3: Cálculo del valor estadístico de prueba Valor determinado a partir de la información muestral, que se utiliza para determinar si se rechaza la hipótesis nula., existen muchos estadísticos de prueba para nuestro caso utilizaremos los estadísticos z y t. La elección de uno de estos depende de la cantidad de muestras que se toman, si las muestras son de la prueba son iguales a 30 o más se utiliza el estadístico z, en caso contrario se utiliza el estadístico t. Tipos de prueba a) Prueba bilateral o de dos extremos: la hipótesis planteada se formula con la igualdad Ejemplo H0 : µ = 200 H1 : µ ≠ 200

b) Pruebas unilateral o de un extremo: la hipótesis planteada se formula con ≥ o ≤ H0 : µ ≥ 200 H0 : µ ≤ 200 H1 : µ < 200 H1 : µ > 200

En las pruebas de hipótesis para la media (μ), cuando se conoce la desviación estándar (σ) poblacional, o cuando el valor de la muestra es grande (30 o más), el valor estadístico de prueba es z y se determina a partir de:

Page 9: Prueba de hipótesis

PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO

El valor estadístico z, para muestra grande y desviación estándar poblacional desconocida se determina por la ecuación:

En la prueba para una media poblacional con muestra pequeña y desviación estándar poblacional desconocida se utiliza el valor estadístico t.

Paso Formular la regla de decisión SE establece las condiciones específicas en la que se rechaza la hipótesis nula y las condiciones en que no se rechaza la hipótesis nula. La región de rechazo define la ubicación de todos los valores que son tan grandes o tan pequeños, que la probabilidad de que se presenten bajo la suposición de que la hipótesis nula es verdadera, es muy remota

Distribución muestral del valor estadístico z, con prueba de una cola a la derecha Valor critico: Es el punto de división entre la región en la que se rechaza la hipótesis nula y la región en la que no se rechaza la hipótesis nula. Paso 5: Tomar una decisión. En este último paso de la prueba de hipótesis, se calcula el estadístico de prueba, se compara con el valor crítico y se toma la decisión de rechazar o no la hipótesis nula. Tenga presente que en una prueba de hipótesis solo se puede tomar una de dos decisiones: aceptar o rechazar la hipótesis nula. Debe subrayarse que siempre existe la posibilidad de rechazar la hipótesis nula cuando no debería haberse rechazado (error tipo I). También existe la posibilidad de que la hipótesis nula se acepte cuando debería haberse rechazado (error de tipo II). Ejemplo en la cual se indica el procedimiento para la prueba de hipótesis El jefe de la Biblioteca Especializada de la Facultad de Ingeniería Eléctrica y Electrónica de la UNAC manifiesta que el número promedio de lectores por día es de 350. Para confirmar o no este supuesto se controla la cantidad de lectores que utilizaron la biblioteca durante 30 días. Se considera el nivel de significancia de 0.05 Datos:

Page 10: Prueba de hipótesis

PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO

Día Usuarios Día Usuarios Día Usuario

1 356 11 305 21 429

2 427 12 413 22 376

3 387 13 391 23 328

510 14 380 24 411

5 288 15 382 25 397

6 290 16 389 26 365

7 320 17 405 27 405

8 350 18 293 28 369

9 403 19 276 29 429

10 329 20 417 30 364

Solución: Se trata de un problema con una media poblacional: muestra grande y desviación estándar poblacional desconocida. Paso 01: Seleccionamos la hipótesis nula y la hipótesis alternativa Ho: μ═350 Ha: μ≠ 350 Paso 02: Nivel de confianza o significancia 95%

α═0.05 Paso 03: Calculamos o determinamos el valor estadístico de prueba De los datos determinamos: que el estadístico de prueba es t, debido a que el numero de muestras es igual a 30, conocemos la media de la población, pero la desviación estándar de la población es desconocida, en este caso determinamos la desviación estándar de la muestra y la utilizamos en la formula reemplazando a la desviación estándar de la población.

Calculamos la desviación estándar muestral y la media de la muestra empleando Excel, lo cual se muestra en el cuadro que sigue.

Columna1

Media 372.8

Error típico 9.56951578

Mediana 381

Moda 405

Desviación estándar 52.4143965

Varianza de la muestra 2747.26897

Curtosis 0.36687081

Coeficiente de asimetría 0.04706877

Rango 234

Mínimo 276

Máximo 510

Suma 11184

Cuenta 30 Nivel de confianza (95.0%) 19.571868

Page 11: Prueba de hipótesis

PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO

38.26.9

8.22

304.52

3508.372

ns

xZ

Paso 04: Formulación de la regla de decisión. La regla de decisión la formulamos teniendo en cuenta que esta es una prueba de dos colas, la mitad de 0.05, es decir 0.025, está en cada cola. el área en la que no se rechaza Ho está entre las dos colas, es por consiguiente 0.95. El valor critico para 0.05 da un valor de Zc = 1.96. Por consiguiente la regla de decisión: es rechazar la hipótesis nula y aceptar la hipótesis alternativa, si el valor Z calculado no queda en la región comprendida entre -1.96 y +1.96, esto es

96.196.1 Z . En caso contrario no se rechaza la hipótesis nula si Z queda entre -1.96 y +1.96.

Paso 05: Toma de decisión. En este último paso comparamos el estadístico de prueba calculado en el paso 3 que es Z = 2.38 y lo comparamos con el valor critico de Zc = 1.96. Como el estadístico de prueba calculado cae a la derecha del valor critico de Z, se rechaza Ho. Por tanto no se confirma el supuesto del Jefe de la Biblioteca. Conclusiones:

Se rechaza la hipótesis nula (Ho), se acepta la hipótesis alterna (H1) a un nivel de significancia de α = 0.05. La prueba resultó ser significativa.

La evidencia estadística no permite aceptar la aceptar la hipótesis nula.

CÁLCULO E INTERPRETACIÓN DE VALORES DE P

El valor de p es una medida de probabilidad. En concreto, se trata de la probabilidad de que la media muestral sea como mínimo tan extrema (tan alta o tan baja) como la obtenida en realidad, siempre que el valor hipotético de µ sea cierto. El valor de p mide la probabilidad de que, si la media poblacional no es igual al valor hipotético, los resultados muestrales sean al menos tan extremos como los realmente obtenidos en la muestra. Es decir, siempre con la condición de que la hipótesis nula sea cierta, el valor de p mide la probabilidad de que los resultados muestrales sean:

1. Al menos tan altos o 2. Al menos tan bajos como los hallados en la muestra.

Algo más importante quizá es que “el valor de p es el valor más pequeño de al cual se puede rechazar la hipótesis nula”. El siguiente ejemplo ilustra el modo de calcular estos valores de p. La mayor cadena de venta al por menor, WAL- MART, cifra en 15 millones de dólares sus ventas por tienda.

A. Si se elige al azar una muestra de 120 tiendas y se hallan unas ventas promedio de 15.39 millones de dólares, con una desviación típica de 2.9 millones de dólares, será que se encuentra respaldada la hipótesis de que μ =15 millones de dólares al nivel de significación del 10%?. Ho: µ=15

H1: µ

Page 12: Prueba de hipótesis

PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO

Ho: µ=15

Z = -1.65 Z = 1.65

Recuerde que el Z crítico, Z( , se obtiene en la tabla del apéndice II (Áreas bajo la curva normal), y que para nuestro ejemplo corresponde a un área de 0,45 y por tanto Z = -1.65 y Z = 1.65

120

9.2*65.115cx

56.141cx

44.152cx

REGLA DE DECISIÓN: No rechazar la hipótesis nula si 44.1556.14 X y rechazar la

hipótesis nula si 56.14X o 44.15X

CONCLUSIÓN: No rechazar la hipótesis nula ya que se encuentra respaldada a ese nivel de significancia

B. Calcular el valor de p asociado con estos datos.

47.1

120

9.2

1539.15testZ

Al buscar en el apéndice II encontramos que para Z = 1.47 se obtiene un área de 0.4292

Por tanto el valor de p será: 1416.02*)4292.05.0(p

“Y esto significa que la hipótesis nula será rechazada a niveles de significancia superiores al 14.16%”

ERRORES DE TIPO I Y DE TIPO II EN UN CONTRASTE DE HIPÓTESIS

Si rechazamos una hipótesis cuando debiera ser aceptada, cometemos un error de tipo I, mientras que si la aceptamos debiendo ser rechazada diremos que hemos cometido un error de tipo II. Minimizar los errores no es una cuestión sencilla, un tipo suele ser más grave que otro y los intentos de disminuir uno suelen producir el aumento del otro. La única forma de disminuir ambos a la vez es aumentar el tamaño de la muestra.

Región de rechazo Región de rechazo

Región de no rechazo

Page 13: Prueba de hipótesis

PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO

La probabilidad de cometer un error de tipo I es el nivel de significación , la probabilidad de cometer un error de tipo II depende del verdadero valor de µ y del tamaño de la muestra. Los errores tipo I y tipo II están relacionados. Una disminución en la probabilidad de uno por lo general tiene como resultado un aumento en la probabilidad del otro. El tamaño de la región crítica, y por tanto la probabilidad de cometer un error tipo I, siempre se puede reducir al ajustar el o los valores críticos. Un aumento en el tamaño muestral n reducirá y de forma simultánea. Si la hipótesis nula es falsa, es un máximo cuando el valor real del parámetro se aproxima al hipotético. Entre más grande sea la distancia entre el valor real y el valor hipotético, será menor El rechazo de una hipótesis nula cuando es cierta se denomina error de tipo I, y su probabilidad (que es también el nivel de significancia) se simboliza como .

El hecho de que p sea muy bajo no califica el acontecimiento como imposible. Simplemente que tiene poca probabilidad de ocurrir al azar. A la probabilidad de cometer error tipo I se la denomina nivel de significación Habitualmente el investigador fija a priori el nivel de significación crítico para rechazar Ho ( ). Si P es menor que , se rechaza. En caso contrario, se acepta Ho. El hecho de aceptar una hipótesis nula cuando es falsa se denomina error de tipo II, y su probabilidad se simboliza como . La probabilidad de cometer un tipo de error puede reducirse sólo si deseamos incrementar la probabilidad de cometer el otro tipo de error. Con el propósito de obtener una baja, tendremos que tolerar una alta. Los responsables de la toma de decisiones deciden el nivel de significancia adecuado, al examinar los costos o desventajas vinculadas con ambos tipos de errores. Una vez especificado el valor de el de queda fijado para cualquier tamaño de muestra determinado. El valor de o probabilidad de cometer un error de tipo II, depende del valor verdadero de µ. Si, por ejemplo, µ vale 100, existirá un determinado valor para . Pero si µ es en realidad 110, existe un valor de diferente. La pregunta se convierte entonces en ésta: si la hipótesis nula es falsa, cuál es la probabilidad de no rechazarla y por consiguiente cometer un error de tipo II?. Veámoslo con un ejemplo: Para el ejemplo anterior si µ es en realidad 14.8 millones, cuál es la probabilidad de cometer un error de tipo II?

)44.1516.14() ( xPIItipoerrorP

Hallamos Z para cada uno de estos valores extremos

42.2

120

9.2

8.1444.15Z

que corresponde a un área de 0.4922 (Apéndice II, tabla de la distribución normal)

Page 14: Prueba de hipótesis

PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO

91.0

120

9.2

8.1456.14Z

que corresponde a un área de 0.3186 (Apéndice II, tabla de la distribución normal)

Por tanto 8108.03186.04922.0) ( IItipoerrorP o 81.08%

Ejercicios

1. La mayor cadena de venta al por menor, WAL- MART, cifra en 15 millones de dólares sus ventas por tienda. Si se elige al azar una muestra de 120 tiendas y se hallan unas ventas promedio de 15.39 millones de dólares, con una desviación típica de 2.9 millones de dólares, será que se encuentra respaldada la hipótesis de que μ =15 millones de dólares al nivel de significación del 10%?.

2. Resuelva el ejercicio anterior, si la estimación de ventas se ha expresado así: “los ingresos no superan los 15 millones de dólares por tienda”

3. Una revista especializada decía que la gente tardaba 34 horas de promedio en aprender un nuevo programa informático. Está respaldada esta afirmación al nivel del 10% si 35 personas emplearan una media de 40.58 horas, con una desviación típica de 19.7 horas?

4. Un convenio trabajadores- dirección exige una producción media diaria de 50 unidades. Una muestra de 150 días revela una media de 47.3 con una desviación típica de 5.7 unidades. Poner α=5% y determinar si se cumple esta clausula del contrato.

5. Se utiliza una máquina para llenar latas de 18 onzas. Si la máquina funciona mal, tiene que ser reajustada. Se elige una muestra de 500 latas, que dan una media de 18.9 onzas con una desviación típica de 4.7 onzas. Para un nivel de significancia del 5% determine si se debe reajustar la máquina.

Page 15: Prueba de hipótesis

PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO

6. En un artículo se debatía la creciente tendencia a que los empleados demanden a sus empresas por incumplimiento de sus promesas en relación con algunos beneficios sanitarios y concluía que el juicio medio se entablaba por 115000 dólares, Si 42 juicios dieron una media de 114412 dólares con una desviación típica de 14000 dólares, determine si está respaldada la hipótesis al nivel del 7%.

7. Un medicamento en estudio tiene que reducir en 13 puntos la presión sanguínea en pacientes cardíacos antes de ser aceptado para uso general. En una prueba sobre 51 pacientes se redujo la presión en 12.2 puntos en promedio con una desviación típica de 2.3 puntos. Al nivel del 1% se debe aprobar este medicamento?

8. Los miembros de un club están desencantados por la decisión del dueño de un campo de fútbol al limitar las reservas a un tiempo inaceptable. Afirman que cada partido dura en promedio 2 horas. De 27 partidos recientes, se halló una media de 1.82 horas con una desviación típica de 0.32 horas. El dueño del campo está dispuesto a retirar el límite de tiempo si los miembros del club tiene la razón. A un nivel del 2%, cuál será la decisión?

9. Determine el nivel de significancia más pequeño para el cual se puede rechazar la hipótesis nula en los ejercicios anteriores.

PRUEBA DE HIPOTESIS PARA LA PROPORCION

Frecuentemente se desea estimar la proporción de elementos que tienen una característica determinada, en tal caso, las observaciones son de naturaleza cualitativa. Cuando se analiza información cualitativa y se está interesado en verificar un supuesto acerca de la proporción poblacional de elementos que tienen determinada característica, es útil trabajar con la prueba de hipótesis para la proporción.

Así por ejemplo; un político puede estar interesado en conocer si ha habido un aumento en la proporción (porcentaje) de votantes que lo favorecen en las próximas elecciones; un productor de cereales puede querer conocer si ha ocurrido o no una baja en la proporción de clientes que prefieren su marca de cereal; un hospital desea confirmar el reclamo de un manufacturero de medicamentos quien afirma que éste cura al 80% de los usuarios. Estos ejemplos son algunas de las situaciones donde nos interesa probar alguna afirmación referente a una proporción. El procedimiento para probar una proporción en una población normal es casi igual al usado para las medias. La información que suele disponerse para la estimación de una porción real o verdadera

(porcentaje o probabilidad) es una proporción muestral n

x, donde x es el número de veces

que ha ocurrido un evento en n ensayos. Por ejemplo, si en una muestra aleatoria de 600 compras realizadas en una tienda y 300 se realizan con tarjeta de crédito, entonces

50.0600

300

n

x se puede utilizar esa cifra como estimación de punto de la proporción real

de compras realizadas en ese negocio que se abonaron a tarjetas de crédito. De la misma forma muchas compañías podrían estimar las proporciones de muchas transacciones. La hipótesis alterna puede ser una de las alternativas usuales unilateral o bilateral tales

como: 000 .... , , ppopppp .

Page 16: Prueba de hipótesis

PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO

El proceso de prueba de hipótesis para la proporción poblacional p es muy similar al de μ. Un

valor Zc calculado a partir de la muestra se compara con un valor crítico de Z dados en las

tablas. Zc se obtiene así:

n

qp

ppZc

.

. O también se puede utilizar:

npq

npxZc

¿Cómo probar una proporción?

Podemos usar cualquiera de los siguientes métodos: 1. Método de la región de rechazo (Método 1) ó 2. Método del valor P (Método 2)

A. MÉTODO DE LA REGIÓN DE RECHAZO (MÉTODO 1)

Digamos que po es la proporción aceptada o reclamada.

Paso 1 Establezca las hipótesis. Ho : p = po

H1 : p > po ó

p < po ó

p po

Paso 2 Use el nivel de significancia ( ) y dibuje la región de rechazo en la curva normal estándar (curva z).

(H1: p > p

o) (H

1: p < p

o) (H

1: p p

o)

Paso 3 Calcule el valor z para la proporción muestral n

xp usando la fórmula

Z =p

pp 0 , n

ppp

)1( 00

Paso 4 Dibuje este valor de z en el diagrama de la región de rechazo (Paso 2).

Paso 5 Si el valor z cae dentro de la región de rechazo (sombreada), entonces rechace Ho. Si cae fuera de la región sombreada, entonces no rechace Ho.

Paso 6 Escriba la conclusión de la prueba.

Ejemplo 1: Prueba la hipótesis H0 : po = 0.4

H1 : p 0.4

suponga que p = 0.45, n = 200, y = .01

z

-z

/2 /2

-z z

Page 17: Prueba de hipótesis

PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO

Solución:

Paso 1 H0 : po = 0.4

H1 : p 0.4

Paso 2 Usando = .01, el diagrama de la región de rechazo es:

Paso 3 Calculando el valor z para la proporción muestral p = 0.45, obtenemos:

0346.0200

)4.01(4.0p

Z = 45.10346.0

4.045.0

Paso 4 Dibujando z = 1.45 en el diagrama de la región de rechazo (Paso 2) obtenemos:

Paso 5 Como el valor z está fuera de la región de rechazo (sombreada), por lo tanto no rechazamos Ho.

Paso 6 La proporción en la población es 0.4.

B. MÉTODO DEL VALOR P (MÉTODO 2)

Dejemos que p0 sea la proporción aceptada o reclamada.

Paso 1 Establezca las hipótesis: H0 : p = p0

H1 : p > p0 ó

p < p0 ó

p p0

Paso 2 Calcule el valor z para la proporción muestral n

xp usando la fórmula:

Z =p

pp 0 , donde n

ppp

)1( 00 .

Paso 3 Usando la hipótesis alterna dibuja la región bajo la curva z que representa los valores extremos.

.005 .005

-2.575 2.575

.005 .005

-2.575 2.575

1.45

Page 18: Prueba de hipótesis

PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO

(H1 : p > po) (H1 : p < po) (H1 : p po)

Paso 4 El valor P = al área de la cola sombreada (s) en el Paso 3.

Paso 5 Si el valor P < , entonces rechaza H0

Si el valor P , entonces no rechaces H0.

Paso 6 Escribe la conclusión de la prueba.

Ejemplo 1: Pruebe la hipótesis H0 : p = 0.4

H1 : p 0.4

Presuma que = 0.45, n = 200, y = 0.01.

Solución:

Paso 1 H0 : p = 0.4

H1 : p 0.4

Paso 2 Calculando el valor z de p , obtenemos

0346.0200

)4.01(4.0p

Z = 45.10346.0

4.045.0

Paso 3 La región bajo la curva z que contiene los valores extremos de Z es

Paso 4 El valor P = suma de las áreas de las regiones sombreadas en el Paso 3.

= 2(el área a la derecha de 1.45)

= 2(0.5 – .4265)

= 0.147

Paso 5 Como el valor P es mayor que , entonces no podemos rechazar H0.

Paso 6 La proporción en la población es 0.4.

Ejercicios resueltos

1. Se afirma que, de todas las familias que salen de Cumana por lo menos el 30 % se mudan a Maracaibo. Si una muestra de 600 mudanzas tomada al azar de los

Valor P

z

Valor P

-z

P/2 P/2

-z z

P/2 P/2

-1.45 1.45

Page 19: Prueba de hipótesis

PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO

registros de la Alcaldía de Cumana revela que de los permisos de mudanza autorizados 153 fueron para Maracaibo, pruebe la hipótesis nula p = 0.30 contra la hipótesis alternativa p < 30 con un nivel de significancia del 1 %.

SOLUCIÓN: Para calcular la proporción p lo primero que se ha de hacer es determinar la proporción, luego se plantea una hipótesis unilateral con un nivel de significancia al 1%.

.153,.33.2,..70.0,..30.0,..255.0600

153,..600 xZqppn

Hipótesis:

30.0:

30.0:

1

0

pH

pH

Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si: ZZ c es

decir, 33.2cZ .

Aplicando formula se tiene:

41.20187.0

045.0

00035.0

045.0

600

7.03.0

300.0255.0

.cc Z

x

n

qp

ppZ

O también Aplicando:

41.2225,11

27

126

180153

)70.0)(30.0(600

)30.0(600153

npq

npxZc

Conclusión: Como cZ es menor que Z , es decir, 33.241.2cZ , se rechaza

30.0:0 pH con un nivel de significancia de 0.01. Esto se puede observar en la grafica

D en donde 41.2cZ cae fuera del área de aceptación, por lo tanto, se cumple que

30.0:1 pH , es decir, menos del 30 % de las familias que salen de Cumana, se mudan a

Maracaibo.

Se recomienda al estudiante que aplique el método del valor p para solucionar el ejercicio.

2. Se sabe que el 10 % de los fumadores prefieren la marca de cigarrillo Malboro. Después de una campaña publicitaria del cigarrillo Malboro, se entrevistaron a 200 fumadores para determinar la eficiencia de la campaña publicitaria. El resultado de la muestra realizada detecto un total de 26 personas que fumaban Malboro. ¿Pueden considerarse que esos datos presentan evidencia suficiente para indicar que hubo un aumento en la aceptación del cigarrillo Malboro. Obtenga las conclusiones del planteamiento desarrollando un contraste de hipótesis con un nivel de significancia del 5 %.

SOLUCIÓN: Para resolver el problema se plantea una hipótesis alternativa unilateral por la

derecha. Por tabla se sabe que al 5 % por la derecha 645,1Z .

Page 20: Prueba de hipótesis

PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO

Datos: 200,..13.0200

26......90.0,..10.0 npqp

.

Hipótesis:

10.0:

10.0:

1

0

pH

pH

Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si ZZc , es decir,

645,1cZ .

Aplicando formula se tiene:

41.102127.0

03.0

00045.0

03.0

200

9.01.0

10.013.0

.cc Z

x

n

qp

ppZ

Conclusión: Como cZ es menor que Z , es decir, 96.141.1cZ , se acepta

10.0:0 pH con un nivel de significancia de 0.05. Esto se puede observar en la grafica A

en donde 41.1cZ cae dentro del área de aceptación, por lo tanto, el 10 % de los

fumadores prefieren Malboro, lo que indica que la campaña publicitaria no fue efectiva ya

que de haberlo sido se hubiese aceptado la hipótesis .10.0:1 pH

Se recomienda al estudiante que aplique el método del valor p para solucionar el ejercicio.

3. Un fabricante de semiconductores produce controladores que se emplean en el sistema eléctrico de vehículos. El cliente requiere que la proporción de controladores defectuosos no sea mayor de 0.05, y que el fabricante demuestre estas características del proceso de fabricación con este nivel de calidad, con un nivel de significancia del 5 %. El fabricante de semiconductores toma una muestra aleatoria de 200 dispositivos y encuentra que 4 de ellos son defectuosos. ¿El fabricante puede demostrar al cliente la calidad exigida? Saque sus conclusiones.

SOLUCIÓN: para resolver el problema hay que plantear una hipótesis alternativa unilateral de una cola por la izquierda es decir, p< 0.05 y para ello se busca en la tabla el valor de

645,1....,.. ZesqueZ .

Datos: .200,02.02004,95.0,05.0 npqp

Hipótesis:

05.0:

05.0:

1

0

pH

pH

Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si ZZc ,es

decir, 645,1cZ .

Page 21: Prueba de hipótesis

PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO

Aplicando formula se tiene:

95.10154.0

03.0

0002375.0

03.0

200

95.005.0

05.002.0

.cc Z

x

n

qp

ppZ

Conclusión: Como cZ es menor que Z , es decir, 645,195.1cZ , se rechaza

05.0:0 pH con un nivel de significancia de 0.05. Esto se puede observar en la grafica A

en donde 95.1cZ cae fuera del área de aceptación, por lo tanto, 05.0:1 pH se

acepta y se concluye que la proporción de artículos defectuosos es menor del 5 %, como quería el cliente.

Se recomienda al estudiante que aplique el método del valor p para solucionar el ejercicio.

4. Se ha afirmado que por lo menos el 60 % de los alumnos de primero y segundo semestre de un Tecnológico prefieren estudiar a partir de las dos de la madrugada. Si 4 de una muestra de alumnos de primero y segundo semestre de n =14 tomadas al azar, afirman estudiar a partir de las dos de la madrugada, pruebe con un nivel de significancia del 5 % si se debe aceptar la hipótesis nula p≥0.60 contra la hipótesis alternativa p<0.60.

Datos: .05.0........,..14,..14,..40.0,..60.0 alciasignificandenivelxnqp

SOLUCIÓN: Por tabla al 0.05 de significancia se sabe que la hipótesis alternativa unilateral

por la izquierda es 645,1Z .

Hipótesis:

60.0:

60.0:

1

0

pH

pH

Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si ZZc ,es

decir, 645,1cZ .

Aplicando formula se tiene:

40.2833,1

4.4

36.3

40.84

)40.0)(60.0(14

)60.0(144

npq

npxZ

Conclusión: Como cZ es menor que Z , es decir, 645,140.2cZ , se rechaza

60.0:0 pH con un nivel de significancia de 0.05. Esto se puede observar en la grafica A

en donde 40.2cZ cae fuera del área de aceptación, por lo tanto, 60.0:1 pH se

acepta y se concluye que la proporción de estudiantes del primero y segundo semestre que prefieren estudiar a partir de las dos de la madrugada es menor del 60 %.

Se recomienda al estudiante que aplique el método del valor p para solucionar el ejercicio.

Page 22: Prueba de hipótesis

PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO

EJERCICIOS

En los ejercicios (1-5) use el método de la región de rechazo para probar la hipótesis.

1. H0 : 0.6

H1 : p 0.6, x= 0.65, n = 100, y = 0.01

2. H0 : p = 0.29

H1 : p 0.29, x= 0.26, n = 90, y = 0.01

3. H0 : p = 0.36

H1 : p < 0.36, x = 0.34, n = 630, y = 0.05

4. Un manufacturero de juguetes Tailandés reclama que solo un 10% de los osos de juguete hechos para hablar están defectuosos. Cuatrocientos de éstos juguetes se sometieron a prueba de forma aleatoria y se encontró que 50 estaban defectuosos. Pruebe el reclamo del manufacturero con un nivel de significancia de 5%.

5. Una agencia de empleos afirma que el 80% de todas las solicitudes hechas por mujeres con hijos prefieren trabajos a tiempo parcial. En una muestra aleatoria de 200 solicitantes mujeres con niños, se encontró que 110 prefirieron trabajos a tiempo parcial. Pruebe la hipótesis de la agencia con un nivel de significancia de 5%.

En los ejercicios (6 - 10) use el método del valor-p para pruebas de hipótesis.

6. H0 : p = 0.2

H1 : p > 0.2, x= 0.245, n = 400, y = 0.01

7. H0 : p = 0.55

H1 : p < 0.55, x = 175, n = 300, y = 0.05

8. H0 : p = 0.2

H1 : p 0.2, x = 235, n = 1000, y = 0.02

9. Nacionalmente, un 16 % de los hogares tiene una computadora personal. En una muestra aleatoria de 80 hogares en Baltimore, solo 13 poseían una computadora personal. Con un nivel de significancia de 5%, pruebe si el porciento de hogares en Baltimore que tienen computadoras personales es menor que el porcentaje nacional.

10. El registrador de cierta universidad ha dicho que está dispuesto a permitir una sección del curso ESTAD 121 una vez a la semana si más del 65% de los estudiantes matriculados en el curso expresan que prefieren el curso una vez a la semana, en vez de dos veces a la semana. En una muestra aleatoria de 40 estudiantes, 26 indicaron su preferencia de una vez a la semana. Usando un nivel de significancia de 0.01, debe

Page 23: Prueba de hipótesis

PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO

el registrador autorizar el ofrecimiento del curso ESTAD 121 una vez?

11. El director de un supermercado piensa que el 50% de sus clientes gastan menos de 10 dólares durante una visita a la tienda. Muchas de sus decisiones en materia de fijación de precios se basa en esa hipótesis. Decide contrastar la hipótesis con una muestra de 50 clientes cuyos gastos totales se indican a continuación. Qué revelan estos datos sobre las decisiones de fijación de precios del director?. Utilice un nivel de significancia del 5%

18.17 8.73 21.12 10.00 4.12 0.65 8.73 17.17 8.42 18.42

7.17 4.12 17.18 5.12 27.18 11.12 2.17 11.17 7.12 4.82

2.08 8.15 6.12 5.12 2.17 3.32 6.42 17.89 9.17 5.55

4.17 5.15 2.12 12.12 8.15 4.83 12.18 11.12 2.63 11.11

18.02 17.15 9.99 18.17 3.02 10.12 8.84 8.92 21.22 17.83