Estadística Inferencial - UNID...ESTADÍSTICA INFERENCIAL 1 Sesión No. 7 Nombre: Pruebas de...

17
Estadística Inferencial

Transcript of Estadística Inferencial - UNID...ESTADÍSTICA INFERENCIAL 1 Sesión No. 7 Nombre: Pruebas de...

Estadística Inferencial

ESTADÍSTICA INFERENCIAL

1

Sesión No. 7

Nombre: Pruebas de hipótesis referentes al valor de la media de la población. Parte I. Objetivo: Al finalizar la sesión, el estudiante conocerá cómo elaborar una prueba

de hipótesis de una media poblacional con el método del valor crítico. Así mismo

conocerá qué son los errores tipo I y II.

Contextualización

Con frecuencia, el problema al que se enfrentan los investigadores es hacer

inferencias acerca de parámetros poblacionales desconocidos con base en

información contenida en datos muestrales.

Por ejemplo, un investigador médico puede decidir sobre la base de la evidencia

experimental si un nuevo medicamento es más eficaz que otro para combatir

una enfermedad; un ingeniero puede tener que decidir sobre la base de datos

muestrales si hay una diferencia entre la precisión de dos tipos de herramientas;

o un profesional de mercadotecnia tenga que determinar la efectividad de

diferentes técnicas de comercialización. Una forma de interpretar estas

inferencias es la prueba de hipótesis acerca de los valores.

ESTADÍSTICA INFERENCIAL

2

Introducción al Tema

¿Qué es la prueba de hipótesis?

Imagen recuperada de: victoryepes.blogs.ipv.es

Una hipótesis es una explicación probable de un fenómeno investigado que se

formula a modo de proposición o afirmación. A veces las hipótesis no son

verdaderas, e incluso no pueden llegar a comprobarse. Pueden ser más o

menos generales o precisas, y abarcar dos o más variables, pero lo que es

común a toda hipótesis, es que se debe corroborar con la realidad. La prueba de hipótesis es un procedimiento basado en evidencia de la muestra y la teoría

de la probabilidad para determinar si la hipótesis es una afirmación razonable

(Lind, Marchal, & Wathen, 2012).

En esta sesión se presenta en primer lugar, los pasos básicos de la prueba de

hipótesis con el método del valor crítico. A continuación, conocerás los errores

tipo I y II para las pruebas de hipótesis que se pueden cometer durante el

proceso.

ESTADÍSTICA INFERENCIAL

3

Explicación

4.1 Pasos básicos de la prueba de hipótesis con el método del valor crítico

¿Cuáles son los pasos básicos para probar una hipótesis?

Hay muchas clases de pruebas de hipótesis. Todas siguen una serie básica de

pasos. En el caso de una media poblacional los pasos a seguir son:

Se empieza por hacer un supuesto tentativo acerca del parámetro poblacional. A

este supuesto tentativo se le llama hipótesis nula, y se denota por H0. En

términos generales, la hipótesis nula se formula para realizar una prueba. O se

rechaza o no se rechaza. Es una afirmación que no se rechaza a menos que la

información de la muestra ofrezca evidencia convincente de que es falsa (Lind,

Marchal, & Wathen, 2012).

Después se define otra hipótesis, llamada hipótesis alternativa (o hipótesis de

investigación), que contradice lo que establece la hipótesis nula y se denota

como H1. Esta hipótesis se acepta si la información de la muestra ofrece

suficiente evidencia estadística para rechazar la hipótesis nula.

A partir de la situación, las pruebas de hipótesis para un parámetro poblacional

asumen una de estas tres formas: en dos se emplean desigualdades, y en la

tercera se aplica una igualdad en la hipótesis nula. En las pruebas de hipótesis

para la media poblacional, 𝜇0 denota el valor hipotético, y hay que escoger una

de las formas siguientes (Anderson, Sweeney, & Williams, 2012).

𝐻0:𝜇 ≥ 𝜇0 𝐻0:𝜇 ≤ 𝜇0 𝐻0:𝜇 = 𝜇0

𝐻1:𝜇 < 𝜇0 𝐻1:𝜇 > 𝜇0 𝐻1:𝜇 ≠ 𝜇0

A las dos primeras formas se les llama pruebas de una cola. A la tercera se le

llama prueba de dos colas.

ESTADÍSTICA INFERENCIAL

4

La prueba de una cola para la media poblacional toma una de las dos formas

siguientes.

Prueba de cola inferior (o izquierda)

𝐻0:𝜇 ≥ 𝜇0

𝐻1:𝜇 < 𝜇0

Prueba de cola superior (o derecha)

𝐻0:𝜇 ≤ 𝜇0

𝐻1:𝜇 > 𝜇0

Se procede a seleccionar nivel de significancia o riesgo (𝛼) es la probabilidad de

rechazar la hipótesis nula cuando es verdadera. Puede darse como un dato para

realizar la prueba, pero no existe ningún nivel de significancia que se aplique a

todas las pruebas. Algunos valores típicos de 𝛼 son: 10%, 5%, 2%, 1%. La

persona que tomará la decisión debe especificar el nivel de significancia.

En una prueba de hipótesis para la media poblacional en el caso de 𝜎 conocida

se emplea la variable aleatoria estándar 𝑧 como estadístico de prueba para

determinar si �̅� se desvía lo suficiente del valor hipotético de 𝜇 como para

justificar el rechazo de la hipótesis nula. Como 𝜎�̅� = 𝜎 √𝑛⁄ , el estadístico de

prueba es el siguiente (Anderson, Sweeney, & Williams, 2012).

𝑧 =�̅� − 𝜇0𝜎 √𝑛⁄

En el método del valor crítico se determina un valor para el estadístico de prueba

llamado valor crítico. En una prueba de cola inferior, este sirve como un punto

de referencia para determinar si el valor del estadístico de prueba es lo

suficientemente pequeño para rechazar la hipótesis nula.

El valor crítico es el valor del estadístico de prueba correspondiente a un área 𝛼

(nivel de significancia) en la cola inferior de la distribución de muestreo del

estadístico. En otras palabras, es el mayor valor del estadístico de prueba que

hará que se rechace la hipótesis nula.

ESTADÍSTICA INFERENCIAL

5

La regla de rechazo se puede generalizar empleando el método del valor crítico

para cualquier nivel de significancia. La regla de rechazo en una prueba de cola

inferior es la siguiente.

𝑅𝑅𝑅ℎ𝑎𝑧𝑎𝑎 𝐻0 𝑠𝑠 𝑧 ≤ −𝑧𝛼

Donde −𝑧𝛼 es el valor crítico; es decir, el valor de 𝑧 que proporciona un área de

𝛼 en la cola inferior de la distribución normal estándar.

En las pruebas de hipótesis, el método del valor crítico llevará siempre a la

misma decisión de rechazo; sólo se sabe que los resultados son significativos al

nivel de significancia establecido.

Este mismo método general se usa para realizar una prueba de cola superior.

Para ésta también se calcula el estadístico de prueba 𝑧. La hipótesis nula es

rechazada si el valor del estadístico de prueba es mayor o igual al valor crítico 𝑧𝛼;

en otras palabras, 𝐻0 es rechazada si

𝑧 ≥ 𝑧𝛼.

La forma de comparar el valor del

estadístico de prueba 𝑧 con un valor

crítico para tomar una decisión en una

prueba de dos colas es la siguiente.

𝑅𝑅𝑅ℎ𝑎𝑧𝑎𝑎 𝐻0 𝑠𝑠 𝑧 ≤ −𝑧𝛼 2⁄ 𝑜 𝑠𝑠 𝑧 ≥ 𝑧𝛼 2⁄

En la siguiente tabla se presentan valores de 𝑧𝛼 2⁄ y 𝑧𝛼 para los niveles de

confianza más utilizados.

Nivel de confianza 𝜶 𝜶 𝟐⁄ 𝒛𝜶 𝟐⁄ 𝒛𝜶

90% 0.10 0.05 1.645 1.280 95% 0.05 0.025 1.960 1.645 99% 0.01 0.005 2.576 2.330

ESTADÍSTICA INFERENCIAL

6

Ejemplo

Una muestra aleatoria de 100 sobres de cereal tomada de la producción de una

fábrica mostró un peso promedio de 71.8 gr con una desviación estándar de 8.9

gr. Se desea probar con un nivel de significancia de 5% que el peso promedio de

todos los sobres de cereal (población) es mayor a 70 gr.

Solución:

Siguiendo los pasos indicados

1. Hipótesis nula: 𝐻0: 𝜇 = 70

2. Hipótesis alternativa: 𝐻1: 𝜇 > 70

3. Nivel de significancia: 𝛼 = 0.05

4. Estadístico de prueba: 𝑧 = �̅�−𝜇0𝜎 √𝑛⁄

5. Región de rechazo: 𝑧𝛼 = 𝑧0.05 = 1.645

Esto implica rechazar 𝐻0 en favor de 𝐻1, si 𝑧 > 1.645

6. Valor del estadístico:

𝑧 =�̅� − 𝜇0𝜎 √𝑛⁄

=71.8 − 708.9/√100

= 2.02

Se puede observar que 2.02 cae en la región de rechazo.

ESTADÍSTICA INFERENCIAL

7

La decisión es, se rechaza que la media poblacional es 70 gr y se

concluye, con una significancia de 5% que el peso promedio de la

población es mayor a 70 gr.

Ejemplo

Un fabricante de termostatos afirma que la temperatura de activación del

dispositivo promedio verdadera es 130°F. Una muestra de 𝑛 = 9 dispositivos se

sometió a una prueba dando una temperatura de activación promedio de

131.08°C con una desviación estándar de 1.5°F. ¿Contradicen los datos la

afirmación del fabricante a un nivel de significancia 𝛼 = 0.01?

Solución:

1. Hipótesis nula: 𝐻0: 𝜇 = 130

2. Hipótesis alternativa: 𝐻1: 𝜇 ≠ 130 (un alejamiento del valor declarado

en una u otra dirección es de interés)

3. Nivel de significancia: 𝛼 = 0.01

4. Estadístico de prueba: 𝑧 = �̅�−𝜇0𝜎 √𝑛⁄

5. Región de rechazo: La forma de 𝐻1 implica el uso de una prueba

de dos colas con región de rechazo de

𝑧 ≥ 𝑧0.005 o de 𝑧 ≤ −𝑧0.005

De acuerdo con la tabla de valores de 𝑧𝛼 2⁄ y 𝑧𝛼

𝑧0.005 = 2.576

Así que se rechazaría 𝐻0 si 𝑧 ≥ 2.576 o de 𝑧 ≤ −2.576

6. Valor del estadístico

𝑧 =�̅� − 𝜇0𝜎 √𝑛⁄

=131.08 − 130

1.5/√9= 2.16

ESTADÍSTICA INFERENCIAL

8

El valor de 𝑧 = 2.16 no cae en la región de rechazo (−2.576 < 2.16 <

2.576), así que 𝐻0 no puede ser rechazada al nivel de significancia de

0.01.

Los datos no apoyan fuertemente la afirmación de que el promedio

verdadero difiere del valor de diseño de 130.

¿Por qué crees que se llegó a esta conclusión?

4.2 Errores tipo I y tipo II en pruebas de hipótesis

¿Qué situaciones posibles determinan si nuestra decisión es correcta o errónea al probar cualquier hipótesis estadística?

Las hipótesis nula y alternativa son afirmaciones opuestas acerca de la

población. Una de las dos, ya sea la hipótesis nula o la alternativa es verdadera,

pero no ambas. Lo ideal es que la prueba de hipótesis lleve a la aceptación de

𝐻0 cuando 𝐻0 sea verdadera y al rechazo de 𝐻0 cuando 𝐻1 sea verdadera. Por

desgracia, las conclusiones correctas no siempre son posibles. Como la prueba

de hipótesis se basa en información muestral debe tenerse en cuenta que existe

la posibilidad de error (Anderson, Sweeney, & Williams, Estadística para

administración y economía, 2008).

Como hay dos opciones en una prueba estadística, también hay dos tipos de

errores que se pueden cometer. Estas dos posibilidades, junto con las

decisiones que puede tomar el investigador, se muestran a continuación.

ESTADÍSTICA INFERENCIAL

9

Un error tipo I para una prueba estadística es el error de rechazar la hipótesis

nula cuando sea verdadera. La probabilidad de cometer un error tipo I se denota

con el símbolo 𝛼 . El procedimiento de prueba y las regiones de rechazo

correspondientes se ilustran a continuación.

Un error tipo II para una prueba estadística es el error de aceptar la hipótesis

nula cuando es falsa y alguna hipótesis alternativa es verdadera. La probabilidad

de cometer un error de tipo II se denota por el símbolo 𝛽.

Como puedes ver la probabilidad de un error tipo I es exactamente igual que el

nivel de significancia 𝛼. Cuando 𝐻0 es rechazada, se tiene una medida precisa

de la confiabilidad de la inferencia; la probabilidad de una decisión incorrecta es

𝛼, pero la probabilidad 𝛽 de un error tipo II no siempre es controlada por el

investigador. De hecho, cuando 𝐻0 es falsa y 𝐻1 es verdadera, puede que no sea

posible especificar un valor exacto para 𝜇, sino sólo un intervalo de valores. Esto

ESTADÍSTICA INFERENCIAL

10

hace difícil, si no imposible, calcular 𝛽. Sin una medida de confiabilidad, no es

inteligente concluir que 𝐻0 sea verdadera. En lugar de arriesgarse a una decisión

incorrecta, el investigador debe detener el juicio, concluyendo que no hay

evidencia suficiente para rechazar 𝐻0 . En lugar de aceptar 𝐻0 , no se debe

rechazar 𝐻0 (Mendenhall, Beaver, & Beaver, 2015).

Ejemplo

Un investigador de la PROFECO cree que un dentífrico de una marca “A” es

mejor que otro de marca “libre” y se desea probar ambos productos, porque de

no ser así se tomaría la decisión de comprar el dentífrico más barato. La idea “el

dentífrico de marca “A” es mejor que el dentífrico de marca “libre” es el motivo

para realizar la prueba, por lo que se vuelve la hipótesis del investigador

(hipótesis estadística alternativa). De esta manera tenemos:

• 𝐻0:𝑛𝑜 ℎ𝑎𝑎 𝑑𝑠𝑑𝑅𝑎𝑅𝑛𝑅𝑠𝑎 𝑅𝑛 𝑅𝑒 𝑑𝑅𝑠𝑅𝑑𝑑𝑅ñ𝑜 𝑑𝑅 𝑒𝑜𝑠 𝑑𝑅𝑛𝑑í𝑑𝑎𝑠𝑅𝑜𝑠

• 𝐻1: 𝑅𝑒 𝑑𝑅𝑛𝑑í𝑑𝑎𝑠𝑅𝑜 𝑑𝑅 𝑑𝑎𝑎𝑅𝑎 A 𝑅𝑠 𝑑𝑅𝑚𝑜𝑎 𝑞𝑞𝑅 𝑅𝑒 𝑑𝑅𝑛𝑑í𝑑𝑎𝑠𝑅𝑜 𝑑𝑅 𝑑𝑎𝑎𝑅𝑎 "𝑒𝑠𝑙𝑎𝑅"

Los posibles resultados y las acciones consiguientes serán:

Decisión

Condición del estado de la naturaleza 𝑯𝟎 verdadera

Veracidad de la situación: No hay diferencia entre los dentífricos.

𝑯𝟏 verdadera Veracidad de la situación: El dentífrico de marca “A” es mejor.

𝐻0 es aceptada

Decisión correcta Conclusión: Se determinó que no hay diferencia entre los dentífricos. Acción: El consumidor compra el dentífrico de marca “libre”, ahorra dinero y obtiene los mismos resultados.

Decisión incorrecta: error tipo I Conclusión: Se determinó que no hay diferencia entre los dentífricos. Acción: El consumidor compra el dentífrico de marca “libre”, ahorra dinero, pero obtiene malos resultados.

𝐻0 es rechazada

Decisión incorrecta: error tipo I Conclusión: Se determinó que el dentífrico de marca “A” es mejor. Acción: El consumidor compra el dentífrico de marca “A”, gasta

Decisión correcta Conclusión: Se determinó que el dentífrico de marca “A” es mejor. Acción: El consumidor compra el dentífrico de marca “A” y, aunque

ESTADÍSTICA INFERENCIAL

11

dinero extra sin obtener mejores resultados.

gasta más, obtiene mejores resultados.

Conclusión

En esta sesión se presentó el procedimiento para prueba de hipótesis acerca de

la media poblacional en el caso de σ conocida por el método del valor crítico, y

los tipos de error en una prueba de hipótesis. En una prueba de hipótesis se

examina evidencia en forma de datos muestrales, para dar lugar a una de dos

resoluciones posibles: rechazar la hipótesis nula, o no rechazarla. Bajo este

planteamiento, pudiste ver que existen dos tipos de error que se pueden cometer:

el error tipo I que se comete cuando se resuelve rechazar la hipótesis nula a

favor de la hipótesis alternativa, siendo que la hipótesis nula es cierta. El error

tipo II que se comete cuando se resuelve no rechazar la hipótesis nula cuando

ésta, es falsa.

Pero, te has preguntado ¿cómo determinar el tamaño de la muestra en la prueba de hipótesis para la media poblacional?

ESTADÍSTICA INFERENCIAL

12

Para aprender más

¿Cuáles son los pasos básicos para realizar un proceso de prueba de hipótesis?

• Estadística útil (27 de octubre de 2013). Proceso de prueba de hipótesis.

(Archivo de video] Recuperado de:

https://www.youtube.com/watch?v=OTfUrPNyoZE

¿Qué situaciones llevan a cometer errores en el proceso de prueba de hipótesis?

• Estadística útil (27 de octubre de 2013). Tipos de errores en la prueba de

hipótesis. [Archivo de video] Recuperado de:

https://www.youtube.com/watch?v=XEULRVqVT0U

ESTADÍSTICA INFERENCIAL

13

Actividad de Aprendizaje

Instrucciones:

Con la finalidad de profundizar en los conocimientos adquiridos a lo largo de esta sesión,

ahora tendrás que realizar la siguiente actividad:

Resuelve los siguientes problemas.

1. El gerente de ventas de una empresa de tiempos compartidos afirma que los

vendedores están promediando no más de 15 contactos por mes. Al gerente

le gustaría aumentar esta cantidad, y como prueba de su afirmación se

selección una muestra aleatoria de 36 vendedores y se registra el número de

contactos hechos por cada vendedor para un solo mes seleccionado al azar.

La media y la varianza de las 36 mediciones fueron 17 y 9, respectivamente.

¿La evidencia contradice lo dicho por el presidente? Emplea una prueba con

𝛼 = 0.05

2. Una academia de computación afirma que sus alumnos tardan máximo 34

horas, en promedio, en aprender un nuevo programa informático. ¿Está

afirmación respaldada con 𝛼 = 0.10, si 35 alumnos tardaron en aprender el

programa un promedio de 38.6 horas con una desviación estándar de 15.8

horas?

3. Una empresa embotelladora tienen que llenar los envases de jugo por lo

menos con 16.2 onzas. En caso contrario, el proceso se interrumpe mientras

se hacen los ajustes necesarios. El gerente de producción tiene la

responsabilidad de determinar, con un nivel de confianza del 99%, si el

proceso funciona como es debido. En una muestra de 24 envases se halla

que el peso medio del contenido es de 15.7 onzas y la desviación estándar

de 3.7 onzas. ¿El gerente deberá ordenar que el proceso se detenga?

Puedes realizarlo en un procesador de textos, al final tendrás que guardarlo en formato

PDF, y entregarlo de acuerdo a las indicaciones de tu profesor.

ESTADÍSTICA INFERENCIAL

14

Esta actividad representa el 5% de tu calificación y se tomará en cuenta lo siguiente:

• Tus datos generales.

• Título de la actividad.

• Procedimiento o desarrollo completo y correcto de los ejercicios y conclusiones.

• Ortografía y redacción.

ESTADÍSTICA INFERENCIAL

15

Bibliografía

• Anderson, D. R., Sweeney, D. J., & Williams, T. A. (2008). Estadística para

administración y economía (10 ed.). México: Cengage Learning.

• Anderson, D. R., Sweeney, D. J., & Williams, T. A. (2012). Estadística para

negocios y economía (11 ed.). México: Cengage Learning.

• Gutiérrez, G. E., & Vladimirovna, P. O. (2014). Probabilidad y estadística.

Aplicaciones a la ingeniería y las ciencias. México: Patria.

• Levin, R. I., & Rubin, D. S. (2004). Estadística para administración y economía (7

ed.). México: Pearson Educación.

• Lind, D. A., Marchal, W. G., & Wathen, S. A. (2012). Estadística aplicada a los

negocios y economía (15 ed.). México: McGraw-Hill.

• Mendenhall, W., Beaver, R. J., & Beaver, B. M. (2015). Introducción a la

probabilidad y estadística (14 ed.). México: Cengage Learning.

• Navidi, W. (2006). Estadística para ingenieros. México: McGraw-Hill.

• Quintana R. C. (1996). Elementos de inferencia estadística. Costa Rica:

Universidad de la Costa Rica.

• Triola, M. F., & Pineda, A. M. L. (2004). Probabilidad y Estadística. México:

Pearson Education.

• Walpole, R. E., Myers, R. H., & Myers, S. L. (1999). Probabilidad y estadística

para ingenieros (6 ed.). México: Prentice-Hall.

Cibergrafía

• Estadística útil (27 de octubre de 2013). Proceso de prueba de hipótesis.

(Archivo de video] Recuperado de:

https://www.youtube.com/watch?v=OTfUrPNyoZE

ESTADÍSTICA INFERENCIAL

16

• Estadística útil (27 de octubre de 2013). Tipos de errores en la prueba de

hipótesis. [Archivo de video] Recuperado de:

https://www.youtube.com/watch?v=XEULRVqVT0U

Te invito a que consultes la Biblioteca Digital UNID