6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014....

46
6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA La estadística está dividida en descriptiva e inferencial donde La estadística Descriptiva se relaciona principalmente con la recopilación, presentación y descripción de datos. Y la estadística Inferencial esta formada por un conjunto de métodos o técnicas utilizadas para la toma de decisiones o establecer conclusiones de una población. Para que la estadística inferencial sea efectiva sobre las conclusiones de una población, se requiere que las muestras seleccionadas de dicha población, sean muestras aleatorias. Los métodos estadísticos hacen uso de la información contenida en la muestra aleatoria y con base a esa información, se interpreta, se infiere y se toman las decisiones de la población. La inferencia estadística puede dividirse en dos grandes áreas: estimación de parámetros y prueba de hipótesis. 6.2 POBLACION, MUESTRA Y MUESTREO En este capítulo se hará un recordatorio de la definición de lo que es muestra, población y muestreo como se vio en el capítulo 2. Una población es el conjunto de todos los elementos a los que se somete a un estudio estadístico; es decir, está formada por la totalidad de las observaciones en las cuales se tiene cierto interés. Una muestra es un conjunto representativo de la población de referencia, el número de individuos de una muestra es menor que el de la población. O también es un subconjunto, extraído de la población (mediante técnicas de muestreo), cuyo estudio sirve para inferir características de toda la población, (Ver fig. 6.1).

Transcript of 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014....

Page 1: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE

HIPÓTESIS.

6.1 INFERENCIA ESTADISTICA

La estadística está dividida en descriptiva e inferencial donde La

estadística Descriptiva se relaciona principalmente con la recopilación,

presentación y descripción de datos. Y la estadística Inferencial esta formada

por un conjunto de métodos o técnicas utilizadas para la toma de decisiones o

establecer conclusiones de una población. Para que la estadística inferencial

sea efectiva sobre las conclusiones de una población, se requiere que las

muestras seleccionadas de dicha población, sean muestras aleatorias. Los

métodos estadísticos hacen uso de la información contenida en la muestra

aleatoria y con base a esa información, se interpreta, se infiere y se toman las

decisiones de la población.

La inferencia estadística puede dividirse en dos grandes áreas:

estimación de parámetros y prueba de hipótesis.

6.2 POBLACION, MUESTRA Y MUESTREO

En este capítulo se hará un recordatorio de la definición de lo que es

muestra, población y muestreo como se vio en el capítulo 2.

Una población es el conjunto de todos los elementos a los que se

somete a un estudio estadístico; es decir, está formada por la

totalidad de las observaciones en las cuales se tiene cierto interés.

Una muestra es un conjunto representativo de la población de

referencia, el número de individuos de una muestra es menor que el

de la población. O también es un subconjunto, extraído de la población

(mediante técnicas de muestreo), cuyo estudio sirve para inferir características

de toda la población, (Ver fig. 6.1).

Page 2: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

Figura. 6.1. Población y Espacio muestral

El muestreo es la técnica o método con que se extraen los elementos

de la población a estudiar.

Existen dos tipos de muestreo Probabilístico y no probabilístico.

En este último (no probabilístico) puede haber clara influencia de la

persona o personas que seleccionan la muestra o simplemente se realiza

atendiendo a razones de comodidad. Salvo en situaciones muy concretas, en la

que los errores cometidos no son grandes, debido a la homogeneidad de la

población, en general no es un tipo de muestreo riguroso y científico, dado que

no todos los elementos de la población pueden formar parte de la muestra. Por

ejemplo, si hacemos una encuesta telefónica por la mañana, las personas que

no tienen teléfono o que están trabajando, no podrán formar parte de la

muestra.

Muestreo probabilístico: En este tipo de muestreo es en el que todos

los individuos de la población, tienen la misma probabilidad de ser parte de la

muestra.

Page 3: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

6.3 ESTADISTICOS Y DISTRIBUCIONES DE MUESTREO

Las inferencias estadísticas se hacen mediante los estadísticos. Los

estadísticos son funciones derivadas de las observaciones contenidas en una

muestra aleatoria. Una distribución de muestreo es una distribución de

probabilidad de un estadístico, por ejemplo la distribución de probabilidad de

, se le conoce como distribución de muestreo de la media. La distribución de

muestreo de un estadístico depende de la distribución de la población, del

tamaño de la muestra y del método de muestreo seleccionado.

6.4 DISTRIBUCION DE MUESTREO DE MEDIAS

Sea un conjunto de observaciones de una muestra

aleatoria de tamaño tomada de una población (finita o infinita) normal con

media y varianza . Cada observación en esta muestra es una variable

aleatoria distribuida normal e independiente, con media y varianza .

Entonces

, tiene una distribución normal con media , y

varianza

. Esta afirmación se puede verificar con el siguiente teorema.

Teorema del Límite Central: Si es una muestra aleatoria

de tamaño tomada de una población (finita o infinita) con media y varianza

, y si es la media muestral, entonces la forma límite de la distribución de

Cuando , es la distribución normal estándar.

Aun cuando la distribución de la población no es normal, el Teorema del

Límite Central permite afirmar que “prácticamente” es normal para muestras

grandes tomadas de cualquier población.

Page 4: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

6.5 ESTIMADORES Y SU PROPIEDADES

Un estimador es una regla, a menudo expresada como una fórmula, que

indica cómo calcular el valor de una estimación con base en las mediciones

contenidas en una muestra. Existen dos tipos de estimaciones concernientes a

una población: la estimación por intervalo y la estimación puntual.

Una estimación puntual, es un solo valor o número que se utiliza para

estimar un parámetro de población desconocido. A menudo una estimación

puntual es insuficiente debido a que ya en resultado, solo se tienen dos

opciones: el valor de estimador es correcta o no. Por ejemplo, mediante una

estimación puntual se afirmara que para el año 2030, la proporción de

enfermos de sida a nivel mundial será 0.70, pudiera ser cierta o no.

Un estimador puntual es una variable aleatoria con una distribución de

muestreo que depende de la población y de su parámetro. Un buen

estimador debe de contener dos propiedades muy importantes, para evaluar

la bondad del estimador, que son que el estimador sea insesgado respecto al

parámetro a estimar y que tenga varianza mínima. Por ejemplo la media

muestral

es un estimador puntual de la media de la población .

Los estimadores puntuales más usuales son los de la distribución

binomial , de la distribución de Poisson del parámetro y la distribución

normal .

Antes de utilizar un estadístico muestral como estimador puntual, se

verifica si el estimador puntual tiene ciertas propiedades que corresponden a

un buen estimador puntual. Como hay distintos estadísticos muéstrales que se

usan como estimadores puntual es de sus correspondientes parámetros

poblacionales, se usará la notación general siguiente:

: es el parámetro poblacional de interés.

: es el estadístico muestral o estimador puntual de .

En general representa cualquier parámetro poblacional como, por

ejemplo, la media poblacional, la desviación estándar poblacional, etc.; y

Page 5: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

representa el correspondiente estadístico muestral, por ejemplo la media

muestral, la desviación estándar muestral y la proporción muestral.

Las propiedades de un buen estimador son:

Insesgadez: Si el valor del estadístico muestral es igual al parámetro

poblacional que se estudia, se dice que el estudio muestral es un estimador

insesgado del parámetro poblacional.

El estadístico muestral es un estimador insesgado del parámetro

poblacional si ( ) , donde ( ) valor esperado del estadístico

muestral.

Por lo tanto, el valor esperado, o media, de todos los posibles valores de

un estadístico muestral insesgado es igual al parámetro poblacional de

interés.

Eficiencia: Se dice que el estimador puntual con menor error estándar

tiene mayor eficiencia relativa que los otros.

Cuando se muestrean poblaciones normales, el error estándar de la

media muestral es menor que el error estándar de la mediana muestral. Por

tanto, la media muestral es más eficiente que la mediana muestral.

Consistencia: Un estimador puntual es consistente si el valor del

estimador puntual tiende a estar más cerca del parámetro poblacional a

medida que el tamaño de la muestra aumenta. En otras palabras, una

muestra grande tiende a proporcionar mejor estimación puntual que una

pequeña.

Los estimadores son estimadores insesgado de ,

respectivamente (Walpole, Ronald E., 2007).

6.6 ERROR ESTÁNDAR DE UN ESTADISTICO

Debido a que un estadístico es una variable aleatoria derivada de las

observaciones de un muestreo aleatorio, el valor del estadístico puede variar

de una muestra a otra muestra aleatoria, dependiendo de la variación de la

Page 6: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

población de interés. De esta forma El error estándar de un estadístico

depende de la desviación estándar de su distribución de muestreo. Por

ejemplo, si la media muestral se utiliza como estimados puntual de la media

poblacional , el error estándar de mide que también estima a .

Si es una muestra aleatoria de tamaño tomada de una

población normal con media y varianza

√ , de modo que el error estándar

de es

(6.1)

Si se desconoce el valor de , éste se puede sustituir por la deviación estándar

muestral de en la expresión 6.1, por consiguiente el error estándar estimado

de es

(6.2)

6.7 ESTIMACION POR INTERVALOS

Tomando en cuenta que la mayoría de las veces el parámetro poblacional es

desconocido, conveniente obtener límites entre los cuales se encuentre el

dicho parámetro con un cierto nivel de confianza estadística, en este caso se

trata de la estimación por intervalos.

Es decir, la estimación por intervalos da por consecuencia un intervalo

de confianza en el que se espera que se encuentre el parámetro poblacional

con una alta probabilidad de certeza. Por ejemplo, el intervalo de confianza

para la media poblacional es el intervalo de valores que tiene una alta

probabilidad de contener a la media de la población como se ilustra en la

figura 6.2. En la estimación por intervalos de un parámetro población, resulta

adecuado hablar en términos de probabilidad de que el estimador cubra el

verdadero valor del parámetro, como se muestra en la figura 6.2. Por lo tanto,

si se seleccionan 100 muestras de una población y se calcula cada media de

las muestras, de las cuales se les estima sus correspondiente intervalos de

Page 7: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

confianza del 95%, se tendría que aproximadamente 95 de los 100 intervalos

de confianza contienen la media poblacional.

Figura 6.2 Distribución de muestreo para estimador por intervalos.

El nivel de confianza (alfa) es el valor de la probabilidad de que el

parámetro poblacional se encuentre dentro del intervalo; los niveles de

confianza más ampliamente usados son:

correspondientes al 90%, 95% y 99% de confianza estadística,

respectivamente.

6.8 ESTIMACION POR INTERVALO DE UNA MEDIA CON n > 30

Sea es una muestra aleatoria de tamaño tomada de

una población normal con media y varianza conocida. Entonces un

intervalo de confianza del 100%(1- ) para esta dos por

√ ⁄

√ (6.3)

Donde ⁄ es el punto de la distribución normal estándar, que corresponde

al nivel de confianza dado . En la tabla 6.1, se pueden ver algunos valores de

⁄ para diferentes valores de .

Page 8: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

0.05

0.01

Tabla 6.1 Valores de ⁄ para distintos valores (alfa)

Ejemplo 6.1. Los datos de la tabla 6.2 se encuentran una muestra

aleatoria de las estaturas en centímetros de 45 estudiantes de la licenciatura

de ingeniería de alguna universidad. Se sabe que la muestra aleatoria de

tamaño proviene de una población normal con la varianza poblacional

. Construya un intervalo de confianza del 95% para la estatura media

poblacional .

164 162 165 163 165

168 165 165 169 167

163 164 160 167 160

166 164 169 163 171

160 163 160 168 167

165 167 162 164 162 166 165 166 165 161 170 164 158 165 160 167 165 169 165 162

Tabla 6.2 Estaturas de 45 estudiantes

La media de la muestra de los 45 estudiantes es

De la tabla I del apéndice y para un se tiene que . La

obtención del intervalo de confianza al 95% de las estaturas de los

estudiantes es la siguiente

Page 9: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

Por lo tanto la estatura media poblacional de los estudiantes esta entre

163.702 y 165.454.

Ahora consideremos lo siguiente, dado que se seleccionó una confianza

estadística del 95%. ¿Qué hubiera pasado si se hubiera escogido una confianza

estadística mayor, por ejemplo 99%? ¿Cómo será el intervalo de confianza

para la estatura media poblacional de los estudiantes?

Para un , y de la tabla I del apéndice se tiene que ⁄ ⁄

, entonces el intervalo de confianza al 99% es

Por lo tanto, para una confianza estadística del 99%, la estatura media

poblacional de los estudiantes esta entre 163.425 y 165.731.

Page 10: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

Nótese que la longitud el intervalo de confianza al 99% es mayor que la

longitud del intervalo de confianza al 95%. En general, para un tamaño de

muestra fijo y una desviación estándar , entre mas grande sea la confianza

estadística, mas grande será el intervalo de confianza resultante.

6.9 ESTIMACION POR INTERVALO DE UNA PROPORCION

Si es una variable aleatoria binomial con los parámetros , y es grande

y

, entonces la expresión 6.4 es un intervalo de confianza

aproximadamente del para ,

⁄ √

⁄ √

(6.4)

Ejemplo 6.2. En una muestra aleatoria, 145 personas de 450, a quienes

se aplicó una vacuna contra la influenza, experimentaron cierto síntoma de

incomodidad. Construir un intervalo de confianza del 95% para la proporción

poblacional de personas que experimentaron algún síntoma de incomodidad

por la vacuna.

Sustituyendo

y para y de la tabla I del

apéndice se tiene que , en la expresión 6.4 del intervalo de

confianza, se obtiene que

Page 11: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

Por lo tanto, la proporción poblacional de personas que experimentaron

algún síntoma de incomodidad por la vacuna está entre 0.2769 y 0.3631.

6.10 DISTRIBUCION t (t- Student)

Sea Z una variable aleatoria con distribución normal con y varianza

y sea V una variable aleatoria ji-cuadrada con k grados de libertad. Si Z y V

son independientes, entonces la variable aleatoria

tiene una función de densidad de probabilidad

[ ]

√ [ ]

y se dice que sigue una distribución t con k grados de libertad. Su media y

varianza de la distribución t son y para ,

respectivamente. En la figura 6.3 se presenta la grafica de varias

distribuciones t.

Page 12: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

Figura 6.3 Grafica de varias distribuciones t

6.11 DISTRIBUCION MUESTRAL t (t- Student)

Por lo general en muchas ocasiones no se conoce la desviación estándar

de la población, sino que se cuenta con solo la estimación de la desviación

estándar obtenida de una muestra aleatoria de dicha población, por

consiguiente no es posible obtener el valor de Z de una distribución normal

estándar. En este caso, se obtiene el estadístico t (t-Student), definido como

la expresión 6.5.

(6.5)

Donde t sigue una distribución t (t-Student) con n-1 grados de libertad y

√∑

es la desviación estándar muestral.

La distribución tiene una curva más ancha que la distribución normal

estandarizada cuando el número de grados de libertad es pequeño. Cuando

los grados de libertad tienden a infinito, la distribución tiende a una

distribución normal estándar. Es significa que a medida que se incrementa el

tamaño de la muestra, la desviación estándar muestral se aproxima a la

G. L.

2

3

10

t de Student

-9 -6 -3 0 3 6 9

x

0

0.1

0.2

0.3

0.4

densid

ad

Page 13: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

desviación estándar poblacional y en consecuencia la distribución de t se a

próxima a la distribución normal estándar (ver figura 6.4)

6.12 ESTIMACION POR INTERVALO DE UNA MEDIA CON

Sea y S la media y desviación estándar, respectivamente, de una

muestra aleatoria tomada de una población normal con media y varianza

desconocida. Entonces un intervalo de confianza del 100%(1- ) para esta

dos por

√ ⁄

√ (6.6)

Donde ⁄ es un punto critico superior de la t-Student con n-1 grados de

libertad, correspondiente al nivel de confianza .

Ejemplo 6.3. Los siguientes datos de la tabla 6.3 corresponden a la estatura

en centímetros de una muestra aleatoria de 10 estudiantes del grupo A de la

licenciatura de ingeniería. Encontrar un intervalo de confianza del 95% para la

estatura media.

168 168 164 160 171

165 157 165 164 165

Tabla 6.3 Estaturas en centímetros de 10 estudiantes

Figura 6.4 Distribución t de Student y normal.

Page 14: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

Supongas que la estatura de los estudiantes sigue una distribución normal. La

media y desviación estándar de la muestra son

S=4.00139

De la tabla II del apéndice y para un y para n-1=10-1=9 grados de

libertad se tiene que . El intervalo de confianza al 95% de las

estaturas de los estudiantes es

Por lo tanto, se tiene una confianza estadística del 95% de que el promedio de

estatura de los estudiantes se encuentra entre 161.15 y 167.71.

6.13 DISTRIBUCION JI-CUADRADA

Sean variables aleatorias con distribución normal e

independiente, con media y varianza , entonces, la variable

aleatoria definida como

(6.7)

Tiene la función de densidad de probabilidad

⁄ ⁄

⁄ ⁄

y por consiguiente sigue una distribución ji-cuadrada con v grados de

libertad, y se simboliza con . La media y la varianza de la distribución

son

Page 15: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

En la figura 6.5 se pueden ver la distribución con v=1, v=5, v=10, grados

de libertad. La distribución de ji-cuadrada es una de las distribuciones de

muestreo con mayor utilidad.

Figura 6.5 Gráficas de la distribución con distintos grados de libertad

Supóngase que es una muestra aleatoria de tamaño,

tomada de una población normal, con media y , entonces el estadístico ji-

cuadrada dado por

(6.8)

Tiene una distribuida como con n-1 grados de libertad y se le conoce como

la distribución de muestreo ji-cuadrada, donde es el tamaño de la muestra

aleatoria, la varianza muestral. Con la distribución de muestreo ji-cuadrada

se puede construir estimaciones de intervalo de confianza y hacer pruebas de

hipótesis estadísticas sobre la varianza de una población normal. El estadístico

ji-cuadrada también se puede dar con la siguiente expresión

(6.9)

G. L.

2

5

10

Chi-Cuadrada

0 10 20 30 40

x

0

0.1

0.2

0.3

0.4

0.5

0.6

densid

ad

v=2

v=5 v=10

Page 16: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

Propiedades de las distribuciones ji-cuadrada

1. Los valores de son mayores o iguales que 0.

2. La forma de una distribución depende de . En

consecuencia, hay un número infinito de distribuciones .

3. El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1.

4. Las distribuciones no son simétricas. Tienen colas estrechas que se

extienden a la derecha; esto es, están sesgadas a la derecha.

5. Cuando , la media de una distribución es y la varianza es

.

6. El valor modal de una distribución se da en el valor .

6.14 INTERVALO DE CONFIANZA DE LA VARIANZA

Sea una muestra aleatoria de tamaño n tomada de una

población normal, sea la varianza muestral y por consiguiente sea el

estimador puntual de . En la sección 6.13 se mostró que la expresión

es una ji- cuadrada con n-1 grados de libertad. Esta distribución se muestra en

la figura 6.6. Para el desarrollo del intervalo de confianza de , de la figura

6.4 se tiene la siguiente expresión (6.10)

( ⁄

) (6.10)

y haciendo un reordenamiento la expresión 6.10 puede escribirse como

(

⁄ )

(6.11)

Page 17: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

Figura 6.6 Derivación de un intervalo de confianza para en una distribución normal

y por lo tanto, de la expresión 6.11, concluimos que in intervalo de confianza

del para esta dado por

(

⁄ )

(6.12)

Ejemplo 6.4. Considerando los datos del ejemplo 6.3, de las estaturas de los

estudiantes, encontrar un intervalo de confianza bilateral al 95% para la

varianza poblacional de las estaturas de los estudiantes.

Supongas que la estatura de los estudiantes sigue una distribución normal. La

desviación estándar y la varianza de la muestra son

S=4.00139

S2=16.011

De la tabla III del apéndice y para un y para n-1=10-1=9 grados de

libertad se tiene que ⁄

y ⁄

Page 18: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

, sustituyendo estos valores en la expresión 6.9, se tiene que el intervalo

de confianza para al 95% de las estaturas de los estudiantes es

(

)

(

)

Por lo tanto, se estima que la varianza poblacional de las estaturas de los

estudiantes esta entre 7.57 y 53.37.

6.15 PRUEBA DE HIPOTESIS

En muchos problemas de la ciencia, de la ingeniería y de la administración, se

requiere que se toma una decisión entre aceptar y rechazar una proposición

sobre algún parámetro. Esta proposición recibe el nombre de hipótesis. Y el

procedimiento sobre la toma de decisión sobre la hipótesis, se le conoce como

prueba de hipótesis.

Una hipótesis estadística es una proposición o supuesto sobre los

parámetros de una o más poblaciones.

Ejemplo 6.5. Considerando los datos del ejemplo 6.1, de las estaturas

en centímetros de los estudiantes de alguna universidad. El interés se centra

sobre la estatura promedio de los estudiantes, de manera específica, el interés

recae en decir si la estatura promedio es o no de 165 centímetros, esto lo

podemos expresar simbólicamente como

centímetros

centímetros

Page 19: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

La proposición centímetros, se conoce como Hipótesis nula,

mientras que la proposición centímetros, recibe el nombre de

Hipótesis alternativa. En la hipótesis alternativa se especifican los valores de

que pueden ser mayores o menores que 165 centímetros, también se conoce

como Hipótesis alternativa bilateral. En algunas situaciones, lo que se

desea es formular una Hipótesis alternativa unilateral, como pudieran ser,

.

ó

.

De este modo, en forma general podemos decir que la Hipótesis nula,

representada por , es la afirmación sobre una o más características de

poblaciones que al inicio se supone cierta (es decir, una "creencia a priori").

La Hipótesis alternativa, representada por , es la afirmación contradictoria

a , y ésta es la hipótesis del investigador.

Es importante señalar que las hipótesis siempre son proposiciones sobre la

población o distribución bajo estudio, no proposiciones sobre la muestra. Por lo

general, el valor del parámetro de la población especificado en la hipótesis nula

se determina en una de tres maneras diferentes:

1. Puede ser resultado de la experiencia pasada o del conocimiento del

proceso, entonces el objetivo de la prueba de hipótesis usualmente es

determinar si ha cambiado el valor del parámetro.

2. Puede obtenerse a partir de alguna teoría, modelo o diseño

experimental, que se relaciona con el proceso bajo estudio. En este

caso, el objetivo de la prueba de hipótesis es verificar la teoría o

modelo.

3. Cuando el valor del parámetro proviene de consideraciones externas,

tales como las especificaciones de diseño o ingeniería, o de obligaciones

contractuales. En esta situación, el objetivo usual de la prueba de

hipótesis es probar el cumplimiento de las especificaciones.

Page 20: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

Los procedimientos de prueba de hipótesis dependen del empleo de la

información contenida en la muestra aleatoria de la población de interés. Si

esta información es consistente con la hipótesis, se concluye que ésta es

verdadera; sin embargo si esta información es inconsistente con la hipótesis,

se concluye que esta es falsa. Debe hacerse hincapié en que la verdad o

falsedad de una hipótesis en particular nunca puede conocerse con

certidumbre, a menos que pueda examinarse a toda la población. Usualmente

esto es imposible en muchas situaciones prácticas. Por tanto, es necesario

desarrollar un procedimiento de prueba de hipótesis teniendo en cuenta la

probabilidad de llegar a una conclusión equivocada.

La hipótesis nula se rechaza en favor de la hipótesis alternativa, sólo si la

evidencia muestral sugiere que es falsa. Si la muestra no contradice

decididamente a , se continúa creyendo en la validez de la hipótesis nula.

Entonces, las dos conclusiones posibles de un análisis por prueba de hipótesis

son rechazar o no rechazar .

6.16 ERRORES DEL TIPO I Y TIPO II.

El procedimiento de contrastar la hipótesis nula contra la hipótesis

alternativa con base de la información obtenida en una muestra aleatoria,

puede llevar a cometer dos posibles errores, debido a fluctuaciones o

variaciones del azar en el muestreo. Si la hipótesis nula es en realidad

verdadera, pero los datos de la muestra aleatoria la contradicen entonces la

hipótesis nula es rechazada y entonces se estará cometiendo el Error Tipo I.

Por otro lado, si la hipótesis nula es falsa y los datos de la muestra conllevan a

no rechazarla, se estará cometiendo el Error Tipo II. En otras palabras, El

Error tipo I se define como el rechazo de la hipótesis nula H0 cuando esta es

verdadera y el Error tipo II se define como la aceptación de la hipótesis nula H0

cuando esta es falsa. Por lo tanto, al probar cualquier hipótesis estadística,

existen cuatro situaciones diferentes que determinan si la decisión final es

correcta o errónea. Estas situaciones aparecen en la tabla 6.4

Page 21: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

Decisión

Eventos No se rechaza Rechazar

es Verdadera No hay error con

probabilidad

Error Tipo I

con probabilidad

es Falsa Error Tipo II

con probabilidad

No hay error

(potencia)

Con probabilidad

Tabla 6.4 Situaciones que determinan si la decisión final fue correcta o errónea.

Algunas veces, la probabilidad del error tipo I recibe el nombre de nivel de

significancia de la prueba y se denota con y La probabilidad de cometer un

error Tipo II se denota por . La probabilidad de no rechazar una hipótesis

nula verdadera es la confianza , con la cual se trabajó para hacer

estimaciones por intervalo. Cuando se rechaza una hipótesis nula falsa se ha

tomado una decisión correcta y la probabilidad de hacerlo se denomina

potencia o poder de la prueba y es denotada por 1 . En símbolos esto se

expresa de la siguiente manera:

P(Error tipo I) = P(Rechazar H0H0 es verdadera) =

P(No rechazar H0H0 es verdadera) = 1

P(Error Tipo II)=P(No rechazar H0H0 es falsa) =

P(Rechazar H0H0 es falsa) = Potencia = 1

El nivel de significancia lo fija el investigador, y en la práctica se

suelen usar valores de 0.01, 0.05 o el 0.1

En la figura 6.7 se ilustra las reglas de decisión y los tipos de error:

Page 22: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

Figura 6.7 Reglas de decisión.

6.17 PROCEDIMIENTO GENERAL PARA LA PRUEBA DE HIPOTESIS

Una vez que se han formulado las hipótesis nula, y la hipótesis

alternativa, , se debe realizar un procedimiento de comparación‚ por medio

del cual se toma una decisión basada en la muestra aleatoria seleccionada de

la población en estudio. Para llevar a cabo este procedimiento es necesario

seleccionar el estadístico de prueba adecuado, calcularlo con base en la

muestra y luego tomar la decisión de rechazar o no con respecto a un nivel

de significancia . Se recomienda utilizar los siguientes pasos al aplicar la

metodología de prueba de hipótesis

Los pasos a seguir en una prueba de hipótesis son:

1. Identificar el parámetro de interés, el cual se deriva del problema.

2. Formular las hipótesis nula H0 y la hipótesis alternativa Ha.

3. Escoger un nivel de significancia .

4. Seleccionar el estadístico de prueba adecuado a la distribución

muestral.

5. Determinar la región crítica o de rechazo para el estadístico de

prueba.

6. Calcular el estadístico de prueba.

7. Tomar una decisión de rechazar H0 o no rechazarla.

8. Dar una conclusión al problema.

Page 23: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

6.18 PRUEBA DE HIPOTESIS SOBRE LA MEDIA DE UNA

DISTRIBUCION NORMAL Y VARIANZA CONOCIDA

CASO I

Supongas que se desea probar la hipótesis

Donde es un valor especifico.

Sea una muestra aleatoria de tamaño , y sea la media

muestral con distribución normal con media y varianza entonces el

estadístico de prueba para la media esta en la expresión 6.13,

(6.13)

Donde es el valor que supuesto en la hipótesis nula .

REGLA DE DECISION

Si se ha planteado la hipótesis alternativa como, , donde es un

valor especifico, se tiene una prueba de hipótesis bilateral, es decir a dos

colas, por lo tanto, el nivel de significancia se divide en dos partes iguales,

quedando estos valores en los extremos de la distribución como se aprecia en

la figura 6.8. En consecuencia, si es cierta, la probabilidad de que el

estadístico de prueba este entre ⁄ y

⁄ es . Los valores de ⁄ y

⁄ pertenecen a una distribución Normal estándar. Nótese en la figura 6.8

que la probabilidad del estadístico de prueba este en la región ⁄ o

⁄ cuando es verdadera, es . En consecuencia, la hipótesis

debe rechazarse si se cumple que

⁄ o

Page 24: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

De otra forma si el valor del estadístico de prueba está entre ⁄ y ⁄

no se rechaza la hipótesis H0.

Figura 6.8 Distribución de Z0 cuando es verdadera, con región critica para .

Ejemplo 6.6. Se esta estudiando el rendimiento de un proceso químico.

De la experiencia, se sabe que la desviación estándar del rendimiento es de

3.2. En la tabla 6.5 están los resultados del rendimiento obtenidas los últimos

40 días en la planta de operación ¿Existe evidencia de que el rendimiento no

es del 90%? Utilizar .

86.74 83.81 85.33 86.33

81.58 88.30 89.65 86.04

87.68 85.00 81.76 86.86

84.84 80.67 90.84 83.26

91.88 81.84 83.75 82.97

87.38 92.51 87.04 86.74

87.32 88.22 89.33 90.39

81.72 76.78 82.97 92.32

89.66 86.18 88.31 88.45

82.66 79.35 85.22 88.11

Tabla 6.5 Rendimiento de un proceso químico

Siguiendo los pasos de la prueba de hipótesis tenemos

1. El parámetro de interés es , el promedio del rendimiento de un

proceso.

2. La hipótesis nula es

Page 25: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

La hipótesis alternativa es

3. El nivel de significancia es

4. El estadístico de prueba es

5. Rechazar H0 si se cumple que ⁄ o

⁄ , de la tabla I del

apéndice se tiene que y .

6. Considerando que el promedio muestral , n=40, y

el valor del estadístico de prueba es

7. Dado que , como se ilustra en la figura 6.9, se rechazar la

hipótesis H0.

8. Por lo tanto se concluye, con una confianza estadística del 95%, de que

el promedio del rendimiento de un proceso químico no es de 90%.

Figura 6.9 Regla de decisión para una prueba de hipótesis a dos colas

CASO II

Si se ha planteado la hipótesis alternativa como: , se tiene una

prueba de hipótesis a una cola superior, quedando el nivel de significancia en

Page 26: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

la parte superior de la distribución, como se aprecia en la figura 6.10, donde

pertenece a una distribución Normal estándar

Figura 6.10 Regla de decisión para una prueba de hipótesis a una cola superior

Si el valor del estadístico de prueba es mayor que se rechaza la

hipótesis nula, en caso contrario no se rechaza .

Ejemplo 6.7. Un proceso manufacturero usado por una fábrica durante

los últimos años da una producción media de 100 unidades por hora con una

desviación estándar de 8 unidades. Se acaba de introducir en el mercado una

nueva máquina para realizar ese tipo de producto. Aunque es muy cara

comparada con la que está ahora en uso, si la media de producción de la

nueva máquina es de más de 150 unidades por hora, su adopción daría

bastantes beneficios.

Para decidir si se debiera comprar la nueva máquina, a la gerencia de la

fábrica se le permite hacer un ensayo durante 35 horas, hallándose un

promedio de 160 unidades por hora. Con ésta información qué decisión se

debe tomar si se asume un nivel de confianza del

Siguiendo los pasos de la prueba de hipótesis tenemos

1. El parámetro de interés es , el promedio de producción de unidades.

2. La hipótesis nula es

La hipótesis alternativa es

Page 27: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

3. El nivel de significancia es

4. El estadístico de prueba es

5. Rechazar H0 si se cumple que de la tabla I del apéndice se

tiene que

6. Considerando que el promedio muestral , n=35, y

el valor del estadístico de prueba es

7. Dado que se rechazar la hipótesis H0.

8. En consecuencia, como puede observarse en la figura 6.11, el valor

del estadístico de prueba está en la zona de rechazo de la hipótesis

nula, por lo tanto, se acepta que la producción promedio por hora es

superior a las 150 unidades y asumiendo un riesgo del 1%, se puede

comprar la nueva máquina.

Figura 6.11 Regla de decisión para una prueba de hipótesis a una cola inferior

CASO III

Si se ha planteado la hipótesis alternativa como, , se tiene una prueba

de hipótesis a una cola inferior, quedando el nivel de significancia en la parte

inferior de la distribución, como se aprecia en la figura 6.12, pertenece a

una distribución Normal estándar.

Page 28: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

Figura 6.12 Regla de decisión para una prueba de hipótesis a una cola inferior

Si el valor del estadístico de prueba es menor que se rechaza la

hipótesis nula, en caso contrario no se rechaza .

Ejemplo 6.8. Considerando los datos del ejemplo 6.6 con respecto al

rendimiento de un proceso químico, plantearemos la hipótesis alternativa de

que el rendimiento del proceso químico es menor que el 90%, es decir

, utilizar .

Siguiendo los pasos de la prueba de hipótesis tenemos

1. El parámetro de interés es , el promedio del rendimiento de un

proceso químico.

2. La hipótesis nula es

La hipótesis alternativa es

3. El nivel de significancia es

4. El estadístico de prueba es

5. Rechazar H0 si se cumple que , de la tabla I del apéndice se

tiene que .

6. Considerando que el promedio muestral , n=40, y

el valor del estadístico de prueba es

Page 29: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

7. Dado que se rechazar la hipótesis H0.

8. Por lo tanto se concluye, con una confianza estadística del 95%, de

que el promedio del rendimiento de un proceso químico no es de

90%, dado el resultado de la prueba se puede afirmar que el

promedio del rendimiento es menor a 90%.

6.19 PRUEBA DE HIPÓTESIS SOBRE IGUALDAD DE DOS MEDIAS,

VARIANZAS CONOCIDAS

En algunos problemas de investigación, se tiene el interés en comparar

las medias de dos poblaciones distintas con muestras aleatorias independientes

de tamaños . Por ejemplo, comparar el rendimiento de dos maquinas

de ensamble, comparar una encuesta de opinión sobre que opinan lo hombres

con respecto a que opinan las mujeres, la calidad de un producto de un

proveedor con respecto a otro proveedor, etc.

Supóngase que se tienen dos poblaciones de interés, donde la primera tiene

una media poblacional desconocida y varianza conocida y la segunda

tiene una media poblacional desconocida y varianza conocida . Supóngase

que las dos poblaciones son normales, y sino se aplican las condiciones del

teorema del limite central. Un planteamiento de las hipótesis para la

diferencia de medias en dos poblaciones se puede ver en la tabla 6.6.

- Prueba de hipótesis a

dos colas

- Prueba de hipótesis a

una cola superior

- Prueba de hipótesis a

una cola inferior

Tabla 6.6 Diversas formas de plantear las hipótesis, donde k es un valor específico.

El procedimiento de prueba se basa en la distribución de la diferencia de

las medias muestrales . En general, si la hipótesis nula es

verdadera, la distribución de es una distribución normal con media y

Page 30: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

varianza

, por lo tanto el estadístico de prueba, se puede ver en la

expresión 6.14

(6.14)

El estadístico tiene una distribución normal estándar. Por consiguiente si la

hipótesis alternativa es definida como , entonces es una prueba de

hipótesis es bilateral, por consiguiente la hipótesis nula se rechaza si

⁄ o

Si la hipótesis alternativa es definida como , corresponde a una prueba

de hipótesis unilateral a una cola superior, en consecuencia la hipótesis nula

se rechaza si

Si la hipótesis alternativa es definida como , corresponde a una

prueba de hipótesis unilateral a una cola inferior, en consecuencia la hipótesis

nula se rechaza si

.

Ejemplo 6.9 Un constructor está considerando dos lugares alternativos

para construir un centro comercial. Como los ingresos de los hogares de la

comunidad son una consideración importante en ésta selección, desea probar

que el ingreso promedio de la primera comunidad excede al promedio de la

segunda comunidad en cuando menos $1,500 diarios. Con la información de

un censo realizado el año anterior se sabe que la desviación estándar del

ingreso diario de la primera comunidad es de $1,800 y la desviación estándar

de la segunda es de $2,400. Se toma una muestra aleatoria de 30 hogares de

la primera comunidad, encuentra que el ingreso promedio es de $35,500 y con

Page 31: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

una muestra de 40 hogares de la segunda comunidad el ingreso promedio es

de $34,600. Pruebe la hipótesis con un nivel de significancia .

Solución: Se desea probar si la diferencia entre los ingresos de la comunidad 1

y la 2 es de $1,500 o más, por lo tanto:

El tamaño de las muestras es grande y las varianzas poblacionales son

conocidas, por consiguiente la estadística de trabajo a utilizar es la expresión

6.14

Para un nivel de significancia , en la tabla I de la distribución normal

del apéndice se tiene un valor de es 1.96. Por consiguiente , lo

que significa que no es posible rechazar la hipótesis nula, con lo que podemos

por lo tanto, con una confiabilidad del 95%, la diferencia entre el ingreso

promedio por hogar en las dos comunidades no es mayor a $1,500.

6.20 PRUEBA DE HIPÓTESIS SOBRE IGUALDAD DE DOS

MEDIAS, VARIANZAS DESCONOCIDAS CON

Para la diferencia de dos medias si las muestras se obtienen de poblaciones

con distribuciones normales, pero y varianzas poblacionales

desconocidas, el estadístico de prueba de la expresión 6.14 es modificado al

sustituir las varianzas muestrales y

por sus respectivas varianzas

Page 32: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

poblacionales y

, como se ilustra en la expresión 6.15

(6.15)

Las reglas de rechazo para la hipótesis nula, son las mismas que se describen

en la sección 6.19.

Ejemplo 6.10 Una muestra de 80 alambres de acero producidos por la

fábrica A presenta una resistencia promedio a la ruptura de 1,230 lbs. Con

una desviación estándar de 120 lbs. Una muestra de 100 alambres de acero

producidos por la fábrica B presenta una resistencia promedio a la ruptura de

1,110 lbs. Con una desviación estándar de 90 lbs. Con base en ésta

información pruebe si la resistencia promedio a la rotura de los alambres de

acero de la marca A es significativamente mayor que la de los alambres de

acero de la marca B. Utilizar un nivel de significancia de .

Solución Las hipótesis a probar son

El tamaño de las muestras es grande, las varianzas poblacionales son

desconocidas, y asumiendo que las medias poblacionales son iguales y

sustituyendo , , , , y en el

estadístico de prueba de la expresión 6.15, se tiene

( )

Para un nivel de significancia , en la tabla de la distribución normal el

valor de es 2.33. Se tiene que , como se aprecia en la figura

Page 33: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

6.13, El estadístico de prueba está en la zona de rechazo de la hipótesis

nula, por consiguiente, con una confiabilidad del 99% se acepta que la

resistencia promedio de los alambres de la marca A es significativamente

mayor que la resistencia promedio de los alambres de la marca B.

Figura 6.13 Regla de decisión para una prueba de hipótesis a una cola superior

6.21 PRUEBAS DE HIPÓTESIS SOBRE LA MEDIA DE UNA

DISTRIBUCION NORMAL, VARIANZA DESCONOCIDA .

Cuando se prueban hipótesis sobre la media de una población normal cuando

es desconocida, es posible aplicar los procedimientos de la sección 6.18, al

sustituir la desviación estándar muestral S por la desviación estándar

poblacional , siempre y cuando el tamaño de muestra sea grande, es decir

. Sin embargo, cuando la muestra es pequeña, digamos , y

es desconocida se requiere de otra distribución de muestreo.

Sea una muestra aleatoria de tamaño , y sea y S la

media y desviación estándar muestral, respectivamente, se desea probar la

hipótesis alternativa bilateral

Donde es un valor especifico.

Page 34: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

El estadístico de prueba es

(6.16)

El estadístico tiene una distribución t con n-1 grados de libertad, si la

hipótesis nula , es verdadera, para una hipótesis alternativa bilateral

, la hipótesis nula se rechaza si

⁄ o

donde ⁄ y

⁄ son los puntos superior e inferior, respectivamente, de

la distribución t con n-1 grados de libertad.

Si la hipótesis alternativa unilateral superior , se calcula el estadístico

de prueba de la expresión 6.16, la hipótesis nula , se rechaza si

y por lo contrario no se rechaza .

Para una hipótesis alternativa unilateral inferior , se calcula el

estadístico de prueba de la expresión 6.16, la hipótesis nula , se rechaza

si

y por lo contrario no se rechaza .

Ejemplo 6.11 En su calidad de comprador comercial para un supermercado,

se toma una muestra aleatoria de 12 sobres de café de una empacadora. Se

encuentra que el peso promedio muestral del contenido de café de cada sobre

es 15.97 grs. con una desviación estándar de 0.15. La compañía empacadora

afirma que el peso promedio mínimo del café es de 16 grs. por sobre. ¿Puede

aceptarse ésta afirmación si se asume un nivel de confianza del 90%?

Page 35: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

Solución. Se desea probar si el peso mínimo es de 16 grs., es decir mayor o

igual a 16 grs., así que las hipótesis adecuadas son:

Teniendo en cuenta que el tamaño de la muestra es pequeño , la

media muestra es y su desviación estándar muestral es S=0.15, el

calculo del estadístico de prueba

Como lo indica la hipótesis alternativa, se trabaja a una cola superior y

para en la tabla II, de la distribución del apéndice, con 11 grados de

libertad el valor de es 1.363. Por consiguiente , y en

consecuencia no se puede rechazar la hipótesis nula y se puede concluir que la

compañía de café tiene la razón de que el peso promedio mínimo de los

sobres de café es de 16 grs.

6.22 PRUEBAS DE HIPÓTESIS SOBRE LAS MEDIAS DE DOS

DISTRIBUCIONES NORMALES, VARIANZAS DESCONOCIDAS

Supóngase que se tienen dos poblaciones de interés, donde la primera

tiene una media poblacional desconocida y varianza desconocida y la

segunda tiene una media poblacional desconocida y varianza desconocida

. Supóngase que las dos poblaciones son normales. Un planteamiento de las

hipótesis para la diferencia de medias en dos poblaciones se puede ver en la

tabla 6.6. Para probar las hipótesis que se plantean en la tabla 6.6 se usara el

estadístico de prueba t. Pero para esto, es necesario considerar dos situaciones

diferentes. En el primer caso, se supondrá que las varianzas de las dos

distribuciones normales son desconocidas pero iguales, esto es

y

en un segundo caso, se supondrá que

y desconocidas.

Page 36: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

Caso I

Sea una muestra aleatoria de observaciones tomadas de

la primera población y sea una muestra aleatoria de

observaciones de la segunda población. Sean

las medias

muestrales y varianzas muestrales, respectivamente. Supongamos que

son estimaciones de la varianza común , en consecuencia ambas varianzas

muestrales pueden combinarse para formar un solo estimador, como se ilustra

en la expresión

(6.17)

Por lo tanto el estadístico de prueba para la comparación de dos medias es

(6.18)

Donde es,

(6.19)

Si es verdadera tiene una distribución .

Si la hipótesis alternativa es bilateral , entonces si

⁄ o

se debe rechazar la hipótesis nula .

Si la hipótesis alternativa es unilateral superior , entonces si

Page 37: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

se debe rechazar la hipótesis nula .

Si la hipótesis alternativa es unilateral inferior , entonces si

se debe rechazar la hipótesis nula .

Ejemplo 6.12

Caso II

En algunos casos no es recomendable suponer que la varianzas desconocidas

sean iguales. En tal situación, no existe un estadístico t exacto para

probar la hipótesis nula . Pero el estadístico

(6.20)

tiene una distribución que es aproximadamente una distribución t con v grados

libertad, donde esta dado por

(

)

(

⁄ )

(

⁄ )

- 2

(6.21)

El procedimiento de prueba de hipótesis es el mismo, que en caso I, solo que

ahora los grados de libertad están determinados por la expresión 6.21.

Ejemplo 6.13

6.23 PRUEBA DE HIPÓTESIS PARA PARA UNA PROPORCION

Page 38: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

En muchos problemas que surgen en la práctica tienen una variable

aleatoria que sigue una distribución binomial, por ejemplo, la proporción de

productos defectuosos, la proporción de personas que están de acuerdo con

una nueva política en la empresa, la proporción de personas que presentan

cierto síntoma de enfermedad, etc. En este caso el parámetro de interés es p,

por consiguiente las hipótesis para considerar en la prueba están en la tabla

6.7

- Prueba de hipótesis a

dos colas

- Prueba de hipótesis a

una cola superior

- Prueba de hipótesis a

una cola inferior

Tabla 6.7 Hipótesis a considera en la prueba, donde es un valor especifico

Si la hipótesis nula es verdadera, el estadístico de prueba es

(6.22)

Para una hipótesis alternativa bilateral , la hipótesis nula se

rechazará si

⁄ o

Para una hipótesis alternativa unilateral superior , la hipótesis nula

se rechazará si

Para una hipótesis alternativa unilateral inferior , la hipótesis nula

se rechazará si

Page 39: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

Es importante señalar que el estadístico de prueba es valido siempre y cuando

no sea muy próximo a 1 o a cero, y si el tamaño de muestra es relativamente

grande, digamos .

Ejemplo 6.14 Un fabricante afirma que por lo menos el 90% de las piezas de

una maquinaria que se fabrican en una empresa cumplen con las

especificaciones del producto. Una inspección de 200 de esas piezas reveló

que 160 de ellas cumplían con las especificaciones. Pruebe si lo que afirma el

fabricante es cierto. Utilizar .

Solución:

Para realizar una prueba de hipótesis para la proporción se utiliza la

expresión 6.22

Para y de la tabla I de la distribución normal estándar del apéndice

el valor de , de este modo , por consecuencia El valor del

estadístico de prueba se encuentra en la zona de rechazo, como se puede

observar en la figura 6.14, por consiguiente, con una confiabilidad del 95% se

concluye que la afirmación del fabricante no es cierta.

Page 40: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

Figura 6.14 Regla de decisión para una prueba de hipótesis a una cola inferior

6.24 PRUEBA DE HIPÓTESIS PARA UNA VARIANZA

Supóngase que se quiere probar la hipótesis de que la varianza de una

población normal es igual un valor específico, digamos, . Para probar

Se utiliza el estadístico de prueba

(6.23)

donde es la varianza muestral.

Si la hipótesis nula

es verdadera, entonces el estadístico se

distribuye ji-cuadrada con n-1 grados de libertad.

Si se plantea como hipótesis alternativa

, entonces se trata una

prueba de hipótesis bilateral. Por consiguiente, la hipótesis nula

,

será rechazada si se cumple que

Page 41: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

o

donde

y

son los puntos que corresponden a los porcentajes

inferior y superior, respectivamente, de la distribución ji-cuadrada con

n-1 grados de libertad.

Si se plantea como hipótesis alternativa

, entonces se trata una

prueba de hipótesis unilateral superior. Por consiguiente, la hipótesis nula

, será rechazada si se cumple que

Si se plantea como hipótesis alternativa

, entonces se trata una

prueba de hipótesis unilateral inferior. Por consiguiente, la hipótesis nula

, será rechazada si se cumple que

Ejemplo 6.15 Se afirma que un pieza para un semiconductor es producido

por una compañía, tiene una varianza del diámetro no mayor que 0.0002

pulgadas. Una muestra aleatoria de 10 piezas arrojó una varianza muestral de

0.0003, pruébese que la varianza del diámetro de la pieza es mayor que

0.0002, utilícese .

Solución. Las hipótesis a probar son

Page 42: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

Es una prueba de hipótesis unilateral superior. Supongamos que las

mediciones de los diámetros tienen una distribución normal, por consiguiente

el valor del estadístico de prueba es

Para un y de la tabla III de los valores de la distribución ji-cuadrada,

se tiene que . Por consiguiente se tiene que

, por lo

tanto no es posible rechazar , lo que significa que no hay

suficiente evidencia para afirmar que sea mayor que 0.0002.

6.25 DISTRIBUCION MUESTRAL F DE SNEDECOR

Si

son las varianzas de muestras aleatorias independientes de

tamaño , respectivamente, tomadas de dos poblaciones normales que

tienen la misma varianza, entonces

(6.24)

Es un valor de una variable aleatoria que tiene distribución con

parámetros .

En la figura 6.15 se puede ver la grafica de esta distribución. La

distribución se usa en situaciones de dos muestras para realizar inferencias

sobre la población. Sin embargo, la distribución se aplica a muchos otros

tipos de problemas en los cuales están relacionadas las varianzas muestrales.

De hecho la distribución se llama distribución de razón de varianzas.

Page 43: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

Fig. 6.15. Distribución .

6.26 COMPARACION DE DOS VARIANZAS POBLACIONALES

Las características son:

Continua, es decir valores infinitos.

Positivamente sesgada (derecha).

Asintótica (aumenta pero no toca el eje)

Existe una familia de distribuciones (grados de libertad)

Pasos para comparar dos varianzas poblacionales

1. Hipótesis nula vs hipótesis alternativa:

2. Nivel de confianza :

Probabilidad de rechazar la hipótesis nula.

usualmente 0.05 y 0.01

3. Grados de Libertad y Valor Crítico .

Según los grados de libertad se ubica el valor crítico en la tabla .

Page 44: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

4. Se extrae el valor de prueba:

el valor resultante se compara con

el valor crítico , si es mayor se rechaza la hipótesis nula.

Ejemplo 6.16 Una compañía produce piezas maquinadas para motor que se

supone tienen una varianza en diámetro no mayor que 0.0002 pulgadas. Una

muestra aleatoria de piezas dio pulgadas. Suponga que

deseamos comparar la variación en los diámetros de las piezas producidas por

la empresa, con la variación en los diámetros de las piezas producidas por un

competidor donde para piezas la ¿los datos proporcionan

suficiente información para indicar una variación mas pequeña en diámetros

para el competidor? Prueba usando .

Solución: Estamos probando

El estadístico de prueba,

esta basado en en el

numerador y en el denominador y (véase la tabla IV del

apéndice) como el valor observado del estadístico de prueba es

Vemos que , por tanto, en el nivel , rechazamos

a favor de

y concluimos que la compañía competidora

produce piezas con menor variación en sus diámetros.

Ejercicios unidad 6

1. Una muestra aleatoria de 100 muertos registrado en México el año

pasado muestra una vida promedio de 71.8 años. Suponga una

desviación estándar poblacional de 8.9 años, ¿esto parece indicar que la

vida media hoy en día es mayor de 70 años? Use α=0.05

µ=71.8 S=8.9 n=100 x =70

2. Buscando conocer los efectos entre hombres y mujeres de una gran

compañía publicitaria contra el uso del tabaco, se ha observado a 90

Page 45: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

hombres y 90 mujeres fumadores elegidos al azar para ver si hay

diferencia en la disminución de cigarros consumidos diariamente; los

resultados son: los hombres 6.51 x cigarros menos y una desviación

estándar 5.31 S , y las mujeres 2.72 x cigarros menos con 9.22 S

¿Qué nos permite inferir estos resultados? Use α=0.05

3. En el pasado, 15% de la propaganda por correo para donativos dio como

resultado contribuciones. Se mando una nueva carta a una muestra de

200 personas y 45 enviaron un donativo. Para α=0.05 ¿Se puede

concluir que la nueva carta fue más efectiva? 45.0p 200n

45.0:0 pH

4. Un periodista publicó una nota en la que sostiene que 35 de cada 100

taxistas en la ciudad son personas que por lo menos han empezado una

carrera profesional ¿Se confirma este porcentaje si en una muestra

aleatoria de 90 taxistas, 38 de ellos expresaron haber iniciado al menos

una carrera profesional? Use α=0.05 35.01 p 1001 n 42.02 p

902 n

5. El proceso de bruñido se usa para esmerilar ciertos discos de silicio al

grueso apropiado es aceptable sólo si σ ≤ 0.5 mm. Emplear el nivel de

significancia de α=0.05 para probar la 5.0:0 H

:aH

> 0.5 si el

grosor de 15 cubitos cortados de tales discos tienen una desviación

estándar de 0.64 mm. 64.0S 15n

6. Al analizar el mercado de comportamiento interno de un país, los

responsables de la economía nacional han formulado la siguiente

hipótesis de trabajo: “El índice de variación de los precios de los

alimentos básicos en las zonas de alto nivel de vida es el mismo que el

de las zonas de bajo nivel de vida”. Para contrastarla, se hizo un estudio

en un sector, muy representativo, del respectivo nivel de vida de cada

zona; o sea que se extrajeron al azar dos muestras de tamaño

6021 nn . Con cada muestra se obtuvieron los precios de uno de los

principales alimentos básicos; registrándose las desviaciones estándar

Page 46: 6. Estimación DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1 INFERENCIA ESTADISTICA · 2014. 1. 2. · 6. Estimación, DISTRIBUCIONES MUESTREO, Y PRUEBA DE HIPÓTESIS. 6.1

muéstrales 75.11 S 07.22 S . Pruebe la hipótesis con un 98% de

confianza.