Practica dirigida de prueba de hipótesis para la diferencia de dos medias
-
Upload
diego-mejia-miranda -
Category
Documents
-
view
62 -
download
1
Transcript of Practica dirigida de prueba de hipótesis para la diferencia de dos medias
![Page 1: Practica dirigida de prueba de hipótesis para la diferencia de dos medias](https://reader031.fdocuments.ec/reader031/viewer/2022012316/54a1858eac7959737b8b46ad/html5/thumbnails/1.jpg)
Estadística Aplicada
Docente:Docente:Docente:Docente: Ing. Ferly Urday Luna Página 1 de 11
Practica dirigida de prueba de hipótesis para la diferencia de dos medias Ejemplo Aplicativo Nro 1 Un corredor de valores de la bolsa de lima estudia los porcentajes de rendimiento de las empresas del sector minero y del sector financiero. Se sabe que las tasas de los rendimientos tienen una distribución normal. Dos muestras aleatorias de las tasas de 8 empresas del sector minero (M) y de 6 empresas del sector financiero (F) han dado los siguientes valores de rendimiento en porcentajes:
Sector M 17 23 25 18 24 20 21 16 Sector F 13 16 14 12 15 14
¿Qué sector empresarial presenta mayor rendimiento? Solución Para resolver este problema se debe cumplir las siguientes condiciones:
a) Los datos provengan de poblaciones normales. b) Los datos sean independientes. c) Probar la igualdad de varianzas. d) Probar la igualdad de medias.
En este ejemplo vamos a suponer que se cumplen las dos primeras condiciones, y vamos a docimar las dos últimas. Primer paso Prueba de hipótesis para la igualdad de varianzas. Cuando se trata de una prueba de hipótesis para la igualdad de varianzas, se utiliza la distribución F de Fisher-Snedecor.
1) H0: 2 2
M Fσ σ=
H1: 2 2
M Fσ σ≠
2) Nivel de significancia: α = 5% 3) Estadística
4) Regla de decisión 6.85, se obtiene leyendo la tabla Fisher del 2.5% con 7 grados de libertad en el numerador y 5 grados de libertad en el denominador. 0.19; se obtiene hallando la inversa del valor de la tabla Fisher de 2.5% con 5 grados de libertad en el numerador y 7 grados de libertad en el denominador.
1 2
2
1
2
2
( r ;r )
SF ~ F
S=
F
2.5%
2.5%
6.85 0.19
10 19
5 29.
.=
![Page 2: Practica dirigida de prueba de hipótesis para la diferencia de dos medias](https://reader031.fdocuments.ec/reader031/viewer/2022012316/54a1858eac7959737b8b46ad/html5/thumbnails/2.jpg)
Estadística Aplicada
Docente:Docente:Docente:Docente: Ing. Ferly Urday Luna Página 2 de 11
5) Cálculos Datos del Problema 2
M
2
F
σ = 11.1428
σ = 2
Cal
Cal
11.1428F =
2
F = 5.57
6) Decisión
Dado que el FCal = 5.57 ∈ RA, aceptamos H0 y rechazamos H1, por lo tanto
podemos concluir que las varianzas poblacionales del sector minero y financiero son iguales.
Cálculos con Statgraphics
a) Una vez introducidos los valores de las variables, se procede a ejecutar menú comparación – Dos muestras – Comparación de dos muestras, luego se seleccionan las respectivas muestras en el cuadro de dialogo y se acepta, ver los pasos para este procedimiento:
Se introducen los
valores de las
variables
Se configura el cuadro
de la siguiente manera
y se presiona aceptar
![Page 3: Practica dirigida de prueba de hipótesis para la diferencia de dos medias](https://reader031.fdocuments.ec/reader031/viewer/2022012316/54a1858eac7959737b8b46ad/html5/thumbnails/3.jpg)
Estadística Aplicada
Docente:Docente:Docente:Docente: Ing. Ferly Urday Luna Página 3 de 11
b) Luego se presiona el botón , y se activa la siguiente opción:
c) Finalmente se analiza el resultado:
Comparación de Desviaciones Típicas
-----------------------------------
Sector M Sector F
------------------------------------------------------------
Desviación Típica 3.33809 1.41421
Varianza 11.1429 2.0
GL 7 5
Cociente de varianzas = 5.57143
95.0% Intervalos de Confianza
Desviación Típica deSector M: [2.20706;6.79393]
Desviación Típica deSector F: [0.882763;3.46852]
Cociente de varianzas: [0.812978;29.4463]
Contrastes F para comparar varianzas
Hipótesis nula: sigma1 = sigma2
(1) Hipótesis alt.: sigma1 <> sigma2
F = 5.57143 P-Valor = 0.0766501
El StatAdvisor
--------------
Esta opción ejecuta un F-test para comparar las varianzas de las
dos muestras. También establece los intervalos de confianza o los
límites para cada desviación típica y para el ratio de varianzas. De
particular interés está el intervalo de confianza para el ratio de las
varianzas, el cual se extiende desde 0.812978 hasta 29.4463. Dado que
el intervalo contiene el valor 1.0, no existe diferencia
estadísticamente significativa entre las desviaciones típicas de las
dos muestras para un nivel de confianza del 95.0%.
También puede utilizarse un F-test para probar una hipótesis
específica sobre las desviaciones típicas de las poblaciones de las
que proceden las dos muestras. En este caso, el test se ha realizado
para determinar si el ratio de las desviaciones típicas son iguales
1.0 frente a la hipótesis alternativa en la que el ratio no es igual
1.0. Puesto que el p-valor calculado no es inferior a 0.05, no
podemos rechazar la hipótesis nula.
NOTA IMPORTANTE: los F-test y los intervalos de confianza mostrados
dependen de que las muestras procedan de distribuciones normales.
Para comprobar esta asunción, seleccione Resumen Estadístico de la
lista de Opciones Tabulares y observe los valores de asimetría
estandarizada y curtosis estandarizada.
Lo mas importante aquí, es observar el valor de p = 7.67% > α = 5%, lo que indica que se acepta la hipótesis nula.
![Page 4: Practica dirigida de prueba de hipótesis para la diferencia de dos medias](https://reader031.fdocuments.ec/reader031/viewer/2022012316/54a1858eac7959737b8b46ad/html5/thumbnails/4.jpg)
Estadística Aplicada
Docente:Docente:Docente:Docente: Ing. Ferly Urday Luna Página 4 de 11
Cálculos con Excel a) Primero se deben colocar los datos en una hoja de cálculo. b) Activar menú herramientas – Análisis de datos – Prueba F para varianzas de
dos muestras
c) Se configura el cuadro de dialogo de la siguiente manera: Obsérvese que el valor de a ha sido colocado dividido entre 2, esto por que en el Excel, para esta prueba, siempre se considera solo uno de los lados, ya sea el izquierdo o el derecho, esto según cual de las dos muestras tenga mayor o menor varianza
d) Obteniéndose los siguientes resultados:
Prueba F para varianzas de dos muestras
Sector M Sector F
Media 20.5 14
Varianza 11.14285714 2
Observaciones 8 6
Grados de libertad 7 5
F 5.571428571
P(F<=f) una cola 0.038324609
Valor crítico para F (una cola) 6.853075629
e) Finalmente se analizan los resultados.
Observen que el valor F es menor que el Valor critico para F (una cola), y que para hallar el valor de p, hay que multiplicar por 2 el valor “P(F<=f) una cola” Por todo lo anterior, aceptamos H0 y rechamos H1. Si se tratase de una prueba con una sola cola, entonces los valores se leerían directamente, sin hacer ningún cambio
![Page 5: Practica dirigida de prueba de hipótesis para la diferencia de dos medias](https://reader031.fdocuments.ec/reader031/viewer/2022012316/54a1858eac7959737b8b46ad/html5/thumbnails/5.jpg)
Estadística Aplicada
Docente:Docente:Docente:Docente: Ing. Ferly Urday Luna Página 5 de 11
Segundo Paso Con la Prueba anterior se ha demostrado que las varianzas poblacionales son iguales, pero desconocidas, entonces ahora se procede a elaborar una prueba de hipótesis para la diferencia de medias. Prueba de hipótesis para la diferencia de medias, con varianzas iguales
1) H0: µM = µF
H1: µM ≠ µF
2) α = 5% 3) Estadística.
Dado que las varianzas poblacionales resultaron ser iguales, se utiliza:
4) Regla de decisión
5) Cálculos
Sector Minero Sector Financiero
Media Aritmética 20.5 14 Varianza Muestral 11.14285714 2
Tamaño de muestra 8 6
6) Decisión
Dado que TCal = 4.44 ∉ R.A., aceptamos H1 y rechazamos H0, por lo tanto los rendimientos medios en las empresas del sector minero no son iguales a los de las empresas del sector financiero.
Hasta este momento solo podemos decir que los rendimientos medios son diferentes pero no sabemos en que sectores son mayores, para ello hacemos un replanteamiento de las hipótesis. Para este replanteamiento se observa el signo del estadístico TCal dado que este es positivo, hay un fuerte indicio que el rendimiento en las empresas del sector minero sea mayor al de las empresas del sector financiero.
� �
1 2
1 22 2
1 2
2
C C
X XT t( n n )
S S
n n
−= + −
+
∼ �2 2
21 1 2 2
1 2
1 1
2C
( n )S ( n )SS
n n
− + −=
+ −
0 t
2.5% 2.5%
-2.179 2.179
�
�
2
C
2
C
(8-1)×11.14285+(6-1)×2S =
8+6-2
S =7.33
Cal
20.5-14T =
7.33 7.33+
8 6
CalT =4.44
![Page 6: Practica dirigida de prueba de hipótesis para la diferencia de dos medias](https://reader031.fdocuments.ec/reader031/viewer/2022012316/54a1858eac7959737b8b46ad/html5/thumbnails/6.jpg)
Estadística Aplicada
Docente:Docente:Docente:Docente: Ing. Ferly Urday Luna Página 6 de 11
Replanteando
1) H0: µM ≤ µF
H1: µM > µF
2) α = 5% 3) Estadística.
Dado que las varianzas poblacionales resultaron ser iguales, se utiliza:
4) Regla de decisión
5) Cálculos
Sector Minero Sector Financiero
Media Aritmética 20.5 14 Varianza Muestral 11.14285714 2
Tamaño de muestra 8 6
6) Decisión
Dado que TCal = 4.44 ∉ R.A., aceptamos H1 y rechazamos H0, por lo tanto el rendimiento promedio de las empresas del sector minero son mayores al rendimiento medio de las empresas del sector financiero.
Cálculos con Statgraphics Con el Statgraphics, se sigue el mismo procedimiento que para la prueba de hipótesis
para las varianzas, con la unica salvedad que al presionar el botón , se deb escoger la siguiente opción:
� �
1 2
1 22 2
1 2
2
C C
X XT t( n n )
S S
n n
−= + −
+
∼ �2 2
21 1 2 2
1 2
1 1
2C
( n )S ( n )SS
n n
− + −=
+ −
0 t
5%
1.782
�
�
2
C
2
C
(8-1)×11.14285+(6-1)×2S =
8+6-2
S =7.33
Cal
20.5-14T =
7.33 7.33+
8 6
CalT =4.44
![Page 7: Practica dirigida de prueba de hipótesis para la diferencia de dos medias](https://reader031.fdocuments.ec/reader031/viewer/2022012316/54a1858eac7959737b8b46ad/html5/thumbnails/7.jpg)
Estadística Aplicada
Docente:Docente:Docente:Docente: Ing. Ferly Urday Luna Página 7 de 11
Obteniéndose así el siguiente resultado:
Comparación de Medias
---------------------
95.0% intervalo de confianza para la media de Sector M: 20.5 +/- 2.79072
[17.7093,23.2907]
95.0% intervalo de confianza para la media de Sector F: 14.0 +/- 1.48413
[12.5159,15.4841]
95.0% intervalos de confianza para la diferencia de medias:
suponiendo varianzas iguales: 6.5 +/- 3.18651 [3.31349,9.68651]
contrastes t de comparación de medias
Hipótesis nula: media1 = media2
Hipótesis alt.: media1 <> media2
suponiendo varianzas iguales: t = 4.44446 P-Valor = 0.00080058
El StatAdvisor
--------------
Esta opción ejecuta el t-test para comparar las medias de las dos
muestras. También establece los intervalos de confianza o los límites
para cada media y para la diferencia entre las medias. De particular
interés está el intervalo de confianza para la diferencia entre las
medias, el cual se extiende desde 3.31349 hasta 9.68651. Dado que el
intervalo no contiene el valor 0.0, existe diferencia estadísticamente
significativa entre las medias de las dos muestras para un nivel de
confianza del 95.0%.
También puede aplicarse un t-test para probar una hipótesis
específica sobre la diferencia entre las medias de las poblaciones de
las que proceden las dos muestras. En este caso, el test se ha
realizado para determinar si la diferencia entre las dos medias es
igual a 0.0 frente a la hipótesis alternativa en la que la diferencia
no es igual 0.0. Puesto que el p-valor calculado es inferior a 0.05,
podemos rechazar la hipótesis nula en favor de la alternativa.
NOTA: estos resultados asumen la igualdad de varianzas en las dos
muestras. En este caso, esa asunción parece ser razonable teniendo en
cuenta los resultados del F-test para comparar las desviaciones
típicas. Puede ver los resultados de este test seleccionando
Comparación de Desviaciones Típicas del menú Opciones Tabulares.
Se puede observar que el estadístico calculado tCal = 4.44 y que el valor de p = 0.00080058; el que es mucho menor que a, por lo tanto se acepta la hipótesis alternativa.
![Page 8: Practica dirigida de prueba de hipótesis para la diferencia de dos medias](https://reader031.fdocuments.ec/reader031/viewer/2022012316/54a1858eac7959737b8b46ad/html5/thumbnails/8.jpg)
Estadística Aplicada
Docente:Docente:Docente:Docente: Ing. Ferly Urday Luna Página 8 de 11
Cálculos con Excel a) Primero se deben colocar los datos en una hoja de cálculo. b) Activar menú herramientas – Análisis de datos – Prueba t para dos muestras
suponiendo varianzas iguales.
c) Se configura el cuadro de dialogo de la siguiente manera:
d) Obteniéndose los resultados siguientes:
Prueba t para dos muestras suponiendo varianzas iguales
Sector M Sector F
Media 20.5 14
Varianza 11.14285714 2
Observaciones 8 6
Varianza agrupada 7.333333333
Diferencia hipotética de las medias 0
Grados de libertad 12
Estadístico t 4.444462482
P(T<=t) una cola 0.00040029
Valor crítico de t (una cola) 1.782287548
P(T<=t) dos colas 0.000800581
Valor crítico de t (dos colas) 2.178812827
![Page 9: Practica dirigida de prueba de hipótesis para la diferencia de dos medias](https://reader031.fdocuments.ec/reader031/viewer/2022012316/54a1858eac7959737b8b46ad/html5/thumbnails/9.jpg)
Estadística Aplicada
Docente:Docente:Docente:Docente: Ing. Ferly Urday Luna Página 9 de 11
Ejemplo Aplicativo Nro 2 Un corredor de valores de la bolsa de lima estudia los porcentajes de rendimiento de las empresas del sector minero y del sector financiero. Se sabe que las tasas de los rendimientos tienen una distribución normal. Dos muestras aleatorias de las tasas de 8 empresas del sector minero (M) y de 6 empresas del sector financiero (F) han dado los siguientes valores de rendimiento en porcentajes:
Sector M 17 23 25 18 24 20 21 16 Sector F 13 15 14 12 15 14
¿Qué sector empresarial presenta mayor rendimiento? En este segundo ejemplo, lo único que se ha hecho es cambiar la segunda observación del sector financiero de 16 por 15 y con este pequeñísimo cambio, la prueba de igualdad de varianzas da como resultado:
1) H0: 2 2
M Fσ σ=
H1: 2 2
M Fσ σ≠
2) Nivel de significancia: α = 5% 3) Estadística
4) Regla de decisión 6.85, se obtiene leyendo la tabla Fisher del 2.5% con 7 grados de libertad en el numerador y 5 grados de libertad en el denominador. 0.19; se obtiene hallando la inversa del valor de la tabla Fisher de 2.5% con 5 grados de libertad en el numerador y 7 grados de libertad en el denominador. 5) Cálculos Datos del Problema 2
M
2
F
σ = 11.1428
σ = 1.3667
Cal
Cal
11.1428F =
1.3667
F = 8.1533
1 2
2
1
2
2
( r ;r )
SF ~ F
S=
F
2.5%
2.5%
6.85 0.19
10 19
5 29.
.=
![Page 10: Practica dirigida de prueba de hipótesis para la diferencia de dos medias](https://reader031.fdocuments.ec/reader031/viewer/2022012316/54a1858eac7959737b8b46ad/html5/thumbnails/10.jpg)
Estadística Aplicada
Docente:Docente:Docente:Docente: Ing. Ferly Urday Luna Página 10 de 11
6) Decisión
Dado que el FCal = 8.15 ∉ RA, aceptamos H1 y rechazamos H0, por lo tanto
podemos concluir que las varianzas poblacionales del sector minero y financiero son diferentes.
Se deja al alumno el desarrollo de este ejercicio con el software respectivo.
Prueba de hipótesis para la diferencia de medias, con varianzas desiguales
1) H0: µM = µF
H1: µM ≠ µF
2) α = 5% 3) Estadística.
Dado que las varianzas poblacionales resultaron ser desiguales, se utiliza:
4) Regla de decisión
5) Cálculos
Sector Minero Sector Financiero
Media Aritmética 20.5 13.8333 Varianza Muestral 11.14285714 1.3667
Tamaño de muestra 8 6
r ≈ 9
6) Decisión
Dado que TCal = 5.24 ∉ R.A., aceptamos H1 y rechazamos H0, por lo tanto los rendimientos medios en las empresas del sector minero no son iguales a los de las empresas del sector financiero.
0 t
2.5% 2.5%
-2.262 2.262
Cal
20.5-13.83T =
11.1429 1.3667+
8 6
CalT =5.24
� �
1 2
2 2
1 2
1 2
X XT t( r )
S S
n n
−=
+
∼� �
� �
22 2
1 2
1 2
2 22 2
1 2
1 2
1 21 1
S S
n nr
S Sn n
n n
+ =
+
− −
r, representa
el número
de grados de
libertad
( ) ( )
2
2 2
11.1429 1.3667+
8 6r= =9.1347
1.3611.148 6+
8-1 6-1
![Page 11: Practica dirigida de prueba de hipótesis para la diferencia de dos medias](https://reader031.fdocuments.ec/reader031/viewer/2022012316/54a1858eac7959737b8b46ad/html5/thumbnails/11.jpg)
Estadística Aplicada
Docente:Docente:Docente:Docente: Ing. Ferly Urday Luna Página 11 de 11
Calculo con Excel
a) Primero se deben colocar los datos en una hoja de cálculo. b) Activar menú herramientas – Análisis de datos – Prueba t para dos muestras
suponiendo varianzas desiguales.
c) Configurar el cuadro de dialogo
d) Finalmente los resultados son:
Prueba t para dos muestras suponiendo varianzas desiguales
Sector M Sector F
Media 20.5 13.83333333
Varianza 11.14285714 1.366666667
Observaciones 8 6
Diferencia hipotética de las medias 0
Grados de libertad 9
Estadístico t 5.236801889
P(T<=t) una cola 0.000268521
Valor crítico de t (una cola) 1.833112923
P(T<=t) dos colas 0.000537042
Valor crítico de t (dos colas) 2.262157158
Se deja al alumno el replanteamiento de la prueba de hipótesis.
En esta tabla se
resume todo el
procedimiento y
resultado de la prueba
de hipótesis.