Practica dirigida de prueba de hipótesis para la diferencia de dos medias

11
Estadística Aplicada Docente: Docente: Docente: Docente: Ing. Ferly Urday Luna Página 1 de 11 Practica dirigida de prueba de hipótesis para la diferencia de dos medias Ejemplo Aplicativo Nro 1 Un corredor de valores de la bolsa de lima estudia los porcentajes de rendimiento de las empresas del sector minero y del sector financiero. Se sabe que las tasas de los rendimientos tienen una distribución normal. Dos muestras aleatorias de las tasas de 8 empresas del sector minero (M) y de 6 empresas del sector financiero (F) han dado los siguientes valores de rendimiento en porcentajes: Sector M 17 23 25 18 24 20 21 16 Sector F 13 16 14 12 15 14 ¿Qué sector empresarial presenta mayor rendimiento? Solución Para resolver este problema se debe cumplir las siguientes condiciones: a) Los datos provengan de poblaciones normales. b) Los datos sean independientes. c) Probar la igualdad de varianzas. d) Probar la igualdad de medias. En este ejemplo vamos a suponer que se cumplen las dos primeras condiciones, y vamos a docimar las dos últimas. Primer paso Prueba de hipótesis para la igualdad de varianzas. Cuando se trata de una prueba de hipótesis para la igualdad de varianzas, se utiliza la distribución F de Fisher-Snedecor. 1) H 0 : 2 2 M F σ σ = H 1 : 2 2 M F σ σ 2) Nivel de significancia: α = 5% 3) Estadística 4) Regla de decisión 6.85, se obtiene leyendo la tabla Fisher del 2.5% con 7 grados de libertad en el numerador y 5 grados de libertad en el denominador. 0.19; se obtiene hallando la inversa del valor de la tabla Fisher de 2.5% con 5 grados de libertad en el numerador y 7 grados de libertad en el denominador. 1 2 2 1 2 2 ( r ;r ) S F ~F S = F 2.5% 2.5% 6.85 0.19 1 0 19 5 29 . . =

Transcript of Practica dirigida de prueba de hipótesis para la diferencia de dos medias

Page 1: Practica dirigida de prueba de hipótesis para la diferencia de dos medias

Estadística Aplicada

Docente:Docente:Docente:Docente: Ing. Ferly Urday Luna Página 1 de 11

Practica dirigida de prueba de hipótesis para la diferencia de dos medias Ejemplo Aplicativo Nro 1 Un corredor de valores de la bolsa de lima estudia los porcentajes de rendimiento de las empresas del sector minero y del sector financiero. Se sabe que las tasas de los rendimientos tienen una distribución normal. Dos muestras aleatorias de las tasas de 8 empresas del sector minero (M) y de 6 empresas del sector financiero (F) han dado los siguientes valores de rendimiento en porcentajes:

Sector M 17 23 25 18 24 20 21 16 Sector F 13 16 14 12 15 14

¿Qué sector empresarial presenta mayor rendimiento? Solución Para resolver este problema se debe cumplir las siguientes condiciones:

a) Los datos provengan de poblaciones normales. b) Los datos sean independientes. c) Probar la igualdad de varianzas. d) Probar la igualdad de medias.

En este ejemplo vamos a suponer que se cumplen las dos primeras condiciones, y vamos a docimar las dos últimas. Primer paso Prueba de hipótesis para la igualdad de varianzas. Cuando se trata de una prueba de hipótesis para la igualdad de varianzas, se utiliza la distribución F de Fisher-Snedecor.

1) H0: 2 2

M Fσ σ=

H1: 2 2

M Fσ σ≠

2) Nivel de significancia: α = 5% 3) Estadística

4) Regla de decisión 6.85, se obtiene leyendo la tabla Fisher del 2.5% con 7 grados de libertad en el numerador y 5 grados de libertad en el denominador. 0.19; se obtiene hallando la inversa del valor de la tabla Fisher de 2.5% con 5 grados de libertad en el numerador y 7 grados de libertad en el denominador.

1 2

2

1

2

2

( r ;r )

SF ~ F

S=

F

2.5%

2.5%

6.85 0.19

10 19

5 29.

.=

Page 2: Practica dirigida de prueba de hipótesis para la diferencia de dos medias

Estadística Aplicada

Docente:Docente:Docente:Docente: Ing. Ferly Urday Luna Página 2 de 11

5) Cálculos Datos del Problema 2

M

2

F

σ = 11.1428

σ = 2

Cal

Cal

11.1428F =

2

F = 5.57

6) Decisión

Dado que el FCal = 5.57 ∈ RA, aceptamos H0 y rechazamos H1, por lo tanto

podemos concluir que las varianzas poblacionales del sector minero y financiero son iguales.

Cálculos con Statgraphics

a) Una vez introducidos los valores de las variables, se procede a ejecutar menú comparación – Dos muestras – Comparación de dos muestras, luego se seleccionan las respectivas muestras en el cuadro de dialogo y se acepta, ver los pasos para este procedimiento:

Se introducen los

valores de las

variables

Se configura el cuadro

de la siguiente manera

y se presiona aceptar

Page 3: Practica dirigida de prueba de hipótesis para la diferencia de dos medias

Estadística Aplicada

Docente:Docente:Docente:Docente: Ing. Ferly Urday Luna Página 3 de 11

b) Luego se presiona el botón , y se activa la siguiente opción:

c) Finalmente se analiza el resultado:

Comparación de Desviaciones Típicas

-----------------------------------

Sector M Sector F

------------------------------------------------------------

Desviación Típica 3.33809 1.41421

Varianza 11.1429 2.0

GL 7 5

Cociente de varianzas = 5.57143

95.0% Intervalos de Confianza

Desviación Típica deSector M: [2.20706;6.79393]

Desviación Típica deSector F: [0.882763;3.46852]

Cociente de varianzas: [0.812978;29.4463]

Contrastes F para comparar varianzas

Hipótesis nula: sigma1 = sigma2

(1) Hipótesis alt.: sigma1 <> sigma2

F = 5.57143 P-Valor = 0.0766501

El StatAdvisor

--------------

Esta opción ejecuta un F-test para comparar las varianzas de las

dos muestras. También establece los intervalos de confianza o los

límites para cada desviación típica y para el ratio de varianzas. De

particular interés está el intervalo de confianza para el ratio de las

varianzas, el cual se extiende desde 0.812978 hasta 29.4463. Dado que

el intervalo contiene el valor 1.0, no existe diferencia

estadísticamente significativa entre las desviaciones típicas de las

dos muestras para un nivel de confianza del 95.0%.

También puede utilizarse un F-test para probar una hipótesis

específica sobre las desviaciones típicas de las poblaciones de las

que proceden las dos muestras. En este caso, el test se ha realizado

para determinar si el ratio de las desviaciones típicas son iguales

1.0 frente a la hipótesis alternativa en la que el ratio no es igual

1.0. Puesto que el p-valor calculado no es inferior a 0.05, no

podemos rechazar la hipótesis nula.

NOTA IMPORTANTE: los F-test y los intervalos de confianza mostrados

dependen de que las muestras procedan de distribuciones normales.

Para comprobar esta asunción, seleccione Resumen Estadístico de la

lista de Opciones Tabulares y observe los valores de asimetría

estandarizada y curtosis estandarizada.

Lo mas importante aquí, es observar el valor de p = 7.67% > α = 5%, lo que indica que se acepta la hipótesis nula.

Page 4: Practica dirigida de prueba de hipótesis para la diferencia de dos medias

Estadística Aplicada

Docente:Docente:Docente:Docente: Ing. Ferly Urday Luna Página 4 de 11

Cálculos con Excel a) Primero se deben colocar los datos en una hoja de cálculo. b) Activar menú herramientas – Análisis de datos – Prueba F para varianzas de

dos muestras

c) Se configura el cuadro de dialogo de la siguiente manera: Obsérvese que el valor de a ha sido colocado dividido entre 2, esto por que en el Excel, para esta prueba, siempre se considera solo uno de los lados, ya sea el izquierdo o el derecho, esto según cual de las dos muestras tenga mayor o menor varianza

d) Obteniéndose los siguientes resultados:

Prueba F para varianzas de dos muestras

Sector M Sector F

Media 20.5 14

Varianza 11.14285714 2

Observaciones 8 6

Grados de libertad 7 5

F 5.571428571

P(F<=f) una cola 0.038324609

Valor crítico para F (una cola) 6.853075629

e) Finalmente se analizan los resultados.

Observen que el valor F es menor que el Valor critico para F (una cola), y que para hallar el valor de p, hay que multiplicar por 2 el valor “P(F<=f) una cola” Por todo lo anterior, aceptamos H0 y rechamos H1. Si se tratase de una prueba con una sola cola, entonces los valores se leerían directamente, sin hacer ningún cambio

Page 5: Practica dirigida de prueba de hipótesis para la diferencia de dos medias

Estadística Aplicada

Docente:Docente:Docente:Docente: Ing. Ferly Urday Luna Página 5 de 11

Segundo Paso Con la Prueba anterior se ha demostrado que las varianzas poblacionales son iguales, pero desconocidas, entonces ahora se procede a elaborar una prueba de hipótesis para la diferencia de medias. Prueba de hipótesis para la diferencia de medias, con varianzas iguales

1) H0: µM = µF

H1: µM ≠ µF

2) α = 5% 3) Estadística.

Dado que las varianzas poblacionales resultaron ser iguales, se utiliza:

4) Regla de decisión

5) Cálculos

Sector Minero Sector Financiero

Media Aritmética 20.5 14 Varianza Muestral 11.14285714 2

Tamaño de muestra 8 6

6) Decisión

Dado que TCal = 4.44 ∉ R.A., aceptamos H1 y rechazamos H0, por lo tanto los rendimientos medios en las empresas del sector minero no son iguales a los de las empresas del sector financiero.

Hasta este momento solo podemos decir que los rendimientos medios son diferentes pero no sabemos en que sectores son mayores, para ello hacemos un replanteamiento de las hipótesis. Para este replanteamiento se observa el signo del estadístico TCal dado que este es positivo, hay un fuerte indicio que el rendimiento en las empresas del sector minero sea mayor al de las empresas del sector financiero.

� �

1 2

1 22 2

1 2

2

C C

X XT t( n n )

S S

n n

−= + −

+

∼ �2 2

21 1 2 2

1 2

1 1

2C

( n )S ( n )SS

n n

− + −=

+ −

0 t

2.5% 2.5%

-2.179 2.179

2

C

2

C

(8-1)×11.14285+(6-1)×2S =

8+6-2

S =7.33

Cal

20.5-14T =

7.33 7.33+

8 6

CalT =4.44

Page 6: Practica dirigida de prueba de hipótesis para la diferencia de dos medias

Estadística Aplicada

Docente:Docente:Docente:Docente: Ing. Ferly Urday Luna Página 6 de 11

Replanteando

1) H0: µM ≤ µF

H1: µM > µF

2) α = 5% 3) Estadística.

Dado que las varianzas poblacionales resultaron ser iguales, se utiliza:

4) Regla de decisión

5) Cálculos

Sector Minero Sector Financiero

Media Aritmética 20.5 14 Varianza Muestral 11.14285714 2

Tamaño de muestra 8 6

6) Decisión

Dado que TCal = 4.44 ∉ R.A., aceptamos H1 y rechazamos H0, por lo tanto el rendimiento promedio de las empresas del sector minero son mayores al rendimiento medio de las empresas del sector financiero.

Cálculos con Statgraphics Con el Statgraphics, se sigue el mismo procedimiento que para la prueba de hipótesis

para las varianzas, con la unica salvedad que al presionar el botón , se deb escoger la siguiente opción:

� �

1 2

1 22 2

1 2

2

C C

X XT t( n n )

S S

n n

−= + −

+

∼ �2 2

21 1 2 2

1 2

1 1

2C

( n )S ( n )SS

n n

− + −=

+ −

0 t

5%

1.782

2

C

2

C

(8-1)×11.14285+(6-1)×2S =

8+6-2

S =7.33

Cal

20.5-14T =

7.33 7.33+

8 6

CalT =4.44

Page 7: Practica dirigida de prueba de hipótesis para la diferencia de dos medias

Estadística Aplicada

Docente:Docente:Docente:Docente: Ing. Ferly Urday Luna Página 7 de 11

Obteniéndose así el siguiente resultado:

Comparación de Medias

---------------------

95.0% intervalo de confianza para la media de Sector M: 20.5 +/- 2.79072

[17.7093,23.2907]

95.0% intervalo de confianza para la media de Sector F: 14.0 +/- 1.48413

[12.5159,15.4841]

95.0% intervalos de confianza para la diferencia de medias:

suponiendo varianzas iguales: 6.5 +/- 3.18651 [3.31349,9.68651]

contrastes t de comparación de medias

Hipótesis nula: media1 = media2

Hipótesis alt.: media1 <> media2

suponiendo varianzas iguales: t = 4.44446 P-Valor = 0.00080058

El StatAdvisor

--------------

Esta opción ejecuta el t-test para comparar las medias de las dos

muestras. También establece los intervalos de confianza o los límites

para cada media y para la diferencia entre las medias. De particular

interés está el intervalo de confianza para la diferencia entre las

medias, el cual se extiende desde 3.31349 hasta 9.68651. Dado que el

intervalo no contiene el valor 0.0, existe diferencia estadísticamente

significativa entre las medias de las dos muestras para un nivel de

confianza del 95.0%.

También puede aplicarse un t-test para probar una hipótesis

específica sobre la diferencia entre las medias de las poblaciones de

las que proceden las dos muestras. En este caso, el test se ha

realizado para determinar si la diferencia entre las dos medias es

igual a 0.0 frente a la hipótesis alternativa en la que la diferencia

no es igual 0.0. Puesto que el p-valor calculado es inferior a 0.05,

podemos rechazar la hipótesis nula en favor de la alternativa.

NOTA: estos resultados asumen la igualdad de varianzas en las dos

muestras. En este caso, esa asunción parece ser razonable teniendo en

cuenta los resultados del F-test para comparar las desviaciones

típicas. Puede ver los resultados de este test seleccionando

Comparación de Desviaciones Típicas del menú Opciones Tabulares.

Se puede observar que el estadístico calculado tCal = 4.44 y que el valor de p = 0.00080058; el que es mucho menor que a, por lo tanto se acepta la hipótesis alternativa.

Page 8: Practica dirigida de prueba de hipótesis para la diferencia de dos medias

Estadística Aplicada

Docente:Docente:Docente:Docente: Ing. Ferly Urday Luna Página 8 de 11

Cálculos con Excel a) Primero se deben colocar los datos en una hoja de cálculo. b) Activar menú herramientas – Análisis de datos – Prueba t para dos muestras

suponiendo varianzas iguales.

c) Se configura el cuadro de dialogo de la siguiente manera:

d) Obteniéndose los resultados siguientes:

Prueba t para dos muestras suponiendo varianzas iguales

Sector M Sector F

Media 20.5 14

Varianza 11.14285714 2

Observaciones 8 6

Varianza agrupada 7.333333333

Diferencia hipotética de las medias 0

Grados de libertad 12

Estadístico t 4.444462482

P(T<=t) una cola 0.00040029

Valor crítico de t (una cola) 1.782287548

P(T<=t) dos colas 0.000800581

Valor crítico de t (dos colas) 2.178812827

Page 9: Practica dirigida de prueba de hipótesis para la diferencia de dos medias

Estadística Aplicada

Docente:Docente:Docente:Docente: Ing. Ferly Urday Luna Página 9 de 11

Ejemplo Aplicativo Nro 2 Un corredor de valores de la bolsa de lima estudia los porcentajes de rendimiento de las empresas del sector minero y del sector financiero. Se sabe que las tasas de los rendimientos tienen una distribución normal. Dos muestras aleatorias de las tasas de 8 empresas del sector minero (M) y de 6 empresas del sector financiero (F) han dado los siguientes valores de rendimiento en porcentajes:

Sector M 17 23 25 18 24 20 21 16 Sector F 13 15 14 12 15 14

¿Qué sector empresarial presenta mayor rendimiento? En este segundo ejemplo, lo único que se ha hecho es cambiar la segunda observación del sector financiero de 16 por 15 y con este pequeñísimo cambio, la prueba de igualdad de varianzas da como resultado:

1) H0: 2 2

M Fσ σ=

H1: 2 2

M Fσ σ≠

2) Nivel de significancia: α = 5% 3) Estadística

4) Regla de decisión 6.85, se obtiene leyendo la tabla Fisher del 2.5% con 7 grados de libertad en el numerador y 5 grados de libertad en el denominador. 0.19; se obtiene hallando la inversa del valor de la tabla Fisher de 2.5% con 5 grados de libertad en el numerador y 7 grados de libertad en el denominador. 5) Cálculos Datos del Problema 2

M

2

F

σ = 11.1428

σ = 1.3667

Cal

Cal

11.1428F =

1.3667

F = 8.1533

1 2

2

1

2

2

( r ;r )

SF ~ F

S=

F

2.5%

2.5%

6.85 0.19

10 19

5 29.

.=

Page 10: Practica dirigida de prueba de hipótesis para la diferencia de dos medias

Estadística Aplicada

Docente:Docente:Docente:Docente: Ing. Ferly Urday Luna Página 10 de 11

6) Decisión

Dado que el FCal = 8.15 ∉ RA, aceptamos H1 y rechazamos H0, por lo tanto

podemos concluir que las varianzas poblacionales del sector minero y financiero son diferentes.

Se deja al alumno el desarrollo de este ejercicio con el software respectivo.

Prueba de hipótesis para la diferencia de medias, con varianzas desiguales

1) H0: µM = µF

H1: µM ≠ µF

2) α = 5% 3) Estadística.

Dado que las varianzas poblacionales resultaron ser desiguales, se utiliza:

4) Regla de decisión

5) Cálculos

Sector Minero Sector Financiero

Media Aritmética 20.5 13.8333 Varianza Muestral 11.14285714 1.3667

Tamaño de muestra 8 6

r ≈ 9

6) Decisión

Dado que TCal = 5.24 ∉ R.A., aceptamos H1 y rechazamos H0, por lo tanto los rendimientos medios en las empresas del sector minero no son iguales a los de las empresas del sector financiero.

0 t

2.5% 2.5%

-2.262 2.262

Cal

20.5-13.83T =

11.1429 1.3667+

8 6

CalT =5.24

� �

1 2

2 2

1 2

1 2

X XT t( r )

S S

n n

−=

+

∼� �

� �

22 2

1 2

1 2

2 22 2

1 2

1 2

1 21 1

S S

n nr

S Sn n

n n

+ =

+

− −

r, representa

el número

de grados de

libertad

( ) ( )

2

2 2

11.1429 1.3667+

8 6r= =9.1347

1.3611.148 6+

8-1 6-1

Page 11: Practica dirigida de prueba de hipótesis para la diferencia de dos medias

Estadística Aplicada

Docente:Docente:Docente:Docente: Ing. Ferly Urday Luna Página 11 de 11

Calculo con Excel

a) Primero se deben colocar los datos en una hoja de cálculo. b) Activar menú herramientas – Análisis de datos – Prueba t para dos muestras

suponiendo varianzas desiguales.

c) Configurar el cuadro de dialogo

d) Finalmente los resultados son:

Prueba t para dos muestras suponiendo varianzas desiguales

Sector M Sector F

Media 20.5 13.83333333

Varianza 11.14285714 1.366666667

Observaciones 8 6

Diferencia hipotética de las medias 0

Grados de libertad 9

Estadístico t 5.236801889

P(T<=t) una cola 0.000268521

Valor crítico de t (una cola) 1.833112923

P(T<=t) dos colas 0.000537042

Valor crítico de t (dos colas) 2.262157158

Se deja al alumno el replanteamiento de la prueba de hipótesis.

En esta tabla se

resume todo el

procedimiento y

resultado de la prueba

de hipótesis.