Prueba de hipótesis para la diferencia de medias · Pruebas de hipótesis Hipótesis nula...

Post on 10-Apr-2018

254 views 4 download

Transcript of Prueba de hipótesis para la diferencia de medias · Pruebas de hipótesis Hipótesis nula...

Estadística Técnica

Prueba de hipótesis para la diferencia de medias

Cladera Ojeda, Fernando

Conceptos previos

Inferencia estadística Población Muestra Parámetro Estadístico Hipótesis estadística

Pruebas de hipótesis

Hipótesis nula Hipótesis alternativa Regiones – Valor crítico

De rechazo De aceptación

Errores Tipo I – Nivel de significancia Tipo II - Potencia

Diferencia de medias

Hipótesis nula

Hipótesis alternativa

1−2=01−2=d0

1−201−2d0

1−2≠0

Poblaciones y muestras

Tenemos ahora, dos poblaciones:Población 1 Población 2

Muestra 1 Muestra 2

1 2

12 1

2

x1 x2

s12 s2

2

n1 n2

Posibilidades...

Varianzas poblacionales conocidas Varianzas poblacionales desconocidas

Se suponen iguales Se suponen diferentes

12=2

2

12≠2

2

Varianzas conocidas - TLC

Si X es la media de una muestra aleatoria de tamaño n tomada de una población con media varianza finita , entonces, la forma límite de la distribución

Si es la disttribución normal estándar n(z;0;1).

Z=X−

−n

n∞

2

Por propiedad reproductiva, y aplicando TLC.

Ya que son independientes:

X1 – X2 ~ Normal ( , )

Media

VarianzaX 1−X2

2 =X1

2 X2

2 =1

2

n1

2

2

n2

X1−X 2=X1

−X 2=1−2

X1−X 2X 1−X2

Aplicando TLC, tenemos

Entonces, evaluaremos nuestra hipótesis en función de z y , obtenida mediante la tabla de la distribución normal.

Z=X 1−X2−X1

−X 2

12

n1

2

2

n2

Z=X 1−X2−d0

12

n1

2

2

n2

z

Varianzas desconocidas e iguales

Z=X 1−X2−1−2

2 [ 1n1

1n2 ]

n1−1S12

2

n2−1S22

2

v. a. con

X2

=n−1

T=Z

Vv

T=X1−X 2−1−2

S p 1n1

1n2

S p2=

n1−1S12n2−1S2

2

n1n2−2

Usamos la distribución t-student, con n1+n2-2 gl. A partir de ella, encontramos y comparamos con el valor calculado.

t ,

Varianzas desconocidas diferentes

T=X1−X 2−1−2

S12

n1

S2

2

n2

= s1

2/n1s22 /n2

2

[s12/n1

2/n1−1 ] [s2

2/n2

2/n2−1 ]

¿

Usamos la distribución t-student, v gl. A partir de ella, encontramos y comparamos nuevamente.

t ,

P 6.23 – Apuntes de la Cátedra

Un diseñador de productos está interesado en reducir el tiempo de secado de una pintura. Se prueban dos fórmulas de pintura; la fórmula 1 tiene el contenido químico estándar y la fórmula 2 tiene un nuevo ingrediente secante que tiende a reducir el tiempo de secado. De la experiencia se sabe que la desviación estándar del tiempo de secado es ocho minutos y esta variabilidad inherente no debe verse afectada por a adición del nuevo ingrediente.Se pintan 35 placas con la fórmula 1 y otras 35 con la fórmula 2. Los dos tiempos promedio de secado muestrales son 116 minutos para la fórmula 1 y 112 minutos para la fórmula 2. ¿A qué conclusión puede llegar el diseñador del producto sobre la eficacia delnuevo ingrediente, al nivel de significancia 0,01?

X1 : tiempo de secado de la fórmula 1 X1 ~ Desc( ) X2: tiempo de secado de la fórmula 2 X2 ~ Desc( ) X1 – X2 ~ N( ) x1 = 116 minutos x2 = 112 minutos n1 = n2 = 35 = 0,01

1 ,1=8

2 ,1=8

1−2 ,12 /n12

2/n2

h0 :1−2=0h1 :1−20

Por tabla, observamos que Zc = 2,33

Decidimos entonces aceptar la hipótesis nula. No hay evidencia suficiente como para demostrar que el tiempo de secado disminuye significativamente.

Podemos calcular el valor P, por tabla normal.

Z0=x1−x2

12

n1

2

2

n2

⇒Z 0=116−112

8 135

1

35

=2,09

La verdadera probabilidad de cometer error de tipo 1 es de 0,01831. Es decir, mayor que la aceptable.

Esto valida nuestra conclusión, de que para este nivel de significancia los tiempos de secado no son significativamente diferentes.

P 10 . 24 - Walpole

Cinco muestras de una sustancia ferrosa se usan para determinar si hay una diferencia entre un análisis químico de laboratorio y un análisis de fluorescencia de rayos X del contenido de hierro. Cada muestra se divide en dos submuestras y se aplican los dos tipos de análisis. A continuación, se presentan los datos codificados que muestran los análisis de contenido de hiero:

Suponga que las poblaciones son normales, pruebe con un nivel de significancia de 0,05 si los dos métodos de análisis dan, en promedio, el mismo resultado.

Analysis 1 2 3 4 5X-ray 2.0 2.0 2.3 2.1 2.4

Chemical 2.2 1.9 2.5 2.3 2.4

X1 : Contenido de Fe en muestra analizada con Rx X2: Contenido de Fe en muestra de análisis

químico X1 ~ N( ) X2 ~ N( ) x1 = 2,16 s1 = 0,18165 x2 = 2,26 s2 = 0,23021 n1 = n2 = 5

= 0,05

1 ,1

2 ,2

h0 :2−1=0h1 :2−1≠0

Si las varianzas son iguales

T o=x2−x1

S p 1n1

1n2

=0,1

0,02072/5=0,7624

S p2=

n1−1 s12n2−1 s2

2

n1n2−2=

4.0,0330,0538

=0,043

Ya que T0 < T = 2,306 se opta por no rechazar la hipótesis nula. No hay evidencia significativa de que el contenido promedio de Fe es mayor en un método que en otro.

Si las varianzas son diferentes

T=X2−X 1

S12

n1

S2

2

n2

=0,10

0,01311=0,7624

= s1

2/n1s22 /n2

2

[s12/n1

2/n1−1 ] [s2

2/n2

2/n2−1 ]

≈8

Nuevamente, concluímos no rechazar la hipótesis nula.

Pueden tomarse ambos métodos de análisis indistintamente.

Bibliografía

Walpole, Myers y Myers (1999). Probabilidad y Estadística para Ingenieros. Sexta edición. Ed. Prentice Hall. México.

Apuntes de la cátedra Estadística Técnica (2009). Facultad de Ingeniería. Universidad Nacional de Cuyo.