Pruebas de hipótesis - campusvirtual.univalle.edu.co · una prueba sobre la calidad del maíz con...

24
1

Transcript of Pruebas de hipótesis - campusvirtual.univalle.edu.co · una prueba sobre la calidad del maíz con...

Page 1: Pruebas de hipótesis - campusvirtual.univalle.edu.co · una prueba sobre la calidad del maíz con alto contenido de lisina destinado al pienso animal, un grupo experimental de 20

Pruebas de hipótesis

Comparación de 2 muestras

Álvaro José Flórez

1Escuela de Ingeniería Industrial y Estadística

Facultad de Ingenierías

Febrero - Junio 2012

Page 2: Pruebas de hipótesis - campusvirtual.univalle.edu.co · una prueba sobre la calidad del maíz con alto contenido de lisina destinado al pienso animal, un grupo experimental de 20

Comparación de medias

La comparación de dos poblaciones o de dos tratamientos es unasituación común en la estadística aplicada.

• Se toman muestras aleatorias de dos poblaciones diferentes.

• Se divide un conjunto de individuos al azar y se exponen a dostratamientos diferentes.

El objetivo es la comparación de las respuestas de los dostratamientos o la comparación de las características de dospoblaciones.

Page 3: Pruebas de hipótesis - campusvirtual.univalle.edu.co · una prueba sobre la calidad del maíz con alto contenido de lisina destinado al pienso animal, un grupo experimental de 20

Comparación de medias

El maíz común no tiene la cantidad de lisina que necesitan losanimales en su pienso. Unos cientí�cos han desarrollado ciertasvariedades de maíz que contienen una mayor cantidad de lisina. Enuna prueba sobre la calidad del maíz con alto contenido de lisinadestinado al pienso animal, un grupo experimental de 20 pollos deun día de edad empezó a recibir una ración que contenía el nuevomaíz. Un grupo control de otros 20 pollos recibió una ración que eraidéntica a la anterior, con la excepción de que contenía maíz normal.Luego de 21 días se obtuvo la ganancia de peso (en gramos) de lospollos.

Page 4: Pruebas de hipótesis - campusvirtual.univalle.edu.co · una prueba sobre la calidad del maíz con alto contenido de lisina destinado al pienso animal, un grupo experimental de 20

Comparación de medias

Para realizar una prueba de diferencias de medias se debe cumplirque:

• Dos muestras aleatorias de dos poblaciones distintas.

• Las muestras son independientes (una muestra no tieneninguna in�uencia sobre la otra)

• Las dos poblaciones tienen distribuciones normales

Page 5: Pruebas de hipótesis - campusvirtual.univalle.edu.co · una prueba sobre la calidad del maíz con alto contenido de lisina destinado al pienso animal, un grupo experimental de 20

Prueba de hipótesis para comparación de

medias

Sea x1, x2, . . . , xnx y y1, y2, . . . , yny dos muestras aleatoriasindependientes, no necesariamente del mismo tamaño, de dospoblaciones normales con medias µx y µy respectivamente. Si setiene que H0 : µx − µy = D

Si se conocen las varianzas (σ2x y σ2

y) entonces

z =(x− y)−D√σx/nx + σy/ny

∼ N(0, 1)

Page 6: Pruebas de hipótesis - campusvirtual.univalle.edu.co · una prueba sobre la calidad del maíz con alto contenido de lisina destinado al pienso animal, un grupo experimental de 20

Prueba de hipótesis para comparación de

medias

Sea x1, x2, . . . , xnx y y1, y2, . . . , yny dos muestras aleatoriasindependientes, no necesariamente del mismo tamaño, de dospoblaciones normales con medias µx y µy respectivamente. Si setiene que H0 : µx − µy = D

Si se conocen desconocen las varianzas pero se consideran iguales (σ2x =

σ2y) entonces:

t =(x− y)−DSp√

1nx

+ 1ny

∼ t(nx + ny − 2)

Donde:

Sp =

√(nx − 1)S2

x + (ny − 1)S2y

nx + ny − 2

Page 7: Pruebas de hipótesis - campusvirtual.univalle.edu.co · una prueba sobre la calidad del maíz con alto contenido de lisina destinado al pienso animal, un grupo experimental de 20

Prueba de hipótesis para comparación de

medias

Sea x1, x2, . . . , xnx y y1, y2, . . . , yny dos muestras aleatoriasindependientes, no necesariamente del mismo tamaño, de dospoblaciones normales con medias µx y µy respectivamente. Si setiene que H0 : µx − µy = D

Si se conocen desconocen las varianzas y se consideran diferentes (σ2x 6=

σ2y) entonces:

t =(x− y)−D√

S2x

nx+

S2y

ny

∼ t(v)

Donde:

v ≈

(S2x

nx+

S2y

ny

)2(S2

x/nx)2

nx−1 +(S2

y/ny)2

ny−1

Page 8: Pruebas de hipótesis - campusvirtual.univalle.edu.co · una prueba sobre la calidad del maíz con alto contenido de lisina destinado al pienso animal, un grupo experimental de 20

Prueba de hipótesis para comparación de

mediasSi:

H0 : µx − µy = D µx − µy < D

Entonces se rechaza H0 si z < zα (varianzas conocidas), t < t(nx+ny−2,α)

(varianzas desconocidas pero iguales) o t < t(v,α) (varianzas desconocidas)

Si:H0 : µx − µy = D µx − µy > D

Entonces se rechaza H0 si z > z1−α (varianzas conocidas), t >t(nx+ny−2,1−α) (varianzas desconocidas pero iguales) o t > t(v,1−α)(varianzas desconocidas)

Si:H0 : µx − µy = D µx − µy 6= D

Entonces se rechaza H0 si |z| > z1−α/2 (varianzas conocidas), |t| >t(nx+ny−2,1−α/2) (varianzas desconocidas pero iguales) o |t| > t(v,1−α/2)(varianzas desconocidas)

Page 9: Pruebas de hipótesis - campusvirtual.univalle.edu.co · una prueba sobre la calidad del maíz con alto contenido de lisina destinado al pienso animal, un grupo experimental de 20

Ejemplo

Un grupo experimental de 20 pollos de un día de edad empezó arecibir una ración que contenía el nuevo maíz. Un grupo control deotros 20 pollos recibió una ración que era idéntica a la anterior, con laexcepción de que contenía maíz normal. Luego de 21 días se obtuvola ganancia de peso (en gramos) de los pollosPara el Grupo Control:

x = 366,95 y S2x = 2488,24

Para el Grupo Experimental:

y = 402,95 y S2y = 1825,734

¾Hay evidencia su�ciente para determinar que con el nuevo

maíz se obtienen mejores resultados?

Page 10: Pruebas de hipótesis - campusvirtual.univalle.edu.co · una prueba sobre la calidad del maíz con alto contenido de lisina destinado al pienso animal, un grupo experimental de 20

Ejemplo

Se quiere comparar dos institutos de capacitación en término decali�cación obtenida por sus respectivos alumnos. Se tomó unamuestra aleatoria alumnos para cada instituto y se observó que lascali�caciones (sobre 100 puntos) para 15 alumnos del centro A tienenun promedio de 81.06 y una desviación estándar de 8.27, mientrasque en la muestra de la institución B se encontró que en una muestraaleatoria de 13 estudiantes el promedio fue de 75.23 y la desviaciónestándar de 8.55.

En particular se está interesado en determinar si hay diferencias enlas cali�caciones de ambos institutos, ¾La muestras encontradas danevidencia para determinar que las medias son diferentes?

Page 11: Pruebas de hipótesis - campusvirtual.univalle.edu.co · una prueba sobre la calidad del maíz con alto contenido de lisina destinado al pienso animal, un grupo experimental de 20

Generalidades en caso de comparación

La recogida de datos debe hacerse de forma que el único factor quein�uya de forma distinta en ambas muestras sea aquel cuyo efectose desea estudiar.

X Asegurarse de que todos los factores que puedan tener algunain�uencia en la respuesta, in�uya exactamente igual en las dosmuestras (excepto aquel cuyo efecto se desea estudiar)

X Aleatorizar todo lo que se pueda para protegerse de posiblessesgos introducidos por factores no identi�cados

También deben cumplirse los supuesto de normalidad de las dospoblaciones, poblaciones independientes y que las muestras seanaleatorias (representativas)

Page 12: Pruebas de hipótesis - campusvirtual.univalle.edu.co · una prueba sobre la calidad del maíz con alto contenido de lisina destinado al pienso animal, un grupo experimental de 20

Prueba de hipótesis para comparación de

varianzas

Sea x1, x2, . . . , xnx y y1, y2, . . . , yny dos muestras aleatoriasindependientes, no necesariamente del mismo tamaño, de dospoblaciones normales con medias µx y µy, y varianzas σ2x y µyrespectivamente.

Si se tiene que H0 : σ2x/σ2y = D

F = DS2x/S

2y ∼ F(nx−1,ny−1)

Page 13: Pruebas de hipótesis - campusvirtual.univalle.edu.co · una prueba sobre la calidad del maíz con alto contenido de lisina destinado al pienso animal, un grupo experimental de 20

Prueba de hipótesis para comparación de

varianzas

Si:H0 : σ2

x/σ2y = D H1 : σ2

x/σ2y < D

Entonces se rechaza H0 si F < F(nx−1,ny−1,α)

Si:H0 : σ2

x/σ2y = D H1 : σ2

x/σ2y > D

Entonces se rechaza H0 si F > F(nx−1,ny−1,1−α)

Si:H0 : σ2

x/σ2y = D H1 : σ2

x/σ2y 6= D

Entonces se rechaza H0 si F < F(nx−1,ny−1,α/2) o F >F(nx−1,ny−1,1−α/2)

Page 14: Pruebas de hipótesis - campusvirtual.univalle.edu.co · una prueba sobre la calidad del maíz con alto contenido de lisina destinado al pienso animal, un grupo experimental de 20

Ejemplo

Una compañia utiliza dos máquinas (A y B) para producir cojinetespara ensambles de volantes para vehículos. Para la compañiaes primordial que el diámetro de estos cojinetes no varíe enforma signi�cativa de las especi�caciones en más de 0.3 pulgadas.El encargado de la producción cree que una de las máquinasestá produciendo cojinetes que presentan mayor dispersión que laespeci�cada y decide hacer una pruebas para comparar las dosmáquinas.

Elije una muestra aleatoria de 25 cojinetes del lote de producción de lamáquina A y 23 de la máquina B y observa que la desviación estándarde la máquina A es de 0.002 pulgadas y de B una desviación de 0.0015pulgadas. Realice una prueba de hipótesis para determinar si haydiferencias signi�cativas en los diámetros de los cojinetes producidospor las dos máquinas.

Page 15: Pruebas de hipótesis - campusvirtual.univalle.edu.co · una prueba sobre la calidad del maíz con alto contenido de lisina destinado al pienso animal, un grupo experimental de 20

Comparación de proporciones

Si se tienen dos muestras aleatorias independientes de tamaño n1 yn2 de dos poblaciones, y se observa la proporción de observacionesque pertenecen a una clase de interés (p1 = X1/n1 y p2 =X2/n2) respectivamente. Suponiendo que las proporciones tienenuna distribución aproximadamente normal.

Si se tiene que H0 : p1 = p2

Z =(p1 − p2)√

p(1− p)(

1n1

+ 1n2

) ∼ N(0, 1)

Donde p = X1+X2n1+n2

Page 16: Pruebas de hipótesis - campusvirtual.univalle.edu.co · una prueba sobre la calidad del maíz con alto contenido de lisina destinado al pienso animal, un grupo experimental de 20

Prueba de hipótesis para comparación de

proporciones

Si:H0 : p1 = p2 H1 : p1 < p2

Entonces se rechaza H0 si Z < Zα

Si:H0 : p1 = p2 H1 : p1 > p2

Entonces se rechaza H0 si Z > Z1−α

Si:H0 : p1 = p2 H1 : p1 6= p2

Entonces se rechaza H0 si |Z| > Z1−α/2

Page 17: Pruebas de hipótesis - campusvirtual.univalle.edu.co · una prueba sobre la calidad del maíz con alto contenido de lisina destinado al pienso animal, un grupo experimental de 20

Prueba de hipótesis para comparación de

proporciones

Un artículo del New York Times en 1987 reportó que se puede reducirel riesgo de sufrir ataques al corazón ingiriendo aspirina. Para llegar aesta conclusión el cronista se basó en los resultados de un experimentodiseñado, en donde participaron dos grupos de personas. A un grupo de11.034 personas se le suministró una dosis diaria de una pastilla que nocontenía ninguna droga (placebo), y de estos 189 sufrieron posteriormenteataques al corazón, mientras que al otro grupo de 11037 se les suministrouna aspirina, y sólo 104 lo sufrieron.

Usando una prueba de hipótesis y un nivel de signi�cancia del 1%,¾considera que el cronista del New York Times estaba en lo correcto?

Page 18: Pruebas de hipótesis - campusvirtual.univalle.edu.co · una prueba sobre la calidad del maíz con alto contenido de lisina destinado al pienso animal, un grupo experimental de 20

Ejemplo

Se dice que escuchar a Mozart mejora los resultados de las pruebas realizadas porestudiantes. Es posible que los buenos olores tengan el mismo efecto. Para probaresta idea, 21 sujetos tuvieron que pasar una prueba que consistía en marcar conun lápiz la trayectoria a seguir para salir de un laberinto mientras llevaban puestauna mascarilla. Las mascarilla era inodora o bien contenía una esencia �oral. Lavariable respuesta es le tiempo medio en tres ensayos. Cada sujeto tenía quepasar la prueba con cada una de las mascarillas 1

Sujeto Sin esencia Con esencia

1 30.6 37.972 48.43 51.57...

......

20 47.37 53.6321 53.67 47

11A. R. Hirsch, L.H. Johnston, Odors and learning (1996)

Page 19: Pruebas de hipótesis - campusvirtual.univalle.edu.co · una prueba sobre la calidad del maíz con alto contenido de lisina destinado al pienso animal, un grupo experimental de 20

Ejemplo

Se dice que escuchar a Mozart mejora los resultados de las pruebas realizadas porestudiantes. Es posible que los buenos olores tengan el mismo efecto. Para probaresta idea, 21 sujetos tuvieron que pasar una prueba que consistía en marcar conun lápiz la trayectoria a seguir para salir de un laberinto mientras llevaban puestauna mascarilla. Las mascarilla era inodora o bien contenía una esencia �oral. Lavariable respuesta es le tiempo medio en tres ensayos. Cada sujeto tenía quepasar la prueba con cada una de las mascarillas 1

Sujeto Sin esencia Con esencia

1 30.6 37.972 48.43 51.57...

......

20 47.37 53.6321 53.67 47

¾Las muestras son

independientes?

11A. R. Hirsch, L.H. Johnston, Odors and learning (1996)

Page 20: Pruebas de hipótesis - campusvirtual.univalle.edu.co · una prueba sobre la calidad del maíz con alto contenido de lisina destinado al pienso animal, un grupo experimental de 20

Prueba t para diseños por pares

Un diseño experimental bastante frecuente utiliza los procedimientos t deuna muestra para comparar dos tratamientos. En un diseño por pares,un mismo sujeto recibe ambos tratamientos (por ejemplo, antes (X1)y después(X2)).Para comparar las respuesta de dos tratamientos en undiseño por pares, aplica los procedimientos t de una muestra a lasdiferencias observadas (D = X1 −X2).

Se desea valorar si el perfume �oral mejora los resultados de formasigni�cativa.

H0 : µD = 0 µD > 0

A partir de los resultados se observó que:

D = 0,9567 SD = 12,5479 n = 21

Page 21: Pruebas de hipótesis - campusvirtual.univalle.edu.co · una prueba sobre la calidad del maíz con alto contenido de lisina destinado al pienso animal, un grupo experimental de 20

Prueba t para diseños por pares

Un diseño experimental bastante frecuente utiliza los procedimientos t deuna muestra para comparar dos tratamientos. En un diseño por pares,un mismo sujeto recibe ambos tratamientos (por ejemplo, antes (X1)y después(X2)).Para comparar las respuesta de dos tratamientos en undiseño por pares, aplica los procedimientos t de una muestra a lasdiferencias observadas (D = X1 −X2).

Se desea valorar si el perfume �oral mejora los resultados de formasigni�cativa.

H0 : µD = 0 µD > 0

A partir de los resultados se observó que:

D = 0,9567 SD = 12,5479 n = 21

Page 22: Pruebas de hipótesis - campusvirtual.univalle.edu.co · una prueba sobre la calidad del maíz con alto contenido de lisina destinado al pienso animal, un grupo experimental de 20

Prueba t para diseños por pares

Un diseño experimental bastante frecuente utiliza los procedimientos t deuna muestra para comparar dos tratamientos. En un diseño por pares,un mismo sujeto recibe ambos tratamientos (por ejemplo, antes (X1)y después(X2)).Para comparar las respuesta de dos tratamientos en undiseño por pares, aplica los procedimientos t de una muestra a lasdiferencias observadas (D = X1 −X2).

Se desea valorar si el perfume �oral mejora los resultados de formasigni�cativa.

H0 : µD = 0 µD > 0

A partir de los resultados se observó que:

D = 0,9567 SD = 12,5479 n = 21

Page 23: Pruebas de hipótesis - campusvirtual.univalle.edu.co · una prueba sobre la calidad del maíz con alto contenido de lisina destinado al pienso animal, un grupo experimental de 20

Otros tipos de pruebas de hipótesis

Si se quiere hacer una comparación de la media de más de 2 muestrasindependientes se puede hacer uso de una prueba de análisis de varianza

(prueba basada en la distribución F), donde se prueban las siguienteshipótesis.

H0 : µ1 = µ2 = . . . = µk H1 : Por lo menos dos medias diferentes

Si se quiere determinar si un conjunto de datos se puede ajustar a unadistribución de probabilidad determinada se puede hacer uso de una prueba

de bondad de ajuste. Por ejemplo si se quiere probar normalidad, lashipótesis serían:

H0 : X = Normal(µ, σ2) H1 : X 6= Normal(µ, σ2)

Algunas de estas pruebas son: Kolmogorov-Smirnov, Anderson-Darling oShapiro-Wilk (Normalidad).

Page 24: Pruebas de hipótesis - campusvirtual.univalle.edu.co · una prueba sobre la calidad del maíz con alto contenido de lisina destinado al pienso animal, un grupo experimental de 20

Bibliografía

Devore, J. L. (2008). Probabilidad y estadística para ingeniería y

ciencias. Thomson Paraninfo, México, vol. 7 edition.

Montgomery, D. and Runger, G. (2004). Probabilidad y estadística

aplicadas la ingeniería. Limusa-Wiley, México, 2 edition.

Moore, D. S. (2005). Estadística aplicada básica. Antoni BoschEditor, Barcelona, España, vol. 2 edition.