Pruebas comparaciones multiples1unidad_ii_ia

10
Cap tulo 1 Pruebas de comparaciones m ultiples En este cap tulo, se presentan diferentes pruebas de comparaci on m ultiple con el n de tomar decisiones, una vez la hip otesis general sobre igualdad de medias (o efectos) de tratamientos ha sido rechazada. 1.1. Pruebas de comparaciones m ultiples Siempre que los resultados del an alisis de varianza conduzcan a rechazar la hip otesis nula de no diferencia entre las medias poblacionales, surge la pregunta respecto a qu e tratamiento es el \mejor", lo cual es de inter es en el caso de un modelo de efectos jos como el presentado con el caso de DCA. De hecho lo que con frecuencia se desea saber, aunque no siempre, es qu e grupos de tratamientos son iguales a trav es de la realizaci on de una prueba en todas las comparaciones de cada uno de los pares de tratamientos. El experimentador debe tener precauci on al pretender encontrar diferencias signicativas entre las medias individuales, siempre asegurarse que su pro- cedimiento de comparaci on sea v alido. Aunque la probabilidad (jado con anterioridad), de rechazar una hip otesis nula verdadera para la prueba co- mo un todo es peque~ na, la probabilidad de rechazar al menos una hip otesis verdadera cuando se prueban varios pares de medias es mayor de . 1

Transcript of Pruebas comparaciones multiples1unidad_ii_ia

Page 1: Pruebas comparaciones multiples1unidad_ii_ia

Capıtulo 1

Pruebas de comparacionesmultiples

En este capıtulo, se presentan diferentes pruebas de comparacion multiplecon el fin de tomar decisiones, una vez la hipotesis general sobre igualdadde medias (o efectos) de tratamientos ha sido rechazada.

1.1. Pruebas de comparaciones multiples

Siempre que los resultados del analisis de varianza conduzcan a rechazarla hipotesis nula de no diferencia entre las medias poblacionales, surge lapregunta respecto a que tratamiento es el “mejor”, lo cual es de interesen el caso de un modelo de efectos fijos como el presentado con el caso deDCA. De hecho lo que con frecuencia se desea saber, aunque no siempre,es que grupos de tratamientos son iguales a traves de la realizacion de unaprueba en todas las comparaciones de cada uno de los pares de tratamientos.El experimentador debe tener precaucion al pretender encontrar diferenciassignificativas entre las medias individuales, siempre asegurarse que su pro-cedimiento de comparacion sea valido. Aunque la probabilidad � (fijado conanterioridad), de rechazar una hipotesis nula verdadera para la prueba co-mo un todo es pequena, la probabilidad de rechazar al menos una hipotesisverdadera cuando se prueban varios pares de medias es mayor de �.

1

Page 2: Pruebas comparaciones multiples1unidad_ii_ia

2 CAPITULO 1. PRUEBAS DE COMPARACIONES MULTIPLES...

1.1.1. Conceptos preliminares

Sea un experimento con t tratamientos y medias poblacionales �1, �2, . . . , �t;

sea una combinacion lineal de las medias L =t∑i=1

ai�i, tal quet∑i=1

ai = 0, es

decir un contraste.

Sean y1▪, y2▪, . . . , yt▪ las medias muestrales obtenidas a partir de estas t mues-tras independientes de tamanos n1, n2, . . . , nt, respectivamente. Sobre lossupuestos de distribucion normal de los residuos y varianzas iguales, se tieneque:

i) L =t∑i=1

aiyi▪ encontrandose ademas que E(L) = L.

ii) V (L) = �2t∑i=1

a2ini

y V (L) = CMEt∑i=1

a2ini

.

iii) L ∼ N(L, V (L)).

iv) Dos contrastes

L1 =t∑i=1

ai1�i y L2 =t∑i=1

ai2�i,

cuyos estimadores son L1 =t∑i=1

ai1yi▪ y L2 =t∑i=1

ai2yi▪ respectivamente,

se dicen que son ortogonales si la covarianza entre ellos es nula, es decir

si se satisfacet∑i=1

ai1ai2/ni = 0.

1.1.2. Procedimientos de comparaciones multiples

Si el interes es comparar todas las parejas de las t medias de los tratamientos,es decir, se desea probar H0 : �i = �i′ para toda i ∕= i′, i, i′ = 1, . . . , t;existen en la literatura estadıstica muchos metodos que permiten hacer estascomparaciones, se destacan a continuacion algunos de estos.

1. Prueba t de Student

Page 3: Pruebas comparaciones multiples1unidad_ii_ia

1.1. PRUEBAS DE COMPARACIONES MULTIPLES 3

Suponga que se tiene interes en el contraste L =t∑i=1

ai�i teniendo en

cuenta los grados de libertad del residuo (gle) y que CME�2 ∼ �2

(gle) y,

por la independencia de este con las yi▪(i = 1, . . . , t) entonces,

L− L√CME

t∑i=1

a2ini

∼ t(gle)

De donde para un contraste particular:

Pr

⎡⎣L− t(gle,�/2)

√√√⎷CME

t∑i=1

a2ini

≤ L ≤ L+ t(gle;�/2)

√√√⎷CME

t∑i=1

a2ini

⎤⎦ = 1− �

Si se tiene en cuenta en la hipotesis: H0 : L = 0 se rechaza con unnivel de significancia de � si

∣L∣ > t(gle;�/2)

√√√⎷CMEt∑i=1

a2ini

en caso contrario se tendra evidencia estadıstica para no rechazar lahipotesis de interes.

2. Metodo de Scheffe

Scheffe (1953), demuestra que para la totalidad de los contrastes L;

Pr[L− F0S0 ≤ L ≤ L+ F0S0

]= 1− �

donde

F0 =√

(t− 1)F(t−1;gle;�) y S0 =

√V (L) =

√√√⎷CME

t∑i=1

a2ini

Page 4: Pruebas comparaciones multiples1unidad_ii_ia

4 CAPITULO 1. PRUEBAS DE COMPARACIONES MULTIPLES...

si se plantea la hipotesis H0 : L = 0, se rechaza a un nivel significancia� si

∣L∣ ≥ F0S0

Por otro lado, si L1 y L2 son contrastes ortogonales se observa en ?que sobre ciertas condiciones

(L1 − L2)t(V (L1−L2)

�2e

)(L1 − L2)

(t− 1)CME∼ F(t−1;gle).

Donde L1 y L2 son contrastes los cuales estiman a L1 y L2, respec-tivamente, en el espacio de las t-medias, V (L1 − L2) es la matriz devarianzas y covarianzas de L1 − L2.

Consecuentemente la region de confianza de tamano (1 − �), es unelipsoide donde el diametro maximo es tal que

Pr[∣L1 − L2∣ ≤

√(t− 1)F(t−1;gle;�)CME

]= 1− �.

Se observa que el metodo esta basado en el diametro maximo que re-presenta la direccion de un contraste particular de varianza maxima.

3. Metodo de Bonferroni (Fisher)

Este metodo fue usado por primera vez por Fisher (1935) y origino ladesigualdad de Bonferroni que tiene la siguiente base: “Para un con-junto de m contrastes, si cada uno es probado con un coeficiente deconfianza de 1−�, el coeficiente de confianza conjunto es por lo menos1−m�”.

El metodo de Bonferroni para comparaciones multiples es adecuadopara probar m contrastes y consiste en aplicar la prueba t-student acada uno de los contrastes usando un nivel de significancia �/m, coneso queda garantizado que el coeficiente de confianza conjunta es 1−�.

Page 5: Pruebas comparaciones multiples1unidad_ii_ia

1.1. PRUEBAS DE COMPARACIONES MULTIPLES 5

Si dos intervalos de confianza de una misma muestra para los con-trastes L1 y L2 se obtienen; sean los eventos A1 : El evento correspon-diente al complemento del intervalo de confianza para L1 y A2 : Enforma analoga pero para L2 con Pr(A1) = Pr(A2) = �.

Se sabe que: Pr(A1 ∪A2) = Pr(A1) +Pr(A2)−Pr(A1 ∩A2) entoncesPr[(A1 ∪ A2)

c] = 1 − Pr(A1 ∪ A2). Ademas, por la desigualdad deBoole: Pr(A1 ∪ A2) ≤ Pr(A1) + Pr(A2), entonces Pr(Ac1 ∩ Ac2) ≥1 − Pr(A1) − Pr(A2) = 1 − 2�, el cual corresponde, en este caso, alevento region de confianza conjunta para L1 y L2.

En el caso general de la cobertura de m eventos se satisface que

Pr

⎛⎝ m∩j=1

Acj

⎞⎠ ≥ 1−m�.

Observacion 1.1. Cuando mayor sea el numero de contrastes m;menor es el nivel de significancia para cada contraste particular; luegoesta prueba se debe usar cuando m no es muy grande.

La hipotesis H0 : L = 0, se rechaza a un nivel de significancia � si

∣L∣ > t(gle;"/2)

√√√⎷CME

t∑i=1

a2ini

con " = 2�p(p−1) cuando se comparan p medias de tratamientos.

4. Metodo basado en la amplitud maxima

La distribucion de las diferencias entre el mayor y el menor estadısti-cos de orden del conjunto de las medias muestrales constituye la basede este metodo .

Al considerar que yi▪ es una variable aleatoria correspondiente a lamedia muestral, la cual se distribuye en forma normal, la distancia

Page 6: Pruebas comparaciones multiples1unidad_ii_ia

6 CAPITULO 1. PRUEBAS DE COMPARACIONES MULTIPLES...

Q =Max(yi▪)−Min(yi▪)√

CME/r= Max

1≤i≤i′≤t

(∣yi▪ − yi′▪∣√CME/r

)se le denomina la amplitud maxima estandarizada o estudentizada(rango estudentizado) con parametros t y gle.

La distribucion de esta estadıstica se encuentra tabulada para variosvalores de �, es decir, existen tablas para valores q(t;gle;�) (ver tablacorrespondiente), tales que

Pr[Q ≤ q(t;gle;�)

]= 1− �.

Por lo tanto, se rechaza la hipotesis H0 : L = 0, si Q > q(t;gle;�).

Observacion 1.2. La prueba t-student y de Bonferroni para contrastede dos medias pueden ser vistas como un caso particular de aplicacionde la amplitud estudentizada.

5. Metodo de Tukey

Tukey(1953) propuso un metodo de comparacion multiple que tam-bien esta basado en los intervalos o regiones de confianza. Este esusado para comparar la totalidad de las

(t2

)contrastes de medias de

tipo L = �i − �i′ , 1 ≤ i ≤ i′ ≤ t.

Si se considera que n1 = ⋅ ⋅ ⋅ = nt = r se demuestra que 1 − � esla probabilidad de que las t(t − 1)/2 comparaciones de dos mediassatisfagan simultaneamente la condicion

(yi▪ − yi′▪)±√CME

rq(t;gle;�)

siendo q(t;gle;�) el valor correspondiente en la tabla apropiada.

Luego con un nivel de significancia � el estadıstico de prueba parala hipotesis H0 : �i = �i′ contra Ha : �i ∕= �i′ , esta dado por

Δ =√

CMEr q(t;gle;�).

Si ∣L∣ = ∣�i − �i′ ∣ > Δ se rechaza H0.

Page 7: Pruebas comparaciones multiples1unidad_ii_ia

1.1. PRUEBAS DE COMPARACIONES MULTIPLES 7

Observacion 1.3. La prueba de Tukey exige en principio balancea-miento.

6. Metodo de Newman-Keuls (N-K)

Esta prueba fue disenada por Newman(1939) y modificada por Keuls(1952), quien genero un nuevo interes en la prueba de Newman y porello el procedimiento se conoce como la prueba de Newman-Keuls.

Esta prueba es un procedimiento secuencial basado en la amplitud es-tandariza y es valido para la totalidad de contrastes de dos mediascomo en los metodos anteriores.

Se exige la condicion de balanceamiento es decir n1 = ⋅ ⋅ ⋅ = nt = r, yel estadıstico Q se estudia con parametros p y gle, con p el numero demedias ordenadas cubiertas por el contraste en estudio.

En la aplicacion de la prueba se siguen los siguientes pasos:

a) Ordenar las medias en un orden creciente o decreciente.

b) Se compara la mayor media (p′ = p) con la menor. Para esa

comparacion se determina√

CMEr q(p′;gle;�) y la estimacion del

contraste; si el valor

NKp =

√CME

rq(p′;gle;�) > ∣L∣

las medias son cubiertas por una sublınea que permite determinaro afirmar que no hay diferencias significativas entre ellas. En elcaso contrario se hace el siguiente paso.

c) Se reduce una unidad el valor de p′ calculandose de nuevo el va-

lor de CME, es decir√

CMEr q(p′;gle;�) y para todos los pares de

medias que no esten cubiertos por una misma lınea y que cubrenp′ medias, se repite el proceso de comparacion.

d) Se repite c) hasta que p′ = 1.

Page 8: Pruebas comparaciones multiples1unidad_ii_ia

8 CAPITULO 1. PRUEBAS DE COMPARACIONES MULTIPLES...

Observacion 1.4. Esta prueba tiene como inconveniente el hecho quecomo las medias ordenadas no son independientes, el valor de q(p′;gle;�)no es exacto.

Nota:

i) La prueba de N-K es un procedimiento secuencial valido para latotalidad de los contrastes de dos medias.

ii) N-K exige en principio balanceamiento.

iii) N-K es una prueba aproximada.

7. Metodo de Duncan

Constituye tambien un procedimiento secuencial valido para la com-paracion del contraste de dos medias. La prueba esta basada en la am-plitud estudentizada, q(p′;gle;�). En este caso, tanto p′ como � varıandurante la aplicacion de la prueba; p′ es el numero de medias ordenadascubiertas por el contraste en estudio y � es el nivel de significancia con-siderado en cada paso de aplicacion de la prueba.

Para un contraste sobre p medias ordenadas el valor de � es igual a1− (1− �)p−1.

Los pasos para la aplicacion de la prueba estadıstica son los mismosque los de N-K, solo que los valores del contraste son comparados con

D =

√CME

rq(p′;gle; p)

p = 1 − (1 − �)p−1 es el nivel de significancia, tomado como si seincluyeran p − 1 contrastes ortogonales en cada paso y cada valor deD es calculado como si las medias fueran independientes, pero comoestan ordenadas no van a ser independientes.

La regla de decision es rechazar H0 si ∣yi▪ − yi′▪∣ ≥√

CMEr q(p′;gle; p).

Page 9: Pruebas comparaciones multiples1unidad_ii_ia

1.1. PRUEBAS DE COMPARACIONES MULTIPLES 9

Teniendo como casos particulares

Prueba t p′ = 2 �′ = �Prueba de Bonfer-roni

p′ = 2 �′ = �/m

Prueba de Tukey p′ = p �′ = �Prueba N-K p′ = p, p− 1, . . . , 2 �′ = �

Prueba de Duncan p′ = p, p− 1, . . . , 2 �′ = 1− (1− �)p′

8. Metodo de Dunnett

Dunnet(1955), desarrolla un procedimiento para comparar un trata-miento control (testigo) con otros tratamientos.

Sea �T y �i (i = 1, 2, . . . , t) las medias poblacionales del control yde los demas p = t − 1 tratamientos y, nT y ni las correspondientesreplicaciones.

Para la totalidad de los contrastes L = �i − �T , se tiene que

Pr

[∣L− L∣ < d(p;gle;�)

√(1

ni+

1

nT

)CME

]= 1− �

Con un nivel � de significancia se rechaza H0 si

∣yi▪ − yT ▪∣ ≥ d(p;gle;�)

√(1

ni+

1

nT

)CME

Observacion 1.5. Es conveniente usar mas observaciones en el trata-miento control que en los otros tratamientos.

En la tabla de Dunnett se presenta los valores crıticos para la pruebade Dunnett asociados a algunos valores de � (d(p;gle;�)).

1.1.2.1. Algunos comentarios sobre comparaciones multiples

Las pruebas de Tukey y de Duncan tienen bases muy semejantes, sin em-bargo, la prueba de Duncan da diferencias significativas con mas facilidad,ya que al formular un nivel de significancia del 5 % la probabilidad de queun contraste incluya dos medias exige una probabilidad del 95 % de que no

Page 10: Pruebas comparaciones multiples1unidad_ii_ia

10 CAPITULO 1. PRUEBAS DE COMPARACIONES MULTIPLES...

se encuentre significancia en una diferencia realmente nula, para el caso detres medias la probabilidad sera de (0, 95)2, en el caso de t medias la proba-bilidad sera de (0,95)t−1; en tanto que la prueba de Tukey es mas exigente,mantiene siempre una probabilidad de (0, 95) de no encontrar significanciaen una diferencia realmente nula entre todas las medias de los tratamientos.La prueba de Duncan aplicada ampliamente no es muy rigurosa, por lo cualdebe ser usada con mucha cautela. Ası la prueba de Duncan es un interme-dio entre el excesivo rigor de la prueba de Tukey y la falta de rigor de laprueba t-student.

La prueba de Scheffe es aun mas rigurosa, no es recomendable para la com-paracion de dos medias, pero puede usarse en contrastes mas amplios (demas de dos medias), esta es mas poderosa que el metodo de Bonferroni siel numero de comparaciones es relativamente mas grande que el numero demedia