Blo Ques Completo s

download Blo Ques Completo s

of 38

Transcript of Blo Ques Completo s

  • 7/27/2019 Blo Ques Completo s

    1/38

    Captulo 5

    Diseos en bloques aleatorizados

    5.1. Introduccin

    En las situaciones que hemos estudiado en el Captulo 1 hemos supuesto que existebastante homogneidad entre las unidades experimentales, as, por ejemplo, en el caso de laindustria algodonera, hemos supuesto que las parcelas de terreno son de la misma calidade igual superficie. Pero, puede suceder que dichas parcelas sean distintas y contribuyan ala variablidad observada en el rendimiento de la semilla de algodn. Si en esta situacinse utiliza un diseo completamente aleatorizado, las diferencias entre los rendimientos dedos unidades experimentales sometidas a distintos tratamientos no sabremos si se debena una diferencia real entre los efectos de los tratamientos o a la heterogeneidad de dichasunidades. Como resultado el error experimental reflejar esta variabilidad entre las parcelasde terreno.

    En todo diseo de experimento se desea que el error experimental sea lo ms pequeoposible. Por lo tanto, en la situacin descrita se debe sustraer del error experimental lavariabilidad producida por las parcelas de terreno. Para ello, el experimentador puede:

    Considerar parcelas de terreno muy homogneas.

    O bien, formar bloques de terreno de manera que el terreno de cada bloque sea loms homogneo posible y los bloques entre s sean heterogneos.

    En esta ltima situacin, cada bloque se divide en I parcelas de terreno, tantas comotratamientos y cada tratamiento se prueba en cada uno de los bloques. Los I tratamientos,en este caso las I variedades del fertilizante, se asignan al azar a cada una de las I parcelasdel bloque; esto se hace con asignacin aleatoria independientemente en cada bloque. Este

    1

  • 7/27/2019 Blo Ques Completo s

    2/38

    2 Diseos en bloques aleatorizados

    diseo se conoce como diseo en bloques1 completos aleatorizados. La palabra completoindica que todos los tratamientos se prueban en cada bloque.

    Puede suceder, cuando se realizan diseos en bloques aleatorizados, que no puedanrealizarse los ensayos de todos los tratamientos dentro de cada bloque, debido, por ejemplo,a la escasez de recursos del experimento o al tamao fsico de los bloques. Es decir, nose puede aplicar cada fertilizante en cada bloque. En estos casos, es posible usar diseosaleatorizados por bloques en los que no todos los tratamientos se encuentran representadosen cada bloque, y aquellos que s estn representados en uno en particular se ensayan enl una sola vez. Estos diseos se conocen como diseos por bloques incompletos.

    Recordemos que en el diseo completamente aleatorizado asignbamos los tratamien-tos al azar a las parcelas sin restriccin alguna, mientras que en el diseo en bloquesaleatorizados primero agrupamos las parcelas en bloques y a continuacin asignamos lostratamientos a las parcelas en cada bloque. Podemos decir, por tanto, que un diseo enbloque aleatorizados es un diseo con aleatorizacin restringida en el cual las unidadesexperimentales son primero clasificadas en grupos homogneos, llamados bloques, y lostratamientos son entonces asignados aleatoriamente dentro de los bloques.

    Esta estrategia de diseo mejora efectivamente la precisin en las comparaciones alreducir la variabilidad residual. Dicho diseo es quizs el diseo experimental ms ampli-amente utilizado. En la prctica, las situaciones en las que este diseo se aplica son muynumerosas y pueden identificarse fcilmente.

    Estudiaremos en primer lugar el diseo en bloques completos aleatorizados, y en laseccin ?? el diseo en bloques incompletos.

    5.2. Diseo en bloques completos aleatorizados

    Para desarrollar esta seccin consideramos el siguiente ejemplo al que seguiremoshaciendo referencia en las sucesivas secciones.

    Ejemplo 5.1

    Una industria algodonera, interesada en maximizar el rendimiento de la semilla de al-

    godn, quiere comprobar si dicho rendimiento depende del tipo de fertilizante utilizado paratratar la planta. A su disposicin tiene 5 tipos de fertilizantes. Como puede haber diferenciaentre las parcelas, el experimentador decide efectuar un diseo en bloques aleatorizados.Para ello, divide el terreno en 4 bloques2 y cada bloque en 5 parcelas, fumigando dentro

    1 El trmino bloques aleatorios procede de la experimentacin agrcola, en la que pueden usarse parcelasde terreno como unidades experimentales. Un bloque consiste en varias parcelas adyacentes, y se suponeque las parcelas adyacentes son ms semejantes que las alejadas entre s.

    2 El terreno, en cada bloque, debe ser lo ms homogneo posible.

  • 7/27/2019 Blo Ques Completo s

    3/38

    5.2 Diseo en bloques completos aleatorizados 3

    de cada bloque cada una de las parcelas con un fertilizante. Al recoger la cosecha se mideel rendimiento de la semilla, obtenindose las siguientes observaciones.

    Tabla 4-1. Rendimiento de lasemilla de algodn

    Bloques

    Fertilizantes A B C D 1 87 86 88 83 2 85 87 95 85

    3 90 92 95 90 4 89 97 98 88 5 99 96 91 90

    Especificamente, en este experimento, se han considerado 5 tipos de fertilizantes quese han aplicado aleatoriamente a las parcelas dentro de cada bloque. La variable de interso variable respuesta es el rendimiento de la semilla en peso por unidad de superficie. Eneste ejemplo hemos supuesto que el tipo de terreno influye en el rendimiento de la semillade algodn y decidimos controlar estadsticamente sus efectos, mediante la formacin debloques. Es decir, nuestro propsito es eliminar en el estudio de los efectos del fertilizante lavariabilidad debida al terreno e intentar que de esta forma sean ms patentes las diferencias

    entre los fertilizantes, si las hay.

    5.2.1. Planteamiento del modelo

    Todo el planteamiento anterior se puede formalizar de manera general. SupongamosI tratamientos, (I fertilizantes), y supongamos tambin que hay otra variable que puedainfluir en la variable respuesta, (por ejemplo el tipo de terreno) y cuyos efectos deseamoscontrolar estadsticamente. Para ello, seleccionamos J niveles de esta variable, J bloques,y aplicamos cada uno de los I niveles del tratamiento en cada bloque. La figura 4-1 muestraeste tipo de diseo.

    Bloque 1

    y11...

    yi1...

    yI1

    ......

    Bloque j

    y1j...

    yij...

    yIj

    ......

    Bloque J

    y1J...

    yiJ...

    yIJ

    Figura 4-1. Diseo en bloques completos aleatorizados.

  • 7/27/2019 Blo Ques Completo s

    4/38

    4 Diseos en bloques aleatorizados

    Supondremos que se realiza una observacin por tratamiento en cada bloque, portanto, hay un total de N = IJ observaciones y que la asignacin de los tratamientos a lasunidades experimentales en cada bloque se determina aleatoriamente. Tambin se suponeque tanto los tratamientos como los bloques son factores de efectos fijos y que no hayinteraccin entre ellos. Se dice que no hay interaccin entre dos factores cuando el efectode un factor no depende del nivel del otro factor; en este caso se dice que los efectos delos factores son aditivos.

    Las observaciones se pueden disponer en forma de tabla de doble entrada como lasiguiente

    Tabla 4-2. Diseo en bloques aleatorizado

    BloquesTratamientos 1 2 j J

    1 y11 y12 y1j y1J2 y21 y22 y2j y2J...

    ......

    ......

    ......

    i yi1 yi2 yij yiJ...

    ......

    ......

    ......

    I yI1 yI2 yIj yIJ

    Generalmente no vamos a utilizar el trmino completo cuando en el contexto est claroque todos los tratamientos estn incluidos en cada bloque.

    Utilizamos la siguiente notacin:

    N = IJ es el nmero total de observaciones.

    yi. es el total de las observaciones bajo el i-simo tratamiento, es decir

    yi. =

    Jj=1

    yij i = 1, 2, , I (5.1)

    y.j es el total de las observaciones bajo el j-simo bloque, es decir

    y.j =I

    i=1

    yij j = 1, 2, , J (5.2)

  • 7/27/2019 Blo Ques Completo s

    5/38

    5.2 Diseo en bloques completos aleatorizados 5

    y.. es la suma de todas las observaciones, denominado el total general, es decir

    y.. =I

    i=1

    Jj=1

    yij =I

    i=1

    yi. =J

    j=1

    y.j (5.3)

    yi. es la media de las observaciones del tratamiento i-simo, es decir

    yi. =yi.J

    y.j es la media de las observaciones del bloque j-simo, es decir

    y.j =y.jI

    y.. es la media general de las observaciones, es decir

    y.. =y..N

    =1

    N

    Ii=1

    Jj=1

    yij ,

    que tambin se puede expresar como media de las medias parciales, es decir

    y.. =1I

    Ii=1

    yi. =1J

    Jj=1

    y.j .

    El modelo estadstico para este diseo es:

    yij = + i + j + uij i = 1, 2, , I ; j = 1, 2, , J , (5.4)

    donde

    yij es la variable aleatoria que representa la observacin (i)-sima del bloque (j)-simo.

    es un efecto constante que mide el nivel promedio de respuesta para todas lasunidades, denominado media global.

    i es el efecto producido por el nivel i-simo del factor principal. Se supone quei i = 0.

    j es el efecto producido por el nivel j-simo del factor secundario o factor de bloque.Se supone que

    j j = 0.

  • 7/27/2019 Blo Ques Completo s

    6/38

    6 Diseos en bloques aleatorizados

    uij son variables aleatorias independientes con distribucin N(0, ), que engloban elefecto de todas las restantes fuentes de variabilidad; al igual que en el modelo com-pletamente aleatorizado, reciben el nombre de perturbaciones o error experimental.

    En este modelo intervienen dos factores, el factor tratamiento y el factor bloque. Alprimero es usual llamarlo factor principal mientras que al segundo factor secundario,puesto que nuestro inters fundamentalmente est centrado en el primero y el factor bloquese introduce en el modelo para eliminar su influencia en la variable respuesta.

    Nuestro objetivo es estimar los efectos de los tratamientos y de los bloques y contrastarla hiptesis de que todos los niveles del factor principal producen el mismo efecto, frente

    a la alternativa de que al menos dos difieren significativamente. Tambin es de interscontrastar la igualdad de los efectos de los bloques.

    La expresin y condiciones de este modelo se resumen en:

    1o) yij = + i + j + uij

    2o) uij N(0, ) i, j

    3o) uij son independientes entre s

    4o

    )

    I

    i=1

    i = 0 ,

    J

    j=1

    j = 0 .

    (5.5)

    Las hiptesis establecidas para la variable de perturbacin pueden ser formuladas tam-bin en trminos de la variable respuesta. Es decir, las observaciones yij son variablesaleatorias independientes con distribucin normal, con media

    E[yij] = + i + j , (5.6)

    y varianza constante2[yij ] =

    2 i, j . (5.7)

    En este planteamiento, el contraste de hiptesis ms importante es

    H0 : i = 0 iH1 : i = 0 por lo menos para algn i .

    (5.8)

    A continuacin, vamos a estudiar la estimacin de los parmetros del modelo , i, jy 2.

  • 7/27/2019 Blo Ques Completo s

    7/38

    5.2 Diseo en bloques completos aleatorizados 7

    5.2.2. Estimacin de los parmetros del modelo

    Estimacin por mxima verosimilitud

    Al igual que en modelo completamente aleatorizado se construye la funcin deverosimilitud asociada a la muestra y = (y11, , y1J, , yI1, , yIJ):

    L(, i, j , 2) = (22)

    N

    2 exp

    122

    Ii=1

    Jj=1

    yij i j2 , (5.9)

    se determina el logaritmo de dicha funcin

    ln(L(, i, j , 2)) =

    N

    2ln(2)

    N

    2ln(2)

    1

    22

    Ii=1

    Jj=1

    yij i j2

    , (5.10)

    y se hallan las primeras derivadas parciales respecto de los parmetros del modelo

    lnL

    =

    1

    2

    Ii=1

    Jj=1

    yij i j

    lnL

    i=

    1

    2

    Jj=1

    yij i j

    i = 1, , I

    lnL

    j=

    1

    2

    Ii=1

    yij i j

    j = 1, , J

    lnL

    2=

    N

    22+

    1

    2(2)2

    Ii=1

    Jj=1

    yij i j2

    .

    (5.11)

    Igualando a cero estas derivadas parciales, se obtiene un sistema de ecuaciones queproporciona los estimadores mximo verosmiles. Dichos estimadores vienen dados por lasexpresiones

    =I

    i=1

    Jj=1

    yij

    N= y.. , (5.12)

  • 7/27/2019 Blo Ques Completo s

    8/38

    8 Diseos en bloques aleatorizados

    i = 1J

    Jj=1

    yij = yi. y.. , (5.13)j = 1I

    Ii=1

    yij = y.j y.. . (5.14)Por tanto, la media general se estima utilizando el promedio de todas las observaciones

    y cualquiera de los efectos de los factores se estiman usando la diferencia entre el promediocorrespondiente al nivel del factor y el promedio total.

    Se puede comprobar fcilmente quei

    i = 0y

    j

    j = 0siendo, por tanto, I 1 y J 1 los grados de libertad asociados a los tratamientos y a losbloques, respectivamente.

    Finalmente, sustituyendo , i y j en la ltima ecuacin de (5.11) igualada a cero,obtenemos el estimador de mxima verosimilitud para la varianza2 = 1

    N

    Ii=1

    Jj=1

    yij i j2 . (5.15)

    Residuos

    Los residuos se definen como las diferencias entre los valores observados yij y losvalores estimados por el modelo

    yij y los denotamos por eij ,

    eij = yij yij = yij i j = yij yi. y.j + y.. . (5.16)Por lo tanto, el estimador mximo-verosimil, 2, se puede escribir como

    2 =I

    i=1

    Jj=1

    e2ij

    N

  • 7/27/2019 Blo Ques Completo s

    9/38

    5.2 Diseo en bloques completos aleatorizados 9

    Se verifica que la suma de los residuos por filas y por columnas es cero, en efectoj

    eij =

    j(yij i j) = Jyi. Jy.. Ji

    j

    j =Jyi. Jy.. J(yi. y..) = 0 i = 1, , I

    ieij =

    i(yij i j) = Iy.j Iy..

    ii Ij =

    Iy.j Iy.. I(y.j y..) = 0 j = 1, , J

    por lo tanto hay (I 1)(J 1) residuos independientes, ya que

    IJ (I+ J 1) = (I 1)(J 1) .

    Propiedades de los estimadores mximo verosmiles

    A continuacin vamos a ver algunas propiedades que verifican los estimadores delmodelo. Concretamente, vamos a determinar su esperanza, su varianza y su distribucinen el muestreo.

    1) Propiedades de

    a) es un estimador centrado de , puesto queE[] = E[y..] = 1

    N

    Ii=1

    Jj=1

    E[yij] =1

    N

    Ii=1

    Jj=1

    ( + i + j) =

    1

    N

    N + J Ii=1

    i + IJ

    j=1

    j

    = 1N

    N =

    b) La varianza de

    es 2/N, puesto que al ser independientes las observaciones

    se verifica:

    Var[] = Var I

    i=1

    Jj=1

    yijN

    = Ii=1

    Jj=1

    Varyij

    N

    =i,j

    Var [yij ]

    N2=

    i,j

    2

    N2=

    1

    N2N2 =

    2

    N

  • 7/27/2019 Blo Ques Completo s

    10/38

    10 Diseos en bloques aleatorizados

    c) se distribuye segn una Normal, puesto que dicho estimador es combinacinlineal de variables aleatorias independientes con distribucin Normal.

    2) Propiedades de ia) i es un estimador centrado de i, puesto que

    E[i] = E[yi.] E[y..] = + i = i .En efecto

    E[yi.] = E

    1J

    Jj=1

    yij

    = 1J

    E

    Jj=1

    + i + j + uij =

    1

    J

    J + Ji + Jj=1

    j +J

    j=1

    E[uij ]

    = + ib) La varianza de

    i es (I 1)

    2

    N, puesto que

    Var[i] = Var [yi. y..] = Var 1J

    j

    yij 1

    N

    i,j

    yij

    =1

    J2

    j

    Var(yij) +1

    N2

    i,j

    Var(yij)2

    N JCov

    j

    yij,i,j

    yij

    =1

    J2

    j

    2 +1

    N2

    i,j

    2 2

    NJJ2 =

    1

    J2 +

    1

    N2

    22

    N=

    2

    J

    2

    N= (I 1)

    2

    N(5.17)

    c) i se distribuye segn una Normal, puesto que dicho estimador est expresadocomo funcin lineal de variables aleatorias con distribucin Normal.

    3) Propiedades de j

  • 7/27/2019 Blo Ques Completo s

    11/38

    5.2 Diseo en bloques completos aleatorizados 11

    a) j es un estimador centrado de j, puesto queE[j ] = E[y.j] E[y..] = + j = j .

    En efecto

    E[y.j ] = E

    1

    I

    i

    yij

    =

    1

    IE

    i

    + i + j + uij

    =

    1

    II +i i + Ij +i E[uij ] = + jb) La varianza de j es (J 1)2N

    c) j se distribuye segn una Normal.4) Propiedades de 22 no es un estimador insesgado de 2 puesto que se verifica

    N

    2

    2=

    1

    2

    I

    i=1J

    j=1(eij)

    2 2(I1)(J1) ,

    donde los grados de libertad de la distribucin 2 corresponden al nmero de residuosindependientes, por tanto

    E

    N2

    2

    = (I 1)(J 1) E[2] = (I 1)(J 1)

    N2 ,

    luego 2 no es un estimador insesgado de 2. Ahora bien, a partir de este resultadose construye fcilmente un estimador centrado simplemente considerando

    2 =

    N

    (I 1)(J 1)

    2 .

    Dicho estimador recibe el nombre de varianza residual, se denota por S2R y se expresa,por tanto, de la siguiente forma

    2 = S2R =I

    i=1

    Jj=1

    [yij yij]2(I 1)(J 1)

    =

    Ii=1

    Jj=1

    e2ij

    (I 1)(J 1). (5.18)

  • 7/27/2019 Blo Ques Completo s

    12/38

  • 7/27/2019 Blo Ques Completo s

    13/38

    5.2 Diseo en bloques completos aleatorizados 13

    )

    ( )e =i

    j

    (i i)eij =i

    (i i)j

    eij = 0 (5.24)

    )

    ( )e =i

    j

    (j j)eij =j

    (j j)i

    eij = 0 (5.25)

    De forma similar se comprueba que los restantes productos escalares son nulos. Porlo tanto, los vectores en que se descompone Z son ortogonales y se verifican lascondiciones del teorema de Cochran cuyo enunciado presentamos en el Captulo 1.

    Por consiguiente, los cuadrados de los mdulos de los vectores de la descomposicin(5.22) seguirn distribuciones 2 independientes cuyos grados de libertad sern ladimensin del subespacio al que pertenezca cada vector. De esta forma,

    a) Como ( ) pertenece a un subespacio de dimensin 1, al tener todas suscoordenadas iguales:

    N(y.. )2

    2 21

    b) Como (

    ) pertenece a un subespacio de dimensin I 1, al tener I coorde-

    nadas distintas y una ecuacin de restriccin:

    1

    ( ) 1

    ( ) = J

    2

    i

    (i i)2 2I1c) Como ( ) pertenece a un subespacio de dimensin J 1, al tener J coor-

    denadas distintas y una ecuacin de restriccin:

    1

    ( ) 1

    ( ) = I

    2

    j

    (j j)2 2J1d) El vector e tiene IJ coordenadas, en principio distintas, pero sujetas, como

    hemos visto, a las ecuaciones de restriccinj

    eij = 0 ;i

    eij = 0

    es decir, la suma de los residuos por filas y por columnas es cero, lo que implicaI+ J 1 ecuaciones de restriccin e IJ (I+ J 1) = (I 1)(J 1) residuosindependientes. Por lo tanto,

  • 7/27/2019 Blo Ques Completo s

    14/38

    14 Diseos en bloques aleatorizados

    i

    j

    e2ij

    2 2(I1)(J1) .

    En resumen,

    N(, 2/N)

    i Ni, (I 1)2/Nj Nj, (J 1)2/NN2/2 2(I1)(J1)

    5.2.3. Descomposicin de la variabilidad

    Como dijimos en el Captulo 1, para comparar globalmente los efectos de losdistintos niveles de un factor se emplea la tcnica estadstica denominada anlisis de

    la varianza, que est basada en la descomposicin de la variabilidad total de los datosen distintas componentes. En los diseos en bloques aleatorizados tambin se emplea estatcnica y para ello consideramos la siguiente identidad:

    yij = y.. + (yi. y..) + (y.j y..) + (yij yi. y.j + y..) , (5.26)

    que expresa cada variable yij observada como la suma de cuatro trminos:

    - La media total y.., es decir el estimador de

    - El efecto producido por el tratamiento i-simo, (desviacin de la media del i-simonivel del factor principal respecto de la media total), y

    i. y

    .., es decir el estimador

    de i

    - El efecto producido por el bloque j-simo, (desviacin de la media del j-simo niveldel factor bloque respecto de la media total), y.j y.., es decir el estimador de j

    - La diferencia entre los valores observados yij y los valores previstos por el modeloyij, es decir el estimador de uij.

  • 7/27/2019 Blo Ques Completo s

    15/38

    5.2 Diseo en bloques completos aleatorizados 15

    Por tanto, la expresin (5.26) tambin se puede poner en la forma

    yij = +i +j + eij (5.27)Considerando esta expresin para todas las observaciones y expresndola en forma

    vectorial resultan los siguientes vectores, todos ellos de dimensin N:

    Y: Contiene los N trminos independientes yij. Tiene, por tanto, N grados de lib-ertad.

    : Contiene N coordenadas iguales a y... Tiene, por tanto, un grado de libertad.: Contiene I valores distintos yi. y.., cada uno repetido J veces. Tiene I1 gradosde libertad, ya que

    ii = 0.: Contiene J valores distintos y.j y.., cada uno repetido I veces. Tiene J1 gradosde libertad, ya que

    jj = 0.

    e: Contiene los N residuos estimados, que deben sumar cero por filas y por columnas.Tiene, por tanto, N (I+ J 1) grados de libertad.

    Por lo que, la ecuacin (5.26) aplicada a los N datos tomar la siguiente forma (mostra-

    da anteriormente): Y = + ++ e (5.28)Esta descomposicin est formada por componentes ortogonales dos a dos siendo los

    grados de libetad de Y la suma de los grados de libertad de los componentes. En efecto,se comprueba directamente que

    = y.. Ii=1

    Jj=1

    i = 0

    = y..

    I

    i=1J

    j=1j = 0 e = y.. I

    i=1

    Jj=1

    eij = 0

    = Ii=1

    i Jj=1

    j = 0

  • 7/27/2019 Blo Ques Completo s

    16/38

    16 Diseos en bloques aleatorizados

    e = Ii=1

    i Jj=1

    eij = 0

    e = Jj=1

    j Ii=1

    eij = 0

    y

    N = 1 + (I 1) + (J 1) + (I 1)(J 1)

    La ecuacin (5.26) tambin se puede expresar

    yij y.. = (yi. y..) + (y.j y..) + (yij yi. y.j + y..) , (5.29)

    elevando los dos miembros al cuadrado y sumando para todas las observaciones tenemos

    Ii=1

    Jj=1

    (yij y..)2 =I

    i=1

    Jj=1

    [(yi. y..) + (y.j y..) + (yij yi. y.j + y..)]2 =

    JI

    i=1(yi. y..)2 + IJ

    j=1(y.j y..)2+I

    i=1

    Jj=1

    (yij yi. y.j + y..)2+

    2I

    i=1

    Jj=1

    (yi. y..)(y.j y..)+

    2I

    i=1J

    j=1(y.j y..)(yij yi. y.j + y..)+2

    Ii=1

    Jj=1

    (yi. y..)(yij yi. y.j + y..)

    (5.30)

    donde los dobles productos se anulan (ya que los trminos son ortogonales, como acabamosde comprobar), por lo que dicha ecuacin queda en la forma

  • 7/27/2019 Blo Ques Completo s

    17/38

    5.2 Diseo en bloques completos aleatorizados 17

    Ii=1

    Jj=1

    (yij y..)2 = JI

    i=1

    (yi. y..)2 + IJ

    j=1

    (y.j y..)2 +I

    i=1

    Jj=1

    (yij yi. y.j + y..)2

    (5.31)

    que representa la ecuacin bsica del anlisis de la varianza, que simblicamente podemosescribir

    SC T = SCTr + SCBl + SCR ,

    donde hemos desglosado la variabilidad total de los datos

    SC T =I

    i=1

    Jj=1

    (yij y..)2 ,

    denominada suma total de cuadrados, en tres componentes:

    1) SCTr = JI

    i=1(yi. y..)

    2, la suma de cuadrados de las diferencias entre las medias

    de los tratamientos y la media general, que expresa la variabilidad explicada por lostratamientos, denominada suma de cuadrados entre tratamientos.

    2) SCBl = IJ

    j=1(y.j y..)

    2, la suma de cuadrados de las diferencias entre las medias

    de los bloques y la media general, que expresa la variabilidad explicada por losbloques, denominada suma de cuadrados entre bloques.

    3) SC R =I

    i=1

    Jj=1 (yij yi. y.j + y..)

    2, la suma de cuadrados de los residuos, queexpresa la variabilidad no explicada por el modelo, denominada suma de cuadradosdel error.

    A partir de la ecuacin bsica del ANOVA se pueden construir los cuadrados mediosdefinidos como:

    Cuadrado medio total

    S2T =I

    i=1

    Jj=1

    (yij y..)2

    N 1(5.32)

  • 7/27/2019 Blo Ques Completo s

    18/38

  • 7/27/2019 Blo Ques Completo s

    19/38

    5.2 Diseo en bloques completos aleatorizados 19

    yi. = J + Ji +J

    j=1

    j + ui. ; yi. = + i + ui.

    y.j = I +I

    i=1

    i + Ij + u.j ; y.j = + j + u.j

    y.. = N + JI

    i=1 i + IJ

    j=1 j + u.. ; y.. = + u..(5.36)

    1o) El cuadrado medio entre grupos se puede expresar

    S2Tr =J

    Ii=1

    (yi. y..)2

    I 1=

    JI

    i=1

    [i + (ui. u..)]2

    I 1=

    JI

    i=1 2iI 1

    +

    JI

    i=1(ui. u..)2I 1

    +

    2JJ

    j=1 i(ui. u..)I 1

    y su esperanza matemtica ser la suma de las esperanzas matemticas de cadasumando; es decir,

    E S2Tr = E

    JI

    i=12i

    I 1

    + E

    JI

    i=1(ui. u..)

    2

    I 1

    + E

    2JI

    i=1i(ui. u..)

    I 1

    .

    (5.37)

    Ahora bien, puesto que:

    a) El modelo es de efectos fijos E[i] = i, entonces

  • 7/27/2019 Blo Ques Completo s

    20/38

    20 Diseos en bloques aleatorizados

    E

    J

    Ii=1

    2i

    I 1

    =J

    I 1

    i

    E

    2i

    =J

    I 1

    i

    2i (5.38)

    b) Como E [i E [i]]2 es la Var (i), cuya expresin, determinada en la subsec-cin 5.2.2, es (I 1)2/N, luego

    E

    J

    Ii=1

    (ui. u..)2

    I 1

    =J

    I 1

    Ii=1

    E [ui. u..]2 =

    J

    I 1

    Ii=1

    E [(yi. y..) i]2 =

    J

    I 1

    Ii=1

    E [i E [i]]2 = JI 1

    Ii=1

    Var (i) =J

    I 1

    Ii=1

    (I 1)2

    N=

    J

    I 1

    (I 1)I2

    N= 2

    (5.39)

    c) Como E (ui. u..) = 0, entonces

    E

    2J

    Ii=1

    i(ui. u..)

    I 1

    =2

    I 1J

    Ii=1

    iE [ui. u..] = 0 . (5.40)

    Por lo tanto, sustituyendo las expresiones (5.38), (5.39) y (5.40) en (5.37) tenemosque el valor esperado del cuadrado medio entre grupos es:

  • 7/27/2019 Blo Ques Completo s

    21/38

    5.2 Diseo en bloques completos aleatorizados 21

    E (S2Tr) = JI 1I

    i=1

    2i + 2 (5.41)

    2o) De la misma forma se comprueba que

    E (S2Bl) = IJ 1J

    j=1

    2j + 2 (5.42)

    3o) Ya hemos visto en la subseccin 5.2.2 que la varianza residual es un estimador ins-esgado de la varianza poblacional, es decir

    E (S2R) = 24o) Por ltimo, calculemos el valor esperado del cuadrado medio total. Para ello nos

    basaremos en la ecuacin bsica del ANOVA que podemos poner en funcin de loscuadrados medios de la siguiente forma:

    (N 1)

    S2T = (I 1)

    S2Tr + (J 1)

    S2Bl + (I 1)(J 1)

    S2R ,

    tomando esperanzas matemticas en ambos miembros y aplicando la linealidad delvalor esperado, tenemos

    (N 1)ES2T = (I 1)E S2Tr+ (J 1)E S2Bl+ (I 1)(J 1)E S2R ,

    de donde, sustituyendo los valores obtenidos anteriormente para ES2Tr , ES2Bl y

    ES2R, obtenemos

    E(S2T) = JI

    i=1

    2i

    N 1+

    I

    Jj=1

    2j

    N 1+ 2 . (5.43)

    Observacin 5.1

    Hemos visto que al aplicar el mtodo de mnimos cuadrados al modelo completamentealeatorizado, se obtiene el sistema de ecuaciones normales (??). En el caso del modelo enbloques completos aleatorizados, las ecuaciones normales para tratamientos no contienen

  • 7/27/2019 Blo Ques Completo s

    22/38

    22 Diseos en bloques aleatorizados

    informacin con respecto a los efectos de bloques, y recprocamente, las ecuaciones nor-males para bloques no contienen informacin alguna sobre los efectos de los tratamientos,(la informacin con respecto a los tratamientos no se encuentra mezclada con aquelladebida a los efectos de los bloques). Y as, un contraste entre efectos de tratamientos serealiza comparando las medias de tratamientos e idnticamente, un contraste entre efectosde bloques se realiza comparando las medias de los bloques. Cuando esto ocurre, se diceque los efectos de bloques y tratamientos son ortogonales.

    5.2.4. Anlisis estadstico

    El contraste estadstico de ms inters en este modelo, como mencionamos anteri-ormente, es el que tiene como hiptesis nula la igualdad de medias de los tratamientos:

    H0 1 = 2 = = I = 0 (5.44)

    Tambin es interesante contrastar la igualdad de medias de los bloques:

    H0 1 = 2 = = J = 0 (5.45)

    Como hemos comprobado anteriormente se verifica que:

    a) S2R = SCR/(I 1)(J I) es un estimador insesgado de la varianza 2, independi-entemente de que se verifiquen las hiptesis nulas.

    b) Si no hay diferencia entre las medias de los I tratamientos; es decir, si es cierta lahiptesis de que todo i = 0, el primer sumando de E(S2Tr) es nulo, y entonces S2Tres un estimador insesgado de 2.

    c) Si no hay diferencia entre las medias de los J bloques; es decir, si es cierta la hiptesisde que todo j = 0, el primer sumando de E(

    S2Bl) es nulo, y entonces

    S2Bl es un

    estimador insesgado de 2.

    Sin embargo, hay que notar que:

    Si existe diferencia en las medias de los tratamientos, el valor esperado de S2Tr esmayor que 2.

    Si existe diferencia en las medias de los bloques, el valor esperado de S2Bl es mayorque 2.

  • 7/27/2019 Blo Ques Completo s

    23/38

    5.2 Diseo en bloques completos aleatorizados 23

    De todo sto podemos deducir que:

    1o) Un contraste para verificar la hiptesis nula de igualdad de medias de los tratamien-tos puede efectuarse comparando S2Tr y S2R.

    2o) Un contraste para verificar la hiptesis nula de igualdad de medias de los bloquespuede efectuarse comparando S2Bl y S2R .

    Para ello, vamos a estudiar la distribucin de SC T, SCTr, SCBl y SC R en las hipte-sis de que ni los tratamientos ni los bloques influyen, es decir si las hiptesis (5.44) y (5.45)son ciertas o equivalentemente, si las N observaciones provienen de la misma poblacin.

    Tipificando las variables aleatorias yij en la descomposicin (5.27) , se tiene

    yij

    =

    +i

    +j

    +

    eij

    . (5.46)

    Considerando esta descomposicin para totas las observaciones y expresndola en for-ma vectorial, tenemos

    Z = Z1 +Z2 +Z3 +Z4 (5.47)

    siendo

    Z =1

    (y

    11 , . . . , y

    1J , y

    21 , . . . , y

    2J , . . . , y

    I1 , . . . , y

    IJ )

    Z1 =1

    (y.. , . . . . . , y.. , y.. , . . . . . , y.. , . . . . . , y.. , . . . . . , y.. )

    Z2 =1

    (1, . . . . . , 1, 2,. . . . . , 2, . . . . . , I, . . . . . , I)

    Z3 =1

    (1, . . . . . , J, 1, . . . . . , J, . . . . . , 1, . . . . . , J)

    Z4 =1

    (e11, . . . , e1J , e21, . . . , e2J , . . . ., eI1, . . . , eIJ)

    donde

    Z: Contiene N trminos independientes1

    (yij ). Tiene, por tanto, N grados de

    libertad.

    Z1: Contiene N coordenadas iguales a1

    (y.. ). Tiene, por tanto, un grado de

    libertad.

  • 7/27/2019 Blo Ques Completo s

    24/38

    24 Diseos en bloques aleatorizados

    Z2: Contiene I valores distintos1

    i, cada uno repetido J veces y sujetos a una

    ecuacin de restriccin,

    ii = 0. Tiene, por tanto, I 1 grados de libertad.Z3: Contiene J valores distintos

    1

    j, cada uno repetido I veces y sujetos a una

    ecuacin de restriccin,

    jj = 0. Tiene, por tanto, J 1 grados de libertad.

    Z4: Contiene N coordenadas1

    eij, sujetas a I + J 1 ecuaciones de restriccin,

    j eij = 0 para i = 1, . . . , I . y

    i eij = 0 para j = 1, . . . , J . Tiene, por tanto,

    (I 1)(J 1) grados de libertad.

    Bajo las hiptesis nulas hemos realizado una descomposicin del vector Z, de variablesN(0, 1) independientes, en componentes ortogonales. Dicha descomposicin cumple lascondiciones del Teorema de Cochran, verificndose que:

    i)

    SCTr

    2=

    Ji

    (yi. y..)2

    2 2I1

    ii)

    SCBl

    2=

    Ij

    (y.j y..)2

    2 2J1

    iii)

    SC R

    2=

    i,j

    (yij yi. y.j + y..)2

    2 2(I1)(J1)

    y adems estas tres distribuciones son independientes entre s.

    Hay que notar que:

    Por una parte, se tiene que SCR/2 se distribuye como una 2 con (I 1)(J 1)grados de libertad, se verifique o no la hiptesis nula, como ya vimos en la subseccin5.2.2

    Por otra parte, bajo las hiptesis (5.44) y (5.45), se tiene que SCTr/2 y SCBl/2

    se distribuyen como una 2 con I 1 y J 1 grados de libertad, respectivamente.

  • 7/27/2019 Blo Ques Completo s

    25/38

    5.2 Diseo en bloques completos aleatorizados 25

    Por consiguiente, bajo las hiptesis de igualdad de efectos de los tratamientos y losbloques, se verifica

    F =

    SCTr/2

    I 1SCR/2

    (I 1)(J 1)

    =S2TrS2R F(I1),(I1)(J1) (5.48)

    y

    F =

    SCBl/2

    J 1

    SCR/2

    (I 1)(J 1)

    =S2Bl

    S2R F(J1),(I1)(J1) . (5.49)Estos son los estadsticos de contraste para probar dichas hiptesis nulas. Por lo tanto:

    Si la hiptesis de igualdad de efectos de los tratamientos es cierta, tanto el numeradorcomo el denominador del estadstico de contraste (5.48) son estimadores insesgadosde 2, mientras que si dicha hiptesis no es cierta, la esperanza del numerador delestadstico de contraste (5.48) es mayor que la esperanza del denominador, por loque rechazaremos H0 cuando el valor experimental de dicho estadstico sea mayorque el valor terico, F(I1),(I1)(J1);.

    Siguiendo el mismo razonamiento anterior, se rechazar la hiptesis nula de igualdad

    de efectos de los bloques cuando el valor del estadistico de contraste (5.49) sea mayorque el valor terico, F(J1),(I1)(J1);.

    Aunque hemos dicho que el contraste principal es el de la igualdad de medias de lostratamientos, tambin es interesante la comparacin entre las medias de los bloques, yaque la eficacia de este diseo depende de los efectos de los bloques. Un valor grandedel cociente (5.49), implica que el factor bloque tiene un efecto grande, es decir que losbloques realmente influyen mucho. En este caso, este diseo es ms eficaz que el diseocompletamente aleatorizado ya que si el cuadrado medio entre bloques,S2Bl , es grande, eltrmino residual ser mucho menor y el contraste principal (5.44) ser ms sensible a lasdiferencias entre tratamientos.

    Si los efectos de los bloques son muy pequeos, el anlisis por bloques quiz no seanecesario y en caso extremo, cuando el cociente (5.49) es prximo a 1, puede llegar aser perjudicial, ya que el nmero de grados de libertad, (I 1)(J 1), del denominadoren la comparacin de tratamientos (5.48) es menor que el nmero de grados de libertadcorrespondiente, IJ I = I(J 1), en el diseo completamente aleatorizado.

    Para una mayor sencillez en el clculo se utilizan las expresiones abreviadas de SC T,SCTr, SCBl y SC R, dadas a continuacin

  • 7/27/2019 Blo Ques Completo s

    26/38

    26 Diseos en bloques aleatorizados

    SC T =I

    i=1

    Jj=1

    y2ij y2..IJ

    SCTr =1

    J

    Ii=1

    y2i. y2..IJ

    SCBl =1

    I

    J

    j=1y2.j

    y2..IJ

    ,

    (5.50)

    y la suma de cuadrados del error se obtiene por diferencia

    SC R = SC T SCTr S CBl . (5.51)

    El anlisis de la varianza utiliza la descomposicin (5.31), ecuacin bsica del anlisisde la varianza, cuyos trminos se pueden disponer de la siguiente manera,

    Tabla 4-3. Tabla ANOVA para el modelo de bloques aleatorizados

    Fuentes de Suma de Grados de Cuadradosvariacin cuadrados libertad medios Fexp

    Entre tratam. JI

    i=1

    (yi. y..)2 = SCT r I 1 S2Tr S2Tr/S2R

    Entre bloques IJ

    j=1

    (y.j y..)2 = SCBl J 1 S2Bl S2Bl/S2R

    Residual SC T SCTr SCBl = (I 1)(J 1)

    S2R

    SC R

    TOTALI

    i=1

    Jj=1

    (yij y..)2 = SCT IJ 1 S2T

    Alternativamente, utilizando las expresiones abreviadas de SC T, SCTr, SCBl y SC R,dadas en (5.50), se construye la siguiente Tabla ANOVA.

  • 7/27/2019 Blo Ques Completo s

    27/38

    5.2 Diseo en bloques completos aleatorizados 27

    Tabla 4-4. Forma prctica de la tabla ANOVA parael modelo de bloques aleatorizados

    Fuentes de Suma de Grados de Cuadradosvariacin cuadrados libertad medios Fexp

    Entre tratam.1

    J

    Ii=1

    y2i. y2..IJ

    = SCT r I 1 S2Tr S2Tr/S2REntre bloques

    1

    I

    Jj=1

    y2.j y2..IJ = SCBl J 1 S2Bl S2Bl/S2R

    Residual SC T SCTr SCBl = (I 1)(J 1) S2RSC R

    TOTALI

    i=1

    Jj=1

    y2ij y2..IJ

    IJ 1 S2TUna de las ventajas del diseo en bloques aleatorizados es que se puede transformar

    en un diseo unifactorial, simplemente suprimiendo el estudio por bloques y uniendo suvariabilidad a la residual.

    Coeficientes de determinacin

    Al igual que en el modelo completamente aleatorizado, una medida apropiadapara comprobar la adecuacin del modelo a los datos es el coeficiente de determinacin,denotado por R2 y definido como el cociente entre la suma de las variabilidades explicadaspor los tratamientos y los bloques, y la variabilidad total

    R2 =SCTr + SCBl

    SC T.

    Llamando

    R2 al cociente entre la variabilidad explicada por los tratamientos y la total, es decir

    R2 =SCTr

    SC T,

  • 7/27/2019 Blo Ques Completo s

    28/38

    28 Diseos en bloques aleatorizados

    R2 al cociente entre la variabilidad explicada por los bloques y la total, es decir

    R2 =SCBl

    SC T,

    el coeficiente de determinacin tambin lo podemos expresar como

    R2 = R2 + R2 ,

    donde R2 y R2 reciben el nombre de coeficientes de determinacin parciales asociados a los

    tratamientos y a los bloques. Estas cantidades son adimensionales y se interpretan comola proporcin de la variabilidad que es explicada por los tratamientos y por los bloques,respectivamente.

    A fin de ilustrar el anlisis de la varianza de bloques aleatorizados vamos a considerarel Ejemplo 4-1, en el que se desea comprobar si se aprecian diferencias significativas, enprimer lugar, entre los fertilizantes y en segundo lugar, entre los bloques de terreno.

    Para ello, construimos la Tabla 4-5, organizando los datos de la siguiente manera

    Tabla 4-5. Datos del Ejemplo 4-1

    bloquesFertilizantes A B C D yi. y2i.

    1 87 86 88 83 344 1183362 85 87 95 85 352 1239043 90 92 95 90 367 1346894 89 97 98 88 372 138384

    5 99 96 91 90 376 141376y.j 450 458 467 436 1811 656689

    y2.j 202500 209764 218089 190096 820449y2ij 40616 42054 43679 38058 164407

    Las sumas de cuadrados necesarias para el anlisis de la varianza se calculan de la

  • 7/27/2019 Blo Ques Completo s

    29/38

    5.2 Diseo en bloques completos aleatorizados 29

    siguiente forma:

    SC T =5

    i=1

    4j=1

    y2ij y2..IJ

    = 164407(1811)2

    20= 420,95

    SCTr =1

    J

    5i=1

    y2i. y2..IJ

    =656689

    4

    (1811)2

    20= 186,20

    SCBl =1

    I

    4

    j=1 y2.j y2..

    IJ=

    820449

    5

    (1811)2

    20= 103,75

    SC R = SC T SCTr SCBl = 131 .

    El anlisis de la varianza resultante se presenta en la siguiente tabla.

    Tabla 4-6. Anlisis de la varianza para los datos del Ejemplo 4-1

    Fuentes de Suma de Grados de Cuadradosvariacin cuadrados libertad medios Fexp

    Entre tratamientos 186.20 4 46.5500 4.264Entre bloques 103.75 3 34.5833 3.168

    Residual 131.00 12 10.9166

    TOTAL 420.95 19

    Realizando los contrastes al nivel de significacin del 5 %, se tiene:

    1o) Si comparamos el cociente F(exp) = 46,55/10,9166 = 4,264, con el valor de la Fterica (F0,05,4,12 = 3,26), se concluye que se rechaza H0 (igualdad de medias de

    tratamientos); en otras palabras, concluimos que, a un nivel de significacin del 5%, el rendimiento de la semilla de algodn difiere significativamente dependiendo deltipo de fertilizante utilizado.

    2o) Si comparamos el cociente F(exp) = 34,5833/10,9166 = 3,168, con el valor de la Fterica (F0,05,3,12 = 3,49), se concluye que no hay suficiente evidencia para rechazarH0 (igualdad de medias de bloques); en otras palabras, concluimos que, a un nivelde significacin del 5 %, los bloques de terreno no son significativamente distintos.

  • 7/27/2019 Blo Ques Completo s

    30/38

    30 Diseos en bloques aleatorizados

    Comprobamos, mediante los coeficientes de determinacin parciales, cuyos valores son

    R2 =SCTr

    SC T=

    186,2

    420,95= 0,4423

    R2 =SCTBl

    SC T=

    103,75

    420,95= 0,2464 ,

    que:

    a) El factor tipo de fertilizante explica el 44.23 % de la variabilidad en el rendimiento

    de la semilla de algodn.

    b) El factor tipo de terreno explica el 24.64 % de la variabilidad en el rendimientode la semilla de algodn.

    Es interesante ver los resultados que se hubiesen obtenido de no haberse realizado undiseo en bloques aleatorizados. Para ello, supongamos que prescindimos del factor tipode terreno y realizamos un anlisis de la varianza de un factor, obtenindose la tablaANOVA siguiente

    Tabla 4-7. Anlisis de la varianza para los datos del Ejemplo 4-1

    Fuentes de Suma de Grados de Cuadradosvariacin cuadrados libertad medios Fexp

    Entre tratamientos 186.20 4 46.55 2.974Residual 234.75 15 15.65

    TOTAL 420.95 19

    Si efectuamos el contraste al 5 % y comparamos el valor de la Fexp = 2,974, con elvalor de la F terica (F0,05;4,15 = 3,05), se concluye que no se puede rechazar H0 (igualdadde medias de tratamientos); es decir, no hemos podido encontrar diferencias significativas

    entre los distintos tipos de fertilizantes aunque si se detectaron dichas diferencias al aplicarel modelo en bloques aleatorizados.

    Con este ejemplo se ilustra el hecho de que aunque los bloques no resulten significativa-mente diferentes, en algunas situaciones no es conveniente prescindir de ellos. Pero cmosaber cuando se puede prescindir de los bloques? La respuesta la tenemos en el valor dela F(exp), experimentalmente se ha comprobado que si dicho valor es mayor que 3, noconviene prescindir de los bloques para efectuar los contrastes.

  • 7/27/2019 Blo Ques Completo s

    31/38

    5.3 Comparaciones mltiples 31

    5.3. Comparaciones mltiples

    Si el anlisis de la varianza confirma la existencia de diferencias significativas entrelos tratamientos o entre los bloques, es conveniente investigar qu medias son distintasrealizando las comparaciones mltiples correspondientes a los tratamientos o a los bloqueso a ambos. Para ello se realizarn cualesquiera de los procedimientos de comparacionesmltiples estudiados en el Captulo 2. Simplemente hay que recordar que, en el diseoen bloques aleatorizados los grados de libertad del error son ((I 1)(J 1)) en lugar de(N I) del diseo completamente aleatorizado y en el caso de comparaciones de mediasrelativas a los tratamientos hay que reemplazar en las frmulas correspondientes el nmero

    de repeticiones (n) del diseo completamente aleatorizado, por el nmero de bloques (J).Como ilustracin vamos a realizar comparaciones entre las medias de los tratamientosutilizando la prueba de rangos mltiples de Tukey con los datos del ejemplo de referencia.

    En este ejemplo, los valores de los cinco promedios de los tratamientos son:

    y1. = 86 ; y2. = 88 ; y3. = 91,75 ; y4. = 93 ; y5. = 94 .

    As, por ejemplo, si realizamos la comparacin entre los tratamientos 1 y 2, el valorcrtico HSD correspondiente a un nivel de significacin del 5 % se calcula como

    HS D = q,I,(I1)(J1)S2R

    J= q0,05,5,1210,9166

    4= (4,51)(1,65) = 7,4415 .

    Puesto que se verifica:| y1. y2. |= 2 < H SD ,

    se concluye que las medias 1 y 2 no difieren significativamente.

    Adems de los procedimientos analticos de comparaciones mltiples tambin se puedeadaptar el mtodo grfico visto en la subseccin ?? del Captulo 2 que nos muestra quemedias son significativamente diferentes. Este procedimiento consiste en utilizar como

    distribucin de referencia una distribucin t ajustada por el factor de escala S2R/J,para la comparacin de las medias de los tratamientos, donde es el nmero de grados delibertad de la varianza residual.

    En la Figura 4-2 se representan las 5 medias de los fertilizantes del Ejemplo 4-1 enrelacin con la distribucin de referencia t con 12 grados de libertad y con un factor deescala

    10,9166/4 = 1,65. Esta figura muestra que los procedimientos grficos a vecesno son suficientemente claros. Sin embargo, en dicha figura puede observarse que hay una

  • 7/27/2019 Blo Ques Completo s

    32/38

    32 Diseos en bloques aleatorizados

    gran diferencia entre los tratamientos 1 y 5, como se comprobar posteriormente en lasubseccin ?? mediante el procedimiento de Tukey realizado con S.

    Figura 4-2

    Tambin se puede comprobar qu bloques son significativamente distintos mediante

    un procedimiento grfico como el anterior, pero con un factor de escalaS2R/I, que en

    nuestro ejemplo tiene el valor

    10,9166/5 = 1,47761. Dicho procedimiento se muestra enla Figura 4-3, donde comprobamos que se confirma el resultado del contraste F del anlisisde la varianza, es decir, no hay diferencias significativas entre los bloques.

    Figura 4-3

    5.4. Comprobacin de la idoneidad del modelo

    La comprobacin de la idoneidad del modelo requiere contrastar las hiptesis dadasen (5.5). Los contrastes de normalidad, homocedasticidad e independencia son anlogos alos realizados en el modelo completamente aleatorizado, por lo que remitimos al lector alCaptulo 3, con la diferencia de que en el modelo en bloques aleatorizados tambin hay

  • 7/27/2019 Blo Ques Completo s

    33/38

    5.4 Comprobacin de la idoneidad del modelo 33

    que estudiar la variabilidad del error por bloques.

    En este modelo hemos supuesto otra hiptesis adicional, la aditividad de los efectos detratamiento y bloque, es decir, hemos supuesto un modelo en el que el efecto de un factorno depende del nivel del otro factor. A pesar de que este modelo aditivo es a menudo til,existen situaciones en las que resulta inadecuado, por ejemplo, las diferencias entre dosfertilizantes pueden ser mayores cuando se aplican en el bloque 1 que cuando se aplican enel bloque 3. Cuando esto ocurre se dice que existe interaccin entre los tratamientos y losbloques, y entonces el modelo de ecuacin (5.4) no es adecuado. Por lo tanto, la hiptesisde aditividad tambin debe ser contrastada.

    5.4.1. Test de Interaccin de Tukey

    Cuando existe interaccin entre tratamiento y bloque, el modelo tendr en generalla siguiente ecuacin

    yij = + i + j + ( )ij + uij i = 1, 2, , I j = 1, 2, , J , (5.52)

    donde el trmino ( )ij representa la interaccin. Se suponen las siguientes restriccionespara los parmetros

    i i =j j =i ( )ij =j ()ij = 0 ,por lo tanto el nmero de parmetros independientes de este modelo sera

    1 + (I 1) + (J 1) + (I 1)(J 1) = IJ ,

    que, puesto que hay una sola observacin por celdilla, coincide con el nmero de obser-vaciones, no habiendo suficientes grados de libertad para estimar la varianza residual. Unprocedimiento para solventar este problema consiste en tomar ms de una observacin porceldilla.

    Tukey (1949) desarroll un mtodo para determinar si existe interaccin entre tratamien-

    tos y bloques, cuando slo hay una observacin por celdilla, conocido como el test de in-teraccin de un grado de libertad de Tukey. Este procedimiento supone que la forma de lainteraccin es particularmente simple, es decir

    ( )ij = ij ,

    en donde es una constante desconocida. De esta forma las interacciones aaden nica-mente un parmetro, y el modelo resultante es:

  • 7/27/2019 Blo Ques Completo s

    34/38

    34 Diseos en bloques aleatorizados

    yij = + i + j + ij + uij i = 1, 2, , I ; j = 1, 2, , J , (5.53)

    siendo las restricciones para este modeloi

    i =j

    j =i

    ij =j

    ij = 0 .

    En primer lugar abordaremos la estimacin de los parmetros del modelo. Para ello,se construye la funcin de verosimilitud asociada a la muestra y =(y11, , y1J , ,yI1 , , yIJ):

    L(, i, j, , 2) = (22)

    N

    2 exp

    122

    Ii=1

    Jj=1

    yij i j ij2 ,

    (5.54)se determina el logaritmo de dicha funcin

    ln(L(, i, 2)) =

    N

    2ln(2)

    N

    2ln(2)

    1

    22

    Ii=1

    Jj=1

    yij i j ij2

    ,

    (5.55)y se hallan las primeras derivadas parciales respecto de los parmetros del modelo, obtenin-dose las mismas expresiones que en (5.12)-(5.14) para los estimadores de los parmetros, i y j .

    El estimador mximo verosimil de se obtiene realizando la correspondiente derivadaparcial, es decir

    lnL

    =

    1

    2

    Ii=1

    Jj=1

    yij i j ij

    ij = 0 (5.56)

    de donde

    Ii=1

    Jj=1

    yijij I

    i=1

    i

    Jj=1

    j I

    i=1

    2i

    Jj=1

    j J

    j=1

    2j

    Ii=1

    i I

    i=1

    2i

    Jj=1

    2j = 0 .

  • 7/27/2019 Blo Ques Completo s

    35/38

    5.4 Comprobacin de la idoneidad del modelo 35

    Por lo tanto

    =I

    i=1

    Jj=1

    ijyijI

    i=1

    2i Jj=1

    2j, (5.57)

    y reemplazando i y j por sus respectivos estimadores muestrales, tenemos

    =I

    i=1J

    j=1(yi. y..)(y.j y..)yijI

    i=1

    (yi. y..)2J

    j=1

    (y.j y..)2

    . (5.58)

    Como hemos supuesto la existencia de interaccin entre los factores, hay que introduciren este modelo una suma de cuadrados que represente dicha interaccin, esta suma decuadrados se denota por SCIT y viene dada por la expresin

    SCIT =

    i j2

    2i

    2

    j , (5.59)

    que recibe el nombre de suma de cuadrados debida a la interaccin o no-aditividad delmodelo, que tambin se puede expresar, sustituyendo los correspondientes estimadoresmuestrales, de la siguiente forma

    SCIT =I

    i=1

    Jj=1

    2(yi. y..)2(y.j y..)2 = I

    i=1

    Jj=1

    (yi. y..)(y.j y..)yij

    2I

    i=1

    (yi. y..)2J

    j=1

    (y.j y..)2

    . (5.60)

    Por lo tanto, la ecuacin bsica del anlisis de la varianza para el modelo con inter-accin (5.53) debe tener un trmino ms que la citada ecuacin del modelo en bloquesaleatorizados. Dicha ecuacin se expresa simblicamente en la forma

    SC T = SCTr + SCBl + SCIT+ SCR , (5.61)

    donde

  • 7/27/2019 Blo Ques Completo s

    36/38

    36 Diseos en bloques aleatorizados

    SCTr es la suma de cuadrados entre tratamientos

    SCBl es la suma de cuadrados entre bloques

    SCIT es la suma de cuadrados debida a la interaccin por Tukey

    SC R es la suma de cuadrados residual que se obtiene como

    SC R = SC T SCTr SCBl SC IT .

    Se demuestra que si = 0, esto es, si no hay interaccin del tipo ij , entoncesSCIT/2 y SCR/2 son variables aleatorias independientes distribuidas segn una 2

    con 1 y IJ I J grados de libertad, respectivamente. Por tanto, si = 0, el estadsticode contraste

    F =SCIT/1

    SCR/(IJ I J), (5.62)

    se distribuye segn una F de Snedecor con 1, IJ I J grados de libertad. As, paracontrastar

    H0 : = 0 (no hay interaccin)H1 : = 0 ( hay interaccin del tipo ij) ,

    (5.63)

    puesto que, F se distribuye como una F1,IJIJ cuando H0 es cierta y puesto que losvalores grandes de Fexp conducen a la conclusin H1, la decisin apropiada para controlarun riesgo de error de Tipo I igual a , es:

    Si Fexp F,1,IJIJ , se acepta H0

    Si Fexp > F,1,IJIJ , se rechaza H0 ,(5.64)

    donde F,1,IJIJ es el punto crtico superior de la distribucin F con 1 y IJ I Jgrados de libertad.

    A fin de ilustrar este procedimiento utilicemos el Ejemplo 4-1. Para ello, construimosla Tabla 4-8, organizando los datos de la siguiente manera:

  • 7/27/2019 Blo Ques Completo s

    37/38

    5.4 Comprobacin de la idoneidad del modelo 37

    Tabla 4-8. Datos del Ejemplo 4-1

    Bloques

    Fert. A B C D yi. i 2i Jj=1ijyij

    1 87 86 88 83 86,00 4,55 20,702 69,162 85 87 95 85 88,00 2,55 6,502 78,033 90 92 95 90 91,75 1,20 1,440 19,62

    4 89 97 98 88 93,00 2,45 6,002 91,635 99 96 91 90 94,00 3,45 11,902 14,49

    y.j 90 91,6 93,4 87,2 90,55 = y.. 46,55 21,45j 0,55 1,05 2,85 3,352j 0,302 1,102 8,122 11,222 20,75En primer lugar calculamos el estimador de y la suma de cuadrados de la interaccin

    SCIT

    =i

    j

    i

    jyij

    i

    2ij

    2j =21,45

    (46,55)(20,75)= 0,0222 ,

    SCIT =i

    j

    22i2j = (0,022)2(46,55)(20,75) = 0,4760 .Continuamos con la suma de cuadrados debida al error SC R

    SC R = SC T SCTr SCBl SCIT = 420,95 186,20 103,75 0,4760 = 130,524 .

    Por lo tanto el valor del estadstico de contraste es

    Fexp =SCIT/1

    SC R/(IJ I J)=

    0,4760

    130,524/11= 0,04011 .

    Si realizamos el contraste al nivel de significacin del 5 %, como el valor de la F tericaes F0,05,1,11 = 4,84 y puesto que Fexp = 0,04011 < 4,84 se concluye que no hay interaccinentre los fertilizantes y los bloques de terreno.

  • 7/27/2019 Blo Ques Completo s

    38/38

    38 Diseos en bloques aleatorizados

    Bibliografa utilizada

    Garca Leal, J. & Lara Porras, A.M. (1998). Diseo Estadstico de Experimentos.Anlisis de la Varianza. Grupo Editorial Universitario.

    Lara Porras, A.M. (2000). Diseo Estadstico de Experimentos, Anlisis de la Vari-anza y Temas Relacionados: Tratamiento Informtico mediante SPSS Proyecto Surde Ediciones.