U3 Diseño en Bloques Actual

18
1 3 DISEÑO EN BLOQUES El objetivo del diseño en bloques es el mismo que el del completamente aleatorizado: analizar los efectos de uno o varios factores (variables independientes) sobre una variable de respuesta (variable dependiente); la diferencia entre ambos diseños radica en que para el diseño en bloques se toma en cuenta un nuevo factor (no considerado en los objetivos generales del experimento) con características peculiares. El investigador supone, con bases bien fundadas, que el nuevo factor contribuye significativamente a la variación total, por lo cual descompone a la variación total en una fuente más (ahora tenemos tres fuentes en vez de las dos del completamente aleatorizado). El manejo estadístico de los niveles del nuevo factor permite disminuir el error experimental y detectar con mayor precisión las diferencias de la respuesta entre los tratamientos. Alrededor de 1925, Fisher buscaba métodos para mejorar los experimentos en la agricultura; dividió la tierra en bloques, internamente homogéneos aunque entre ellos pudiera darse bastante heterogeneidad, y volvió a subdividir a cada bloque en parcelas asignándolas al azar a los cuatro tratamientos. Partiendo de la diferencia de las respuestas entre los tratamientos, el alto grado de homogeneidad de las unidades experimentales (parcelas) dentro de cada bloque permitió medir más eficazmente los efectos de los tratamientos y disminuir además la variación debida al error experimental (los factores no controlados del experimento). Este es el origen de los diseños en bloques. En la actualidad se aplican ampliamente en las más diversas disciplinas. Un ejemplo: si los tratamientos están constituidos por cuatro marcas de llantas y la respuesta es la resistencia al desgaste sufrido por el uso, al considerar a los vehículos como bloques se aíslan, quedando bajo control, fuentes de variación tan determinantes como el peso del motor, las condiciones mecánicas de la suspensión de los vehículos, el estilo de manejo del operador de cada unidad, las condiciones de los caminos transitados, las variaciones climatológicas, etc. Un bloque, o sea un vehículo, será una unidad experimental homogénea si se van intercambiando las llantas de atrás para adelante y viceversa, de manera que cada llanta recorra la misma distancia en la misma posición que las demás, con ello nos aseguramos de que, dentro de cada bloque (vehículo), el desgaste de las llantas responda más al factor “calidad de su fabricación (marca)” que a los

description

Estadistica Inferencial II

Transcript of U3 Diseño en Bloques Actual

  • 1

    3 DISEO EN BLOQUES

    El objetivo del diseo en bloques es el mismo que el del completamente aleatorizado: analizar los efectos de uno o varios factores (variables independientes) sobre una variable de respuesta (variable dependiente); la diferencia entre ambos diseos radica en que para el diseo en bloques se toma en cuenta un nuevo factor (no considerado en los objetivos generales del experimento) con caractersticas peculiares.

    El investigador supone, con bases bien fundadas, que el nuevo factor contribuye significativamente a la variacin total, por lo cual descompone a la variacin total en una fuente ms (ahora tenemos tres fuentes en vez de las dos del completamente aleatorizado). El manejo estadstico de los niveles del nuevo factor permite disminuir el error experimental y detectar con mayor precisin las diferencias de la respuesta entre los tratamientos.

    Alrededor de 1925, Fisher buscaba mtodos para mejorar los experimentos en la agricultura; dividi la tierra en bloques, internamente homogneos aunque entre ellos pudiera darse bastante heterogeneidad, y volvi a subdividir a cada bloque en parcelas asignndolas al azar a los cuatro tratamientos. Partiendo de la diferencia de las respuestas entre los tratamientos, el alto grado de homogeneidad de las unidades experimentales (parcelas) dentro de cada bloque permiti medir ms eficazmente los efectos de los tratamientos y disminuir adems la variacin debida al error experimental (los factores no controlados del experimento).

    Este es el origen de los diseos en bloques. En la actualidad se aplican ampliamente en las ms diversas disciplinas. Un ejemplo: si los tratamientos estn constituidos por cuatro marcas de llantas y la respuesta es la resistencia al desgaste sufrido por el uso, al considerar a los vehculos como bloques se aslan, quedando bajo control, fuentes de variacin tan determinantes como el peso del motor, las condiciones mecnicas de la suspensin de los vehculos, el estilo de manejo del operador de cada unidad, las condiciones de los caminos transitados, las variaciones climatolgicas, etc.

    Un bloque, o sea un vehculo, ser una unidad experimental homognea si se van intercambiando las llantas de atrs para adelante y viceversa, de manera que cada llanta recorra la misma distancia en la misma posicin que las dems, con ello nos aseguramos de que, dentro de cada bloque (vehculo), el desgaste de las llantas responda ms al factor calidad de su fabricacin (marca) que a los

  • 2

    numerosos imponderables ya mencionados, los cuales quedan contenidos en la fuente de variacin debida a los bloques, separndose tal fuente del error experimental.

    El caso ms sencillo del diseo en bloques es el mtodo de la prueba de hiptesis para dos medias de poblacin con muestras dependientes relacionadas por parejas. Veamos el siguiente ejemplo

    Ejemplo 3.2. Se desea conocer qu tan eficaz resulta una dieta para reducir el peso de las personas, para lo cual se selecciona una muestra aleatoria de 16 personas interesadas en bajar de peso, se registra el peso de cada persona antes y despus del tratamiento. El criterio mdico de eficacia es reducir cinco kilos o ms el peso medio de las personas por efecto de la dieta.

    Persona 1 2 3 4 16 Antes 96.9 89.11 105.7 112 126.3 Despus 93.1 83.0 101.9 105.87 123.3

    En este ejemplo tenemos dos muestras aleatorias que no son independientes sino que estn relacionadas entre s por parejas. Cada persona sometida a la dieta constituye un bloque, es una unidad homognea de material experimental en la cual se miden los efectos de la dieta en trminos del peso antes y despus de someterse a la dieta.

    Si las muestras en vez de ser pareadas fueran independientes (diseo completamente aleatorizado), o sea que fuesen dos conjuntos distintos de personas, el diseo sera tan complicado que se perdera el control de la diferencia entre los pesos antes y despus de la dieta.

    El diseo en bloques (cuando los bloques estn bien construidos) es ms preciso para medir los efectos del factor experimental que el diseo anlogo completamente aleatorizado (con muestras independientes), adems de ser ms sencillo y econmico de aplicar.

    Un diseo en bloques es completo cuando cada bloque queda dividido de modo que el nmero de unidades experimentales en cada bloque es igual del nmero de tratamientos, (por ejemplo, cada vehculo tiene asignadas las cuatro marcas de llantas).

  • 3

    Hay diseos en bloque que no son completos (no todos los tratamientos estn en cada bloque o usan varios tipos de bloques a la vez) A continuacin se dan ejemplos importantes de diseo experimental.

    1. COMPLETAMENTE ALEATORIZADO: Suponga que se pretende realizar un experimento agrcola como el de la parcela de Fisher. Para disear un experimento de este tipo, se divide el terreno en 4 x 4 = 16 lotes (ver figura 3-1) y se asigna a cada tratamiento, indicado por A, B, C y D, a cuatro bloques que se eligen de manera completamente aleatoria. El propsito de la aleatorizacin es eliminar diversas fuentes de error, como la fertilidad de la tierra.

    D A C C I C B A D D B C A B A D C

    B D B A II A B D C B D A C A B C D

    D C B D III B C D A C A D B D C B A

    A B C A IV A D C B A C B D C D A B

    2. DE BLOQUES ALEATORIZADO: cuando es necesario tener un conjunto completo de tratamientos para cada bloque, los tratamientos A, B, C y D se introducen en orden aleatorio dentro de cada bloque I, II, III y IV (ver figura -3-2), y, por tanto, los bloques se llaman bloques aleatorizados. Este tipo de diseo se usa cuando se desea controlar una fuente de error o variabilidad, o sea, la diferencia entre los bloques (los renglones de la figura 3-2).

    3. CUADRADOS LATINOS: Para algunos propsitos, es necesario controlar dos fuentes de error o variabilidad al mismo tiempo, como la diferencia de los renglones y la de las columnas. En el experimento del ejemplo 3-2, es posible que los errores en diferentes renglones y columnas se deban a cambios en la fertilidad de la tierra en diferentes partes del terreno. En ese caso, es deseable que cada tratamiento ocurra una vez en cada rengln y una vez en cada columna, como en la figura 3-3. El arreglo se llama cuadrado latino porque se usan las letras latina A, B, C y D.

    EL DISEO EN BLOQUES COMPLETAMENTE ALEATORIZADO es el que contiene I-tratamientos y m-bloques con i unidades experimentales cada bloque, de tal modo que cada tratamiento aparece exactamente una vez en cada bloque, siendo al azar la asignacin de los tratamientos a las unidades experimentales en cada bloque o de estas unidades a los tratamientos.

    Completamente aleatorio Figura 3-1

    De bloques aleatorizado Figura 3-2

    Cuadrado latino Figura 3-3

    Cuadrado grecolatino Figura 3-4

  • 4

    4. CUADRADOS GRECOLATINOS: Si es necesario controlar tres fuentes de error o variabilidad, se usa un cuadrado grecolatino, como se ilustra en la figura 3-4. Este cuadrado consiste bsicamente en dos cuadrados superpuestos, usando las letras latinas A, B, C y D para un cuadrado mientras que se utilizan las letras griegas , , y para los otros cuadrados. El requisito adicional que debe cumplirse es que se necesita usar cada letra latina slo una vez con cada letra griega. Cuando se cumple esta propiedad, se dice que el cuadrado es ortogonal.

    3.1 DISEOS EN BLOQUE COMPLETAMENTE ALEATORIOS

    En algunos experimentos hay factores que varan y tienen un efecto en la respuesta, pero esos efectos son irrelevantes para el experimentador.

    Si las condiciones que pueden afectar el resultado se desvan da tras da, entonces este concepto representa un factor en el experimento, aunque puede haber un nulo inters en calcular su efecto.

    Para un ejemplo ms especfico, imaginemos que queremos evaluar tres tipos de fertilizante con respecto a su efecto sobre la cosecha de fruta en una huerta de naranjas y que se realizaran tres rplicas con un total de nueve observaciones.

    Un rea se divide en nueve parcelas, en tres hileras de tres parcelas cada hilera. Supondremos que hay una cada de agua a lo largo del rea de la parcela, por lo que ahora las hileras reciben cantidades diferentes de agua. La cantidad del agua es ahora un factor en el experimento, aunque no hay inters en calcular el efecto de la cantidad de agua sobre la cosecha de naranja.

    Si se ignora el factor de agua, un experimento de un solo factor se podra realizar con el fertilizante como el nico factor. Cada uno de los tres fertilizantes sera asignado a tres parcelas. En un experimento completamente aleatorio, los tratamientos serian asignados a las parcelas al azar. La figura 3-5 presenta dos arreglos aleatorios posibles. En el arreglo de la izquierda, las parcelas con fertilizante A tienen ms agua que las de los otros dos fertilizantes. En la parcela de la derecha, las parcelas con el fertilizante C tienen ms agua. Cuando los tratamientos para un factor son asignados completamente al azar, es probable que no sea distribuido uniformemente sobre los niveles de otro factor.

  • 5

    A A B Ms agua C B C Ms agua B C A A C B B C C Menos agua A A B Menos agua

    Si la cantidad de agua tiene un efecto insignificante sobre la respuesta, entonces es adecuado el diseo de un solo factor completamente aleatorio. No hay por qu preocuparse por un factor que no afecta la respuesta. Pero ahora supongamos que el nivel de agua tiene un impacto importante en la respuesta. Entonces la figura 3-5 muestra que en cualquier otro experimento los efectos estimados de los tratamientos estn probablemente sesgados, por los niveles diferentes de agua. Los arreglos diferentes de los tratamientos desvan las estimaciones en diferentes direcciones. Si el experimento se repite varias veces, las estimaciones probablemente varen mucho de repeticin en repeticin. Por esta razn, el diseo de un solo factor completamente aleatorio produce efectos que tienen incertidumbres grandes.

    Un mejor diseo para este experimento es uno que contenga dos factores, con el agua como segundo factor. Debido a que los efectos del agua son irrelevantes, el agua se llama factor bloqueado, en vez de un factor de tratamiento. En el experimento de dos factores hay nueve combinaciones de bloque tratamiento, por lo que corresponde a los tres niveles del tratamiento fertilizante y a los tres niveles de bloque de agua. Con nueve unidades experimentales (las nueve parcelas) es necesario asignar una parcela a cada combinacin de fertilizante y agua. La figura 3-6 presenta dos arreglos posibles.

    Bloque 1 A C B Ms agua Bloque 1 C B A Ms agua Bloque 2 B A C Bloque 2 A B C Bloque 3 B C A Menos agua Bloque 3 B A C Menos agua

    Los tratamientos estn aleatorizados dentro de los bloques. Debido a que cada combinacin posible de tratamiento y bloques es incluida en el experimento, el diseo est completo. Por esta razn el diseo se llama diseo en bloques completamente aleatorios.

    Los datos de un diseo de bloques completamente aleatorios se analizan con un ANOVA de dos factores.

    Figura 3-5 Dos arreglos posibles para fertilizantes, A, B y C, asignados a las nueve parcelas en forma completamente aleatoria. Es probable que las cantidades de agua sean diferentes para los diferentes fertilizantes.

    Figura 3-6 Dos arreglos posibles para fertilizantes, A, B y C, con la restriccin de que cada fertilizante debe aparecer una vez en cada nivel de agua (bloque). La distribucin de niveles de agua es siempre la misma para cada fertilizante.

  • 6

    Para facilitar dicho anlisis usaremos la siguiente forma de condensar los datos del diseo de experimento.

    DISEO EN BLOQUES COMPLETAMENTE ALEATORIZADOS BLOQUES

    TRATAMIENTOS 1 2 3 M TOTAL DE TRATAMIENTOS MEDIA DE TRATAMIENTOS

    1 X11 X12 X13 X1m T1 2 X21 X22 X23 X2m T2 3 X31 X32 X33 X3m T3 ... ...

    ...

    I Xi1 Xi2 Xi3 Xim Ti TOTAL DE BLOQUES T

    1 T2 T3 Tm T Gran total MEDIA DE BLOQUES .. Gran media muestral

    Ejemplo 3.3 Se estudia el efecto de tres fertilizantes sobre la cosecha en una huerta de naranjas. Se estn utilizando nueve parcelas de tierra, dividida en bloques de tres parcelas cada una. Se usa un diseo en bloques completamente aleatorio, aplicando cada fertilizante una vez en cada bloque. Los resultados, en kilos de la fruta cosechada, se presentan en la tabla siguiente. Nota.- las cantidades en negritas son los kilos de la fruta cosechada, las dems cantidades son valores que calculamos para usarlos posteriormente en ANOVA.

    Con los datos anteriores podremos realizar la ANOVA, como sigue: ANLISIS DE VARIANZA

    Origen de las

    variaciones

    Suma de

    cuadrados

    Grados de

    libertad Promedio de los cuadrados F Valor crtico para F

    Tratamientos SCTR I-1 = 1

    ; 1, 1 1

    Bloques SCBL m-1 = 1

    ; 1, 1 1

    Error SCE (I-1)(m-1) = 1 1

    Total STC N-1

    PARCELAS (M) FERTILIZANTE (I) 1 2 3 TOTAL DE TRATAM MEDIA DE TRATAM ()

    A 430 542 287 1259 419.66 B 367 463 253 1083 361.00 C 320 421 207 948 316.00

    TOTAL DE BLOQUE 1,117 1,426 747 3,290 Gran total MEDIA DE BLOQUE () 372.33 475.33 249.00 365.55 Gran media muestral

  • 7

    CLCULOS Y CONCLUSIONES

    Los clculos de la tabla anterior se realizan en cuatro pasos. Adems de la notacin I, m y N ya introducida, usaremos:

    = valor de la observacin correspondiente al tratamiento i en el bloque m = gran total o total global (suma de todos las observaciones) = media muestral con el tratamiento i = media muestral en el bloque m = gran media muestral

    PASO 1.- Calcular la suma total de cuadrados (STC)

    = (4302 + 5422 + 2872 + 3672 + 4632 + 2532 + 3202 + 4212 + 2072) , ! = 93,912.22

    PASO 2.- Calcular la suma de los cuadrados debido a los tratamientos (SCTR)

    = ,"!#, $!#%$!

    -

    , ! = 16,213.55

    PASO 3.- Calcular la suma de los cuadrados debido a los bloques (SCBL)

    = ,&!#,%'!#&%&!

    -

    , ! =77,046.88

    PASO 4.- Calcular la suma de cuadrados debido al error (SCE)

    = 93,912.22 16,213.55 77,046.88 = 651.78

    A continuacin se muestra el ANOVA calculado usando Excel.

    = (

    )

    *

    +

    = (

    )

    *

    +

    =

    = ( ( )

    *

    *

    +

  • 8

    ANLISIS DE VARIANZA

    Origen de

    las

    variaciones

    Suma de

    cuadrados

    Grados de

    libertad

    Promedio

    de los

    cuadrados F Probabilidad

    Valor

    crtico para

    F

    Filas 16213.5556 2 8106.77778 49.75179 0.00149351 6.94427191 Columnas 77046.8889 2 38523.4444 236.42073 7.0367E-05 6.94427191

    Error 651.777778 4 162.944444

    Total 93912.2222 8

    NOTA: Los efectos de un factor (el factor de tratamiento) son relevantes, mientras que los efectos del otro factor (el factor bloqueado) no. El factor bloqueado se incluye para reducir la incertidumbre en las estimaciones del efecto principal del factor del tratamiento.

    Con los datos anteriores, podemos concluir que la media de las cosechas difiere entre los fertilizantes?

    SOLUCIN: Se realiza la prueba de hiptesis.

    1. Establecer hiptesis estadstica: ,-: /0 = /1 = /2 ,0: 34 567-8 973 /: 68 ;67?6

    2. Estadstico de prueba o contraste Fcal @ = ABCDABE = 49.75179

    3. Valor crtico: ; 1, 1 1, as tenemos que con un nivel de significancia de 0.05 = 6.944

    4. Regla de decisin: Se rechaza FG si Fcal > ; sabemos que 49.75179 > 6.944,

    5. Decisin tcnica o inferencia: la evidencia experimental da elementos significativos para afirmar que el fertilizante tiene un efecto sobre la cosecha de naranjas. s hay diferencias entre las parcelas respecto al tipo de fertilizante aplicado

    El diseo de experimentos descrito en esta seccin es, como ya lo dijimos, de bloques completo; la palabra completo indica que cada bloque se somete a todos los I tratamientos. Es decir todos los fertilizantes (tratamientos) fueron probados en las 3 parcelas (bloques). A los diseos de experimentos en los que a cada

  • 9

    bloque se le aplican algunos, pero no todos, los tratamientos se les llaman diseo de bloques incompletos.

    3.2 DISEOS EN CUADRO LATINO En el diseo en cuadro latino se controlan dos factores de bloque y se estudia un factor de tratamientos, por lo que se tienen cuatro fuentes de variabilidad que pueden afectar la respuesta observada, stas son: los tratamientos, el factor de bloque 2 (columnas), el factor de bloques 1 (renglones) y el error aleatorio.

    Se llama cuadro debido a que tiene la restriccin adicional de que los tres factores involucrados se prueban en la misma cantidad de niveles, y es latino porque se utilizan las letras latinas para denotar los tratamientos o niveles de factor de inters.

    Ahora se necesitan al menos tres subndices, por ejemplo, la respuesta H se gener en el tratamiento tres (C), en el primer nivel del factor rengln y en el tercer nivel de factor columna.

    BLOQUE 2 (columnas) 1 2 3

    BLOQUE 1 (renglones)

    1 A=H B=H C=H 2 B=H C=H A=H 3 C=H A=H B=H

    Ventajas del diseo en bloques: Controla las fuentes de variacin en las dos direcciones: filas y columnas, es decir, extrae del error experimental la variacin debida a tratamientos, filas y columnas.

    Desventajas Se pierden grados de libertad en el error experimental, sacrificando la precisin del diseo experimental.

    Debido a que el nmero de hileras y columnas debe ser igual al de tratamientos, el nmero de tratamientos es limitado.

    Restricciones Un tratamiento cualquiera debe estar solamente una vez en una fila. Un tratamiento cualquiera debe estar solamente una vez en una columna.

  • 10

    En cuanto al anlisis de varianza. El diseo permite partir la variacin total en 4 componentes:

    Renglones (Filas, hileras y por tanto bloque 1) Columnas (bloque 2) Tratamientos (letras latinas) Error experimental

    ANOVA para el diseo de cuadro latino. Las frmulas de trabajo son como siguen:

    Fuente de variacin

    Suma de cuadrados GL Cuadrado medio F Valor crtico

    Renglones (Bloque 1) = H

    J @ r-1 = KJ

    ; J 1, J 1L 2

    Columnas (Bloque 2) = HN

    L @ c-1 = KL

    Tratamientos = HO

    L @ c-1 = KP

    Error = J 1L 2 = KQ

    Total = ( HNR @ ( KJ, KL, KP, KQ

    Ejemplo 3.4 Un campesino desea probar los efectos de cuatro diferentes fertilizantes, A, B, C, D sobre la produccin de trigo. Para eliminar las fuentes de error debidas a la variabilidad en la fertilidad, usa los fertilizantes en un cuadrado latino arreglado como se ve en la tabla 3-4, donde los nmeros indican las producciones en quintales (46 kgm cada uno) por rea unitaria. Llevar a cabo un anlisis de varianza para determinar si hay una diferencia significativa entre los fertilizantes a un nivel de significancia de 0.05.

    A 18 C 21 D 25 B 11 D 22 B 12 A 15 C 19 B 15 A 20 C 23 D 24 C 22 D 21 B10 A 17

    Tabla 3-4

  • 11

    SOLUCIN:

    COLUMNAS (Bloque 2) FILAS 1 2 3 4 H H HO HO

    1 A 18 C 21 D 25 B 11 75 5625 70 4900 2 D 22 B 12 A 15 C 19 68 4624 48 2304 3 B 15 A 20 C 23 D 24 82 6724 85 7225 4 C 22 D 21 B 10 A 17 70 4900 92 8464 HN 77 74 73 71 295 21873 22893 HN 5929 5476 5329 5041 21775

    Tabla 3.5

    Para facilitar los clculos de las frmulas para el ANOVA; de la tabla 3-5, identificaremos sumatorias y determinaremos elementos necesarios para la misma de la siguiente manera.

    a) Sumatoria de los renglones al cuadrado (bloque 1): H = 21,873 b) Sumatoria de las columnas al cuadrado (bloque 2): HN = 21,775 c) Sumatoria de los tratamientos al cuadrado: HO = 22,893 d) Sumatoria total: HNO = 18 + 21 + 25 + 11 + 22 + +

    172=5,769

    Clculo de frmulas: Factor de correccin (FC): [\]^!_` =

    "!%% =

    $& "' = a, b2c. de

    a) = [\!_ @ ,$&% = 5,468.25 - 5,439.06 = 29.19 b) = []!` @ ,&&"% = 5,443.70 - 5,439.06 = 4.694.694.694.69 c) = [^!` @ ,$% = 5,723.25 - 5,439.06 = 284.19284.19284.19284.19 d) = 329.94 29.19 4.69 284.19 = 11.87 e) = HNO @ 5,769 - 5,439.06 = 329.94329.94329.94329.94

    H = i; 18+21+25+11 = 75

    HO = ij; L=A 18+20+15+17 = 70 L=B 15+12+10+11 = 48 HN = i; 18+22+15+22 = 77

    Bloque 1

  • 12

    ANOVA

    Fuente de variacin Suma de cuadrados

    GL Cuadrado medio

    F Valor crtico

    Renglones (Bloque 1) 29.19 4 -1= 3 9.73 4.92 4.76 Columnas (Bloque 2) 4.69 4 -1= 3 1.563 0.79 Tratamientos 284.19 4 -1= 3 94.73 47.90

    Error 11.87 4 14 2= 6 1.978 Total 329.94 15

    Tabla 3.6

    CONCLUSIN:

    Puesto que . ";,'*%.&', a un nivel de significancia de 0.05 es posible rechazar la hiptesis de que existen medias de renglones iguales. Se deduce que a un nivel de significancia de 0.05 existe una diferencia en la fertilidad de la tierra entre los renglones.

    Puesto que el valor de F para las columnas es menor que 1, se concluye que no hay diferencia entre la fertilidad de la tierra en las columnas.

    Puesto que el valor de F para los tratamientos es 47.9 > 4.76, se concluye que s hay una diferencia entre los fertilizantes.

    3.3 DISEOS EN CUADRO GRECOLATINO En este diseo se superpone un segundo cuadrado latino, el que se designa por letras griegas. Se dice que los dos cuadrados son ortogonales si al sobreponerse poseen la propiedad de que cada letra griega aparece slo una vez con cada letra latina.

    El diseo cuadrado grecolatino puede utilizarse para controlar sistemticamente tres fuentes extraas de variabilidad, en otras palabras, se usa para hacer un anlisis por bloques en tres direcciones. El diseo permite analizar cuatro factores (rengln, columna, letra latina y letra griega).

    Veamos el siguiente ejemplo: Estamos interesados en determinar si existe una diferencia entre el numero de millas por galn que se logra con las gasolinas A, B, C y D. Disearemos un experimento que incluya cuatro diferentes conductores, coches y carreteras.

  • 13

    Puesto que nmero (cuatro) de gasolinas, conductores, coches y carreteras es el mismo, es posible usar un cuadrado grecolatino. Se supone que los coches se representan por los renglones y los conductores por las columnas, como vemos en la tabla 3.7.

    CONDUCTORES

    COCH

    ES

    1 2 3 4 1 k lm no 2 lo k nm 3 n o m lk 4 m nk l o

    Tabla 3.7

    Se asignan las diferentes gasolinas A, B, C, D a renglones y columnas de manera aleatoria, lo que se sujeta slo al requisito de que cada letra aparece slo una vez en cada rengln y slo una vez en cada columna. En consecuencia, cada conductor tendr la oportunidad de manejar cada coche y de usar cada tipo de gasolina (ningn coche utiliza dos veces la misma gasolina).

    Ahora se asignan, de manera aleatoria, las cuatro carreteras que se van a utilizar, denotadas por las letras griegas, mismas que estn sujetas al mismo requisito impuesto a las letras latinas. Por tanto, cada conductor tendr una oportunidad de manejar en cada una de las carreteras. Un posible arreglo es el siguiente:

    CONDUCTORES

    COCH

    ES

    1 2 3 4 1 k 19 lm 16 no 16 14 2 lo 15 18 k 11 nm 15 3 n 14 o 11 m 21 lk 16 4 m 16 nk 16 l 15 o 23

    Tabla 3.8

    Supongamos que, al llevar a cabo este experimento, los nmeros de millas por galn estn dados como se muestra en la tabla 3.9. Emplearemos un nivel de 0.05 para el anlisis de varianza y as determinar si hay alguna diferencia significativa en las millas por galn de las diversas gasolinas.

    SOLUCIN: primero obtenemos los totales de los renglones, columnas, tratamientos latinos y tratamientos griegos.

  • 14

    1 2 3 4 H H HO HO Hj Hj 1 pq 19 rs 16 tu 16 vw 14 65 4225 62 3844 61 3721 2 ru 15 pw 18 vq 11 ts 15 59 3481 81 6561 68 4624 3 tw 14 vu 11 ps 21 rq 16 62 3844 52 2704 62 3844 4 vs 16 tq 16 rw 15 pu 23 70 4900 61 3721 65 4225 HN 64 61 63 68 256 16,450 16,830 16,414 HN 4096 3721 3969 4624 16,410

    Ahora calculamos las variaciones que corresponden a todo lo anterior.

    Factor de correccin (FC): [\]!_` ="'!%% =

    '""'' = b, dce

    f) = [\!_ @ '%" % = 4,112.5 4,096 = 16.50 g) = []!` @ ',% % = 4,102.50 4,096 = 6666....50505050 h) yzP{|G} = [^!` @ '$ % = 4,207.50 - 4096 = 111.50111.50111.50111.50 i) ~J{Q~G} = [!` @ '%%% = 4,103.50 - 4096 = 7.507.507.507.50 j) = 148 16.5 6.5 111.5 - 7.5 = 6 k) = HN @ 4,244 - 4096 = 148148148148 l) zyGJ LJP{LG: ; J 1, J 1L 3 . "; 4 1, 4 14 3 = . "; 3,3 = 9.28

    Los resultados obtenidos los ubicamos en la ANOVA correspondiente, de la siguiente manera:

    ANOVA Fuente de Variacin SC GL CM F Valor C. Filas 16.5 3 5.5 2.75 9.28 Columnas 6.5 3 2.167 1.08 Tratamientos latinos (ABCD) 111.5 3 37.167 18.6 Tratamientos griegos (, , , , 7.5 3 2.5 1.25 Errores 6.0 3 2.0 Total 148.0 15

    H = i; 19+16+16+14 = 65 HO = ij; L=A 15+16+15+16 = 62 L=B 19+18+21+23 = 81

    Hj = i; l= 14+18+15+14 = 61 l= 16+16+21+15 = 68 HN = i; 19+15+14+16 = 64

  • 15

    PRUEBA DE HIPOTESIS: F: % F: zy Q|G} G} Q yz} ) }G| {QJQ|PQ}

    @` 18.6

    9.28

    CONCLUSIN: Debido a que @` 18.6 > 9.28, se rechaza la hiptesis nula de que las gasolinas rinden iguales millas por galn.

    3.4 USO DE SOFTWARE ESTADSTICO (Minitab)

    Trabajaremos ahora en un ejemplo para Bloques Completos Aleatorizados.

    1. Ingreso de datos: Tomemos los datos del ejemplo 3.3 de la pgina 6 de este material. En la hoja de trabajo de Minitab, copiamos tres vectores de datos uno que identifica el tipo de fertilizante, el otro corresponde a la parcela y finalmente la variable respuesta (kilogramos por parcela) en correspondencia por fila con el factor y el efecto bloqueado.

    2. El segundo paso sera seleccionar el procedimiento o prueba a realizar, en este caso queremos realizar un ANOVA con un factor y un efecto bloqueado. Para realizar este paso debemos buscar entre las opciones que se presentan en la parte superior del Men principal de .

    f=9.28 F=18.6

  • 16

    3. Seleccionamos primero la opcin y dentro de sta escogemos la opcin . Dentro de esta opcin se puede escoger entre estas dos opciones . Para este ejemplo, trabajaremos con la segunda opcin .

    4. Al seleccionar se presenta la siguiente pantalla (vase la siguiente Figura siguiente). En sta usted debe indicar cul es el vector o columna correspondiente a la variable respuesta () y el modelo que est considerndose ().

    Note que este casillero tiene que incluir tanto el factor fertilizante como el bloque parcela. Esto se hace colocando el puntero en la ventana para cada campo y

  • 17

    oprimiendo el botn izquierdo del ratn dos veces consecutivas luego de llevarlo hasta el nombre de la columna. Tambin puede hacerse usando el botn luego de seleccionar el nombre de la columna.

    La funcin es idntica a la mencionada en la Unidad 1.

    La funcin permite almacenar en una variable (dentro de la hoja de trabajo) los residuales y los valores obtenidos a travs del modelo (Fits).

    5. Finalmente oprima el botn y el anlisis de sus datos ser presentado en la pantalla conocida como .

  • 18

    BIBLIOGRAFIA:

    Gutirrez, Humberto Pulido y De La Vara, Romn Salazar. Anlisis y diseo de experimentos. McGraw-Hill/Interamericana Editores, 2008.