Diseños jaime mori

116
PRESENTACION El presente trabajo denominado Métodos Estadísticos en la Investigación Agraria, pretende ser un instrumento de consulta y de aplicación para los Investigadores y Profesionales en general, cuyo principal objetivo, es el de aprovechar las experiencias logradas por el autor en la aplicación de los procedimientos estadísticos. En este documento se tratan de manera práctica los principales métodos estadísticos, donde se releva sus principios, la conceptualización del uso de los diseños experimentales y la aplicación práctica con el uso del SAS y del MINITAB. Jaime Alberto Mori Castro Universidad Nacional Mayor de San Marcos

Transcript of Diseños jaime mori

Page 1: Diseños jaime mori

PRESENTACION

El presente trabajo denominado Métodos Estadísticos en la Investigación Agraria, pretende ser un instrumento de consulta y de aplicación para los Investigadores y Profesionales en general, cuyo principal objetivo, es el de aprovechar las experiencias logradas por el autor en la aplicación de los procedimientos estadísticos.

En este documento se tratan de manera práctica los principales métodos estadísticos, donde se releva sus principios, la conceptualización del uso de los diseños experimentales y la aplicación práctica con el uso del SAS y del MINITAB.

Jaime Alberto Mori CastroUniversidad Nacional Mayor de San Marcos

Page 2: Diseños jaime mori

CAPITULO I

DISEÑOS EXPERIMENTALES

1.1 ASPECTOS GENERALES El Diseño de Experimentos tuvo su inicio teórico a partir de 1935 por Sir Ronald A.

Fisher, quién sentó la base de la teoría del Diseño Experimental y que a la fecha se encuentra bastante desarrollada y ampliada. Actualmente las aplicaciones son múltiples, especialmente en la investigación de las ciencias naturales, ingeniería, laboratorios y casi todas las ramas de las ciencias sociales.

La experimentación proporciona los datos experimentales, en contraste con los datos de la observación; los datos de la observación se representan como su nombre indica por observaciones de las unidades elementales de una población o de una muestra, y no deben ser cambiados ni modificados por ningún intento de parte de un investigador en el curso de la observación.

ORIENTACIONES GENERALES EN LA EXPERIMENTACION AGRICOLAEn la planificación agrícola o biológica y en el desarrollo de una investigación en

particular, son de interés las siguientes aspectos:

a. Especificar los problemas, con el fin de probar hipótesis o encontrar respuestas. Es necesario considerar que los experimentos sean:

a.1. Experimentos simples, cuando se estudia un solo factor de variación; por ejemplo, probar cinco variedades de sorgo, estudiar cinco dosis de nitrógeno en trigo, etc.

a.2. Experimentos factoriales, cuando se estudian simultáneamente dos o más factores que influyen en la producción; por ejemplo, estudiar tres variedades, cada una sembrada a tres densidades de siembra, o bien tratamientos de fósforo, nitrógeno y potasio, cada uno a cuatro dosis por unidad de superficie.

b. Ubicar el lugar adecuado para la realización de los experimentos, para lo cual se debe elegir una localidad accesible y representativa de áreas agrícolas, de suelo uniforme, con unidades experimentales lo más uniforme posible, y escoger el material adecuado para experimentos, de manera que pueda estratificarse (agruparse unidades experimentales con características homogéneas) el terreno correctamente para formar grupos uniformes y de fácil manejo.

c. Reducir las fuentes de error, tanto del experimento como de aquellos errores o equivocaciones operacionales. Es muy importante que en la selección de datos, muestreo, etc., el personal responsable esté constituido por técnicos o personas con entrenamiento.

d. Mantener constante los diversos factores que pueden afectar a la producción o a la calidad del producto, de manera que los únicos factores de variación sean los tratamientos objeto de estudio.

- 2 -

Page 3: Diseños jaime mori

e. Extremar precauciones y ser cautos en los resultados experimentales, considerando que un experimento es una observación de una muestra en una población de experimentos.

f. Repetir experimentos uniformes en diferentes localidades,suelos y años.

g. Tener conocimiento de la tecnología de campo y saber cuáles son los problemas del productor.

En la planeación o diseño de un experimento agronómico, es necesario aplicar un conjunto de disciplinas y conocimientos biológicos con el fin de encontrar una respuesta correcta a un problema específico. Por ejemplo, si se comparan diversas variedades de trigo, todos los factores de la producción que influyen en el comportamiento de las variedades deben permanecer constantes y las únicas fuentes de variación o diferencias serán presentadas por las variedades de trigo, si tales fuentes existen. Para lograr lo anterior, es necesario contar con ciertos conocimientos sobre:

a. Suelos, a fin de elegir el terreno más uniforme y adecuado para realizar el experimento.

b. Fertilización, para cuando sea necesario planear experimentos con fertilizantes químicos orgánicos o abonos orgánicos.

c. Topografía e hidráulica, para trazar parcelas, niveles, riegos, etc.

d. Especialidades afines como: Botánica, entomología, fitopatología, fisiología, genética, ecología, etc. para poder trabajar con seres vivos.

e. Tecnologías de: Cultivos, sistemas agroforestales, agrosilvo pastoriles y zootecnia, para manejar las unidades experimentales.

f. Estadística (biometría o bioestadística), para evaluar y separar las diversas causas de variación y para realizar la interpretación de los resultados experimentales.

Pasos al planear un experimento:

El método científico sugiere que en el planeamiento de la experimentación se debe tener presente las siguientes etapas :

a. Definir el problema: En esta etapa se debe determinar los antecedentes, importancia, objetivos, hipótesis a probar y revisión de la bibliografía.

b. Planeamiento y diseño del experimento: En esta etapa se debe tener en cuenta: Lugar de ejecución del experimento, tamaño de la parcela o unidad experimental, número de repeticiones por tratamiento, equipos e instrumentos a utilizar y métodos de evaluación de los resultados

c. Ejecución del experimento.

- 3 -

Page 4: Diseños jaime mori

d. Recolección de datos del experimento.

e. Ordenamiento de la información experimental.

f. Discusión de los resultados obtenidos.

g. Análisis económico de los tratamientos que se probaron y utilidad práctica.

h. Conclusión final y recomendación.

DISEÑO DEL EXPERIMENTOEste término se utiliza para planear un experimento de manera que se pueda obtener

la información pertinente a un determinado problema que se investiga y así tomar decisiones correctas.

El diseño adecuado del experimento es una etapa fundamental de la experimentación, que permite el suministro correcto de datos a posteriori, los que a su vez conducirán a un análisis objetivo y con deducciones válidas del problema.

PROPOSITO DE UN DISEÑO EXPERIMENTALEl propósito de un diseño experimental es proporcionar métodos que permitan

obtener la mayor cantidad de información válida acerca de una investigación, teniendo en cuenta el factor costo y el uso adecuado del material disponible mediante métodos que permitan disminuir el error experimental.

VARIABILIDAD DEL MATERIAL EXPERIMENTALLa característica de todo material experimental es su variabilidad de respuesta a un

tratamiento, esta variabilidad se refiere a que el material experimental no puede reaccionar o responder a los tratamientos de la misma manera o con la misma capacidad debido a sus diferencias intrínsecas, lo cual no necesariamente significa que no tengan el mismo aspecto.

ERROR EXPERIMENTAL El error experimental viene a constituir la variabilidad motivada por las diferencias

que se producen en los resultados de unidades experimentales tratadas en forma similar.

Las principales fuentes del error experimental son:

a. La variabilidad inherente al material experimental (unidades experimentales).

b. Falta de homogeneidad en la técnica experimental.

c. Errores de experimentación.

d. Errores de observación y medición.e. Efectos combinados de todos los factores extraños que puedan influir sobre los

resultados del experimento.

- 4 -

Page 5: Diseños jaime mori

FORMAS DE DISMINUCION DEL ERROR EXPERIMENTALEl error experimental puede ser reducido mediante:

a. El uso de un diseño experimental apropiado.

b. La selección minuciosa del material experimental a usarse (lo más homogéneo posible). Si el material experimental es heterogéneo se deberá agrupar en forma homogénea (formar estratos).

c. Incremento del número de repeticiones en el experimento.

d. El perfeccionamiento de la técnica experimental y el mayor cuidado al dirigir el experimento.

e. La utilización de la información proporcionada por variables relacionadas a la variable en estudio (uso de la técnica de covariancia).

TRATAMIENTOLos tratamientos vienen a constituir los diferentes procedimientos, procesos, factores

o materiales y cuyos efectos van a ser medidos y comparados.

El tratamiento establece un conjunto de condiciones experimentales que deben imponerse a una unidad experimental dentro de los confines del diseño seleccionado. Ejemplos:

Dósis de fertilizante, ración alimenticia, profundidad de sembrado, distanciamiento entre plantas, variedades de un cultivo.

TESTIGOEl testigo es el tratamiento de comparación adicional, que no debe faltar en un

experimento; por ejemplo, si se usan cinco tratamientos con fertilizante, el testigo puede ser aquel tratamiento que no incluye fertilizante. La elección del tratamiento testigo es de gran importancia en cualquier investigación, este se constituye como referencial del experimento y sirve para la comparación de los tratamientos en prueba.

UNIDAD EXPERIMENTALLa unidad experimental, es el objeto o espacio al cual se aplica el tratamiento y donde

se mide y analiza la variable que se investiga. En los experimentos pecuarios la unidad experimental por lo general esta conformada por un animal (cuye, cerdo, pato, etc.), en los experimentos forestales la unidad experimental en la mayoría de los casos esta conformado por un árbol y en la mayor parte de las pruebas de campo agrícolas, la unidad experimental es una parcela de tierra en lugar de una planta individual; es en este último caso que con frecuencia se presenta lo que se llama efecto de borde.

Efecto de BordeEn los experimentos agrícolas, muchas veces existen diferencias en el

crecimiento y la producción de las plantas que están situadas en los perímetros de la

- 5 -

Page 6: Diseños jaime mori

parcela en relación con aquellas plantas situadas en la parte central; esta diferencia es llamado efecto de borde y puede causar sobre-estimación o sub-estimación de las respuestas de los tratamientos, llegando con esto a comparaciones sesgadas entre ellos.

El efecto de bordes puede ser causado por:

- Vecindad de las parcelas ó áreas no cultivadas, que hace que las plantas en los perímetros tengan menor competencia de luz y nutrientes.

- Competencia entre tratamientos, que depende de la naturaleza de los tratamientos vecinos.Para controlar el efecto de borde se acostumbra a evaluar solamente las plantas centrales para los fines experimentales. Estas plantas centrales constituyen lo que se llama PARCELA NETA EXPERIMENTAL.

En el siguiente ejemplo se muestra el croquis de una parcela de maíz con cuatro surcos, donde las plantas de cabecera y de los dos surcos laterales, se consideran efectos de borde.

- 6 -

Page 7: Diseños jaime mori

Una manera de disminuir el efecto de borde es mediante el uso de Calles que pueden ser: áreas adyacentes sin sembrar ó el uso de bordes con plantas que no intervendrán en la cosecha del experimento.

ANALISIS DE LA VARIANCIAEs una técnica estadística que sirve para analizar la variación total de los resultados

experimentales de un diseño en particular, descomponiéndolo en fuentes de variación independientes atribuibles a cada uno de los efectos en que constituye el diseño experimental.

Esta técnica tiene como objetivo identificar la importancia de los diferentes factores ó tratamientos en estudio y determinar como interactúan entre sí.

HIPOTESIS ESTADISTICAEs el supuesto que se hace sobre el valor de un parámetro (constante que caracteriza a

una población) el cual puede ser validado mediante una prueba estadística.

En la investigación agraria al realizar un análisis estadístico utilizando el ANVA de un diseño experimental, la hipótesis a probar es si los tratamientos tienen el mismo efecto

- 7 -

Croquis de una parcela experimental

1.0 m

5.5 m 4.5 m

3.5 m

Golpe experimental

Golpe con efecto de borde

Area total : 5.5 x 3.5 = 19.25 m2

Area neta experimental : 1x 4.5 =4.5 m2

Page 8: Diseños jaime mori

sobre la variable que se estudia, es así como se tienen las hipótesis planteada (Hp) e hipótesis alterna (Ha):

Hp: i = 0 (Los i tratamientos tienen el mismo efecto sobre la variable en estudio)Ha: i 0 (No todos los tratamientos tienen el mismo efecto sobre la variable en estudio)

Al probar la hipótesis estadística el investigador está propenso a cometer los siguientes tipos de errores:

Error Tipo I: Se comete cuando se rechaza la hipótesis que se plantea, siendo esta hipótesis falsa; la magnitud de este error es fijado por el investigador y constituye el "nivel de significación de la prueba"; usualmente los valores usados como nivel de significación son 0.05 ó 0.01.

Error tipo II: Se comete cuando se acepta la hipótesis que se plantea, siendo esta hipótesis falsa; la magnitud de este error no se puede fijar, pero si es posible minimizar utilizando un tamaño adecuado de muestra.

PRINCIPIOS BASICOS DEL DISEÑO EXPERIMENTALLos principios básicos del diseño experimental son: repetición, aleatorización, y

control local.Repetición: Viene a ser la reproducción o réplica del experimento básico (asignación de un tratamiento a una unidad experimental). Las principales razones por las cuales es deseable la repetición son : Primero por que proporciona una estimación del error experimental, siendo tal estimación confiable a medida que aumenta el número de repeticiones, y segundo permite estimaciones más precisas del tratamiento en estudio.

Aleatorización: Consiste en la asignación al azar de los tratamientos en estudio a las unidades experimentales con el propósito de asegurar que un determinado tratamiento no presente sesgo. Por otro lado la aleatorización hace válidos los procesos de inferencia y las pruebas estadísticas.

Control Local (Control del error Experimental): Consiste en tomar medidas dentro del diseño experimental para hacerlo más eficiente, de tal manera que pueda permitir la reducción del error experimental y así hacerla más sensible a cualquier prueba de significación.

SUPUESTOS ACERCA DEL MODELO ESTADISTICO

Los supuestos necesarios del modelo estadístico son:

a. Aditividad: Los factores o componentes del modelo estadístico son aditivos, es decir la variable respuesta es la suma de los efectos del modelo estadístico.

b. Linealidad: La relación existente entre los factores o componentes del modelo estadístico es del tipo lineal.

- 8 -

Page 9: Diseños jaime mori

c. Normalidad: Los valores resultado del experimento provienen de una distribución de probabilidad "Normal" con media y variancia 2 .

d. Independencia: Los resultados observados de un experimento son independientes entre sí.

e. Variancias Homogéneas (Homocedasticidad): Las diversas poblaciones generadas por la aplicación de dos o más tratamientos tienen variancias homogéneas (variancia común).

TIPOS DE MODELOS ESTADISTICOS

De acuerdo a la selección de los tratamientos y otros factores se tiene la siguiente clasificación:

Modelo I (Efectos Fijos):Se presenta cuando los tratamientos y demás factores que intervienen en un

experimento son fijados por el investigador; es decir, no se efectúa una elección aleatoria. En estos casos las conclusiones del análisis de variancia solamente son válidas para los tratamientos y otros factores usados en el experimento. En el presente trabajo se ha considerado únicamente el caso de modelo de efectos fijos, por ser el que se presenta con mayor frecuencia en la experimentación agraria.

Modelo II (Efectos aleatorios):Se presenta cuando los tratamientos y demás factores que intervienen en un

experimento son elegidos al azar de una población. En estos casos las conclusiones del análisis de variancia son válidos, tanto para los tratamientos y demás factores usados, asi como para todas las poblaciones de tratamientos y factores.

Modelo III (Modelo Mixto):Este modelo es la combinación de los dos anteriores y se presenta cuando algunos

factores son fijados y otros son elegidos al azar. En estos casos las conclusiones del análisis de variancia serán válidas para toda la población de factores cuando estos son elegidos al azar, y solamente para los factores usados cuando estos son fijados.

PRUEBAS DE COMPARACION DE MEDIASEs propósito de todo investigador que realiza un análisis de variancia de un

experimento en particular, realizar la prueba sobre el efecto de los tratamientos en estudio, para ello hace uso de la prueba F el cual indicará si los efectos de todos los tratamientos son iguales o diferentes; en caso de aceptar la hipótesis de que todos los tratamientos no tienen el mismo efecto, entonces es necesario realizar pruebas de comparación de promedios a fin de saber entre que tratamientos hay diferencias, y para esto es necesario realizar pruebas de comparación múltiple como las siguientes:

a. Las comparaciones fuéron planeadas antes de ejecutar el experimento

Diferencia Significativa Mínima (DLS)

- 9 -

Page 10: Diseños jaime mori

Es una prueba para comparar la igualdad de dos medias y su uso en comparaciones simultáneas se justifica sólo si la prueba F resulta significativa.

Prueba TEs una prueba para comparar dos medias y su uso en comparaciones simultáneas se

justifica sólo si la prueba F resulta significativa. Esta prueba es mas general que el DLS, ya que puede probar no solo la igualdad de dos medias sino que media es mejor.

b. Las comparaciones no fuéron planeadas antes de ejecutar el experimento

Prueba de Rangos Múltiples de DuncanEste procedimiento es utilizado para realizar comparaciones múltiples de medias;

para realizar esta prueba no es necesario realizar previamente la prueba F y que ésta resulte significativa; sin embargo, es recomendable efectuar esta prueba después que la prueba F haya resultado significativa, a fin de evitar contradicciones entre ambas pruebas.

Prueba de Rangos Múltiples de TukeyEste procedimiento es llamado también "Diferencia Significativa Honesta", se utiliza

para realizar comparaciones múltiples de medias; esta prueba es similar a la prueba de Duncan en cuanto a su procedimiento y además es más exigente.

Prueba de Comparación de DunnetEsta prueba es útil cuando el experimentador está interesado en determinar que

tratamiento es diferente de un testigo, control o tratamiento estándar, y no en hacer todas las comparaciones posibles (que pasarían a una segunda prioridad); es decir, cuando se quiere comparar el testigo con cada uno de los tratamientos en estudio.

TRANSFORMACION DE DATOS La razón principal de la transformación de datos es que de llevarse a cabo un análisis

estadístico con resultados que no cumplan con los supuestos acerca del modelo estadístico, se puede llegar a una conclusión equivocada.

Un cambio de escala puede variar la media y la variancia de la variable así como su relación con respecto a otras variables. La forma de la distribución de una variable cambia con la escala. Mediante una transformación adecuada puede conseguirse que un variable que no se distribuye normalmente pase a tener una distribución casi normal. Las poblaciones con variancias desiguales pueden convertirse en homocedásticas (variancias homogéneas) mediante una transformación apropiada. Las transformaciones mas usadas son:a. Transformación logarítmica

El modelo lineal (por ejemplo Yij = µ + i + j + eij) indica que el efecto del bloque , el efecto del tratamiento y el error experimental, son todos ellos aditivos. Si los bloques y los tratamientos aumentan o disminuyen las mediciones en un determinado porcentaje en lugar de una determinada cantidad, entonces se dice que los efectos son multiplicativos y no aditivos. En estos casos, una transformación logarítmica transformará en aditiva la relación multiplicativa y en consecuencia el modelo lineal podrá ser aplicado a los nuevos datos.

Para ciertos tipos de análisis, el investigador prefiere la escala que elimina las

- 10 -

Page 11: Diseños jaime mori

interacciones mientras que para otras puede preferir la escala que restituye los efectos lineales. Lo que hay que recordar es que la relación entre las variables está muy influenciada por las escalas con las que se miden dichas variables. Las interpretaciones de los datos sólo son válidas en relación con la escala particular adoptada en un caso determinado.

Variable transformada : Yij*=log(Yij)

b. Transformación de la raíz cuadradaCuando los datos están dados por números enteros procedentes del conteo de objetos,

como por ejemplo el número de manchas en una hoja o el número de bacterias en una placa, los números observados tienden a presentar una distribución de Poisson más que una distribución normal. Las consideraciones teóricas conducen a la transformación de la raíz cuadrada de los números observados. Normalmente esta transformación determina que las variancias de los grupos sean más iguales, también es aplicable a las distribuciones sesgadas puesto que acorta la cola larga a un lado que es característica de distribuciones sesgadas.

Si y es el número observado, para el análisis estadístico y la prueba de significación utilizaremos . Cuando los números observados son pequeños (de 2 a 10), se prefiere la transformación , en especial cuando algunos de los números observados son cero.

c. Transformación raíz arcosenoCuando los datos provienen de contadas expresados en porcentajes, la transformación que se recomienda es :

Yij*=arco seno (Yij) 1/2

COEFICIENTE DE VARIABILIDADEs una medida de variabilidad relativa (sin unidades de medida) cuyo uso es para

cuantificar en términos porcentuales la variabilidad de las unidades experimentales frente a la aplicación de un determinado tratamiento. En experimentación no controlada (condiciones de campo) se considera que un coeficiente de variabilidad mayor a 35% es elevado por lo que se debe tener especial cuidado en las interpretaciones y ó conclusiones. La expresión estimada del coeficiente de variabilidad es:

- 11 -

Page 12: Diseños jaime mori

Diseño Completamente al Azar

1.2 EXPERIMENTO EN EL DISEÑO COMPLETAMENTE AL AZAR

En este diseño, los tratamientos en estudio se distribuyen al azar en todas las unidades experimentales; siendo el número de repeticiones por tratamiento igual ó diferente. Este diseño se emplea cuando la variabilidad en todo el material experimental es relativamente pequeña y uniformemente distribuída.

Ventajas:Fácil de planear y analizar; además es flexible en el empleo del número de

tratamientos y repeticiones. Finalmente, permite tener dentro del análisis de variancia el máximo número de grados de libertad para la suma de cuadrados del error.

Desventaja:La principal desventaja que presenta este diseño está relacionado a la homogeneidad

del material experimental; el cual es difícil de encontrar en experimentos de campo, por lo que su uso se restringe con mucha frecuencia a experimentos en laboratorio, ó allá donde se pueda tener control de los efectos no considerados en el estudio (ambiente, temperatura, luz, etc.).

Aleatorización:En este diseño, la aleatorización de los tratamientos se realiza en forma irrestricta

sobre las unidades experimentales, asi pués si tenemos 3 tratamientos T1, T2, T3, una posible distribución experimental podría ser:

T1 T3 T2

T1 T1 T2

T2 T3 T1

T2 T2 T3

Donde el número de repeticiones de los tratamientos T1, T3 y T2 es 4, 5 y 3 respectivamente.

Modelo estadístico:

Yij = µ + i + eij , i= 1,2,...,t j= 1,2,...,ri

Donde:Yij = Valor observado en la j-ésima repetición para el i-ésimo tratamiento.µ = Efecto de la media general.

-12-

Page 13: Diseños jaime mori

Diseño Completamente al Azar

i = Efecto del i-ésimo tratamiento.eij = Efecto aleatorio del error experimental.t = Número de tratamientos.ri = Número de repeticiones del i-ésimo tratamiento.

El efecto del i-ésimo tratamiento esta dado por ti , siendo la expresión: i = µi - µ , donde µi es la media del i-ésimo tratamiento y µ la media general.

CUADRO DEL ANALISIS DE VARIANCIA ┌───────────┬──────────┬─────────┬──────────┬──────────────┐│ Fuentes │grados de │suma de │cuadrado │F calculado ││ de │libertad │cuadrados│medio │ ││ Variación │ G.L. │ S.C. │ C.M.=S.C │ Fcal ││ │ │ │ G.L.│ │├───────────┼──────────┼─────────┼──────────┼──────────────┤│Tratamiento│ t-1 │ SCTrat │ CMTrat │CMTrat/CMError│├───────────┼──────────┼─────────┼──────────┼──────────────┤ │Error Exp. │ t │ SCError │ CMError │ ││ │ ri - t │ │ │ ││ │i=1 │ │ │ │├───────────┼──────────┼─────────┼──────────┼──────────────┤│Total │ t │ SCTot │ │ ││ │ ri - 1 │ │ │ ││ │i=1 │ │ │ │└───────────┴──────────┴─────────┴──────────┴──────────────┘Para el Modelo I, este Anva prueba la siguiente hipótesis:Hp: i = 0 (Todos los tratamientos tienen el mismo efecto sobre la variable en estudio)Ha: i 0 (No todos los tratamientos tienen el mismo efecto sobre la variable en estudio)

Nivel de significación :

Fcal=CMTrat/CMError

ZONAS CRITICAS

Page 14: Diseños jaime mori

Diseño Completamente al Azar

tSi Fcal > F tabular (con (t-1) y (ri-t) grados de libertad) se rechaza la i=1hipótesis planteada a un nivel de significación .EJEMPLO

En la Estación Experimental "La Molina", se realizó un estudio en cuyes hembras, las cuales poseen características similares en peso, raza, edad, etc., con la finalidad de determinar el efecto del flushing (efecto en el cual se produce la maduración de un mayor número de óvulos, por un cambio brusco en la alimentación) sobre la eficiencia reproductiva (número de crías nacidas).Los tratamientos fuéron:T1 : Maíz chala.T2 : Maíz chala + Afrecho de trigo.T3 : Maíz chala + Concentrado comercial.

Los resultados se midieron en tamaño de camada al nacimiento (TCN), se utilizaron 60 hembras de 3 años de edad distribuidas al azar (20 por cada tratamiento), de las cuales sólo pudieron ser evaluadas 31 cuyes.

Datos experimentales: ┌───────────────────────>Tratamiento │ ┌───────────────────>Unidad experimental │ │ ┌──────────────>Tamaño de camada al nacimiento │ │ │

Page 15: Diseños jaime mori

Diseño Completamente al Azar

┌───────────┐│T1 0054 2 ││T1 0021 3 ││T1 0329 2 ││T1 0320 1 ││T2 0351 3 ││T2 0781 3 ││T2 0541 3 ││T2 0002 2 ││T2 0582 4 ││T2 0244 3 ││T2 0655 3 ││T2 0008 3 ││T2 0998 3 ││T2 0057 4 ││T2 0080 3 ││T2 0280 2 ││T2 0049 4 ││T2 0636 4 ││T2 0448 4 ││T2 0900 4 ││T2 0022 1 ││T2 0063 3 ││T3 0958 3 ││T3 0301 3 ││T3 0572 1 ││T3 0804 3 ││T3 0485 3 ││T3 0071 3 ││T3 0552 2 ││T3 7882 3 ││T3 0818 3 │└───────────┘

1.581141.870831.581141.224741.870831.870831.870831.581142.121321.870831.870831.870831.870832.121321.870831.581142.121322.121322.121322.121321.224741.870831.870831.870831.224741.870831.870831.870831.581141.870831.87083

Page 16: Diseños jaime mori

Diseño Completamente al Azar

Los resultados anteriores fuéron transformados para la realización del Anva, esto debido a la naturaleza de los datos (contadas), la transformación realizada fué :

1.2.1 PROCEDIMIENTO SAS PARA EL ANALISIS EN EL DISEÑO COMPLETO AL AZAR

DATA SS; INFILE "D:\SAS\DCR.DAT"; INPUT TRAT$ 1-2 ARETE 4-7 TCN 10-10; TCN=SQRT(TCN+0.5); PROC ANOVA; CLASS TRAT; MODEL TCN=TRAT; MEANS TRAT / DUNCAN; RUN;

1.2.2.1 SALIDA EN SAS PARA EL ANALISIS EN EL DISEÑO COMPLETO AL AZAR

Analysis of Variance Procedure Class Level Information

Class Levels Values

TRAT 3 T1 T2 T3

Number of observations in data set = 31

Analysis of Variance Procedure

Dependent Variable: TCN Sum of MeanSource DF Squares Square F Value Pr > F

Model 2 0.36254656 0.18127328 3.23 0.0547

Error 28 1.57133554 0.05611913

Corrected Total 30 1.93388210

R-Square C.V. Root MSE TCN Mean

0.187471 13.08766 0.236895 1.81006254

Analysis of Variance Procedure

Dependent Variable: TCN

Source DF Anova SS Mean Square F Value Pr > F

TRAT 2 0.36254656 0.18127328 3.23 0.0547

Page 17: Diseños jaime mori

Diseño Completamente al Azar

Analysis of Variance Procedure Duncan's Multiple Range Test for variable: TCN

NOTE: This test controls the type I comparisonwise error rate, not the experimentwise error rate

Alpha= 0.05 df= 28 MSE= 0.056119 WARNING: Cell sizes are not equal. Harmonic Mean of cell sizes= 7.2

Number of Means 2 3 Critical Range 0.256 0.269

Means with the same letter are not significantly different.

Analysis of Variance Procedure

Duncan Grouping Mean N TRAT

A 1.886 18 T2 A B A 1.767 9 T3 B B 1.564 4 T1

1.2.2.2 SALIDA EN MINITAB PARA EL ANALISIS EN EL DISEÑO COMPLETO AL AZAR

General Linear Model: TCNTRANSF versus TRAT

Factor Type Levels Values TRAT fixed 3 T1 T2 T3

Analysis of Variance for TCNTRANS, using Adjusted SS for Tests

Source DF Seq SS Adj SS Adj MS F PTRAT 2 0.36255 0.36255 0.18127 3.23 0.055Error 28 1.57134 1.57134 0.05612Total 30 1.93388

Unusual Observations for TCNTRANS

Obs TCNTRANS Fit SE Fit Residual St Resid 21 1.22474 1.88624 0.05584 -0.66150 -2.87R 25 1.22474 1.76685 0.07896 -0.54211 -2.43R

R denotes an observation with a large standardized residual.

Tukey Simultaneous TestsResponse Variable TCNTRANSAll Pairwise Comparisons among Levels of TRAT

TRAT = T1 subtracted from:

Level Difference SE of AdjustedTRAT of Means Difference T-Value P-ValueT2 0.3218 0.1309 2.457 0.0519T3 0.2024 0.1424 1.422 0.3437

TRAT = T2 subtracted from:

Level Difference SE of AdjustedTRAT of Means Difference T-Value P-ValueT3 -0.1194 0.09671 -1.234 0.4433

Page 18: Diseños jaime mori

Diseño Completamente al Azar

1.2.3 CONCLUSION

Del Anva, se puede apreciar que no existen diferencias significativas entre los tres tipos de alimentos sobre la eficiencia reproductiva de los cuyes a un =0.01 y a un =0.05, esto debido a que Pr > F = 0.0547 para la fuente de variación tratamiento (TRAT) es mayor a 0.05 y 0.01.

Del análisis de las medias de tratamiento por Duncan, los tratamientos agrupados con la misma letra no tienen diferencias significativas; así pues los tratamientos T2 y T3 tienen el mismo efecto sobre la eficiencia reproductiva, no siendo así los tratamientos T2 y T1; asimismo se puede apreciar que el tratamiento T2 es el que tiene mejor promedio y por lo tanto proporciona una mayor eficiencia reproductiva.

Page 19: Diseños jaime mori

Diseño en Bloques Completos al Azar

1.3 EXPERIMENTO EN EL DISEÑO BLOQUES COMPLETOS AL AZAR

El término "experimento con bloques aleatorizados" surge de la investigación agrícola, en el que cada nivel de un tratamiento es aplicado aleatoriamente a cada una de las subparcelas (unidad experimental) en que es dividida cada parcela (bloque), siendo el total de niveles de tratamiento igual al número de subparcelas que tiene cada parcela. En este diseño, dentro de cada parcela hay homogéneidad en sus características (tipo de suelo, fertilización, gradiente de fertilidad, etc.); sin embargo existen diferencias de una a otra parcela. Principios de la formación de bloques:

El objetivo en este diseño es establecer diferencias significativas entre los efectos del tratamiento; pero las diferencias entre los efectos que pudiéran tener los tratamientos pueden ser atribuídas no sólo a la naturaleza misma de los tratamientos, sino también a diferencias en la característica de las parcelas. Para reducir tal confusión, o aislar los "efectos de las parcelas" es que se emplea la aleatoriedad en la siguiente forma: dentro de cada bloque se crean subdivisiones (unidades experimentales), de modo que el número de subdivisiones sea igual al número de tratamientos, y luego los tratamientos son asignados al azar en cada subdivisión, asegurándose de que cada tratamiento es usado exactamente una vez en dicho bloque. El siguiente ejemplo muestra dos distribuciones de tratamiento en bloques:

Page 20: Diseños jaime mori

Diseño en Bloques Completos al Azar

Nota: Considere que los rectángulos con igual tramado, tienen unidades experimentales de características homogéneas.

Modelo estadístico

Yij = j + eij , i= 1,2,...,t j= 1,2,...,r

Donde: Yij = Valor observado de la unidad experimental sujeto al i-ésimo trata-

miento en el j-ésimo bloque. = Efecto de la media general. i = Efecto del i-ésimo tratamiento.j = Efecto del j-ésimo bloque.eij = Efecto aleatorio del error experimental en la unidad experimental sujeta al i-ésimo tratamiento en el j-ésimo bloque. Además:

El efecto de tratamiento esta dado por:

i = i. - , i. = media del tratamiento i.

CUADRO DEL ANALISIS DE VARIANCIA ┌───────────┬──────────┬─────────┬─────────┬──────────────┐│ Fuentes │grados de │suma de │cuadrado │F calculado ││ de │libertad │cuadrados│medio │ ││ Variación │ G.L. │ S.C. │C.M.=S.C │ Fcal ││ │ │ │ G.L.│ │├───────────┼──────────┼─────────┼─────────┼──────────────┤│Bloques │ r-1 │SCBloq │CMBloq │ - │

Page 21: Diseños jaime mori

Diseño en Bloques Completos al Azar

├───────────┼──────────┼─────────┼─────────┼──────────────┤│Tratamiento│ t-1 │SCTrat │CMTrat │CMTrat/CMError│├───────────┼──────────┼─────────┼─────────┼──────────────┤│Error Exp. │(r-1)(t-1)│SCError │CMError │ │├───────────┼──────────┼─────────┼─────────┼──────────────┤│Total │ rt-1 │SCTot │ │ │└───────────┴──────────┴─────────┴─────────┴──────────────┘

Este Anva prueba la hipótesis para el modelo I:

Hp: i = 0 (Todos los tratamientos tienen el mismo efecto sobre la variable en estudio)

Ha: i 0 (No todos los tratamientos tienen el mismo efecto sobre la variable en estudio)

Nivel de significación :

Fcal=CMTrat/CMError

ZONAS CRITICAS

Si Fcal> F tabular (con (t-1) y (r-1) (t-1) grados de libertad) se rechaza la hipótesis planteada a un nivel de significación .

Page 22: Diseños jaime mori

Diseño en Bloques Completos al Azar

EJEMPLOEl INIA en el marco del del proyecto "Sistemas de Producción en Granos y

Tubérculos Andinos", realizó un experimento en dos épocas de siembra. Los datos experimentales se indican a continuación:

Localidad donde se ejecutó el experimento: Estación Experimental "La Molina", Lima.

Unidad experimental: Parcela de 5.4 m2

Cultivares de quinua en estudio: Kamiri, Camacani, Sajama, Gigante Boliviana, Jujuy, Amarillo Marangani

Fechas de siembra:

25 de Mayo de 1993 23 de Setiembre de 1993

Disposición experimental: Bloques completos al azar

Los resultados experimentales fueron dados en gramos de grano por parcela

Page 23: Diseños jaime mori

Diseño en Bloques Completos al Azar

EPOCA DE SIEMBRA (MAYO, 25, 1993)

Tratamiento Bloque Rendimiento┌─────────────────────┐│KAMIRI 1 1184││CAMACANI 1 0938││SAJAMA 1 1162││GIG.BOL. 1 0650││JUJUY 1 0704││AM.MARANG 1 1265││KAMIRI 2 0910││CAMACANI 2 1243││SAJAMA 2 1116││GIG.BOL. 2 0657││JUJUY 2 1024││AM.MARANG 2 1344││KAMIRI 3 1142││CAMACANI 3 1165││SAJAMA 3 1337││GIG.BOL. 3 1000││JUJUY 3 1160││AM.MARANG 3 1362││KAMIRI 4 0932││CAMACANI 4 1246││SAJAMA 4 1424││GIG.BOL. 4 1273││JUJUY 4 0578││AM.MARANG 4 1393│└─────────────────────┘

EPOCA DE SIEMBRA (SETIEMBRE 23, 1993)

Tratamiento Bloque Rendimiento┌─────────────────────┐│KAMIRI 1 1537││CAMACANI 1 0852││SAJAMA 1 1234││GIG.BOL. 1 1899││JUJUY 1 1519││AM.MARANG 1 1061││KAMIRI 2 1797││CAMACANI 2 1122││SAJAMA 2 1643││GIG.BOL. 2 1588││JUJUY 2 1767││AM.MARANG 2 1235││KAMIRI 3 1675││CAMACANI 3 1757││SAJAMA 3 2332││GIG.BOL. 3 1910││JUJUY 3 2109││AM.MARANG 3 1312││KAMIRI 4 1905││CAMACANI 4 1205││SAJAMA 4 1983││GIG.BOL. 4 1972││JUJUY 4 1799││AM.MARANG 4 1090│└─────────────────────┘

Page 24: Diseños jaime mori

1.3.1 PROCEDIMIENTOS EN SAS PARA EL ANALISIS EN EL DISEÑO EN BLOQUES COMPLETOS AL AZAR DE CADA EPOCA

DATA SS;INFILE "D:\SAS\EPOCA1.DAT";INPUT TRAT$ 1-9 BLOQ 14-14 RDT 18-21;PROC ANOVA;CLASSES BLOQ TRAT;MODEL RDT = BLOQ TRAT;MEANS TRAT / DUNCAN;RUN;

DATA SS;INFILE "D:\SAS\EPOCA2.DAT";INPUT TRAT$ 1-9 BLOQ 14-14 RDT 18-21;PROC ANOVA;CLASSES BLOQ TRAT;MODEL RDT = BLOQ TRAT;MEANS TRAT / DUNCAN;RUN;

1.3.2.1 SALIDA EN SAS PARA EL ANALISIS EN EL DISEÑO BLOQUES COMPLETOS AL AZAR, PARA LOS DATOS DE LA EPOCA DE SIEMBRA 25/05/93

SAS 1:00 Sunday, April 5, 1994

Analysis of Variance Procedure Class Level Information

Class Levels Values

BLOQ 4 1 2 3 4

TRAT 6 AM.MARANG CAMACANI GIG.BOL. JUJUY KAMIRI SAJAMA

Number of observations in data set = 24

Analysis of Variance Procedure

Dependent Variable: RDT Sum of MeanSource DF Squares Square F Value Pr > FModel 8 900278.0000 112534.7500 3.20 0.0249Error 15 527432.9583 35162.1972Corrected Total 23 1427710.9583

R-Square C.V. Root MSE RDT Mean

0.630574 17.17113 187.5159 1092.04167

Page 25: Diseños jaime mori

Analysis of Variance ProcedureDependent Variable: RDT

Source DF Anova SS Mean Square F Value Pr > F

BLOQ 3 158532.7917 52844.2639 1.50 0.2543TRAT 5 741745.2083 148349.0417 4.22 0.0136

SAS 1:00 Sunday, April 5, 1994

Analysis of Variance Procedure Duncan's Multiple Range Test for variable: RDT NOTE: This test controls the type I comparisonwise error rate, not the experimentwise error rate Alpha= 0.05 df= 15 MSE= 35162.2 Number of Means 2 3 4 5 6 Critical Range 282.1 295.9 305.4 310.6 314.6 Means with the same letter are not significantly different.

Duncan Grouping Mean N TRAT A 1341.0 4 AM.MARANG A A 1259.7 4 SAJAMA A B A 1148.0 4 CAMACANI B A B A 1042.0 4 KAMIRI B B 895.0 4 GIG.BOL. B B 866.5 4 JUJUY

1.3.2.2 SALIDA EN MINITAB PARA EL ANALISIS EN EL DISEÑO BLOQUES COMPLETOS AL AZAR, PARA LOS DATOS DE LA EPOCA DE SIEMBRA 25/05/93

General Linear Model: RDT versus BLOQ, TRAT

Factor Type Levels Values BLOQ fixed 4 1 2 3 4TRAT fixed 6 AM.MARANG CAMACANI GIG.BOL. JUJUY KAMIRI SAJAMA

Analysis of Variance for RDT, using Adjusted SS for Tests

Source DF Seq SS Adj SS Adj MS F PBLOQ 3 158533 158533 52844 1.50 0.254TRAT 5 741745 741745 148349 4.22 0.014Error 15 527433 527433 35162Total 23 1427711

Unusual Observations for RDT

Obs RDT Fit SE Fit Residual St Resid 22 1273.00 943.96 114.83 329.04 2.22R 23 578.00 915.46 114.83 -337.46 -2.28R

R denotes an observation with a large standardized residual.

Tukey Simultaneous TestsResponse Variable RDT All Pairwise Comparisons among Levels of TRAT

TRAT = AM.MARAN subtracted from:

Level Difference SE of AdjustedTRAT of Means Difference T-Value P-ValueCAMACANI -193.0 132.6 -1.456 0.6951

Page 26: Diseños jaime mori

GIG.BOL. -446.0 132.6 -3.364 0.0404JUJUY -474.5 132.6 -3.579 0.0270KAMIRI -299.0 132.6 -2.255 0.2705SAJAMA -81.3 132.6 -0.613 0.9884

TRAT = CAMACANI subtracted from:

Level Difference SE of AdjustedTRAT of Means Difference T-Value P-ValueGIG.BOL. -253.0 132.6 -1.908 0.4343JUJUY -281.5 132.6 -2.123 0.3271KAMIRI -106.0 132.6 -0.799 0.9632SAJAMA 111.7 132.6 0.843 0.9543

TRAT = GIG.BOL. subtracted from:

Level Difference SE of AdjustedTRAT of Means Difference T-Value P-ValueJUJUY -28.50 132.6 -0.2149 0.9999KAMIRI 147.00 132.6 1.1086 0.8704SAJAMA 364.75 132.6 2.7509 0.1219

TRAT = JUJUY subtracted from:

Level Difference SE of AdjustedTRAT of Means Difference T-Value P-ValueKAMIRI 175.5 132.6 1.324 0.7683SAJAMA 393.2 132.6 2.966 0.0837

TRAT = KAMIRI subtracted from:

Level Difference SE of AdjustedTRAT of Means Difference T-Value P-ValueSAJAMA 217.7 132.6 1.642 0.5858

1.3.4 CONCLUSION

Del cuadro de Anva se puede apreciar que existe diferencias significativas entre los tratamientos en estudio a un =0.05, debido a que el valor Pr >F es menor a 0.05 (0.0136), no todos los cultivares de quinua tienen el mismo rendimiento.

Por otro lado de la prueba de comparación de medias por Duncan se puede apreciar que entre los tratamientos que tienen la misma letra no hay diferencias significativas, y entre los tratamientos que tienen diferentes letras si existen diferencias significativas. así:

Existen diferencias significativas en el rendimiento entre los tratamientos SAJAMA y JUJUY pero no entre SAJAMA y CAMACANI, así también se aprecia que uno de los cultivares de mejor rendimiento es el AM.MARANG .

1.3.5.1 SALIDA EN SAS PARA EL ANALISIS EN EL DISEÑO BLOQUES COMPLETOS AL AZAR, PARA LOS DATOS DE LA EPOCA DE SIEMBRA 23/09/93

SAS 1:00 Sunday, April 5, 1994

Analysis of Variance Procedure Class Level Information Class Levels Values

BLOQ 4 1 2 3 4

Page 27: Diseños jaime mori

TRAT 6 AM.MARANG CAMACANI GIG.BOL. JUJUY KAMIRI SAJAMA

Number of observations in data set = 24

Analysis of Variance Procedure

Dependent Variable: RDT Sum of MeanSource DF Squares Square F Value Pr > F

Model 8 2675296.667 334412.083 7.41 0.0005

Error 15 676670.292 45111.353

Corrected Total 23 3351966.958

R-Square C.V. Root MSE RDT Mean

0.798127 13.30826 212.3943 1595.95833

SAS 1:00 Sunday, April 5, 1994

Analysis of Variance Procedure

Dependent Variable: RDT

Source DF Anova SS Mean Square F Value Pr > F

BLOQ 3 800449.458 266816.486 5.91 0.0072TRAT 5 1874847.208 374969.442 8.31 0.0006

Analysis of Variance Procedure Duncan's Multiple Range Test for variable: RDT NOTE: This test controls the type I comparisonwise error rate, not the experimentwise error rate Alpha= 0.05 df= 15 MSE= 45111.35 Number of Means 2 3 4 5 6 Critical Range 319.5 335.2 345.9 351.8 356.4 Means with the same letter are not significantly different. Duncan Grouping Mean N TRAT A 1842.2 4 GIG.BOL. A A 1798.5 4 JUJUY A A 1798.0 4 SAJAMA A A 1728.5 4 KAMIRI B 1234.0 4 CAMACANI B B 1174.5 4 AM.MARANG

1.3.5.1 SALIDA EN MINITAB PARA EL ANALISIS EN EL DISEÑO BLOQUES COMPLETOS AL AZAR, PARA LOS DATOS DE LA EPOCA DE SIEMBRA 23/09/93

General Linear Model: RDT versus BLOQ, TRAT

Factor Type Levels Values BLOQ fixed 4 1 2 3 4TRAT fixed 6 AM.MARANG CAMACANI GIG.BOL. JUJUY KAMIRI SAJAMA

Analysis of Variance for RDT, using Adjusted SS for Tests

Source DF Seq SS Adj SS Adj MS F P

Page 28: Diseños jaime mori

BLOQ 3 800449 800449 266816 5.91 0.007TRAT 5 1874847 1874847 374969 8.31 0.001Error 15 676670 676670 45111Total 23 3351967

Tukey Simultaneous TestsResponse Variable RDT All Pairwise Comparisons among Levels of TRAT

TRAT = AM.MARAN subtracted from:

Level Difference SE of AdjustedTRAT of Means Difference T-Value P-ValueCAMACANI 59.50 150.2 0.3962 0.9985GIG.BOL. 667.75 150.2 4.4462 0.0051JUJUY 624.00 150.2 4.1549 0.0090KAMIRI 554.00 150.2 3.6888 0.0219SAJAMA 623.50 150.2 4.1515 0.0090

TRAT = CAMACANI subtracted from:

Level Difference SE of AdjustedTRAT of Means Difference T-Value P-ValueGIG.BOL. 608.2 150.2 4.050 0.0110JUJUY 564.5 150.2 3.759 0.0192KAMIRI 494.5 150.2 3.293 0.0461SAJAMA 564.0 150.2 3.755 0.0193

TRAT = GIG.BOL. subtracted from:

Level Difference SE of AdjustedTRAT of Means Difference T-Value P-ValueJUJUY -43.8 150.2 -0.2913 0.9997KAMIRI -113.8 150.2 -0.7574 0.9707SAJAMA -44.2 150.2 -0.2946 0.9996

TRAT = JUJUY subtracted from:

Level Difference SE of AdjustedTRAT of Means Difference T-Value P-ValueKAMIRI -70.00 150.2 -0.4661 0.9967SAJAMA -0.50 150.2 -0.0033 1.0000

TRAT = KAMIRI subtracted from:

Level Difference SE of AdjustedTRAT of Means Difference T-Value P-ValueSAJAMA 69.50 150.2 0.4628 0.9968

1.3.6 CONCLUSION

Del cuadro de Anva se puede apreciar que existe diferencias significativas entre los efectos producidos por los tratamientos en estudio a un =0.05; esto debido a que el valor Pr >F es menor a 0.05 (0.0006).

Por otro lado, de la prueba de comparación de Duncan se puede apreciar que entre los tratamientos que tienen la misma letra no hay diferencias significativas, así:

No existe diferencias significativas entre los tratamientos SAJAMA Y JUJUY, pero si existe diferencia significativa entre los tratamientos AM.MARANG y GIG.BOL.

Page 29: Diseños jaime mori

Experimento en Parcelas Divididas

1.4 EXPERIMENTO FACTORIAL EN BLOQUES COMPLETOS AL AZAR

Es aquel donde la disposición experimental de los tratamientos se conforman por la combinación de los diferentes niveles de cada uno de los factores en estudio.

Un factor es un ingrediente o una manipulación que interviene en un tratamiento. El nivel es la dósis o cantidad del ingrediente empleado en el tratamiento.

Se llama Factor cualitativo cuando sus niveles vienen a ser categorias, generalmente no numéricas; por ejemplo, el factor "Fuentes de nitrógeno" cuyos niveles pueden ser: Nitrato de Amonio, Urea, Guano de Islas.

Se llama Factor cuantitativo cuando sus niveles son medidas numéricas; por por ejemplo, el factor "Dósis de nitrógeno" cuyos niveles pueden ser las dósis 0, 100, y 200 Kg. de Nitrog./Ha.

Generalmente cuando se trata de un factor cualitativo, el experimentador esta interesado en hacer comparaciones múltiples de medias entre los niveles del factor; esto puede ser realizado mediante las pruebas de comparación por: Duncan, Tukey, DLS, etc.

Cuando un factor es cuantitativo, lo más conveniente para el experimentador sería conocer la naturaleza de la Curva de respuesta al factor en estudio, la cual puede ser realizada mediante el análisis de regresión utilizando modelos polinomiales.

Proceso de aleatorización:En un arreglo factorial se aleatorizan las combinaciones de los niveles de los factores,

considerando cada combinación de niveles como un tratamiento, así por ejemplo si se tienen dos factores A y B, con p niveles el factor A (a0, a1, ....ap) y q niveles el factor B (b0, b1, b2, ...bq); entonces una posible forma de aleatorización en bloque sería como sigue:┌────┬────┬────┬───────┬────┐ ─┐│a0b0│apb1│a4b2│...... │a0b1│ I │ └────┴────┴────┴───────┴────┘ │ │ Bloques: I,II,III, ..K┌────┬────┬────┬───────┬────┐ │ │a4b0│a1b2│a0bq│...... │a1b0│ II │ Factor A:a0,a1,a2,..,ap└────┴────┴────┴───────┴────┘ │ p niveles del factor A . │ . │ Factor B:b0,b1,b2,..,bq . │ q niveles del factor q . │ . │ Combinaciones de tratam. . │ ┌────┬────┬────┬───────┬────┐ │ a0b0,a0b1,..,a0bq, a1b0,│a1b1│a2b4│apbq│...... │a2b2│ K │ a1b1,..,a1bq,..,apbq└────┴────┴────┴───────┴────┘ ───┘

Page 30: Diseños jaime mori

Experimento en Parcelas Divididas

Ventajas de los experimentos factoriales:Los experimentos de física normalmente solo permiten que varíe un factor mientras

que los restantes permanecen constantes. El experimento de un factor (tratamiento) se ha convertido más o menos en el modelo típico de la investigación científica porque ha resultado ser muy adecuado; sin embargo, en el campo de la biología los diversos factores interaccionan entre sí de forma complicada e inesperada y el experimento unifactorial con frecuencia no sólo es inadecuado por lo restringido sino que engaña en cuanto a los resultados.

Al diseñar un experimento factorial, el investigador debe utilizar su criterio y el conocimiento de los factores que se consideran; así, si se sospecha que hay factores que pueden interactuar en el resultado no es conveniente aislarlos realizando el estudio de cada factor en forma separada, sino analizar todos los factores en forma simultánea para ver si los factores realmente interactúan entre si.

Interacción de factoresLa interacción de los factores representa un papel importante en el análisis, de ahí que

las pruebas F que se realizen deben obedecer al siguiente orden: Primero la interacción de orden superior, luego la de menor orden y por último de los factores.

Si la interacción de mayor orden resulta significativa, termina la prueba del ANVA y se procede a comparar los niveles de un factor en la combinación de los otros factores.

Si la interacción de mayor orden no resulta significativa, continuan las pruebas de F con las interacciones de menor orden, si algunas de estas interacciones resulta significativa, se procede a comparar los niveles de un factor en la combinación de los otros factores.

Si en una prueba de una interacción de menor orden no resulta significativa, se continua las pruebas de F de cada factor por separado.

CASO : Cuando se estudian dos factores A y B

Modelo Estadístico

Yijk = + k + i + j + ()ij + eijk i=1,2,...,p j=1,2,...,qk=1,2,...,r

Donde:Yijk = Valor observado en el bloque k, para el nivel i del factor y el nivel j del factor B. = Efecto de la media general.k = Efecto del bloque k.i = Efecto del nivel i del factor A.j = Efecto del nivel j del factor B()ij = Efecto de la interacción del nivel i del factor A y el nivel j del factor B.eijk = Efecto aleatorio del error experimental.

Page 31: Diseños jaime mori

Experimento en Parcelas Divididas

CUADRO DEL ANALISIS DE VARIANCIA (ANVA ┌─────────────┬────────────┬──────────┬─────────┐ │Fuentes de │ Grados de │Suma de │Cuadrado ││variación │ libertad │cuadrados │medio ││ F.V. │ G.L. │ S.C. │C.M.=S.C ││ │ │ │ G.L.│├─────────────┼────────────┼──────────┼─────────┤ │Bloques │ r-1 │ SCBloq │ - │ ├─────────────┼────────────┼──────────┼─────────┤ │Factor A │ p-1 │ SCA │CMA │ ├─────────────┼────────────┼──────────┼─────────┤│Factor B │ q-1 │ SCB │CMB │├─────────────┼────────────┼──────────┼─────────┤│interacción │(p-1)(q-1) │ SCAB │CMAB ││ AxB │ │ │ │├─────────────┼────────────┼──────────┼─────────┤│Error │(pq-1)(r-1) │ SCError │CMError │├─────────────┼────────────┼──────────┼─────────┤│Total │ pqr-1 │ SCT │ │└─────────────┴────────────┴──────────┴─────────┘Este Anva prueba las hipótesis considerando el modelo I sobre los efectos de cada factor (A, B), así como de la interacción (AxB), así:

Hp: i = 0 (Todos los niveles del factor A tienen el mismo efecto)Ha: i 0 (No todos los niveles del factor A tienen el mismo efecto)

Hp: j = 0 (Todos los niveles del factor B tienen el mismo efecto)Ha: j 0 (No todos los niveles del factor B tienen el mismo efecto)

Hp: ()ij = 0 (El factor A y el factor B no interaccionan)Ha: ()ij 0 (El factor A y el factor B interaccionan)

Nivel de significación : FcalX = CMX/CMError , siendo X el factor o la interacción a probar.

ZONAS CRITICAS (para cada Hp.)

Page 32: Diseños jaime mori

Experimento en Parcelas Divididas

Si:

Fcal>Ftabular (con grados de libertad del factor ó interacción y el grado de libertad del error), se rechaza la hipótesis planteada (Hp) a un nivel de significación .

EJEMPLO

En la Estación experimental "Santa Ana" de Huancayo; se realizó un experimento para determinar el efecto de la sustitución de maíz por cebada en dietas para patos.

La variable analizada fué el incremento total de peso (kgs.) desde la 4ta. semana a la 12va. semana. Los tratamientos usados fuéron:R: Niveles de cebada en la ración (R1=0%, R2=15%, R3=30% y R4=45%) S: sexo (M=Machos y H=Hembras).El nivel de cebada R1=0% es considerado como testigo.El diseño usado para el análisis fué el de bloques completos al azar con dos factores ( R y S). Los resultados experimentales son:

┌──────────────────────────────────>Ración │ ┌───────────────────────────────>Bloque │ │ ┌────────────────────────────>Sexo │ │ │ ┌────────────────────────>Incremento de peso │ │ │ │ ┌────────────┐│R1 1 M 3.05││R1 1 H 2.90││R1 2 M 1.58││R1 2 H 1.61││R2 1 M 2.96│

Page 33: Diseños jaime mori

Experimento en Parcelas Divididas

│R2 1 H 3.24││R2 2 M 1.56││R2 2 H 1.67││R3 1 M 3.08││R3 1 H 3.12││R3 2 M 1.49││R3 2 H 1.73││R4 1 M 3.20││R4 1 H 3.09││R4 2 M 1.65││R4 2 H 1.70│└────────────┘

1.4.1 PROCEDIMIENTO EN SAS PARA EL ANALISIS DEL FACTORIAL EN DBCR. DATA SS;INFILE "D:\SAS\FACT.DAT";INPUT RACION$ 1-2 BLOQ 4-4 SEXO$ 7-7 INCREM 9-12;PROC ANOVA;CLASS RACION BLOQ SEXO;MODEL INCREM=BLOQ RACION SEXO RACION*SEXO;MEANS RACION / DUNCAN;RUN;

1.4.2 SALIDA SAS PARA EL ANALISIS DEL FACTORIAL EN DBCR

Analysis of Variance Procedure Class Level Information

Class Levels Values

RACION 4 R1 R2 R3 R4

BLOQ 2 1 2

SEXO 2 H M

Number of observations in data set = 16

Analysis of Variance Procedure

Dependent Variable: INCREM Sum of MeanSource DF Squares Square F Value Pr > F

Model 8 8.57635000 1.07204375 189.06 0.0001

Error 7 0.03969375 0.00567054

Corrected Total 15 8.61604375

R-Square C.V. Root MSE INCREM Mean

0.995393 3.201827 0.075303 2.35187500

Analysis of Variance Procedure

Dependent Variable: INCREM

Source DF Anova SS Mean Square F Value Pr > F

Page 34: Diseños jaime mori

Experimento en Parcelas Divididas

BLOQ 1 8.48265625 8.48265625 1495.92 0.0001RACION 3 0.03156875 0.01052292 1.86 0.2253SEXO 1 0.01500625 0.01500625 2.65 0.1478RACION*SEXO 3 0.04711875 0.01570625 2.77 0.1206

Analysis of Variance Procedure Duncan's Multiple Range Test for variable: INCREM

NOTE: This test controls the type I comparisonwise error rate, not the experimentwise error rate Alpha= 0.05 df= 7 MSE= 0.005671

Number of Means 2 3 4 Critical Range 0.126 0.131 0.134 Means with the same letter are not significantly different. Duncan Grouping Mean N RACION

A 2.4100 4 R4 A A 2.3575 4 R2 A A 2.3550 4 R3 A A 2.2850 4 R1

1.4.2 SALIDA EN MINITAB PARA EL ANALISIS DEL FACTORIAL EN DBCR

General Linear Model: INCREM versus BLOQUE, RACION, SEXO

Factor Type Levels Values BLOQUE fixed 2 1 2RACION fixed 4 R1 R2 R3 R4SEXO fixed 2 H M

Analysis of Variance for INCREM, using Adjusted SS for Tests

Source DF Seq SS Adj SS Adj MS F PBLOQUE 1 8.4827 8.4827 8.4827 1495.92 0.000RACION 3 0.0316 0.0316 0.0105 1.86 0.225SEXO 1 0.0150 0.0150 0.0150 2.65 0.148RACION*SEXO 3 0.0471 0.0471 0.0157 2.77 0.121Error 7 0.0397 0.0397 0.0057Total 15 8.6160

Tukey Simultaneous TestsResponse Variable INCREM All Pairwise Comparisons among Levels of RACION

RACION = R1 subtracted from:

Level Difference SE of AdjustedRACION of Means Difference T-Value P-ValueR2 0.07250 0.05325 1.362 0.5576R3 0.07000 0.05325 1.315 0.5829R4 0.12500 0.05325 2.348 0.1760

RACION = R2 subtracted from:

Level Difference SE of AdjustedRACION of Means Difference T-Value P-ValueR3 -0.002500 0.05325 -0.04695 1.0000

Page 35: Diseños jaime mori

Experimento en Parcelas Divididas

R4 0.052500 0.05325 0.98597 0.7619

RACION = R3 subtracted from:

Level Difference SE of AdjustedRACION of Means Difference T-Value P-ValueR4 0.05500 0.05325 1.033 0.7371

1.4.3 CONCLUSIONDel cuadro de Anva se puede apreciar que no existen diferencias significativas en los

incrementos de peso producido por los efectos de las raciones; asimismo el incremento de peso efectuado por las raciones es similar en los patos machos y hembras, no existiendo efecto de interacción entre sexo y ración sobre el incremento de peso.

La prueba de comparación de las medias mediante Duncan, muestra que no existen diferencias significativas entre las los efectos que pudieran producir las raciones sobre el incremento de peso.

1.5 EXPERIMENTO EN PARCELAS DIVIDIDAS

En el campo de la investigación se presentan numerosos experimentos que requieren unidades experimentales grandes, los mismos que pueden aprovecharse para dividir estas parcelas en subparcelas o subunidades donde puede estudiarse un factor diferente, en tal caso se debe de aplicar parcelas divididas donde la aleatorización se hace en dos etapas, en la 1ra. se colocan al azar los niveles de un factor (A) en parcelas y en la 2da. se colocan al azar todos los niveles de otro factor (B) en subparcelas dentro de cada parcela. De esta forma cada unidad de parcela llega a ser un bloque para los tratamientos que estan en subparcelas.

Suponga que se tiene que probar tres tratamientos: A1,A2,A3 en bloques al azar y que dentro de cada bloque cada tratamiento se asigna al azar a una parcela de terreno. Para ciertos tipos de tratamientos (por ejemplo método de labranza, irrigación, pastos, sistemas agroforestales, etc.), la parcela de terreno no puede ser demasiado pequeña. La parcela de terreno relativamente grande es la unidad de experimentación con respecto a los tratamientos A. Suponga que hay que probar al mismo tiempo otros cuatro tratamientos (B1,B2,B3,B4), cada uno de ellos en combinación con cada uno de los tratamientos Ai (i=1,2,3).

Con el fin de introducir los tratamientos Bi (i=1,2,3), cada una de las parcelas donde se asignaron al azar los tratamientos Ai (i=1,2,3) se puede dividir en cuatro subparcelas (subunidades), asignándose al azar a estas subparcelas los cuatro tratamientos B, este arreglo recibe el nombre de "parcelas divididas".

Hay que distinguir claramente este tipo de diseño del de los bloques al azar

Page 36: Diseños jaime mori

Experimento en Parcelas Divididas

ordinarios; en este último caso, las 12 combinaciones de tratamientos se asignan al azar a las 12 unidades de un bloque. En el diseño de parcela dividida, primero se asignan los tratamientos A y a continuación, dentro de cada nivel de A se asignan al azar los cuatro niveles del tratamiento B.

En experimentos de laboratorio, los tratamientos que no pueden administrarse a pequeña escala deberán ser las A de las unidades completas y los tratamientos que pueden aplicarse convenientemente a pequeña escala deberán ser los B de las subunidades. Sin embargo, en caso de poder elegir, los tratamientos más importantes deberán ser los B de las subunidades y los tratamientos de importancia secundaria deberán ser los A de las unidades completas.

ejemplos:

PARCELA SUBPARCELA

a. Niveles de fertilizante Métodos de aplicaciónb. Variedades de maíz Densidades de siembrac. Epocas de siembra Niveles de fertilización

Ejemplo de aleatorización en parcelas divididas: Considere que se tienen 2 factores, considerando el factor A aleatorizado en las

parcelas grandes, y el factor B aleatorizado en parcelas pequeñas (subparcelas) dentro de cada parcela grande, entonces un posible croquis experimental es:

a0 a1 a3 a2╔══╤══╤══╦══╤══╤══╦══╤══╤══╦══╤══╤══╗║ │ │ ║ │ │ ║ │ │ ║ │ │ ║║b0│b2│b1║b1│b2│b0║b0│b1│b2║b2│b1│b0║ Bloque I║ │ │ ║ │ │ ║ │ │ ║ │ │ ║║ │ │ ║ │ │ ║ │ │ ║ │ │ ║╚══╧══╧══╩══╧══╧══╩══╧══╧══╩══╧══╧══╝

a2 a3 a0 a1╔══╤══╤══╦══╤══╤══╦══╤══╤══╦══╤══╤══╗║ │ │ ║ │ │ ║ │ │ ║ │ │ ║║b0│b1│b2║b0│b1│b2║b2│b1│b0║b1│b2│b0║ Bloque II║ │ │ ║ │ │ ║ │ │ ║ │ │ ║║ │ │ ║ │ │ ║ │ │ ║ │ │ ║╚══╧══╧══╩══╧══╧══╩══╧══╧══╩══╧══╧══╝

Page 37: Diseños jaime mori

Experimento en Parcelas Divididas

a1 a2 a0 a3╔══╤══╤══╦══╤══╤══╦══╤══╤══╦══╤══╤══╗║ │ │ ║ │ │ ║ │ │ ║ │ │ ║║b0│b1│b2║b1│b2│b0║b1│b2│b0║b2│b0│b1║ Bloque III║ │ │ ║ │ │ ║ │ │ ║ │ │ ║║ │ │ ║ │ │ ║ │ │ ║ │ │ ║╚══╧══╧══╩══╧══╧══╩══╧══╧══╩══╧══╧══╝

a1 a3 a2 a0╔══╤══╤══╦══╤══╤══╦══╤══╤══╦══╤══╤══╗║ │ │ ║ │ │ ║ │ │ ║ │ │ ║║b2│b1│b0║b0│b2│b1║b1│b2│b0║b1│b2│b0║ Bloque IV║ │ │ ║ │ │ ║ │ │ ║ │ │ ║║ │ │ ║ │ │ ║ │ │ ║ │ │ ║╚══╧══╧══╩══╧══╧══╩══╧══╧══╩══╧══╧══╝│ │ │ └────────┘ └─> subparcela

parcela

Modelo estadístico:

Yijk = + k + i + eik + j + ()ij + ijk

i= 1,...,a a= número de niveles del factor Aj= 1,...,b b= número de niveles del factor Bk= 1,...,r r= número de bloques.

Donde:

Yijk = Valor observado en el bloque k, para el nivel i del factor A y el nivel j del factor B.

= Efecto de la media, constante general para todas las observaciones.

k = Efecto del k-ésimo bloque o repetición.i = Efecto del i-ésimo nivel del factor A.eik = Efecto del error de la parcela principal ik (Error(a))j = Efecto del j-ésimo nivel del factor B.()ij= Efecto de la interacción del i-ésimo nivel del factor A y el j-ésimo nivel del

Page 38: Diseños jaime mori

Experimento en Parcelas Divididas

factor B.ijk = Efecto del error de la subparcela ijk (Error(b))

CUADRO DEL ANALISIS DE VARIANCIA (ANVA) ┌───────────┬───────────┬─────────┬─────────┬─────────────┐│Fuentes de │ grados de │Suma de │cuadrado │F calculado ││variación │ libertad │cuadrados│mgdio │ ││ │ G.L. │ S.C. │C.M.=S.C │ F cal. ││ │ │ │ G.L │ │├───────────┼───────────┼─────────┼─────────┼─────────────┤│Bloques │ r-1 │SCbloq │ CMbloq │ - ││ │ │ │ │ ││Factor A │ a-1 │SCA │ CMA │CMA/CME(a) ││ │ │ │ │ ││Error(a) │(a-1)(r-1) │SCE(a) │ CME(a) │ │├───────────┼───────────┼─────────┼─────────┼─────────────┤│Factor B │ b-1 │SCB │ CMB │CMB/CME(b) ││ │ │ │ │ ││A x B │(a-1)(b-1) │SC(AxB) │ CM(AxB) │CM(AxB) ││ │ │ │ │CME(b) ││Error(b) │a(b-1)(r-1)│SCE(b) │ CME(b) │ ││ │ │ │ │ │├───────────┼───────────┼─────────┼─────────┼─────────────┤│Total │ abr-1 │SCTot │ │ │└───────────┴───────────┴─────────┴─────────┴─────────────┘

Para el Modelo I, este Anva prueba las siguientes hipótesis :

Hp: i = 0 (Todos los niveles del factor A tienen el mismo efecto)Ha: i 0 (No todos los niveles del factor A tienen el mismo efecto)

Hp: j = 0 (Todos los niveles del factor B tienen el mismo efecto)Ha: j 0 (No todos los niveles del factor A tienen el mismo efecto)

Hp: ()ij = 0 (El factor A y el factor B no interaccionan)Ha: ()ij 0 (El factor A y el factor B interaccionan)

Nivel de significación :

FcalA = CMA/CMError(a) ; ó también :

FcalX = CMX/CMError(b) , siendo X el factor B o la interacción AxB.

ZONAS CRITICAS

Page 39: Diseños jaime mori

Experimento en Parcelas Divididas

Si:Fcal > F tabular (con grados de libertad del factor ó interacción y el grado de libertad del error que corresponde), se rechaza la hipótesis planteada (Hp) a un nivel de significación a.

EJEMPLOEl programa de Suelos Tropicales del INIA, la Universidad Nacional Agraria - La

Molina y expertos de la Universidad de Carolina del Norte, realizáron experimentos sobre una serie de sistemas de producción en la Selva de Yurimaguas en los cultivos más importantes; entre estos, el arroz está siendo considerado por su adaptación a los suelos con PH bajo. En otro tipo de suelos la fertilización nitrogenada ha mostrado ser un factor muy importante en el aumento del rendimiento de dicho cultivo. Otro factor muy importante es la época de aplicación; ya que las condiciones cálidas y húmedas del trópico aceleran todos los procesos que liberan el nitrógeno y lo hacen más asimilable por la planta.

Para probar estos dos factores se aplicó un experimento en Parcelas Divididas, disponiendo los niveles de fertilización en subparcelas y las épocas de aplicación en parcelas.

Epocas de aplicación del nitrógeno (parcelas):Siembra (E1)Siembra y floración (E2)Macollo y floración (E3)

Page 40: Diseños jaime mori

Experimento en Parcelas Divididas

Siemb., Mac. y florac. (E4)

Dósis de nitrógeno (subparcelas):0 Kg./Ha. (N1)50 Kg./Ha. (N2)100 Kg./Ha. (N3)

Unidad experimental: Parcela.

Disposición experimental:

Page 41: Diseños jaime mori

Experimento en Parcelas Divididas

Los datos que se muestran a continuación son del rendimiento de arroz en kg/parcela. ┌─────────────>Dósis de nitrógeno │ ┌──────────>Epocas de aplicación │ │ ┌───────>Bloque │ │ │ ┌────>Rendimiento │ │ │ │ │ │ │ │ ┌───────────┐│N1 E1 1 6.1││N1 E1 2 8.3││N1 E1 3 7.8││N2 E1 1 3.7││N2 E1 2 7.4││N2 E1 3 6.0││N3 E1 1 3.0││N3 E1 2 3.1││N3 E1 3 4.4││N1 E2 1 6.0││N1 E2 2 7.4││N1 E2 3 6.1││N2 E2 1 4.1││N2 E2 2 6.2││N2 E2 3 4.4││N3 E2 1 3.0││N3 E2 2 4.6││N3 E2 3 4.1││N1 E3 1 5.0││N1 E3 2 8.3││N1 E3 3 6.2││N2 E3 1 5.8││N2 E3 2 7.2││N2 E3 3 7.7││N3 E3 1 4.0││N3 E3 2 5.0││N3 E3 3 4.5││N1 E4 1 4.8││N1 E4 2 7.2││N1 E4 3 6.3││N2 E4 1 5.3││N2 E4 2 6.1││N2 E4 3 6.9││N3 E4 1 3.6││N3 E4 2 4.4││N3 E4 3 4.0│

1.5.1 PROCEDIMIENTO SAS PARA EL ANALISIS EN PARCELAS DIVIDIDAS

DATA SS;INFILE "D:\SAS\PARCELA.DAT";INPUT NITROG$ 1-2 EPOCA$ 4-5 BLOQ 7-7 RDT 9-11;PROC ANOVA;CLASSES BLOQ NITROG EPOCA;MODEL RDT = BLOQ EPOCA BLOQ*EPOCA NITROG NITROG*EPOCA NITROG*BLOQ(EPOCA);TEST H=EPOCA E=BLOQ*EPOCA;

Page 42: Diseños jaime mori

Experimento en Parcelas Divididas

TEST H=NITROG E= NITROG*BLOQ(EPOCA);TEST H=NITROG*EPOCA E=NITROG*BLOQ(EPOCA);MEANS EPOCA/ DUNCAN E=BLOQ*EPOCA;MEANS NITROG/ DUNCAN E=NITROG*BLOQ(EPOCA);MEANS NITROG*EPOCA;RUN;

1.5.2.1 SALIDA EN SAS PARA EL ANALISIS EN PARCELAS DIVIDIDAS

Analysis of Variance Procedure Class Level Information

Class Levels Values

BLOQ 3 1 2 3

NITROG 3 N1 N2 N3

EPOCA 4 E1 E2 E3 E4

Number of observations in data set = 36

Analysis of Variance Procedure

Dependent Variable: RDT Sum of MeanSource DF Squares Square F Value Pr > F

Model 35 84.06000000 2.40171429 . .

Error 0 . .

Corrected Total 35 84.06000000

R-Square C.V. Root MSE RDT Mean

1.000000 0 0 5.50000000

Analysis of Variance Procedure

Dependent Variable: RDT

Source DF Anova SS Mean Square F Value Pr > F

BLOQ 2 18.74666667 9.37333333 . .EPOCA 3 3.50000000 1.16666667 . .BLOQ*EPOCA 6 1.82000000 0.30333333 . .NITROG 2 45.01500000 22.50750000 . .NITROG*EPOCA 6 6.98500000 1.16416667 . .NITROG*BLOQ(EPOCA) 16 7.99333333 0.49958333 . .

Analysis of Variance Procedure

Dependent Variable: RDT

Tests of Hypotheses using the Anova MS for BLOQ*EPOCA as an error term

Source DF Anova SS Mean Square F Value Pr > F

EPOCA 3 3.50000000 1.16666667 3.85 0.0754

Page 43: Diseños jaime mori

Experimento en Parcelas Divididas

SAS

Analysis of Variance Procedure

Dependent Variable: RDT

Tests of Hypotheses using the Anova MS for NITROG*BLOQ(EPOCA) as an error term

Source DF Anova SS Mean Square F Value Pr > FNITROG 2 45.01500000 22.50750000 45.05 0.0001

Tests of Hypotheses using the Anova MS for NITROG*BLOQ(EPOCA) as an error term

Source DF Anova SS Mean Square F Value Pr > F

NITROG*EPOCA 6 6.98500000 1.16416667 2.33 0.0826

Analysis of Variance Procedure

Duncan's Multiple Range Test for variable: RDT

NOTE: This test controls the type I comparisonwise error rate, not the experimentwise error rate

Alpha= 0.05 df= 6 MSE= 0.303333

Number of Means 2 3 4 Critical Range 0.635 0.658 0.669

Means with the same letter are not significantly different.

Duncan Grouping Mean N EPOCA

A 5.967 9 E3 A B A 5.533 9 E1 B A B A 5.400 9 E4 B B 5.100 9 E2

Analysis of Variance Procedure

Duncan's Multiple Range Test for variable: RDT

NOTE: This test controls the type I comparisonwise error rate, not the experimentwise error rate

Alpha= 0.05 df= 16 MSE= 0.499583

Number of Means 2 3 Critical Range 0.611 0.641

Means with the same letter are not significantly different.

Duncan Grouping Mean N NITROG

A 6.625 12 N1

B 5.900 12 N2

C 3.975 12 N3

Page 44: Diseños jaime mori

Experimento en Parcelas Divididas

Analysis of Variance Procedure

Level of Level of -------------RDT------------- NITROG EPOCA N Mean SD

N1 E1 3 7.40000000 1.15325626 N1 E2 3 6.50000000 0.78102497 N1 E3 3 6.50000000 1.67032931 N1 E4 3 6.10000000 1.21243557 N2 E1 3 5.70000000 1.86815417 N2 E2 3 4.90000000 1.13578167 N2 E3 3 6.90000000 0.98488578 N2 E4 3 6.10000000 0.80000000 N3 E1 3 3.50000000 0.78102497 N3 E2 3 3.90000000 0.81853528 N3 E3 3 4.50000000 0.50000000 N3 E4 3 4.00000000 0.40000000

1.5.2.2 SALIDA EN MINITAB PARA EL ANALISIS EN PARCELAS DIVIDIDAS

General Linear Model: RDT versus BLOQ, EPOCA, NITROG

Factor Type Levels Values BLOQ fixed 3 1 2 3EPOCA fixed 4 E1 E2 E3 E4NITROG fixed 3 N1 N2 N3

Analysis of Variance for RDT, using Adjusted SS for Tests

Source DF Seq SS Adj SS Adj MS F PBLOQ 2 18.7467 18.7467 9.3733 18.76 0.000EPOCA 3 3.5000 3.5000 1.1667 2.34 0.112BLOQ*EPOCA 6 1.8200 1.8200 0.3033 0.61 0.721NITROG 2 45.0150 45.0150 22.5075 45.05 0.000EPOCA*NITROG 6 6.9850 6.9850 1.1642 2.33 0.083Error 16 7.9933 7.9933 0.4996Total 35 84.0600

Unusual Observations for RDT

Obs RDT Fit SE Fit Residual St Resid 5 7.40000 6.43333 0.52683 0.96667 2.05R 8 3.10000 4.23333 0.52683 -1.13333 -2.41R

R denotes an observation with a large standardized residual.

Nota:En esta salida debe observarse que los cuadrados medios del error de todas las fuentes, han sido divididas entre el error experimental que viene a ser el error(b) o NITROG*BLOQ(EPOCA); por lo que en el caso de la fuente de variabilidad epoca esta deberia dividirse entre bloq*epoca.

1.5.3 CONCLUSION

a. No hay diferencias significativas entre los efectos de las épocas sobre el rendimiento de arroz; se acepta la hipótesis que las epócas de aplicación del fertilizante tienen el

Page 45: Diseños jaime mori

Experimento en Parcelas Divididas

mismo efecto a un =0.05.

b. Hay diferencias significativas a un =0.05 entre el efecto producido por los niveles de nitrógeno en el rendimiento de arroz; por lo tanto es necesario realizar una prueba de comparación de promedios para determinar entre que niveles existen las diferencias.

c. Realizada la prueba de comparación de promedios de los efectos producidos por el nitrógeno en el rendimiento, Duncan muestra que los tres niveles de nitrógeno tienen efectos diferentes en el rendimiento, siendo el nivel de nitrógeno N1 (sin fertilización nitrogenada) el que mejor efecto tiene sobre el rendimiento. Es un hecho poco frecuente que cuando no se hace la fertilización con nitrógeno el rendimiento sea mucho mayor que cuando se fertiliza esto se puede deber a que el suelo con el que se esta experimentando ya tenga nitrógeno y el exceso de ella cause un desarrollo vegetativo mas no de rendimiento de grano.

d. No existe efecto de interacción entre la época de aplicación y el nivel de nitrógeno sobre el rendimiento a un =0.05; en caso que hubiera sido significativo sería necesario probar el efecto que tienen los niveles de nitrógeno en cada época de aplicación de las mismas, para ello se puede hacer uso de un análisis gráfico (visto en el caso de factorial).

Page 46: Diseños jaime mori

Experimento en Cuadrado Latino

1.6 EXPERIMENTO EN CUADRADO LATINO

El agrupamiento de las unidades experimentales en dos sentidos (filas y columnas) y la asignación de los tratamientos al azar en las unidades experimentales, de tal forma que en cada fila y en cada columna se encuentren todos los tratamientos constituye un Cuadrado Latino.

Características:

a. Las unidades experimentales se distribuyen bajo dos criterios de homogeneidad: dentro de la fila y dentro de la columna.

b. En cada fila y en cada columna, el número de unidades experimentales es igual al número de tratamientos.

AleatorizaciónSe aleatoriza de tal forma que en el primer bloque fila los tratamientos están

ordenados de izquierda a derecha y para el primer bloque columna estos tratamientos también deben estar ordenados en bloques columnas de arriba hacia abajo; cada tratamiento debe aparecer en un bloque fila y en un bloque columna una sola vez.

ejemplo: Diseño con cuatro filas, cuatro columnas y cuatro tratamientos (A,B,C,D)

CASO I CASO II CASO III

┌──>COLUMNA │

┌┴──┬───┬───┬───┐ ┌───┬───┬───┬───┐ ┌───┬───┬───┬───┐│ A │ B │ C │ D │ │ A │ B │ C │ D │ │ A │ B │ C │D │├───┼───┼───┼───┤ ├───┼───┼───┼───┤ ├───┼───┼───┼───┤│ B │ A │ D │ C │ │ B │ C │ D │ A │ │ B │ A │ D │ C │├───┼───┼───┼───┤ ├───┼───┼───┼───┤ ├───┼───┼───┼───┤│ C │ D │ B │ A │ │ C │ D │ A │ B │ │ C │ D │ A │ B │├───┼───┼───┼───┤ ├───┼───┼───┼───┤ ├───┼───┼───┼───┤

FILA<───┤ D │ C │ A │ B │ │ D │ A │ B │ C │ │ D │ C │ B │ A │└───┴───┴───┴───┘ └───┴───┴───┴───┘ └───┴───┴───┴───┘

Modelo Estadístico

Yijk = +i + Fj + Ck + eijk i=1,2,...,t j=1,2,...,t k=1,2,...,t

Donde:Yijk = Valor observado correspondiente a la j-ésima fila,

k-ésima columna, y a la cual le aplicaron el tratamiento i-ésimo.

= Efecto de la media general.i = Efecto del i-ésimo tratamiento.Fj = Efecto de la j-ésima fila.Ck = Efecto de la k-ésima columna.eijk = Efecto del error experimental, asociado a la jk-ésima unidad experimental, a la cual se le aplica el i-ésimo tratamiento.

Page 47: Diseños jaime mori

Experimento en Cuadrado Latino

CUADRO DEL ANALISIS DE VARIANCIA (ANVA) ┌───────────┬───────────┬─────────┬───────────┬─────────────┐│Fuentes de │ grados de │Suma de │cuadrado │F calculado ││variación │ libertad │cuadrados│medio │ ││ │ G.L. │ S.C. │ C.M.=S.C │ F cal. ││ │ │ │ G.L. │ │├───────────┼───────────┼─────────┼───────────┼─────────────┤│Entre filas│ t-1 │SCFilas │ CMFilas │ - ││ │ │ │ │ ││Entre │ t-1 │SCColum. │ CMColum. │ - ││columnas │ │ │ │ ││ │ │ │ │ ││Entre │ t-1 │SCTratam.│ CMTratam │CMTratam./CME││tratam. │ │ │ │ ││ │ │ │ │ ││Error │ (t-1)(t-2)│SCE │ CME │ ││experim. │ │ │ │ │├───────────┼───────────┼─────────┼───────────┼─────────────┤│ │ 2 │ │ │ ││ Total │ t - 1 │SCTot │ │ │└───────────┴───────────┴─────────┴───────────┴─────────────┘

Este Anva prueba la hipótesis sobre el Modelo I :

Hp: ti = 0 (Todos los tratamientos tienen el mismo efecto)Ha: ti ╪ 0 (Todos los tratamientos no tienen el mismo efecto)

Nivel de significación :

Fcal=CMTratam/CME ;

ZONAS CRITICAS

Page 48: Diseños jaime mori

Experimento en Cuadrado Latino

Si: Fcal > F tabular (con (t-1) y (t-1) (t-2) grados de libertad), se rechaza la hipótesis planteada (Hp) a un nivel de significación .

EJEMPLO

Se probaron cuatro raciones alimenticias para pollos, criados en jaula tipo batería de 4 pisos (filas) y 4 casilleros (columnas). La variable analizada fué: Peso del pollo (kg.) a las 8 semanas de edad. El croquis experimental es como sigue:

C1 C2 C3 C4 ┌───┬───┬───┬───┐ P1 │T1 │T2 │T3 │T4 │ ├───┼───┼───┼───┤ P2 │T2 │T1 │T4 │T3 │ ├───┼───┼───┼───┤ P3 │T3 │T4 │T2 │T1 │ ├───┼───┼───┼───┤ P4 │T4 │T3 │T1 │T2 │ └───┴───┴───┴───┘

Los datos experimentales son: ┌───────────────────────────>Pisos │ ┌────────────────────────>Casilleros │ │ ┌─────────────────────>Raciones │ │ │ ┌────────────────>Peso │ │ │ │ ┌─────────────┐│P1 C1 T1 1.40││P1 C2 T2 1.38││P1 C3 T3 1.40││P1 C4 T4 1.60││P2 C1 T2 1.35││P2 C2 T1 1.28││P2 C3 T4 1.45││P2 C4 T3 1.62││P3 C1 T3 1.38││P3 C2 T4 1.40││P3 C3 T2 1.42││P3 C4 T1 1.63││P4 C1 T4 1.39││P4 C2 T3 1.39││P4 C3 T1 1.40││P4 C4 T2 1.60│└─────────────┘

1.6.1 PROCEDIMIENTO EN SAS PARA EL ANALISIS EN CUADRADO LATINO

Page 49: Diseños jaime mori

Experimento en Cuadrado Latino

DATA SS;INFILE "D:\SAS\CUADLAT.DAT";INPUT PISO$ 1-2 CASILL$ 4-5 RACION$ 7-8 PESO 10-13;PROC ANOVA;CLASS PISO CASILL RACION;MODEL PESO=PISO CASILL RACION ;MEANS RACION / DUNCAN;RUN;

1.6.2.1 SALIDA SAS PARA EL ANALISIS EN CUADRADO LATINO Analysis of Variance Procedure Class Level Information

Class Levels Values

PISO 4 P1 P2 P3 P4

CASILL 4 C1 C2 C3 C4

RACION 4 T1 T2 T3 T4

Number of observations in data set = 16

Analysis of Variance Procedure

Dependent Variable: PESO Sum of MeanSource DF Squares Square F Value Pr > F

Model 9 0.16380625 0.01820069 12.79 0.0029

Error 6 0.00853750 0.00142292

Corrected Total 15 0.17234375

R-Square C.V. Root MSE PESO Mean

0.950462 2.613881 0.037722 1.44312500

Analysis of Variance Procedure

Dependent Variable: PESO

Source DF Anova SS Mean Square F Value Pr > F

PISO 3 0.00216875 0.00072292 0.51 0.6911CASILL 3 0.15931875 0.05310625 37.32 0.0003RACION 3 0.00231875 0.00077292 0.54 0.6704

Duncan's Multiple Range Test for variable: PESO

NOTE: This test controls the type I comparisonwise error rate, not the experimentwise error rate

Alpha= 0.05 df= 6 MSE= 0.001423

Number of Means 2 3 4 Critical Range .0653 .0676 .0688

Page 50: Diseños jaime mori

Experimento en Cuadrado Latino

Means with the same letter are not significantly different.

Duncan Grouping Mean N RACION

A 1.4600 4 T4 A A 1.4475 4 T3 A A 1.4375 4 T2 A A 1.4275 4 T1

1.6.2.2 SALIDA EN MINITAB PARA EL ANALISIS EN CUADRADO LATINO

General Linear Model: PESO versus PISO, CASILL, RACION

Factor Type Levels Values PISO fixed 4 P1 P2 P3 P4CASILL fixed 4 C1 C2 C3 C4RACION fixed 4 T1 T2 T3 T4

Analysis of Variance for PESO, using Adjusted SS for Tests

Source DF Seq SS Adj SS Adj MS F PPISO 3 0.002169 0.002169 0.000723 0.51 0.691CASILL 3 0.159319 0.159319 0.053106 37.32 0.000RACION 3 0.002319 0.002319 0.000773 0.54 0.670Error 6 0.008537 0.008537 0.001423Total 15 0.172344

Unusual Observations for PESO

Obs PESO Fit SE Fit Residual St Resid 6 1.28000 1.32875 0.02982 -0.04875 -2.11R

R denotes an observation with a large standardized residual.

Tukey Simultaneous TestsResponse Variable PESO All Pairwise Comparisons among Levels of RACION

RACION = T1 subtracted from:

Level Difference SE of AdjustedRACION of Means Difference T-Value P-ValueT2 0.01000 0.02667 0.3749 0.9804T3 0.02000 0.02667 0.7498 0.8737T4 0.03250 0.02667 1.2185 0.6387

RACION = T2 subtracted from:

Level Difference SE of AdjustedRACION of Means Difference T-Value P-ValueT3 0.01000 0.02667 0.3749 0.9804T4 0.02250 0.02667 0.8435 0.8326

RACION = T3 subtracted from:

Level Difference SE of AdjustedRACION of Means Difference T-Value P-ValueT4 0.01250 0.02667 0.4686 0.9633

Page 51: Diseños jaime mori

Experimento en Cuadrado Latino

1.6.3 CONCLUSION

Del análisis de variancia se puede afirmar, que no existen diferencias significativas entre los efectos de las raciones sobre el peso de los pollos a las 8 semanas de edad; es decir producen efectos similares, esto se puede apreciar también en la prueba de Duncan donde las medias de las raciones estan asociadas una misma letra.

Por otro lado, también es posible notar que no existe diferencias significativas a un =0.05 entre los pisos en que fuéron tratados los pollos respecto al incremento de peso a las 8 semanas de edad; siendo significativo a un =0.05 el efecto de la casilla sobre el incremento de peso a las 8 semanas de edad.

1.7 EXPERIMENTOS REPETIDOS

Cuando un experimento va a ser conducido en diferentes localidades o épocas se debe utilizar una aleatorización individual para cada época o localidad ya que repetir la misma aleatorización en cada experimento individual invalida las pruebas estadísticas en los resultados debido a la posibilidad de que un sesgo haya sido introducido en la aleatorización, también es conveniente tener el mismo número de repeticiones y tratamientos comunes en cada experimento individual a fin de facilitar el análisis de variancia combinado.

Para realizar el análisis de variancia combinado, primero se deberá realizar el análisis de variancia de los experimentos individuales; luego se deberá probar la homogeneidad entre las variancias de los experimentos individuales, ya sea esto por una prueba F (para dos experimentos) ó una prueba chi-cuadrado (Bartlett) para más de dos experimentos y realizar el análisis combinado entre los experimentos que presenten homogeneidad de variancias.

Una forma rápida de probar la homogeneidad de variancias sin usar la prueba de Bartlett es mediante el procedimiento sugerido por Hartley, el cual se muestra como sigue:

Hp: Existe homogeneidad de varianciasHa: no existe homogeneidad de variancias

Fcal = CME1 (más alto de todos los experimentos individuales)

CME2 (más bajo de todos los experimentos individuales)

Page 52: Diseños jaime mori

Experimento en Cuadrado Latino

ZONAS CRITICAS:

Si Fcal > F1 tabular (con los grados de libertad del cuadrado medio del error más alto y más bajo respectivamente) ó Fcal < F2 tabular (con los grados de libertad del cuadrado medio del error más alto y más bajo respectivamente), se rechaza la hipótesis planteada (Hp) a un nivel de significación .

En caso de aceptar la hipótesis planteada, se puede realizar el análisis combinado de todos los experimentos individuales; si se rechaza la hipótesis planteada se deberá agrupar los experimentos individuales con variancias homogéneas, de tal forma que se pueda realizar el análisis combinado dentro de cada grupo.

CASO I: Experimentos repetidos en diferentes localidades en el mismo período

En la experimentación agrícola sobre un determinado tratamiento, a veces hay la necesidad de repetirlo sobre un número de localidades o ambientes en un mismo período. Este tipo de ensayos se realizan por lo general cuando se instalan una red de ensayos en diferentes estaciones experimentales, para una misma campaña agrícola. Para tal efecto se tiene que usar el mismo modelo estadístico en cada ambiente, considerando una aleatorización diferente para cada experimento.

Modelo estadístico:

Yijk = m + Li + Rj(Li) + Tk + (LT)ik + eijk

i= 1,...,l l= número de localidades.k= 1,...,t t= número de tratamientos.j= 1,...,r r= número de bloques.

donde:

Page 53: Diseños jaime mori

Experimento en Cuadrado Latino

Yijk = Valor observado correspondiente a la i-ésima localidad,con el k-ésimo tratamiento, en el j-ésimo bloque.

m = Efecto de la media, constante general para todas las observaciones.Li = Efecto de la i-ésima localidad.Tk = Efecto del k-ésimo tratamiento.(LT)ik = Efecto de la interacción de la i-ésima localidad y el k-ésimo

tratamiento.eijk = Error experimental.

CUADRO DEL ANALISIS DE VARIANCIA (ANVA) ┌────────────────┬───────────┬─────────────┬─────────┬────────────┐│Fuentes de │grados de │Sumas de │Cuadrado │F calculado ││variación │libertad │cuadrado │medio │ Fcal. │├────────────────┼───────────┼─────────────┼─────────┼────────────┤│Localidad │ l-1 │SCLoc │CMLoc │CMLoc ││ │ │ │ │CMError1 ││Rep(Localidad) │ l(r-1) │SCRep(Loc) │CMError1 │ │├────────────────┼───────────┼─────────────┼─────────┼────────────┤│Tratam. │ t-1 │SCTrat │CMTrat │CMTrat ││ │ │ │ │CMLxTrat ││Local. x tratam.│(l-1)(t-1) │SC(Locxtrat) │CMLxTrat │CMLxTrat ││ │ │ │ │CMError ││RepxTrat.(local)│l(r-1)(t-1)│SCError │CMError │ │├────────────────┼───────────┼─────────────┼─────────┼────────────┤│Total │ trl-1 │ │ │ │└────────────────┴───────────┴─────────────┴─────────┴────────────┘

Este Anva prueba las hipótesis para el Modelo I sobre cada factor (tratamiento, localidad), así como de la interacción (tratamiento x localidad).

Hp: Li = 0 (Todas las localidades tienen el mismo efecto)

Hp: Tk = 0 (Todos los tratamientos tienen el mismo efecto)

Hp: (LT)ik = 0 (No existe interacción entre las localidades y los tratamientos)

Nivel de significación :

Fcal=CMLoc/CMError1

Fcal=CMTrat/CMLxTrat

Fcal=CMLxTrat/CMError

Page 54: Diseños jaime mori

Experimento en Cuadrado Latino

ZONAS CRITICAS (para cada Hp.)

Si:Fcal> F tabular (con grados de libertad del factor ó interacción y el grado de libertad del error que corresponde), se rechaza se rechaza la hipótesis planteada a un nivel de significación .

CASO II: Experimentos repetidos en el mismo ambiente en dos ó mas períodos

En la experimentación agrícola sobre un determinado tratamiento, a veces hay la necesidad de repetirlo en diferentes períodos en una misma localidad o ambiente. Este tipo de ensayos se realizan por lo general cuando se instalan experimentos en diferentes campañas agrícolas para una misma localidad ó ambiente (estación experimental). Para tal efecto se tiene que usar el mismo modelo estadístico en cada período, considerando una aleatorización diferente para cada experimento.

Modelo estadístico:

Yijk = m + Pi + Rj(Pi) + Tk + (PT)ik + eijk

Page 55: Diseños jaime mori

Experimento en Cuadrado Latino

i= 1,...,p p= número de períodos.k= 1,...,t t= número de tratamientos.j= 1,...,r r= número de bloques.

donde:

Yijk = Valor observado correspondiente al i-ésimo período, conel k-ésimo tratamiento, en el j-ésimo bloque.

m = Efecto de la media, constante general para todas las observaciones.Pi = Efecto del i-ésimo período.Tk = Efecto del k-ésimo tratamiento.(PT)ik = Efecto de la interacción del i-ésimo período y el k-ésimo tratamiento.eijk = Error experimental.

CUADRO DEL ANALISIS DE VARIANCIA (ANVA) ┌──────────────────┬───────────┬─────────────┬─────────┬────────────┐│Fuentes de │grados de │Sumas de │Cuadrado │F calculado ││variación │libertad │cuadrado │medio │ Fcal. │├──────────────────┼───────────┼─────────────┼─────────┼────────────┤│Periodos │ p-1 │SCPer │CMPer │CMPer ││ │ │ │ │CMError1 ││Rep(Periodos) │ p(r-1) │SCRep(Per) │CMError1 │ │├──────────────────┼───────────┼─────────────┼─────────┼────────────┤│Tratam. │ t-1 │SCTrat │CMTrat │CMTrat ││ │ │ │ │CMPxTrat ││Period. x tratam. │(p-1)(t-1) │SC(Perxtrat) │CMPxTrat │CMPxtrat ││ │ │ │ │CMError ││Rep x Trat (per) │p(r-1)(t-1)│SCError │CMError │ │├──────────────────┼───────────┼─────────────┼─────────┼────────────┤│Total │ trp-1 │ │ │ │└──────────────────┴───────────┴─────────────┴─────────┴────────────┘

Este Anva prueba las hipótesis para el Modelo I sobre cada factor (tratamiento, período), así como de la interacción (tratamiento x período)

Hp: Pi = 0 (Todos los períodos tienen el mismo efecto)

Hp: Tk = 0 (Todos los tratamientos tienen el mismo efecto)

Hp: (PT)ik = 0 (No existe interacción entre períodos y tratamientos)

Nivel de significación :

Fcal =CMPer/CMError1

Fcal=CMTrat/CMPxTrat

Fcal=CMPxTrat/CMError

Page 56: Diseños jaime mori

Experimento en Cuadrado Latino

ZONAS CRITICAS (para cada Hp.)

Si:Fcal> F tabular (con grados de libertad del factor ó interacción y el grado de libertad del error que corresponde), se rechaza se rechaza la hipótesis planteada a un nivel de significación .

Page 57: Diseños jaime mori

Experimento en Cuadrado Latino

EJEMPLOConsiderando los datos y resultados del ejemplo dado en el capítulo de Bloques

completos al azar, se procederá a realizar el análisis combinado para las dos épocas de siembra (Epoca 1= 25 de mayo de 1993, Epoca 2= 23 de setiembre de 1993):

EPOCA 1 Tratam. Bloque Rend. Epoc┌──────────────────────────┐│KAMIRI 1 1184 EP1││CAMACANI 1 0938 EP1││ SAJAMA 1 1162 EP1││GIG.BOL. 1 0650 EP1││JUJUY 1 0704 EP1││AM.MARANG 1 1265 EP1││KAMIRI 2 0910 EP1││CAMACANI 2 1243 EP1││SAJAMA 2 1116 EP1││GIG.BOL. 2 0657 EP1││JUJUY 2 1024 EP1││AM.MARANG 2 1344 EP1││KAMIRI 3 1142 EP1││CAMACANI 3 1165 EP1││SAJAMA 3 1337 EP1││GIG.BOL. 3 1000 EP1││JUJUY 3 1160 EP1││AM.MARANG 3 1362 EP1││KAMIRI 4 0932 EP1││CAMACANI 4 1246 EP1││SAJAMA 4 1424 EP1││GIG.BOL. 4 1273 EP1││JUJUY 4 0578 EP1││AM.MARANG 4 1393 EP1│└──────────────────────────┘

EPOCA 2Tratam. Bloque Rend. Epoc┌──────────────────────────┐│KAMIRI 1 1537 EP2││CAMACANI 1 0852 EP2││SAJAMA 1 1234 EP2││GIG.BOL. 1 1899 EP2││JUJUY 1 1519 EP2││AM.MARANG 1 1061 EP2│ KAMIRI 2 1797 EP2││CAMACANI 2 1122 EP2││SAJAMA 2 1643 EP2││GIG.BOL. 2 1588 EP2││JUJUY 2 1767 EP2││AM.MARANG 2 1235 EP2││KAMIRI 3 1675 EP2││CAMACANI 3 1757 EP2││SAJAMA 3 2332 EP2││GIG.BOL. 3 1910 EP2││JUJUY 3 2109 EP2││AM.MARANG 3 1312 EP2││KAMIRI 4 1905 EP2││CAMACANI 4 1205 EP2││SAJAMA 4 1983 EP2││GIG.BOL. 4 1972 EP2││JUJUY 4 1799 EP2││AM.MARANG 4 1090 EP2│└──────────────────────────┘

Page 58: Diseños jaime mori

Experimento en Cuadrado Latino

Antes de realizar el análisis combinado se tiene que realizar el procedimiento estadístico para probar la homogeneidad de variancias de los experimentos individuales:

1.7.1 PRUEBA DE HOMOGENEIDAD DE VARIANCIAS

Hp: Existe homogeneidad de variancias

Ha: No existe homogeneidad de variancias

=0.1

CME1= 45111.353 ; CME2= 35162.1972

Fcal= 45111.353 /35162.1972 = 1.2829

Zonas críticas:

Se acepta la Hp. y se concluye a un a=0.1 que hay evidencia estadística para afirmar que hay homogeneidad de variancias; por lo tanto se puede realizar el análisis combinado para las dos epócas.

1.7.2 PROCEDIMIENTO EN SAS PARA EL ANALISIS DEL EXPERIMENTO REPETIDO EN QUINUA (2 EPOCAS DE SIEMBRA)

DATA SS;INFILE "D:\SAS\COMBINAD";INPUT TRAT$ 1-9 BLOQ 14-14 RDT 18-21 EPOCA$ 24-26;PROC ANOVA;

Page 59: Diseños jaime mori

Experimento en Cuadrado Latino

CLASSES BLOQ TRAT EPOCA;MODEL RDT = EPOCA BLOQ(EPOCA) TRAT TRAT*EPOCA TRAT*BLOQ(EPOCA);TEST H=EPOCA E=BLOQ(EPOCA); TEST H=TRAT E=TRAT*EPOCA; TEST H=TRAT*EPOCA E=TRAT*BLOQ(EPOCA); MEANS TRAT / DUNCAN E=TRAT*EPOCA; RUN; 1.7.3.1 RESULTADO EN SAS PARA EL ANALISIS REPETIDO DE LAS DOS EPOCAS

DE SIEMBRA Analysis of Variance Procedure Class Level Information Class Levels Values BLOQ 4 1 2 3 4 TRAT 6 AM.MARANG CAMACANI GIG.BOL. JUJUY KAMIRI SAJAMA EPOCA 2 EP1 EP2 Number of observations in data set = 48 Analysis of Variance Procedure Dependent Variable: RDT Sum of MeanSource DF Squares Square F Value Pr > F Model 47 7826862.000 166528.979 . . Error 0 . . Corrected Total 47 7826862.000 R-Square C.V. Root MSE RDT Mean 1.000000 0 0 1344.00000 SAS 1:00 Sunday, April 5, 1994 Analysis of Variance Procedure Dependent Variable: RDT Source DF Anova SS Mean Square F Value Pr > F EPOCA 1 3047184.083 3047184.083 . .BLOQ(EPOCA) 6 958982.250 159830.375 . .TRAT 5 539736.250 107947.250 . .TRAT*EPOCA 5 2076856.167 415371.233 . .BLOQ*TRAT(EPOCA) 30 1204103.250 40136.775 . . Tests of Hypotheses using the Anova MS for BLOQ(EPOCA) as an error term Source DF Anova SS Mean Square F Value Pr > F EPOCA 1 3047184.083 3047184.083 19.07 0.0047 SAS 1:00 Sunday, April 5, 1994 Dependent Variable: RDT Tests of Hypotheses using the Anova MS for TRAT*EPOCA as an error term

Page 60: Diseños jaime mori

Experimento en Cuadrado Latino

Source DF Anova SS Mean Square F Value Pr > F TRAT 5 539736.2500 107947.2500 0.26 0.9173 Tests of Hypotheses using the Anova MS for BLOQ*TRAT(EPOCA) as an error term Source DF Anova SS Mean Square F Value Pr > F TRAT*EPOCA 5 2076856.167 415371.233 10.35 0.0001

Analysis of Variance Procedure Duncan's Multiple Range Test for variable: RDT NOTE: This test controls the type I comparisonwise error rate, not the experimentwise error rate Alpha= 0.05 df= 5 MSE= 415371.2 Number of Means 2 3 4 5 6 Critical Range 829.2 854.7 863.6 868.4 869.3 Means with the same letter are not significantly different. Duncan Grouping Mean N TRAT A 1528.9 8 SAJAMA A A 1385.2 8 KAMIRI A A 1368.6 8 GIG.BOL. A A 1332.5 8 JUJUY A A 1257.7 8 AM.MARANG A A 1191.0 8 CAMACANI

1.7.3.2 RESULTADO EN MINITAB PARA EL ANALISIS REPETIDO DE LAS DOS EPOCAS DE SIEMBRA

General Linear Model: RDT versus EPOCA, TRAT, BLOQ

Factor Type Levels Values EPOCA fixed 2 EP1 EP2BLOQ(EPOCA) fixed 8 1 2 3 4 1 2 3 4TRAT fixed 6 AM.MARANG CAMACANI GIG.BOL. JUJUY KAMIRI SAJAMA

Analysis of Variance for RDT, using Adjusted SS for Tests

Source DF Seq SS Adj SS Adj MS F PEPOCA 1 3047184 3047184 3047184 **BLOQ(EPOCA) 6 958982 958982 159830 **TRAT 5 539736 539736 107947 **EPOCA*TRAT 5 2076856 2076856 415371 **TRAT*BLOQ(EPOCA) 30 1204103 1204103 40137 **Error 0 0 0 0Total 47 7826862

** Denominator of F-test is zero.

Page 61: Diseños jaime mori

Experimento en Cuadrado Latino

1.7.4 CONCLUSION a. Existe un efecto de época que influye en el rendimiento de los cultivares de quinua a un =0.05;. Este efecto puede apreciarse en la prueba de comparación de Duncan que se realizó para cada época (diseño bloque completo al azar), en ella se nota que los cultivares rinden mejor en la segunda época de siembra.

b. No existe diferencias significativas en el rendimiento de los cultivares de quinua a un =0.05, sin considerar el efecto de época.

c. Existe un efecto de época que interacciona en los cultivares de quinua sobre el rendimiento (a un =0.05), esto indica que los cultivares producen efectos diferentes dependiendo de la época de siembra.

Page 62: Diseños jaime mori

Análisis de regresión

CAPITULO II ANALISIS DE REGRESION

2.1 REGRESION LINEAL MULTIPLE

El estudio efectuado hasta el momento de los métodos estadísticos se ha limitado principalmente a los datos univariables; es decir a realizar el análisis estadístico de una sola variable respuesta por unidad experimental.

En la práctica; cuando el investigador toma datos, lo hace sobre un conjunto de variables; así por ejemplo si se está estudiando un conjunto de tratamientos dado por accesiones de maíz, entonces algunos de los datos que el investigador anotará en su libro de campo serán: altura de la planta, rendimiento por parcela, días a floración, porcentaje de humedad, # de mazorcas, etc.

Un método que permite analizar más de una variable mediante una relación funcional está dada por la regresión.

Así pues, la regresión es una técnica estadística que permite establecer la mejor relación funcional entre una variable dependiente y una ó más variables independientes.

Una relación funcional matemática está dado por la siguiente expresión:donde:

Y = Es la variable dependiente.Xi = Es la i-ésima variable independiente.ßj = Es el j-ésimo parámetro de la función.

Cuando se decide ajustar los datos muestrales a una función, los parámetros no se

pueden determinar sin error, por lo que la función matemática se convierte en:donde e representa el error cometido en el intento de observar la característica en estudio, la cual es influenciada por:variables no consideradas en el modelo, errores de observación o medición de las variables, modelo no adecuado, etc.

62

Page 63: Diseños jaime mori

Análisis de regresión

A esta última función es la que se denomina función estadística, que será materia de estudio en el presente capítulo.Modelo Estadístico poblacional

Yi = ß0 + ß1 Xi1+ ß2 Xi2+ ... + ß(p-1) Xi(p-1)+ ei donde: Yi = i-ésimo valor de la variable dependiente Y (i=1,2,...n) ß0 = Coeficiente de intersección parametríca. ßj = Coeficientes de regresión paramétrica (j=1,2, .. (p-1)).p = Número de parámetros del modelo poblacional.ei = i-ésimo término de error del modelo. Xij = i-ésima observación de la j-ésima variable dependiente. Este modelo puede ser expresado en forma matricial de la siguiente manera:

Y = X ß + e , y en términos de un modelo muestral como:

Y = X b + e , siendo los componentes de este modelo: ┌ ┐ ┌ ┐ ┌ ┐ │ Y1 │ │ 1 X11 X12 .... X1(p-1) │ │ b0 │ │ Y2 │ │ 1 X21 X22 .... X2(p-1) │ │ b1 │Y = │ Y3 │; X = │ . . . . │; b = │ b2 │ │ . │ │ . . . . │ │ . │ │ . │ │ . . . . │ │ . │ │ . │ │ . . . . │ │ . │ │ Yn │ │ 1 Xn1 Xn2 .... Xn(p-1) │ │ b(p-1)│ └ ┘ └ ┘ └ ┘

┌ ┐ │ e1 │ │ e2 │ │ . │e = │ . │ │ . │ │ . │ │ e(p-1)│ └ ┘

Mediante el método de Mínimos Cuadrados es posible encontrar los estimadores de los parámetros del modelo poblacional, para ello el procedimiento consiste en minimizar la suma de cuadrados del error, usando el concepto de derivadas; luego formar un sistema de ecuaciones normales cuya solución será el vector de estimadores.

Paso 1: Minimizar la suma de cuadrados del error

63

Page 64: Diseños jaime mori

Análisis de regresión

Paso 2: Formar el sistema de ecuaciones normales

┌ ┐ ┌ ┐ ┌ ┐│n S Xi1 S Xi2 ......... S Xi(p-1) │ │ b0 │ │S Xi1 Yi ││ 2 │ │ │ │ ││S Xi1 S Xi1 S Xi1 Xi2 ..... S Xi1 Xi(p-1)│ │ b1 │ │S Xi2 Yi ││ 2 │ │ │ │ ││S Xi2 S Xi2 Xi1 S Xi2 ..........S Xi2 Xi(p-1)│ │ b2 │=│S Xi3 Yi ││ . . . │ │ . │ │ . ││ . . . │ │ . │ │ . ││ . . . │ │ . │ │ . ││ . . 2 │ │ . │ │ . ││S Xi(p-1) ......................... S Xi(p-1) │ │b(p-1)│ │S Xi(p-1) Yi│└ ┘ └ ┘ └ ┘

El cual puede ser expresado como:

Donde el vector solución es:

Con lo cual el modelo estimado es:

Los coeficientes del vector b pueden ser interpretados de la siguiente manera:

b0 = Cuando las variables independientes toman el valor 0, en promedio la variable dependiente es b0. Este coeficiente no siempre tiene interpretación práctica, debido a que por efectos propios del ajuste de datos a la ecuación de regresión, puede resultar un valor que no tiene relación con lo que se estudia.

bi = Cuando la variable Xi varía en una unidad, en promedio la variable Y varía en bi unidades, manteniendo constante las demás variables

independientes.

64

Page 65: Diseños jaime mori

Análisis de regresión

Supuestos básicos del modelo

a. Las variables Xi son no aleatorias o fijas.b. No existe relación lineal exacta entre las variables Xi (no existe multicolinealidad).c. La matríz X es de rango completo (p-1), es decir que (p-1) es el número de columnas

de X y (p-1) es menor que n (tamaño de muestra) .d. Los errores atribuibles a cada observación Yi no están asociados.

MATRIZ DE CORRELACIONES SIMPLESEl coeficiente de correlación (r) es un número que indica el grado de asociación entre

dos variables. Su valor se encuentra entre -1 y 1, cuando r= -1 entonces la asociación entre las variables es perfecta e inversa, cuando r=1 entonces la asociación entre las variables es perfecta y directa y cuando r=0 no hay asociación entre las variables. En la práctica se debe tener en cuenta que es difícil encontrar relaciones perfectas entre dos variables distintas; por lo tanto el valor del coeficiente de correlación debe interpretarse de la siguiente manera:

Cuando el valor de r se acerca a -1 la asociación de las variables es alta e inversa, cuando el valor de r se acerca a 1 la asociación de las variables es alta y directa y cuando el valor de r se acerca a cero entonces las variables no están asociadas o son independientes. La matríz de correlaciones simples se muestra de la siguiente manera: ┌ ┐ │ 1 ryx1 ryx2 ....... ryx(p-1) │ │ rx1y 1 rx1x2 ....... rx1x(p-1)│ │ . . . . │ r= │ . . 1 . │ │ . . . . │ │ . . . . │ │ rx(p-1)y rx(p-1)x1 rx(p-1)x2 ........ 1 │ └ ┘

Siendo:

Donde Wi, Zj son variables que pueden asumir a dos variables independientes ó a la variable

65

Page 66: Diseños jaime mori

Análisis de regresión

dependiente y una variable independiente cualquiera.

CUADRO DE ANALISIS DE VARIANCIA ┌─────────────────────┬─────────┬────────────────┬─────────────┬───────┐│FUENTES DE VARIACION │GRADOS DE│ SUMA DE │ CUADRADO │Fcal. ││ │LIBERTAD │ CUADRADO │ MEDIO │ │├─────────────────────┼─────────┼────────────────┼─────────────┼───────┤│ │ │ T T _2 │ │ ││DEBIDO A LA REGRESION│ p-1 │SCR=b (X Y)-nY │CMR=SCR/(p-1)│CMR/CME││ │ │ │ │ ││ERROR │ n - p │SCE=SCT-SCR │CME=SCE/(n-p)│ │├─────────────────────┼─────────┼────────────────┼─────────────┴───────┘│ │ │ T _2 │ │TOTAL │ n - 1 │SCT=Y Y-nY │ └─────────────────────┴─────────┴────────────────┘ Hipótesis a probar:Hp: ß1=ß2=ß3= .....=ß(p-1)=0Ha: Al menos un ßi es diferente de 0, para i=1,2,..,(p-1).Nivel de significación :

Fcal =CMR/CME

ZONAS CRITICAS

Si Fcal > F tabular (con (p-1) y (n-p) grados de libertad) se rechaza la hipótesis Hp.Si se acepta la Hp. entonces no existe regresión múltiple, si se rechaza la Hp. es

66

Page 67: Diseños jaime mori

Análisis de regresión

necesario realizar la prueba de hipótesis sobre cada coeficiente de regresión, a fin de determinar si existe un efecto adicional de cada variable independiente. El procedimiento que se usa para realizar la prueba de hipótesis sobre el i-ésimo coeficiente de regresión (i=1,2,.., (p-1)) es:

Hp: ßi=0Ha: ßi╪0Nivel de significación: Tc = bi /Sbi

└──────> Desviación estándar del coeficiente de regresión bi; el cual puede ser

determinado de la matríz variancia-covariancia; la cual resulta de la siguiente expresión: que puede ser expresado como: ┌ ┐ │ a00 a01 a02 .......... a0(p-1) │ │ │ │ a10 a11 a12 .......... a1(p-1) │ │ │ (CME) │ a20 a21 a22 .......... a2(p-1) │ │ . . │ │ . . │ │ . . │ │ a(p-1)0 a(p-1)1 a(p-1)2 ...... a(p-1)(p-1)│ └ ┘Del cual se desprende que:

ZONAS CRITICAS

67

Page 68: Diseños jaime mori

Análisis de regresión

Si │Tc│>Ttab (con (n-p) grados de libertad) se rechaza la hipótesis planteada, con lo cual se puede concluir que efectivamente la variable Xi si aporta significativamente al modelo lineal múltiple (tiene un efecto adicional).

COEFICIENTE DE DETERMINACION MULTIPLE

La expresión r2= SCR / SCT indica en que porcentaje la variación de la variable dependiente es debida a efectos de la regresión. El valor del coeficiente de determinación se encuentra entre cero y uno; cuanto más lejos este de cero mejor es el modelo de regresión que se usó para describir los datos. Adicionalmente a este coeficiente de determinación múltiple se define el r2 ajustado (r2aj.), el término ajustado implica que el coeficiente utiliza los grados de libertad como una manera de mejorar el valor del coeficiente de determinación.

La expresión del coeficiente de determinación ajustado es:

Es una buena práctica utilizar el r2aj. en lugar del r2 debido a que este último proporciona un cuadro demasiado optimista de la regresión, particularmente cuando el número de variables independientes no es muy pequeño en comparación con el número de observaciones.

EJEMPLOEn 1988 en la estación experimental "Los Pobres - Ica", se realizaron experimentos

en papa con el fin de evaluar la resistencia a diversos tipos de virus y al calor. En uno de los experimentos se sembraron 162 clones, de las cuales se seleccionaron 36 por sus características de rendimiento, precocidad, número de tubérculos por planta y apariencia. El siguiente conjunto de datos corresponde al rendimiento y otras características de los clones tolerantes a calor seleccionados en ica:

68

Page 69: Diseños jaime mori

Análisis de regresión

┌───────────────────> Altura de la planta (cm) │ ┌─────────────> Número de tubérculos/planta (promedio) │ │ ┌─────────> Rendimiento (gr/planta) │ │ │┌─────────────────┐│ 40.6 14.1 506.2 ││ 49.0 6.5 362.5 ││ 32.6 7.0 561.1 ││ 52.0 5.5 431.2 ││ 33.0 8.1 368.8 ││ 61.6 9.8 494.5 ││ 54.6 6.8 500.0 ││ 32.3 6.5 243.8 ││ 33.6 5.2 257.2 ││ 40.0 8.2 465.0 ││ 56.6 15.0 800.0 ││ 48.6 11.4 344.4 ││ 57.3 7.6 566.7 ││ 41.6 5.0 337.7 ││ 60.6 7.3 422.2 ││ 17.6 7.3 350.0 ││ 22.3 9.7 277.8 ││ 53.0 6.2 337.5 ││ 56.6 11.0 468.8 ││ 39.0 5.8 377.8 ││ 38.0 10.5 655.5 ││ 51.6 10.1 387.5 ││ 24.3 4.8 200.0 ││ 55.6 6.4 633.3 ││ 47.6 8.5 442.9 ││ 28.6 5.4 271.4 ││ 28.0 10.4 500.0 ││ 28.0 10.2 285.7 ││ 53.4 9.7 557.1 ││ 27.6 0.4 357.1 ││ 43.6 7.8 322.2 ││ 32.2 7.4 414.2 ││ 33.6 7.5 433.3 ││ 24.0 8.2 471.4 ││ 24.3 6.2 300.0 ││ 48.0 9.6 590.0 │└─────────────────┘

2.1.1 PROCEDIMIENTO EN SAS PARA EL ANALISIS DE REGRESION MULTIPLE

DATA SS; INFILE "D:\SAS\REGRE";INPUT ALTPLANT 1-4 NROTUBER 6-9 RENDIM 11-15;

69

Page 70: Diseños jaime mori

Análisis de regresión

OPTIONS NODATE NONUMBER PS=72 LS=55;PROC REG;MODEL RENDIM=ALTPLANT NROTUBER;PROC CORR;RUN;

2.2.2.1 SALIDA EN SAS PARA EL ANALISIS DE REGRESION MULTIPLE

Model: MODEL1Dependent Variable: RENDIM

Analysis of Variance

Sum of Mean Source DF Squares Square F Value Prob>F

Model 2 242030.20504 121015.10252 11.330 0.0002 Error 33 352469.50384 10680.89406 C Total 35 594499.70889

Root MSE 103.34841 R-square 0.4071 Dep Mean 424.85556 Adj R-sq 0.3712 C.V. 24.32554

Parameter Estimates

Parameter Standard T for H0: Variable DF Estimate Error Parameter=0 Prob > |T|

INTERCEP 1 104.366560 69.70142111 1.497 0.1438 ALTPLANT 1 4.078202 1.44691422 2.819 0.0081 NROTUBER 1 19.292845 6.67258022 2.891 0.0067

CORRELATION ANALYSIS

3 'VAR' Variables: ALTPLANT NROTUBER RENDIM

Simple Statistics

Variable N Mean Std Dev Sum ALTPLANT 36 40.85833 12.57845 1471 NROTUBER 36 7.97500 2.72757 287.10000 RENDIM 36 424.85556 130.32922 15295

Simple Statistics

Variable Minimum Maximum

ALTPLANT 17.60000 61.60000 NROTUBER 0.40000 15.00000 RENDIM 200.00000 800.00000

Pearson Correlation Coefficients / Prob > |R| under Ho: Rho=0 / N = 36

ALTPLANT NROTUBER RENDIM

ALTPLANT 1.00000 0.28054 0.50687 0.0 0.0975 0.0016

70

Page 71: Diseños jaime mori

Análisis de regresión

NROTUBER 0.28054 1.00000 0.51419 0.0975 0.0 0.0013

RENDIM 0.50687 0.51419 1.00000 0.0016 0.0013 0.0

2.2.2.2 SALIDA EN MINITAB PARA EL ANALISIS DE REGRESION MULTIPLERegression Analysis: RENDIM versus ALTPLANT, NROTUBER

The regression equation isRENDIM = 104 + 4.08 ALTPLANT + 19.3 NROTUBER

Predictor Coef SE Coef T PConstant 104.37 69.70 1.50 0.144ALTPLANT 4.078 1.447 2.82 0.008NROTUBER 19.293 6.673 2.89 0.007

S = 103.3 R-Sq = 40.7% R-Sq(adj) = 37.1%

Analysis of Variance

Source DF SS MS F PRegression 2 242030 121015 11.33 0.000Residual Error 33 352470 10681Total 35 594500

Source DF Seq SSALTPLANT 1 152738NROTUBER 1 89292

Unusual ObservationsObs ALTPLANT RENDIM Fit SE Fit Residual St Resid 30 27.6 357.1 224.6 51.7 132.5 1.48 X

X denotes an observation whose X value gives it large influence.

Correlations: ALTPLANT, NROTUBER, RENDIM

ALTPLANT NROTUBERNROTUBER 0.281 0.097

RENDIM 0.507 0.514 0.002 0.001

Cell Contents: Pearson correlation P-Value

2.3 CONCLUSION

Del cuadro de análisis de variancia se aprecia que efectivamente hay regresión a un =0.05, esto debido a que prob>F (0.0002) es menor a =0.05. Al realizar la prueba de

71

Page 72: Diseños jaime mori

Análisis de regresión

hipótesis sobre cada coeficiente de regresión parcial (ß1 y ß2) también se muestra que existe regresión (prob > |t| es 0.0081 y 0.0067, inferiores a =0.05), con lo cual se concluye que el modelo estimado que establece la relación funcional es:

Cuya interpretación de los coeficientes estimados es:

b0= 104.366 Cuando la altura de planta es cero y el número de tubérculos es cero; en promedio el rendimiento es 104.366. En este caso la interpretación del coeficiente de intersección carece de realismo, debido a que si no hay desarrollo vegetativo no hay rendimiento (rendimiento cero).

Esto se puede comprobar también cuando se realiza la hipótesis sobre el parámetro ß0, el cual resulta que a un =0.05 se acepta la hipótesis que ß0 es cero ya que prob > |T| resulta 0.1438 que es mayor a 0.05; lo cual indica que es preferible realizar una regresión a través del origen, el cual no incluye el coeficiente ß0.

b1= 4.078 Cuando la altura de la planta aumenta en 1 cm., en promedio el rendimiento aumenta en 4.078 grs/planta, manteniendo constante el número de tubérculos por planta.

b2= 19.292 Cuando el número de tubérculos por planta se incrementa en uno, en promedio el rendimiento se incrementa en 19.292 grs/planta, manteniendo constante la altura de la planta.

De la matríz de correlaciones simples, se establece que tanto el número de tubérculos como la altura de la planta están correlacionados de manera muy similar con el rendimiento (0.5068 y 0.5141 respectivamente).

Finalmente, el coeficiente de determinación de la regresión múltiple 0.3712 y 0.4071 (ajustado y no ajustado respectivamente) no es muy alto, por lo que sería conveniente tomar con mucha precaución las estimaciones o predicciones que se realicen con el modelo lineal múltiple, una alternativa a esto sería buscar un modelo no lineal múltiple, el cual podría mejorar la estimación.

72

Page 73: Diseños jaime mori

2.2 REGRESION INTRINSECAMENTE LINEAL La teoría de conceptos físicos, químicos o biológicos pueden sugerir que la relación entre variables sólo es posible representarla en forma no lineal. En ausencia de estas indicaciones teóricas, la simple inspección del diagrama de dispersión (ploteo) nos puede advertir de lo inapropiado del intento de ajustar a una relación lineal; en tales casos caben dos posibilidades: Intentar ajustar directamente a los datos una relación no lineal adecuada, o bien buscar una transformación inicial de los datos de tal manera que la relación entre los datos transformados aparezca como aproximadamente lineal y puedan aplicarse las técnicas propias de modelos lineales; esta ultima posibilidad es la que será materia de la presente exposición.

Procedimiento General para el ajuste a un modelo no lineal linealizable:

a. Plotear los datos X (Variable independiente) con Y (Variable dependiente).

b. Después del paso anterior, identificar a que tipo de curva podría ajustarse los datos; para esto se puede usar algunos modelos ya graficados como el que figura en el presente trabajo.

c. Identificada la curva, realizar las transformaciones a X e Y según sea el caso.

d. Realizar la estimación de parámetros y el cuadro Anva para el modelo linealizado.

e. Considerar que cualquier procedimiento de inferencia estadística se deberá realizar con el modelo linealizado, pudiendo finalmente concluir sobre el modelo original.

ALGUNOS MODELOS NO LINEALES LINEALIZABLES

MODELO I (MODELO EXPONENCIAL)

ln(Yi) = ln(b0) + Xi ln(b1) + ei (modelo muestral lineal)

MODELO II (MODELO DE POTENCIA)

ln(Yi) = ln(b0) + b1 ln(Xi) + ei (modelo muestral lineal)

MODELO III (MODELO INVERSA LOGARITMICA)

Page 74: Diseños jaime mori

* *ln(Yi) = b0 - b1 Xi + ei (modelo muestral lineal, Xi = 1/Xi)

MODELO IV (MODELO RECIPROCO)

* *Yi = b0 + b1 Xi + ei (modelo muestral lineal, Xi = 1/Xi)

MODELO V (MODELO INVERSA)

* * * *Yi = b0 - b1 Xi + ei (modelo lineal,Xi = 1/Xi, Yi= 1/Yi)

Page 75: Diseños jaime mori

ESTIMACION DE PARAMETROS

Se procede en forma similar al caso de regresión lineal múltiple, teniendo en consideración que se debe trabajar con los valores de las variables transformadas (logaritmos , inversa , etc.)Suponiendo que después de la transformación respectiva el modelo muestral se reduce a:

Page 76: Diseños jaime mori

Donde: Wi , Zi son los valores de Yi , Xi transformadas, además a0 , a1 las transformaciones de b0 , b1 respectivamente; entonces se puede establecer el siguiente procedimiento matricial para estimar los parámetros y elaborar el cuadro de ANVA, considerando un tamaño de muestra n. -1 ┌ ┐ ┌ ┐ ┌ ┐ │a0│ T -1 T │n Szi │ │Swi │a = │ │= (Z Z) (Z W) = │ 2 │ │ │ │a1│ │Szi Szi │ │Swizi │ └ ┘ └ ┘ └ ┘donde: ┌ ┐ ┌ ┐ │1 z1 │ │ w1 │ │1 z2 │ │ w2 │Z = │. │ W = │ . │ │. │ │ . │ │1 zn │ │ wn │ └ ┘ └ ┘

Con lo cual el modelo estimado para el modelo tranformado es:

CUADRO DE ANALISIS DE VARIANCIA ┌─────────────────────┬─────────┬────────────────┬─────────────┬───────┐│FUENTES DE VARIACION │GRADOS DE│ SUMA DE │ CUADRADO │ Fcal. ││ │LIBERTAD │ CUADRADO │ MEDIO │ │├─────────────────────┼─────────┼────────────────┼─────────────┼───────┤│ │ │ T T _2 │ │ ││DEBIDO A LA REGRESION│ 1 │SCR?a (Z W)-nW │CMR=SCR │CMR/CME││ │ │ │ │ ││ERROR │ n - 2 │SCE=SCT-SCR │CME=SCE/(n-2)│ │├─────────────────────┼─────────┼────────────────┼─────────────┴───────┘│ │ │ T _2 │ │TOTAL │ n - 1 │SCT=W W-nW │ └─────────────────────┴─────────┴────────────────┘

Hipótesis a probar:

Hp: No existe regresión Ha: Existe regresión

Nivel de significación :

Fcal=CMR/CME

ZONAS CRITICAS

Page 77: Diseños jaime mori

Si Fcal > F tabular (con 1 y (n-2) grados de libertad) se rechaza la hipótesis Hp.

COEFICIENTE DE DETERMINACION

r2= SCR / SCT (Indica en que porcentaje la variación de la variable dependiente es debida a efectos de la regresión con el modelo linealizado).El valor del coeficiente de determinación se encuentra entre cero y uno; cuanto más lejos este de cero mejor es el modelo que se usó para describir los datos.

EJEMPLOEn un estudio realizado para la obtención de suero de sangre de bovinos secado por

atomización se realizó el estudio del tiempo en minutos que demora en coagular el plasma (Y) con diferentes concentraciones de Cl2 Ca (X) dado en gramos, a una temperatura de 37°C.

X Y ───────────0.9 50.01.0 30.01.5 12.02.0 10.03.0 9.05.0 8.5

Page 78: Diseños jaime mori

2.2.1 PROCEDIMIENTO EN SAS PARA EL ANALISIS DE REGRESION NO LINEAL

INFILE "D:\SAS\REGR";INPUT X 1-3 Y 5-8;LOGY=LOG(Y); LOGX=LOG(X);INVY=1/Y; INVX=1/X;PROC PRINT;VAR X Y LOGY LOGX INVY INVX;PROC PLOT;PLOT Y*X;PROC REG;MODEL LOGY=X;MODEL LOGY=LOGX;MODEL INVY=INVX;

2.2.2.1 SALIDA EN SAS PARA EL ANALISIS DE REGRESION NO LINEAL OBS X Y LOGY LOGX INVY INVX

1 0.9 50.0 3.91202 -0.10536 0.02000 1.11111 2 1.0 30.0 3.40120 0.00000 0.03333 1.00000 3 1.5 12.0 2.48491 0.40547 0.08333 0.66667 4 2.0 10.0 2.30259 0.69315 0.10000 0.50000 5 3.0 9.0 2.19722 1.09861 0.11111 0.33333 6 5.0 8.5 2.14007 1.60944 0.11765 0.20000

Plot of Y*X. Legend: A = 1 obs, B = 2 obs, etc.60 + | | A |40 + | Y | A |20 + | | A A A A | 0 + --+-------------+-------------+-------------+-------------+-------------+-- 0 1 2 3 4 5 XModel: MODEL1Dependent Variable: LOGY Analysis of Variance Sum of Mean Source DF Squares Square F Value Prob>F

Model 1 1.42971 1.42971 4.426 0.1032 Error 4 1.29204 0.32301 C Total 5 2.72175

Root MSE 0.56834 R-square 0.5253 Dep Mean 2.73967 Adj R-sq 0.4066 C.V. 20.74486

Parameter Estimates

Page 79: Diseños jaime mori

Parameter Standard T for H0: Variable DF Estimate Error Parameter=0 Prob > |T|

INTERCEP 1 3.506299 0.43199356 8.117 0.0013 X 1 -0.343268 0.16316172 -2.104 0.1032

Model: MODEL2

Dependent Variable: LOGY Analysis of Variance

Sum of Mean Source DF Squares Square F Value Pr > F

Model 1 1.78667 1.78667 7.64 0.0506 Error 4 0.93507 0.23377 Corrected Total 5 2.72174

Root MSE 0.48350 R-Square 0.6564 Dependent Mean 2.73967 Adj R-Sq 0.5706 Coeff Var 17.64795

Parameter Estimates

Parameter Standard Variable DF Estimate Error t Value Pr > |t|

Intercept 1 3.37151 0.30199 11.16 0.0004 LOGX 1 -0.96907 0.35053 -2.76 0.0506

Model: MODEL3Dependent Variable: INVY Analysis of Variance

Sum of Mean Source DF Squares Square F Value Prob>F

Model 1 0.00829 0.00829 135.895 0.0003 Error 4 0.00024 0.00006 C Total 5 0.00854 Root MSE 0.00781 R-square 0.9714 Dep Mean 0.07757 Adj R-sq 0.9643 C.V. 10.07154

Parameter Estimates

Parameter Standard T for H0: Variable DF Estimate Error Parameter=0 Prob > |T| INTERCEP 1 0.148813 0.00689352 21.587 0.0001 INVX 1 -0.112159 0.00962127 -11.657 0.0003

2.2.2.2 SALIDA EN MINITAB PARA EL ANALISIS DE REGRESION NO LINEAL

Page 80: Diseños jaime mori

Regression Analysis: LOGY versus X

The regression equation isLOGY = 3.51 - 0.343 X

Predictor Coef SE Coef T PConstant 3.5063 0.4320 8.12 0.001X -0.3433 0.1632 -2.10 0.103

S = 0.5683 R-Sq = 52.5% R-Sq(adj) = 40.7%

Analysis of Variance

Source DF SS MS F PRegression 1 1.4297 1.4297 4.43 0.103Residual Error 4 1.2920 0.3230Total 5 2.7217

Regression Analysis: LOGY versus LOGX

The regression equation isLOGY = 3.37 - 0.969 LOGX

Predictor Coef SE Coef T PConstant 3.3715 0.3020 11.16 0.000LOGX -0.9691 0.3505 -2.76 0.051

S = 0.4835 R-Sq = 65.6% R-Sq(adj) = 57.1%

Analysis of Variance

Source DF SS MS F PRegression 1 1.7867 1.7867 7.64 0.051Residual Error 4 0.9351 0.2338Total 5 2.7217

Regression Analysis: INVY versus INVX

The regression equation isINVY = 0.149 - 0.112 INVX

Predictor Coef SE Coef T PConstant 0.148814 0.006892 21.59 0.000INVX -0.112162 0.009620 -11.66 0.000

S = 0.007811 R-Sq = 97.1% R-Sq(adj) = 96.4%

Analysis of Variance

Source DF SS MS F PRegression 1 0.0082950 0.0082950 135.95 0.000Residual Error 4 0.0002441 0.0000610Total 5 0.0085391

Page 81: Diseños jaime mori

2.2.3 CONCLUSION

Del análisis gráfico, se aprecia que la tendencia de los datos es no lineal y que hay dos posibles modelos que mejor se pueden ajustar (modelo potencia y modelo inversa); para ello se realiza el análisis de regresión con los dos modelos y se observa que el modelo inversa es el que mejor se ajusta debido al mayor r2 (0.9714); por lo tanto el modelo estimado linealizado que se debe usar para fines de inferencia estadística es:

^* *Y = 0.148813 - 0.112159 X

Siendo el modelo estimado original:

El cual puede ser usado para fines de predicción.

Por otra parte; del cuadro ANVA para el modelo inversa, se puede concluir que efectivamente existe regresión a un nivel de significación =0.05; debido a que el valor Prob>F es menor a 0.05.

Page 82: Diseños jaime mori

INTRODUCCION AL PROCESAMIENTOESTADISTICO CON SAS

INSTRUCCIONES PARA CODIFICAR Y EJECUTAR UN ARCHIVO DE PROCEDIMIENTOS SAS

El SAS es un software integrado de múltiples aplicaciones en estadística; este software permite realizar diversos tipos de análisis estadísticos, desde los análisis mas sencillos (estadística descriptiva) hasta los análisis con técnicas más sofisticadas.

Para el uso de este software es preferible contar con un software editor de textos en ASCII (por ejemplo: el KEDIT ó el EDIT del DOS o el Wordpad en Windows). En los siguientes pasos para ejecutar un archivo de procedimiento SAS se supondrá el uso del KEDIT como editor de textos y el SAS en version DOS.

Secuencia para realizar un análisis estadístico con SAS:

1. Crear un archivo de datos (de preferencia con la extensión DAT ), con la información de los resultados experimentales; ejemplo:

Considere el experimento en Bloques completos al azar con cuatro tratamientos y 3 bloques:

trat.1 trat.2 trat.3 Trat.4Testigo

bloque 1 4.3 6.3 3.1 4.6

bloque 2 4.7 5.0 7.3

bloque 3 5.2 5.7 4.56.5

- Invocar al programa Kedit

- Luego aparece:New file... |...+....1....+....2....+....3....+....4....+....5....+....6....+....7.]00000 * * * Top of file * * *00001 * * * End of file * * *

Al presionar Enter, aparecerá la flecha ====>, después del cual se digita el comando ADD 12, con el cual se añadirán 12 líneas al archivo (es el número total de datos); a continuación digitar en columna los datos, así de la columna 1 a la 3 figuran los tratamientos (codificados), en la columna 5 los bloques (codificados), de la columna 7 a la 9 los datos.

====>

-82-

Page 83: Diseños jaime mori

|...+....1....+....2....+....3....+....4....+....5....+....6....+....7.]00000 * * * Top of file * * *00001 t1 1 4.300002 t2 1 6.300003 t3 1 3.100004 *t4 1 4.600005 t1 2 4.7 00006 t2 2 5.000007 t3 2 . ──────────> Unidad experimental perdida00008 *t4 2 7.300009 t1 3 5.200010 t2 3 5.700011 t3 3 6.500012 *t4 3 4.200013 * * * End of file * * *

Nota: En el archivo de datos solamente se deben poner los valores resultado de la evaluación, considerando cada columna como una variable; es recomendable que los niveles de los factores de naturaleza alfanumérica (ej. tratamientos) tengan a lo más 8 caracteres.

Cuando se realiza análisis estadístico en el cual se tiene unidades experimentales perdidas, se debe colocar un punto (.) al final de la columna en la variable respuesta; es preferible en estos casos realizar el ANVA para diseños experimentales, usando el procedimiento GLM; asimismo para realizar la comparación de medias por DUNNETT, se debe identificar al tratamiento testigo anteponiendo un asterisco (*) al nombre del tratamiento testigo.

- Grabar el archivo con el comando FILE, asi:

====> file

2. Crear un archivo de procedimientos SAS ( de preferencia con la extensión SAS), haciendo uso del mismo editor que se uso para la creación de un archivo de datos.

FORMATO GENERAL DE PROCEDIMIENTO SAS PARA UN DISEÑO EXPERIMENTAL:

====> |...+....1....+....2....+....3....+....4....+....5....+....6....+....7.]00000 * * * Top of file * * *00001 DATA SS;00002 INFILE "NOMBRE DEL ARCHIVO DE DATOS"00003 INPUT (SE INDICA LAS VARIABLES Y LOS CAMPOS);00004 PROC (SE INDICA EL PROCEDIMIENTO);00005 CLASS (SE INDICAN LOS FACTORES QUE INTERVIENEN);00006 MODEL = (SE INDICA EL MODELO ESTADISTICO);00007 MEANS (SE INDICA EL NOMBRE DEL TRATAMIENTO)/ OPCIONES;00008 RUN;00009 * * * End of file * * *

-83-

Page 84: Diseños jaime mori

Ejm:

|...+....1....+....2....+....3....+....4....+....5....+....6....+....7.]00000 * * * Top of file * * *00001 DATA SS;00002 INFILE "C:\SAS\ANOVA.DAT";00003 INPUT TRAT$ 1-3 BLOQ 5-5 REND 7-9;00004 PROC ANOVA;00005 CLASS TRAT BLOQ;00006 MODEL REND= BLOQ TRAT;00007 MEANS TRAT/DUNNETT;00008 RUN;00009 * * * End of file * * *

Sólo a las variables alfanuméricas se le asigna la terminación del símbolo dólar $ en el INPUT (ej. la variable trat$); a las variables numéricas se les indica por un nombre de variable sin terminación alguna. Es recomendable que los nombres de las variables tengan a lo más 8 caracteres.

3. Ejecutar el procedimiento SAS

3.1 Hacer clic al ícono

Después del cual aparecerá la siguiente ventana:

3.2 Una vez ingresado al SAS, tipear entre comillas en la ventana EDITOR: INCLUDE "ANOVA.SAS" si el archivo de procedimiento SAS es ANOVA.SAS, caso contrario dar como nombre el usado como procedimiento SAS; se debe tener en cuenta para este paso el directorio donde el archivo en mención se encuentra. El SAS tiene tres ventanas:

-84-

Page 85: Diseños jaime mori

EDITOR: Es la ventana en el cual se puede incorporar archivos de procedimientos, de datos, etc.

LOG: En esta ventana se puede apreciar el status de la ejecución del procedimiento SAS.

OUTPUT: En esta ventana se aprecia el resultado (salida) de la ejecución del procedimiento SAS.

3.3 Ejecutar el procedimiento SAS: Presionar la tecla de función F10 o su equivalente. Cuando termina de ejecutar el procedimiento SAS y si no hay errores de ejecución se graba la salida con el comando FILE. Ejemplo: File "anova.out" (la extensión OUT pude agregarse para indicar que es archivo de salida"

3.4 Salir del SAS digitando BYE y presionando ENTER.

ALGUNOS PROCEDIMIENTOS EN SAS

PROC ANOVA Realiza análisis de variancia para datos balanceados en una variedad de diseños experimentales.

PROC ANOVA ; CLASS variables; MODEL dependientes=efectos ; MEANS efectos / DUNCAN T|LSD TUKEY DUNNETT; E=efecto a considerar como error ; TEST H=efectos a probar E=efecto que se considera como error;----------------------------------------------------------------------------PROC REG Realiza el ajuste de la regresión por mínimos cuadrados.

PROC REG ; CORR ; MODEL dependientes=independientes;---------------------------------------------------------------------------

PROC GLM usa el método de mínimos cuadrados para ajustar a un modelo lineal general, este procedimiento es conveniente cuando se tiene datos no balanceados. Puede ser usado en análisis de variancia y regresión

PROC GLM ; CLASS variables; MODEL dependientes=independientes CONTRAST 'label' {valores de efectos...}/ E E=efecto ETYPE=n SINGULAR=n; ESTIMATE 'label' {valores de efectos...}/ E DIVISOR=n SINGULAR=n; LSMEANS efectos / COV E E=efecto ETYPE=n NOPRINT OUT=SASdataset PDIFF SINGULAR=n STDERR TDIFF; MEANS efectos / DUNCAN T|LSD TUKEY DUNNETT E=efecto a considerar como error; TEST H=efecto E=efecto / HTYPE=n ETYPE=n;

-85-

Page 86: Diseños jaime mori

------------------------------------------------------------------------------PROC PLOT es usado para establecer un diagrama de dispersión de los datos

PROC PLOT ;PLOT vertical*horizontal / opciones;BY variables;NOMISS excluye las observaciones perdidas;-------------------------------------------------------------------------------

FUNCIONES Y OPERACIONES DEL SAS

Símbolo Descripción del operador

+ Suma- Resta* Multiplicación/ DivisiónABS(argumento) retorna el valor absoluto .SQRT(argumento) calcula la raíz cuadrada.LOG(argumento) calcula el logaritmo natural.LOG2(argumento) calcula el logaritmo en base 2.LOG10(argumento) calcula el logaritmo en base 10.ARCOS(argumento) calcula el arco coseno.ARSIN(argumento) calcula el arco seno.ATAN(argumento) calcula el arco tangente.COS(argumento) calcula el coseno de un ángulo.SIN(argumento) calcula el seno de un ángulo.TAN(argumento) calcula la tangente de un ángulo.

-86-

Page 87: Diseños jaime mori

Bibliografía consultada

1. Aliaga Rodríguez L. (1979).- Producción de Cuyes, editorial de la Universidad nacional del centro del Perú, huancayo.

2. Barry Arnold. 1979.- Curso de Estadística Experimental Avanzado (Tomos I, II), Centro Internacional de la Papa - Lima Perú.

3. Benavides Pantigozo J. (1989).- Introducción a la Investigación Operativa (Manuscrito inédito), Estación Experimental de Yurimaguas-Perú.

4. Calzada Benza J. 1972.- Métodos estadísticos para la investigación, Universidad Nacional Agraria La Molina-Perú.

5. Castañeda P.R. 1980.- Diseño de experimentos aplicados, Editorial Trillas, Mexico.

6. Caramete C; Tomescu, 1970.- Metode Statistice in Nutritia Planteloa si Aplicarea Ingrasaminte loa . Academia de Stiinte Agricole Si Silvice, Bucuresti-Romania.

7. Dimancha S.; Berca M. 1975.- Elementos de Técnicas Experimental Agrícola, Bucuresti-Romania.

8. Hartley, H, O. (1950).- The Maximun F-ratio as Short-cut Test for Heterogenety of Variance. Biometrika 37:308-312

9. Martínez G. A. (1983).- Introdución al SAS, Colegio de Postgraduados, Centro de Estadística y cálculo Chapingo México.

10. Soto Rodríguez I. (1991).- Análisis de Covariancia en el Diseño Bloques Completos al Azar, con unidades experimentales perdidas. Anales científicos, Editorial de la Universidad Nacional Agraria La Molina, Perú.

11. Sevilla P. y Autores Varios (1985).- Estadística Aplicada a la Extensión Agrícola, Universidad Nacional Agraria la Molina. Departamento Académico de Estadística e Informática, Perú.

12. Vasquez Arce V. (1990).- Experimentación Agrícola, Amaru Editores, Lima, Perú.

INDICE

Page 88: Diseños jaime mori

I. Diseños Experimentales

1.1 Aspectos generales 1

1.2 Experimento en el diseño completamente al azar 12

1.3 Experimento en el diseño bloques completos al azar 17

1.4 Experimento factorial en bloques completos al azar 25

1.5 Experimento en parcelas divididas 311.6 Diseño cuadrado latino 40

II. Introducción al procesamiento estadístico con SAS 45