Post on 28-Sep-2018
Notas de Matemticas III
Principios de Diseos Experimentales Incluye manejo bsico de R, Sas, Minitab y Excel Jos Lpez Medina Facultad de Agrobiloga, UMSNH
Carlos Alberto Ramrez Mandujano Facultad de Biologa, UMSNH
Diciembre de 2012
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
2
CONTENIDO
Principios de experimentacin 3
Anlisis de varianza (anova, andeva, anva) 7
Principios de Sas (statistic analysis system) para msdos 13
Diseo completamente al azar (un factor, one way) 23
Diseo bloques completos al azar (dos factores, two way) 43
Anlisis de varianza de una y dos vas (factores) con R 49
Pruebas de comparaciones mltiples de medias 54
Transformacin de datos 62
Pruebas no paramtricas 64
Diseo cuadrado latino 67
Contrastes ortogonales 82
Experimentos factoriales 87
Diseo parcelas divididas 105
Diseo jerrquico o anidado 117
Regresin y correlacin lineal simple y doble 126
Bibliografa bsica 155
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
3
PRINCIPIOS DE EXPERIMENTACIN
Un experimento es un trabajo cientficamente planeado para investigar una o ms
poblaciones en condiciones controladas.
Conceptos bsicos
Factor de un experimento es una variable independiente nominal o categrica cuyos
niveles son configurados por el experimentador para probar una respuesta a travs de
ellos. Un experimento puede tener ms de un factor en estudio. Es comn que a los
niveles de un factor se les llame Tratamiento o Grupo. Estos suelen ser las nuevas
tecnologas a evaluar, lo que propone como novedoso el investigador. Algunos ejemplos
de tratamientos son: Variedades a ensayar, concentraciones de un fungicida, dosis de un
fertilizante, riego artificial o carencia del mismo, localidades, estaciones de ao, etc.
Tratamientos testigos (control) son tratamientos de referencia que sirven para comparar
los tratamientos propios del experimento y que pueden ser de dos tipos: Absoluto y
Relativo. A veces un experimento lleva ambos testigos. El tratamiento absoluto puede ser
no aplicar tratamiento alguno; el tratamiento relativo puede ser la tecnologa tradicional,
una situacin normal, lo que se hace de manera corriente, etc., que permite valorar el
comportamiento relativo de los tratamientos que se estn poniendo a prueba.
Bloque en principio es un segundo factor; es un conjunto de unidades experimentales ms
o menos homogneas, en donde se alojan todos los tratamientos del experimento. En
experimentacin agrcola en campo a menudo los bloques son divisiones del terreno
experimental; el objetivo de los bloques es disminuir la variabilidad del material
experimental.
Repeticin es el nmero de veces que se instala cada tratamiento o nivel de un factor, o la
combinacin de dos o mas de ellos. Con frecuencia este trmino se usa como equivalente
a los bloques de un experimento establecido en campo. Para tener confiabilidad en los
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
4
resultados de un experimento, el nmero mnimo de repeticiones no debera ser menor a
cuatro.
Unidad Experimental es la unidad bsica empleada para experimentar. Cada unidad
experimental comprende uno de los niveles de un factor o combinacin de niveles de dos
o mas factores a evaluar. Con frecuencia a una unidad experimental se le denomina
parcela. Puede ser una persona, una comunidad, una planta, etc. Es la unidad donde se
hace la toma de datos. El tamao y nmero de elementos vara segn los objetivos de la
investigacin.
Tamao de un experimento es el nmero de unidades experimentales del experimento.
Diseo del experimento es el arreglo espacial y en el tiempo de los tratamientos. Cuando
ms complicado es el diseo, ms grados de libertad pierde modelo, pero se controla
mejor el error experimental si se conocen las direcciones de los gradiente de las causas de
perturbacin. En este sentido hay un equilibrio dinmico, un diseo ms complejo y que
no tiene un mejor el control del error puede ser ms ineficiente que un diseo simple. El
investigador debe determinar cul es el mejor diseo para su experimento y este
depender de la irregularidad del rea experimental, del nmero de tratamientos y de la
orientacin espacial de las causas que perturban el experimento. El diseo ms simple de
todos es el Diseo Completamente al Azar, DCA, sin embargo el diseo ms utilizado en la
agricultura en el de Bloques completos al azar, BCA.
Planeacin de experimentos. El mtodo cientfico sugiere que en la planeacin de
experimentos se tomen en cuenta las siguientes etapas: a) Definir el problema; Una vez
que hayamos comprendido el problema, debemos ser capaces de formular preguntas que,
una vez contestadas, conduzcan a la solucin del mismo. En esta etapa se debe
determinar los antecedentes, importancia, objetivos, hiptesis a probar y revisin de la
bibliografa. b) Diseo del experimento; Se debe tener en cuenta: Lugar de ejecucin del
experimento, tamao de la parcela o unidad experimental, nmero de repeticiones por
tratamiento, las variables a medir, los equipos e instrumentos a utilizar y los mtodos de
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
5
evaluacin de los resultados. c) Ejecucin del experimento. d) Recoleccin de datos del
experimento. e) Ordenamiento de la informacin experimental. f) Anlisis de la
informacin y discusin de los resultados obtenidos. g) En lo posible, realizar anlisis
econmico de los tratamientos que se probaron e identificar la utilidad prctica. h)
Conclusin final y recomendacin.
Supuestos del modelo estadstico
Los supuestos en que se fundamenta el modelo estadstico son:
a) Aditividad: La variable respuesta es la suma de los efectos del modelo estadstico.
b) Linealidad: La relacin existente entre los factores o componentes del modelo
estadstico es lineal (no curvilnea), es decir, se ajusta a una recta.
c) Normalidad: Los valores resultantes del experimento tienen una buena
aproximacin a la distribucin Normal.
d) Independencia: Los resultados observados de un experimento son independientes
entre s.
e) Homocedasticidad (varianza homognea): Las poblaciones generadas por la
aplicacin de dos o ms tratamientos tienen varianzas mas o menos de igual
magnitud.
Tipos de modelos estadsticos
De acuerdo a la seleccin de los tratamientos y otros factores, se tiene la siguiente
clasificacin:
Modelos de Efectos Fijos: Es cuando los tratamientos y dems factores que intervienen en
un experimento constituyen el todo y no una muestra de una poblacin; si se repite el
experimento los tratamientos son los mismos. En estos casos las conclusiones del anlisis
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
6
de varianza solamente son vlidas para los tratamientos y otros factores usados en el
experimento.
Modelos de Efectos aleatorios: Los tratamientos y dems factores que intervienen en un
experimento son una muestra aleatoria de una poblacin; si el experimento se repite los
elementos que conforman los tratamientos son diferentes. Las conclusiones del anlisis de
varianza son vlidos tanto para los tratamientos y dems factores que se incluyeron en el
experimento, como para la poblacin de donde fueros tomados.
Modelos Mixtos: Es la combinacin de los dos anteriores y se presenta cuando algunos
factores son fijos y otros son elegidos al azar. Las conclusiones del anlisis de varianza
sern vlidas para toda la poblacin de factores cuando stos son elegidos al azar, y
solamente para los factores usados cuando estos son fijos.
Nos referiremos en el presente texto a modelos fijos, pero debemos estar conscientes de
que en la experimentacin en campo a menudo tendremos que trabajar con factores
aleatorios. Por ejemplo, si establecemos una prueba en tres localidades representativas
de una regin, el factor localidad es aleatorio. Si probamos dos frmulas de medio de
cultivo para un hongo las frmulas son niveles de un factor fijo, pero la poblacin del
hongo que est siendo representada es un factor aleatorio. Los modelos mixtos los
abordaremos en una futura versin.
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
7
ANLISIS DE VARIANZA (Anova, Andeva, Anva)
El ANOVA sirve como base para probar nuestra hiptesis. Consiste en separar de la
variacin total observada, las diferentes causas o fuentes de variacin que influyen en los
resultados de un experimento en particular y que afectan en distinto grado el efecto de
los tratamientos en estudio.
Tiene como objetivo identificar la importancia relativa de los diferentes factores o
tratamientos en estudio y determinar cmo stos interactan entre s.
Variacin planeada
Si comparamos diferentes mtodos de control de maleza, diferentes frmulas de
fertilizacin, diferentes marcas de un agroqumico, diferentes niveles de una hormona,
etc. estamos introduciendo variacin intencionalmente. A esto llamamos tratamientos o
niveles de un factor en un experimento. Los dos trminos son equivalentes.
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
8
Variacin no planeada
Adems de los tratamientos o factores que ponemos a prueba, hay causas diversas que no
introducimos pero que estn all y provocan variacin que modifica el resultado final del
efecto de los tratamientos. Si el efecto es grande, los resultados se alteran tanto que nos
pueden llevar a cometer un error al comparar el efecto de los diferentes tratamientos.
Esto afecta la validez de las observaciones.
La variacin entre los tratamientos evaluados nos estima la variacin planeada. La
variacin dentro de los tratamientos nos estima la variacin no planeada o varianza del
error experimental. Pada dar por vlidas las observaciones la varianza planeada debe ser
mucho mayor que la varianza no planeada y la proporcin mnima requerida est dada
por la prueba de F, que se aplica a la cantidad de veces que la variacin planeada es mayor
que la no planeada (razn de varianzas).
Clasificacin anidada y cruzada
Cuando cada nivel de un factor se aplica a todos los niveles de un segundo factor estamos
hablando de clasificacin cruzada. Por ejemplo, si en cuatro medios de cultivo se prueban
tres cepas de un hongo y en cada uno de los cuatro medios estn las tres cepas. Todos los
medios de cultivo tienen a todas las cepas.
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
9
Por el contrario, cuando cada nivel de un primer factor se aplica a diferentes niveles de un
segundo factor estamos hablando de un caso de clasificacin anidada. Por ejemplo, si se
evalan cruzamientos de 10 toros, cada uno con cuatro vacas, pero ninguna vaca cruzada
con el toro 1 se cruz con otro toro. Cada toro tuvo sus cuatro vacas y cada vaca tuvo un
solo toro.
Esto afecta el procedimiento del anlisis de varianza y para ejemplificar se muestran los
cuadros de anlisis de varianza que corresponden a los dos diseos bsicos.
Clasificacin anidada, un solo factor, diseo completamente al azar. Las repeticiones estn
anidadas en los tratamientos y no son un factor de variacin planeada. La variacin total
tiene solo dos componentes: Planeada (tratamientos o factor) y no planeada o error.
Fuentes de Variacin Grados
de
libertad
Sumas de Cuadrados Cuadrados
Medios
F calculada
Tratamientos t 1 SCtrat SCtrat/t-1 CMtrat/CMe
Error (rep/trat) (r-1)t Por diferencia SCe/t(r-1)
Total tr 1 SCTotal
Clasificacin cruzada, dos factores, diseo bloques completos al azar. Todos los
tratamientos estn en todos los bloques y ambos son factores de variacin planeada. La
variacin total tiene tres componentes: Tratamientos o factor 1, bloques o factor 2, y
variacin no planeada o error.
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
10
Fuentes de
Variacin
Grados de
Libertad
Sumas de Cuadrados Cuadrados Medios F calculada
Tratamientos t 1 SCt SCt/t-1 CMt/CMe
Bloques b 1 SCb SCb/b-1 CMb/CMe
Error (trat*bl) (t-1)(b-1) SCT (SCt + SCb) SCe/(t-1)(b-1)
Total tb 1 SCT
Operaciones en el anlisis de varianza
La variacin total se desglosa en componentes y esto implica llevar a cabo operaciones
que incluyen sumatorias de datos, sumatorias de cuadrados de datos individuales y
sumatorias de cuadrados de totales, y divisiones.
Previamente se construye un cuadro de concentracin de datos, como vemos a
continuacin para el caso de clasificacin cruzada con tres tratamientos y tres bloques
(tres niveles para ambos factores).
Tratamientos
1 2 3 Total
Bloques
1 X11 X21 X31 X.1
2 X12 X22 X32 X.2
3 X13 X23 X33 X.3
Total X1. X2. X3. X..
Donde
X1. significa que se sumaron todas las observaciones para el tratamiento 1.
X.1 significa que se sumaron todas las observaciones para el bloque 1.
X.. es el gran total.
Veamos ahora las frmulas para el anlisis de varianza de dos factores.
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
11
F.V. G.L. S.C. C.M. Fc
Tratamientos t - 1 (Xi.2/b) (X..2/tb) SCt/t-1 CMt/CMe
Bloques b 1 (X.j2/b) (X..2/tb) SCb/b-1 CMb/CMe
Error (Trat*Bloq) (t-1)(b-1) SCTot (SCt + SCb) SCe/(t-1)(b-1)
Total tb 1 Xij2 (X..2/tb)
Donde
Xi.2 es la sumatoria de los cuadrados de los totales de cada tratamiento.
X.j2 es la sumatoria de los cuadrados de los totales de cada bloque.
Xij2 es la sumatoria de los cuadrados de cada uno de los datos.
X..2/tb es llamado factor o trmino de correccin, gran total al cuadrado entre nmero de
unidades experimentales.
t es el nmero de tratamientos o niveles del factor tratamientos.
b es el nmero de bloques o niveles del factor bloques.
La suma de cuadrados incluye a los totales de todos los niveles de un factor (tratamientos
o bloques) y se divide entre el nmero de elementos que se sumaron para calcular dicho
total. A la suma de cuadrados de una interaccin se le restan las sumas de cuadrados de
los factores que estn interactuando, en este caso el error es la interaccin de
tratamientos y bloques. Para interacciones en clasificacin anidada, solo se resta la suma
de cuadrados del factor que anida. A todas se les resta el factor de correccin.
Los componentes de la tabla son:
Fuentes de Variacin u origen de las variaciones, es decir las causas tanto planeadas como
no planeadas que provocan diferencias dentro del experimento.
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
12
Grados de libertad, que son el nmero de elementos menos uno.
Sumas de cuadrados, que son parte del procedimiento de clculo de varianzas.
Cuadrados medios o varianzas para cada fuente de variacin.
Fc o valor de F calculada, magnitud relativa de la varianza.
Los cuadrados medios se obtienen al dividir la suma de cuadrados entre sus
correspondientes grados de libertad. Fc es la divisin del cuadrado medio de un factor
(tratamientos o bloques) entre el cuadrado medio del error. El valor de Fc se compara con
un valor de tabla para decidir si las diferencias observadas entre los tratamientos pueden
ser validadas. Puede ser complementada o sustituida con el valor de P, que nos indica el
riesgo de error si rechazamos la hiptesis de igualdad de tratamientos. El mximo valor de
P aceptado es de 0.05.
Las operaciones pueden ser hechas paso a paso con calculadora o en hoja de clculo,
aunque todo el procedimiento puede realizarse con ayuda de uno de los mltiples
programas de cmputo disponibles. En este texto se incluyen Excel, Minitab, Sas y R.
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
13
PRINCIPIOS DE SAS (STATISTIC ANALYSIS SYSTEM) PARA MSDOS
El paquete estadstico SAS es uno de los mas utilizados en la investigacin. A continuacin
se muestra el manejo de una forma primitiva del mismo. Posteriormente hablaremos de
R, Excel y Minitab, que tambin son utilizados como herramientas de anlisis.
Nota importante: La programacin es la misma en la versin 9 para Windows.
Lo primero
Sas para MSDOS viene en una carpeta llamada SAS que se copia al disco duro en el
directorio raz C o a una memoria USB.
No debe estar dentro de otra carpeta.
No necesita instalarse.
Se abre la carpeta SAS y se da doble click en el archivo SAS.
Programa abierto
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
14
Cuando se quiere cerrar se escribe bye en la lnea de comando y se presiona Enter
Ventanas de SAS
Program editor: captura
Output: resultado
Log: bitcora del programa que se acaba de correr
Teclas bsicas
F5 es para cambiar de ventana.
F7 es la lupa o zoom para ampliar una ventana o regresar a la vista de las tres ventanas.
F10 corre el programa desde la ventana del editor.
F9 en la ventana del editor reaparece los datos de un programa que ya corri.
Programacin
Pueden capturarse los datos en Excel y all mismo elaborar todo el programa.
Cada dato recabado para una o mas variables evaluadas lleva en la fila en que se registra,
a todo el historial de l mismo: Tratamiento, repeticin, planta, etc., a que pertenece.
Luego se copia todo al block de notas y se guarda, o se guarda como texto separado por
tabulaciones. El nombre del archivo no puede exceder los 8 caracteres, que pueden ser
letras o nmeros y no puede tener espacios. Tendr la extensin .txt.
Se guarda en la carpeta SAS o en una memoria fuera de cualquier carpeta.
Pasos para anlisis de datos
Organizar los datos.
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
15
Primero se anota un comando DATA.
Existen comandos PROC para analizar los datos.
Sintaxis
Los enunciados siempre terminan con punto y coma ;
Luego el programa espera otro enunciado.
Cuando el programa no entiende algo marca un error.
Espaciamiento
Se puede colocar mas de un enunciado en una lnea o cada enunciado en diferente lnea.
Se usan MAYSCULAS o minsculas.
Ejemplo: tres enunciados en una sola lnea.
data new; input x; cards;
O bien: cada enunciado en una lnea diferente
data new;
input x;
Cards;
Reglas bsicas de escritura
Los nombres de las bases de datos y de las variables deben iniciar con letra, luego se
pueden incluir nmeros.
El nombre no debe ser mayor de 8 caracteres.
El nombre no puede llevar espacios intermedios.
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
16
Ejemplo
options nodate pagesize=70 linesize= 70; data grasac; input sexo $ pctgr; cards; m 13.3 f 22 f 23.2 m 20 F . m 16 ; proc print data= grasac; title 'datos de grasa corporal'; run; proc sort data=grasac; by sexo; run; proc means data=grasac ; by sexo; var pctgr; title 'promedio de grasa corporal' ; run;
Que significa cada lnea?
Options: algunas opciones.
Nodate nonumber: no anotar fecha ni nmeros de pgina.
Pagesize = 50: 50 lneas (renglones) por hoja.
Linesize = 70: 70 espacios por lnea.
Data: se crear una base de datos.
Data grasac: la base de datos se llamar grasac
Input: nombres y tipo de variables y orden en que aparecern en columnas.
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
17
Input sexo $ pctgr; La variable sexo ocupar la primera columna y la variable pctgr
ocupar la segunda columna.
La variable sexo es categrica o alfanumrica. Despus de escribirla se anota el signo $.
la variable pctgr es numrica.
Datos perdidos se anotan como punto.
Cards; indica que en seguida se anotan las lneas de datos.
Al final de la captura se anota una lnea con solo punto y coma ;
Proc print data = grasac; le indica imprimir los datos de la base llamada grasac en la
primera hoja de resultados
Title datos de grasa corporal; es el ttulo
Run; le indica ejecutar los comandos escritos
proc sort data=grasac; by sexo; reordena los datos de dicha base por categora de sexo
para que luego se haga el anlisis
proc means data=grasac ; by sexo; var pctgr;
Se pide que obtenga las medias de la variable pctgr por categora de sexo para la base de
datos creada
Programa para anlisis de varianza de dos factores (diseo bloques al azar)
Options nodate nonumber; Se pide que no ponga la fecha ni nmero de pgina.
Data pino; La base de datos se llamar pino.
Input bloque origen alt; Tres columnas: bloque, origen, altura.
Cards;
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
18
AQU SIGUEN LAS LNEAS DE DATOS
;
PROC ANOVA; Se har anlisis de varianza.
CLASS bloque origen; Son las fuentes de variacin planeada.
Model alt = bloque origen; Alt (altura) es la variable respuesta.
Todo lo que no se incluye en el modelo ser parte del error.
Means origen / Tukey lines; Prueba de Tukey (comparacin de medias)
Run; Corre el programa.
Para anlisis de varianza de un factor (diseo completamente al azar)
Lo nico que cambia respecto al diseo bloques al azar es que el modelo no incluye
bloques.
Model alt = origen; Altura (alt) es la variable respuesta.
Fuente de variacin planeada es solamente origen.
Lo que no incluye el modelo ser el error.
Todo lo dems es igual al diseo bloques al azar.
Anlisis de regresin
Options nodate; Se pide que no ponga la fecha.
Data pino; La base de datos se llamar pino.
Input bloque origen alt db d130; Cinco columnas: bloque, origen, altura dimetro basal
y dimetro a 1.30.
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
19
Cards;
AQU SIGUEN LAS LNEAS DE DATOS
;
PROC Reg; Se har anlisis de regresin.
Model alt = db d130; Altura es la variable dependiente.
db y d130 son las variables independientes.
Run; Corre el programa.
Captura de datos y programa
Recordando. Se captura en Excel. Se copia todo y se pega en el block de notas.
Se guarda con un nombre de no mas de 8 caracteres y sin espacios.
En el block de notas los archivos tienen la extensin .txt. Se guarda fuera de cualquier
carpeta en la memoria USB o en el disco duro C.
Para abrir el archivo en SAS
Se abre en la ventana del PROGRAM EDITOR. Si el cursor estuviera fuera de la lnea de
comando se presiona la tecla Inicio (Home).
Utilizar el comando include seguido de la ruta de acceso. Luego dar Enter.
INCLUDE E:examen.txt. Significa que en la computadora la memoria aparece como E y
que el archivo se llama examen. Es necesario anotar la extensin .txt.
Notas importantes
Es comn que el teclado cambie su configuracin y que no coincidan las teclas con los
smbolos. En este caso habr que buscar donde aparece cada uno.
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
20
Si el archivo que se abrir est guardado en la carpeta SAS la instruccin ser
Include examen.txt. Si est en una memoria USB registrada por la PC como E.
Si est guardado en el disco duro
Include c:examen.txt. En seguida presionamos la tecla Enter.
Guardando
Despus de correr el programa presionando la tecla F10, aparece el resultado en la
ventana OUTPUT. Vamos all con la tecla F5.
Para guardar el resultado se usa el comando file.
file ruta:nombre.ext y se presiona Enter.
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
21
Se puede utilizar la extensin txt para crear archivo de texto para block de notas o rtf o
doc para archivo perfectamente compatible con Word.
Ejemplo file e:examenr.txt
Queda guardado en la memoria e.
File pinus.txt lo guarda en la carpeta SAS.
Figuras antes y despus de presionar la tecla Enter
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
22
La instruccin es que guarde los resultados en la carpeta SAS en un archivo llamado
examenr con la extensin txt, que es archivo de texto y se abre con el block de notas.
Para borrar cada ventana se usa el comando clear y se presiona Enter. Luego se puede
abrir otro archivo.
Si tenemos la versin de SAS para Windows
En este caso copiamos todo el programa desde Excel y lo pegamos en la ventana del
editor. Para correr el programa damos click en el dibujo del monito, donde en la figura
aparece en un cuadrito blanco la palabra submit.
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
23
DISEO COMPLETAMENTE AL AZAR (UN FACTOR, ONE WAY)
El Diseo Completamente al Azar o de un solo factor es de los ms sencillos y consiste en
la asignacin al azar de los tratamientos en estudio a un conjunto de unidades
experimentales. Algunas condiciones en las que se puede usar esta distribucin son:
Cuando el lugar y las unidades experimentales son muy uniformes; suelo homogneo,
laboratorio, invernadero, o cuando solamente interesa poner a prueba un cierto nmero
de niveles de un factor que provoque variacin, como por ejemplo las estaciones del ao
o varios sitios de muestreo, etc. y el conjunto de las observaciones en cada nivel son las
repeticiones. Es uno de los mas utilizados en experimentacin con animales.
Puede probarse cualquier nmero de tratamientos, asignando preferentemente el mismo
nmero de unidades experimentales a cada tratamiento (aunque esto no es esencial). El
nmero de unidades experimentales ser igual al nmero de tratamientos multiplicado
por el nmero de veces que stos se repitan.
Modelo lineal aditivo
El modelo para este diseo es:
yij = + ti + ij
donde,
yij = Variable respuesta
= Media general (alrededor de la cual oscilan todas las observaciones)
ti = Efecto del tratamiento i
ij = Variacin debida al azar (causas no pertinentes) = error experimental
Al considerar la variacin total, las causas parciales de variacin sern: 1) Variacin entre
tratamientos y 2) variacin dentro de tratamientos (variacin atribuible al error
experimental). Lo anterior se resume en el cuadro siguiente:
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
24
F.V. G.L. S.C. C.M. Fc
Tratamientos t 1 SCt CMt CMt/CMe
Error (rep/trat) t(r-1) Por diferencia CMe
Total tr 1 SCTot
Ejemplo (datos de Jos Lpez Medina, Fac. de Agrobiologa, UMSNH):
Supongamos que queremos probar el efecto de fertilizante fosforado sobre la
produccin de fresa en Zamora. Para ello, al momento de preparar las camas, previo a
la plantacin, adicionamos tres dosis de superfosfato triple de calcio equivalentes a 25,
50 y 100 Kg/ha, respectivamente e incluyendo un cuarto tratamiento sin fertilizante.
Las especificaciones del experimento son:
- Nmero de tratamientos: 4 (A= 0; B = 25; C = 50; D = 100 Kg/ha de P2O5) - Nmero de repeticiones: 4 - Tamao de u. exp.: 5 m de surco (1.2 m ancho x 5 m largo = 6 m2)
La distribucin de los tratamientos dentro de las unidades experimentales se puede
hacer de la forma siguiente:
1) Se enumeran las unidades experimentales (ya sea, de manera progresiva o al azar).
2) Se distribuyen los tratamientos al azar dentro de las unidades experimentales, tal
como se presenta a continuacin:
1
B4
2
C4
3
A3
4
A2
8
C3
7
C2
6
D3
5
B2
9
D4
10
D2
11
A4
12
B3
16
A1
15
B1
14
D1
13
C1
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
25
Los nmeros del 1 al 16 son las unidades experimentales y el subndice de las letras o
niveles del factor tratamientos denota el nmero de repeticin.
En una libreta de campo se llevar el registro de los frutos obtenidos cada vez que
stos se cosechen. A continuacin se presentan los datos finales:
No. de
U. Exp.
Tratamiento
Rep.
Rendimiento
acumulado
(Kg/parcela)
1 B 4 9.0
2 C 4 9.0
3 A 3 9.5
4 A 2 8.5
5 B 2 8.7
6 D 3 10.7
7 C 2 8.6
8 C 3 10.2
9 D 4 9.2
10 D 2 9.8
11 A 4 8.4
12 B 3 10.0
13 C 1 9.0
14 D 1 8.7
15 B 1 8.3
16 A 1 8.0
Los datos obtenidos se concentran en un cuadro de la forma siguiente:
Trat. P2O5 Repeticiones
(kg/ha) I II III IV Total Media
A 0 8.0 8.5 9.5 8.4 34.4 8.6
B 25 8.3 8.7 10.0 9.0 36.0 9.0
C 50 9.0 8.6 10.2 9.0 36.8 9.2
D 100 8.7 9.8 10.7 9.2 38.4 9.6
G = 145.6 9.1
Hiptesis:
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
26
Ho: ti = 0; es decir, no hay efecto de tratamientos, o todos los tratamientos son
iguales, o las diferencias de medias de tratamientos no son
significativas.
Ha: ti 0; es decir, al menos uno de los tratamientos es diferente de los dems.
Construccin del anlisis de varianza
1) Determinacin de los grados de libertad
F.V. G.L.
Tratamientos t 1 = 4-1 = 3
Error t(r-1) = 15-3 = 12
Total tr 1 = (4x4)-1 = 15
2) Clculo del factor o trmino de correccin (C): El gran total elevado al cuadrado y
dividido entre el nmero total de datos.
rt
XC
2..)(= =
rt
G 2
16
6.145 2= = 1,324.96
3) Sumas de cuadrados: Recordar que la variacin total tiene dos componentes que
son tratamientos y error. El esquema del huevo se aplica tambin a las sumas de
cuadrados y grados de libertad. Si a la suma de cuadrados total le restamos la de
tratamientos queda la suma de cuadrados del error.
menos igual a
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
27
Para la suma de cuadrados total ocupamos cada uno de los datos de las unidades
experimentales elevados al cuadrado. Como son datos individuales no se dividen. Se resta
el factor de correccin.
CxSCTot ij = 2)(
= (82 + 8.32 + . . . + 9.22) 1,324.96 = 8.54
Para la suma de cuadrados de tratamientos ocupamos los totales de cada uno de ellos
elevado al cuadrado. Como son el resultado de sumar cuatro repeticiones se dividen entre
cuatro. Se resta el factor de correccin.
Cr
XSCtrat
i = 2.)(
96.324,14
)4.388.360.364.34( 2222
+++= = 2.08
La suma de cuadrados del error la calculamos por diferencia.
SCe = SCTot SCtrat
= 8.54 2.08 = 6.46
4) Cuadrados medios. Suma de cuadrados entre sus correspondientes grados de libertad.
1=
t
SCCMtrat trat = 2.08/3 = 0.693
elg
SCeCMe
..= = 6.46/12 = 0.538
5) Relacin F (Fc) y comparacin con F de tablas. Los valores de cuadrado medio son
varianzas y se compara la variacin planeada correspondiente a los tratamientos
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
28
con la variacin no planeada correspondiente al error experimental. Esto se hace
con una divisin que nos dice la magnitud relativa de la variacin planeada
respecto a la no planeada.
e
t
CM
CMFc = = 0.693/0.538 = 1.288
La variacin provocada por los niveles del factor fertilizacin fosfrica es 1.29 veces mayor
que la variacin provocada por causas no planeadas.
Expresada en porcentaje la variacin por el factor planeado
es el 56.3 % de la variacin total. Para rechazar la hiptesis
nula de igualdad entre tratamientos se requiere un
porcentaje sensiblemente mayor que este.
Nuestro cuadro del anlisis de varianza queda como sigue:
FV GL SC CM Fc F0.05 F0.01
Trats. 3 2.08 0.693 1.288 ns 3.49 5.95
Error 12 6.46 0.538
TOTAL 15 8.54
ns = no significativo al 5% de probabilidad
Ahora comparamos el valor de F calculada con un valor de
tabla para 3 y 12 grados de libertad respectivamente para el
numerador (tratamientos) y el denominador (error) a los
niveles de significancia de 0.05 y 0.01 en el extremo derecho
inferior del fragmento de la tabla de la distribucin F que aqu se presenta.
Interpretacin. Como la F calculada es menor que el valor de F de tablas al lmite de
significancia determinado (5% de probabilidad), podemos concluir que nuestra
hiptesis de igualdad es cierta; por lo tanto, las dosis de fsforo evaluadas no
incrementaron el rendimiento de fresa de manera significativa.
Tratamientos
Error
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
29
Conclusin: Se acepta nuestra hiptesis nula; los tratamientos son iguales, tienen el
mismo efecto en la variable respuesta medida (kg).
Clculo del coeficiente de variacin
100.. xX
CMVC
e=
= 1001.9
538.0x = 100
1.9
733.0x = 8.0%
Resolviendo con la hoja de clculo Excel
Para llevar a cabo las operaciones podemos auxiliarnos de la hoja de clculo.
Excel tiene funciones de suma y suma de cuadrados que pueden facilitarnos las
operaciones aritmticas. Para ello los datos se capturan igual que en el cuadro de
concentracin de datos
Para calcular los totales de tratamientos, de repeticiones y gran total se utiliza la funcin
suma sealando el rango de celdas que contienen los datos que se desea sumar. En la
figura se muestra como se obtiene el total de las cuatro repeticiones del tratamiento A.
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
30
Estamos calculando .1x
Si queremos una suma de cuadrados utilizamos la funcin suma.cuadrados.
Estamos calculando 2)( ijx
De esta forma podemos ir calculando todos los componentes necesarios para construir el
cuadro de anlisis de varianza.
Sin embargo, Excel puede realizar todos los clculos si previamente se instala el
complemento anlisis de datos (para su instalacin ver ayuda de Excel; no se requiere el
disco de instalacin del programa).
Entonces entramos al men datos y al submen anlisis de datos.
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
31
Aparece el siguiente cuadro de dilogo, donde seleccionamos Anlisis de varianza de un
factor.
Se da click en aceptar y aparece otro cuadro de dilogo. Seleccionamos como rango de
entrada a todos los datos del experimento
Como el factor o tratamientos est ordenado en filas (hileras o renglones), seleccionamos
agrupado por filas.
Alfa es el nivel de significancia o riesgo de error que deseamos aplicar. Por omisin
aparece 0.05 pero puede modificarse.
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
32
El rango de salida ser por defecto en una hoja nueva, pero podemos modificarlo. Si
optamos por Rango de salida seleccionamos una celda y a partir de ah se despliega el
resultado. Si seleccionamos la celda A8.
Podemos editar el contenido para presentar el cuadro de anlisis de varianza como sigue:
ANLISIS DE VARIANZA
Fuentes de
variacin
Sumas de
cuadrados G. L.
Cuadrados
medios
F
calculada P > F
Valor
crtico para
F
Tratamientos 2.08 3 0.69333333 1.2879257 0.32320003 3.49029482
Error 6.46 12 0.53833333
Total 8.54 15
Comparando con el cuadro anterior vemos que el valor crtico de F calculada es el que
corresponde al valor tabulado para el nivel de significancia de 0.05.
FV GL SC CM Fc F0.05 F0.01
Trats. 3 2.08 0.693 1.288 ns 3.49 5.95
Error 12 6.46 0.538
TOTAL 15 8.54
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
33
El valor de Probabilidad, que editamos como P > F, nos dice directamente el riesgo de
cometer un error si rechazamos la hiptesis nula de igualdad entre tratamientos. En este
ejemplo Excel nos dice que ese riesgo es 0.32 o 32%; siempre que el valor de P sea mayor
de 0.05 se considera que debemos aceptar la hiptesis nula de igualdad.
Anlisis de varianza con Sas
Para el paquete SAS y otros programas de anlisis estadstico los datos se manejan en la
forma en que vienen en el libro de campo que aqu se repite.
No. de U. Exp.
Tratamiento
Rep.
Rendimiento acumulado
(Kg/parcela)
1 B 4 9.0
2 C 4 9.0
3 A 3 9.5
4 A 2 8.5
5 B 2 8.7
6 D 3 10.7
7 C 2 8.6
8 C 3 10.2
9 D 4 9.2
10 D 2 9.8
11 A 4 8.4
12 B 3 10.0
13 C 1 9.0
14 D 1 8.7
15 B 1 8.3
16 A 1 8.0
Las instrucciones como se vieron anteriormente, son las siguientes:
data fresa; input ue trat $ rep Kg; cards; 1 B 4 9 2 C 4 9 3 A 3 9.5 4 A 2 8.5 5 B 2 8.7 6 D 3 10.7
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
34
7 C 2 8.6 8 C 3 10.2 9 D 4 9.2 10 D 2 9.8 11 A 4 8.4 12 B 3 10 13 C 1 9 14 D 1 8.7 15 B 1 8.3 16 A 1 8 ; proc anova; class trat; model Kg = trat; run;
Despus de correr el programa la salida es la siguiente:
SAS Analysis of Variance Procedure Class Level Information Class Levels Values TRAT 4 A B C D Number of observations in data set = 16 Dependent Variable: KG Sum of Mean Source DF Squares Square F Value Pr > F Model 3 2.08000000 0.69333333 1.29 0.3232 Error 12 6.46000000 0.53833333 Corrected Total 15 8.54000000 R-Square C.V. Root MSE KG Mean 0.243560 8.062769 0.733712 9.10000000
NOTA: PRIMERAMENTE SE MUESTRA EL RESULTADO PARA EL MODELO COMPLETO Y EL ERROR. LUEGO APARECEN LOS COMPONENTES DEL MODELO. En este caso el modelo incluye solo a tratamientos. Source DF Anova SS Mean Square F Value Pr > F TRAT 3 2.08000000 0.69333333 1.29 0.3232
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
35
El nico factor (tratamientos) tiene una P > F superior a 0.05 y como conclusin se acepta
la hiptesis nula concluyendo que los diferentes tratamientos de fertilizacin no modifican
sensiblemente el rendimiento en Kg de fresa.
Anlisis de varianza con Minitab, versin 13
Este programa requiere el mismo arreglo de datos que el SAS. Se anotan las etiquetas
(rtulos, encabezados, ttulos, labels) en una primera fila
destinada para ese fin. Los datos pueden capturarse en Excel y
luego copiarlos y pegarlos en Minitab.
Para llevar a cabo el anlisis se sigue la siguiente ruta dentro
del men: Stat > Anova > One way.
Y aparece el siguiente cuadro de dilogo:
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
36
Debemos anotar la columna de la variable respuesta, en este caso Kg/parcela (c4) y el
factor de variacin planeada, en este caso los tratamientos (c2). Puede escribirse el
nombre de columna que aparece en el cuadro de dilogo o puede darse doble click sobre
ese mismo cuadro de dilogo en las filas que hacen referencia a las columnas
correspondientes y en seguida seleccionar dando click en Select. Luego se da click en OK y
aparece el resultado.
One-way ANOVA: (Kg/parcela) versus Tratamiento Analysis of Variance for (Kg/parc
Source DF SS MS F P
Tratamie 3 2.080 0.693 1.29 0.323
Error 12 6.460 0.538
Total 15 8.540
Individual 95% CIs For Mean
Based on Pooled StDev
Level N Mean StDev ---+---------+---------+---------+---
A 4 8.600 0.638 (--------*---------)
B 4 9.000 0.726 (---------*--------)
C 4 9.200 0.693 (---------*---------)
D 4 9.600 0.860 (---------*---------)
---+---------+---------+---------+---
Pooled StDev = 0.734 8.00 8.80 9.60 10.40
Ejemplo 2
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
37
En el zoolgico se prueban tres frmulas de alimento enriquecido para murcilagos. Se
tiene a la dieta actual como testigo y se alimenta a tres murcilagos con cada una de las
cuatro. Se pesan los doce animales un mes despus de alimentarlos con las cuatro
frmulas.
Peso de Murcilagos con dieta normal y con tres frmulas enriquecidas
Dieta normal Enriquecida 1 Enriquecida 2 Enriquecida 3
Murcilago 1 98 120 130 140
Murcilago 2 105 123 118 135
Murcilago 3 110 115 120 138
El factor es la dieta con cuatro niveles y tres repeticiones (individuos) por nivel.
Procedemos a calcular las sumas de cuadrados con la ayuda de Excel. Primero
necesitamos el factor de correccin, gran total al cuadrado entre el nmero de unidades
experimentales, 12 en este caso.
Ahora la suma de cuadrados de total, todos los datos al cuadrado menos el factor de
correccin.
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
38
Seguimos con la suma de cuadrados de tratamientos. Ocupamos el total de
cada una de las dietas.
Como son la suma de tres murcilagos dividimos entre 3.
Finalmente la suma de cuadrados del error, restando a la total la de tratamientos, C15 -
C16.
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
39
El cuadro de anlisis de varianza ser el siguiente, resuelto por el mismo Excel con la
herramienta Anlisis de datos.
Ntese que se toma la opcin agrupado por columnas y luego se da click en aceptar.
F. de V. S. C. g. l. C. M. Fc P F 0.05
Dietas 1683.33 3 561.11 22.37 0.00 4.07
Error 200.67 8 25.08 Total 1884.00 11
Conclusin: como el valor de F calculada es mucho mayor que el de tabla a nivel de 0.05
(22.37 > 4.07) y el valor de P es prcticamente de cero, podemos afirmar que hay
diferencias en el peso de los murcilagos alimentados con las diferentes frmulas.
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
40
Si ahora deseamos resolver con Sas o Minitab debemos acomodar los datos tal y como
vienen en el libro de campo, o sea que cada una de las 12 medidas de peso ocupa una fila
con toda la informacin referente a la misma.
Peso Dieta Sujeto
98 Normal 1
120 E1 4
130 E2 7
140 E3 10
105 Normal 2
123 E1 5
118 E2 8
135 E3 11
110 Normal 3
115 E1 6
120 E2 9
138 E3 12
Podemos prescindir de la columna del sujeto porque no es un factor de variacin
planeada. Hay que notar que los murcilagos sometidos a cada dieta fueron diferentes, es
decir estn anidados dentro de las dietas.
Copiando los datos en Minitab seguimos la ruta Stat > Anova > One way y luego en el
cuadro de dilogo seleccionamos como respuesta al peso y como factor a la dieta.
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
41
Para tener el resultado.
Analysis of Variance for Peso
Source DF SS MS F P
Dieta 3 1683.3 561.1 22.37 0.000
Error 8 200.7 25.1
Total 11 1884.0
En Sas tendramos lo siguiente en el block de notas:
data murci; input peso dieta $ sujeto; cards;
98 Normal 1
120 E1 4
130 E2 7
140 E3 10
105 Normal 2
123 E1 5
118 E2 8
135 E3 11
110 Normal 3
115 E1 6
120 E2 9
138 E3 12
proc anova; class dieta; model peso = dieta;
run;
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
42
Con el resultado siguiente:
Sum of Mean Source DF Squares Square F Value Pr > F Model 3 1683.333333 561.111111 22.37 0.0003 Error 8 200.666667 25.083333 Corrected total 11 1884.000000
Omitimos el resto del resultado porque el modelo incluye solamente al factor dieta.
La variacin causada por el factor dieta es 22.37 veces mayor que la causada por factores
no planeados.
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
43
DISEO BLOQUES COMPLETOS AL AZAR (DOS FACTORES, TWO WAY)
Generalidades
El DBCA es quizs el de mayor uso en los experimentos de campo. Las unidades
experimentales se agrupan en estratos o bloques (segundo factor, comnmente llamado
repeticiones), dentro de los cuales se asignan aleatoriamente los tratamientos en estudio.
Nota: En la experimentacin agrcola en suelo es comn que se divida el terreno en partes
iguales y cada una de ellas es un bloque. El factor que est actuando es la variabilidad
natural del suelo. La experiencia ha demostrado que comnmente s hay diferencias entre
los bloques de suelo.
El error se reduce en comparacin con el diseo completamente al azar, por lo que debe
haber una verdadera influencia del factor de bloqueo para justificar su implementacin.
Es necesario mantener la variabilidad entre unidades experimentales dentro de un bloque
lo mas pequea posible, pero maximizando a la vez las diferencias entre bloques. Esto
resulta en minimizacin del error experimental.
El DBCA resulta til en los casos siguientes:
1) Cuando el nmero de tratamientos es de 3 a 15. En caso de que el nmero de
tratamientos sea de 3 a 5, deben tenerse como mnimo seis bloques a fin de
contar con suficientes grados de libertad para el error experimental.
2) Cuando se tiene un gradiente de variabilidad o productividad, en cuyo caso
deben observarse los cuidados siguientes:
Los bloques deben orientarse de manera perpendicular al gradiente.
Las unidades experimentales (tratamientos) dentro de cada bloque
deben disponerse en la misma direccin del gradiente.
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
44
Modelo lineal aditivo
yij = + ti + bj + ij
donde,
yij = Variable respuesta.
= Media general (alrededor de la cual oscilan todas las observaciones).
ti = Efecto del tratamiento i
bj = Efecto del bloque j
ij = Variacin debida al azar (causas no pertinentes) = error experimental
Modelo del anlisis de varianza
Al considerar la variacin total, las causas parciales de variacin sern: 1) Variacin entre
tratamientos, 2) variacin entre bloques y 3) variacin dentro de unidades
experimentales (variacin atribuible al error experimental, o interaccin de los dos
factores). Lo anterior se resume en el cuadro siguiente:
F.V. G.L. S.C. C.M. Fc
Tratamientos t 1 SCt CMt CMt/CMe
Bloques b 1 SCb CMb CMb/CMe
Error (t-1)(b-1) SCT (SCt + SCb) CMe
Total tb 1 SCT
Ejemplo (datos de Juan Paulo Rojas Murillo, Fac. de Agrobiologa, UMSNH)
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
45
Se aplicaron cinco dosis de fertilizacin a plantas de zarzamora en cinco bloques que
fueron variaciones naturales de suelo. Los resultados para la variable de respuesta altura
de planta fueron los siguientes:
Dosis Fert B 1 B 2 B 3 B 4 B 5 1 2.45 3.4 2.87 3.52 3.52 2 3.75 3.1 3.37 3.42 3.25 3 2.2 2.37 3.27 3.45 2.77 4 4 2.62 3.52 2.92 3.65 5 3.22 3.42 3.9 2.75 3.62
Este arreglo nos sirve para hacer el anlisis de datos con Excel.
El procedimiento es igual al del
diseo Completamente al Azar, con
la diferencia de que se selecciona
anlisis de varianza para dos
factores con una sola muestra por
grupo
En este ejemplo
Desplegando el siguiente resultado
ANLISIS DE VARIANZA
Origen de las
variaciones
Suma de
cuadrados
Grados de
libertad
Promedio de los
cuadrados Fc P > F
Valor crtico
para F
Fertilizacin 1.184744 4 0.296186 1.2567108 0.32737056 3.00691728
Bloques 0.567064 4 0.141766 0.60151008 0.66700923 3.00691728
Error 3.770936 16 0.2356835
Total 5.522744 24
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
46
Como al capturar los datos en Excel las filas correspondieron a las dosis de fertilizacin y
las columnas a los bloques, se edita el cuadro de resultados anotando dichos nombres en
el lugar correspondiente.
Interpretacin de los resultados
Dado que los valores de P > F son
superiores a 0.05, tanto para dosis de
fertilizacin como para bloques se
concluye que cualquiera de las dosis
utilizadas produce el mismo crecimiento
en altura de planta y que en este caso
los bloques en realidad no
representaron un segundo factor. El factor fertilizacin fue responsable del 44 % de la
variacin total y los bloques del 21 %, mientras que el error contiene el 35 %.
Anlisis con Sas
El arreglo necesario es el mismo que tiene la libreta de campo. De este modo el programa
quedar como se muestra a continuacin:
data zarza; input fer bloq alt ; cards; 1 1 2.45 1 2 3.75 1 3 2.2 1 4 4 1 5 3.22 2 1 3.4 2 2 3.1 2 3 2.37 2 4 2.62 2 5 3.42 3 1 2.87 3 2 3.37 3 3 3.27 3 4 3.52 3 5 3.9 4 1 3.52
Fertilizacin
Bloques
Error
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
47
4 2 3.42 4 3 3.45 4 4 2.92 4 5 2.75 5 1 3.52 5 2 3.25 5 3 2.77 5 4 3.65 5 5 3.62 ; proc anova; classes fer bloq; model alt = fer bloq; run;
Que al correrlo muestra la siguiente salida
SAS Analysis of Variance Procedure Class Level Information Class Levels Values FER 5 1 2 3 4 5 BLOQ 5 1 2 3 4 5 Number of observations in data set = 25 SAS Analysis of Variance Procedure Dependent Variable: ALT Sum of Mean Source DF Squares Square F Value Pr > F Model 8 1.75180800 0.21897600 0.93 0.5192 Error 16 3.77093600 0.23568350 Corrected Total 24 5.52274400 R-Square C.V. Root MSE ALT Mean 0.317199 15.10869 0.485472 3.21320000
COMPONENTES DEL MODELO. En este caso el modelo incluye a tratamientos y bloques.
Source DF Anova SS Mean Square F Value Pr > F FER 4 0.56706400 0.14176600 0.60 0.6670 BLOQ 4 1.18474400 0.29618600 1.26 0.3274
Anlisis con Minitab
El procedimiento es igual al del diseo anterior con la diferencia de que ahora en el men
se sigue la ruta
Stat > ANOVA > Two-way
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
48
Luego aparece el cuadro de dilogo donde hay que seleccionar la variable respuesta y los
dos factores.
Y al dar click en OK aparece el siguiente resultado
Two-way ANOVA: Altura versus Dosis Fert, Bloque
Analysis of Variance for Altura
Source DF SS MS F P
Dosis Fe 4 0.567 0.142 0.60 0.667
Bloque 4 1.185 0.296 1.26 0.327
Error 16 3.771 0.236
Total 24 5.523
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
49
ANLISIS DE VARIANZA DE UNA Y DOS VAS O FACTORES (DISEOS COMPLETAMENTE
AL AZAR Y BLOQUES COMPLETOS AL AZAR) CON R.
Primero que nada hay que sealar que debemos situarnos en la carpeta (directorio) en
donde tenemos el archivo de datos en formato txt o block de notas, y que all mismo se
guarda el archivo de instrucciones o script. Para esto seguimos la ruta Archivo > cambiar
dir
Una vez que estamos en la carpeta deseada podemos crear el script. Hay varias
alternativas para realizar el anlisis de varianza, aqu se muestra una de ellas.
Ejemplo de script para anlisis de varianza de dos vas o factores
o
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
50
flecha hacia la izquierda
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
51
odf
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
52
> print(names(odf)) [1] "trat" "rep" "yield" > > mod1 print(summary(mod1)) Df Sum Sq Mean Sq F value Pr(>F)
trat 4 4995 1248.7 11.233 0.000503 ***
rep 3 2004 668.0 6.009 0.009681 **
Residuals 12 1334 111.2
Interpretacin: La variacin por
tratamientos es 11.2 veces mayor que
la atribuida a causas no planeadas, y la
variacin por repeticiones 6 veces. Hay
diferencias entre tratamientos (Pr>F =
0.0005) y tambin entre repeticiones
(Pr>F = 0.0009). Recordar que la
hiptesis nula de igualdad se rechaza cuando P < 0.05, como en este caso. Los
tratamientos son causantes del 62 % de la variacin total, las repeticiones del 33 % y el
error de solo el 5 %.
Anlisis de varianza de un factor
Al medir la longitud del cuerpo de una especie de insecto en tres sitios y dos repeticiones,
el resultado fue el siguiente.
Sitio
Repeticin A B C
R1 45 63 70 R2 57 77 74
Y el archivo de datos tendra la siguiente forma:
repeticion sitio longitud R1 A 45 R1 B 63 R1 C 70
1248.7
668
111.2
Tratamientos
Repeticiones
Error
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
53
R2 A 57 R2 B 77 R2 C 74
El script es el siguiente:
oF = 0.124.
Como el mximo admitido para
rechazar la hiptesis nula de igualdad es
0.05, se concluye que se acepta H0 y por
lo tanto no hay diferencias en el tamao
de los insectos en los sitios
muestreados. La variacin atribuida a los sitios fue 4.5 veces mayor que la variacin por
otras causas. Esto es el 82 % del total.
Sitios
Error
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
54
COMPARACIONES MLTIPLES DE MEDIAS
Como la prueba de F solamente nos dice si hay diferencias entre los tratamientos o niveles
de un factor, pero no nos dice cuales son los mejores o si algunos de ellos son iguales
entre s pero diferentes del resto, es necesario realizar una comparacin entre los
tratamientos para determinar las diferencias especficas al compararlos. A continuacin se
describen las frmulas para algunas de las mas utilizadas. Todas las que se mencionan
requieren que el tamao de muestra sea uniforme, es decir que el nmero de repeticiones
o bloques sea el mismo para todos los tratamientos o niveles del factor.
a) Prueba de t (DMS, LSD)
r
CMetSMD
*2*... )(=
Donde D.M.S. quiere decir diferencia mnima significativa entre dos
tratamientos para que puedan considerarse realmente diferentes.
CMe es el cuadrado medio del error experimental.
r es el nmero de repeticiones o bloques.
)(t es un valor tabulado para un nivel de significancia y grados de
libertad del error.
b) Prueba de Tukey (DSH, HSD)
r
CMeqHSD
it*... ),( =
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
55
Donde D.S.H. quiere decir diferencia mnima significativa honesta entre dos
tratamientos para que puedan considerarse realmente diferentes.
CMe es el cuadrado medio del error experimental.
r es el nmero de repeticiones o bloques.
Importante: Si existe submuestreo, es decir, cada unidad experimental contiene
mas de un individuo, sustituimos r (ere) por n (ene). Por ejemplo, si se tomaron
medidas en tres ramas de cada una de cinco plantas n = 15.
),( itq es un valor tabulado para un nivel de significancia , un nmero t de
tratamientos y grados de libertad del error.
Igual que la anterior, esta prueba solo debe usarse cuando el tamao de las
muestras es igual.
c) Prueba de rango mltiple de Duncan
Esta prueba fue diseada para determinar diferencias entre pares especficos
de medias. Las medias se ordenan en orden ascendente. Existe un valor de
diferencia mnima significativa para la comparacin de dos medias,
determinado por el nmero de medias que se incluyen en la comparacin de
stas.
M1 M2 M3 M4 M5
Si comparamos la media 1 con la 5 habr un valor de DMS para cinco medias
involucradas; si comparamos la media 2 con la 4 o la 1 con la 3 habr un valor
de DMS para tres medias involucradas.
)11
(*)2
(*21
)(rr
CMetLS +=
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
56
Donde LS es la diferencia mnima significativa entre un par de tratamientos que
involucra n medias, para que estos puedan ser considerandos realmente
diferentes.
CME es el cuadrado medio del error experimental
r es el nmero de repeticiones o bloques.
)(t es un valor tabulado para un nivel de significancia y grados de
libertad del error.
d) Prueba de Scheff
ftr
CMeSD )1(*
2.. =
Donde t = nmero de promedios (tratamientos o niveles) que se comparan
CMe es el cuadrado medio del error experimental
r es el nmero de repeticiones
f0,05 es un valor tabulado. Utiliza la distribucin F.
En general, la prueba de Scheff es mas rigurosa que la de Tukey para detectar
diferencias significativas. En experimentos de mejoramiento de plantas, cuando se
comparan cultivares es comn utilizar la prueba de Tukey, mientras que en experimentos
mas complicados como pruebas de fertilizacin, se aplica la prueba de Scheff.
Ejemplo con SAS
El siguiente conjunto de datos corresponde a la prueba de cinco tratamientos de
hormonas promotoras de crecimiento en zarzamora en cinco repeticiones midiendo como
variable respuesta la longitud de tres ramas laterales (Datos de Juan Paulo Rojas Murillo,
fac. de Agrobiologa, UMSNH).
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
57
data edgar; input trat rep lateral long; cards; 3 1 1 221 3 1 2 171 3 1 3 194 2 2 1 237.5 2 2 2 240 2 2 3 122.5 4 2 1 89 4 2 2 76.5 4 2 3 45 3 3 1 159 3 3 2 193 3 3 3 82 5 3 1 100.63 5 3 2 94.38 5 3 3 90.5 1 4 1 126.67 1 4 2 136.67 1 4 3 56.67 3 4 1 140 3 4 2 138 3 4 3 108 4 5 1 63.25 4 5 2 81.25 4 5 3 115.88 1 1 1 166.67 1 1 2 128.33 1 1 3 53.33 4 1 1 102.5 4 1 2 161.25 4 1 3 89.63 5 2 1 79.38 5 2 2 47.5 5 2 3 72.25 1 3 1 265 1 3 2 250 1 3 3 190 4 3 1 116.25 4 3 2 93.13 4 3 3 88.75 2 3 1 111.25 2 3 2 110 2 3 3 62.75 4 4 1 75.83 4 4 2 178 4 4 3 107 3 5 1 180 3 5 2 92 3 5 3 99
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
58
2 5 1 125 2 5 2 133.25 2 5 3 236.67 2 1 1 91 2 1 2 152.5 2 1 3 128.25 5 1 1 47.25 5 1 2 47.75 5 1 3 31.75 1 2 1 220 1 2 2 190 1 2 3 120 3 2 1 86.6 3 2 2 104 3 2 3 144.6 5 4 1 74.88 5 4 2 80.38 5 4 3 87.63 2 4 1 113.75 2 4 2 110 2 4 3 157.5 1 5 1 223.33 1 5 2 131.67 1 5 3 336.67 5 5 1 76.38 5 5 2 57.5 5 5 3 72.13 proc anova; class trat rep; model long = trat rep; means trat / tukey lsd duncan scheffe lines; run;
Las prueba de separacin de medias de Tukey, T (lsd), Duncan y Scheff se solicitan en el
penltimo rengln del programa y la salida que proporciona SAS es la siguiente:
SAS
Analysis of Variance Procedure
Class Level Information
Class Levels Values
TRAT 5 1 2 3 4 5
REP 5 1 2 3 4 5
Number of observations in data set = 75
SAS
Analysis of Variance Procedure
Dependent Variable: LONG
Sum of Mean
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
59
Source DF Squares Square F Value Pr > F
Model 8 102611.8610 12826.4826 4.96 0.0001
Error 66 170663.7746 2585.8148
Corrected Total 74 273275.6355
R-Square C.V. Root MSE LONG Mean
0.375489 40.64760 50.85091 125.101867
Source DF Anova SS Mean Square F Value Pr > F
TRAT 4 97194.56034 24298.64008 9.40 0.0001
REP 4 5417.30063 1354.32516 0.52 0.7186
HASTA AQU SE CONCLUYE QUE HAY DIFERENCIAS ENTRE LOS TRATAMIENTOS. AHORA HAY QUE DETERMINAR CUALES
TRATAMIENTOS SON IGUALES ENTRE S Y CUALES SON DIFERENTES.
SAS
Analysis of Variance Procedure
T tests (LSD) for variable: LONG
NOTE: This test controls the type I comparisonwise error rate not
the experimentwise error rate.
Alpha= 0.05 df= 66 MSE= 2585.815
Critical Value of T= 2.00
Least Significant Difference= 37.072
Means with the same letter are not significantly different.
T Grouping Mean N TRAT
A 173.00 15 1
A
A 142.13 15 2
A
A 140.81 15 3
B 98.88 15 4
B
B 70.69 15 5
SAS
Analysis of Variance Procedure
Duncan's Multiple Range Test for variable: LONG
NOTE: This test controls the type I comparisonwise error rate, not
the experimentwise error rate
Alpha= 0.05 df= 66 MSE= 2585.815
Number of Means 2 3 4 5
Critical Range 37.10 39.01 40.27 41.17
Means with the same letter are not significantly different.
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
60
Duncan Grouping Mean N TRAT
A 173.00 15 1
A
A 142.13 15 2
A
A 140.81 15 3
B 98.88 15 4
B
B 70.69 15 5
SAS
Analysis of Variance Procedure
Tukey's Studentized Range (HSD) Test for variable: LONG
NOTE: This test controls the type I experimentwise error rate, but
generally has a higher type II error rate than REGWQ.
Alpha= 0.05 df= 66 MSE= 2585.815
Critical Value of Studentized Range= 3.966
Minimum Significant Difference= 52.076
Means with the same letter are not significantly different.
Tukey Grouping Mean N TRAT
A 173.00 15 1
A
B A 142.13 15 2
B A
B A 140.81 15 3
B
B C 98.88 15 4
C
C 70.69 15 5
SAS
Analysis of Variance Procedure
Scheffe's test for variable: LONG
NOTE: This test controls the type I experimentwise error rate but
generally has a higher type II error rate than REGWF for all
pairwise comparisons
Alpha= 0.05 df= 66 MSE= 2585.815
Critical Value of F= 2.51083
Minimum Significant Difference= 58.845
Means with the same letter are not significantly different.
Scheffe Grouping Mean N TRAT
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
61
A 173.00 15 1
A
B A 142.13 15 2
B A
B A 140.81 15 3
B
B C 98.88 15 4
C
C 70.69 15 5
Las pruebas de Tukey y Scheff dan resultados similares.
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
62
TRANSFORMACIN DE DATOS
Debemos estar conscientes de que los supuestos del anlisis de varianza no siempre se
cumplen y que de llevarse a cabo un anlisis estadstico con resultados que no cumplan
con dichos supuestos se puede llegar a una conclusin equivocada. Aunque todava no es
prctica generalizada, es muy conveniente aplicar pruebas de bondad de ajuste,
homocedasticidad e independencia antes de realizar un anlisis de varianza. No las
abarcaremos en este texto, sino en una prxima versin. Por ahora nos limitamos a
mencionar que suele utilizarse la chi cuadrada para distribuciones discretas como la
binomial o la de Piosson, y la de Anderson Darling para distribuciones continuas como la
normal, o la de Shapiro Wilk especficamente para esta ltima.
Mediante una transformacin adecuada puede conseguirse que una variable que no se
distribuye normalmente pase a tener una distribucin cercana a la normal. Las
poblaciones con varianzas desiguales pueden convertirse en homocedsticas (varianzas
homogneas) mediante una transformacin apropiada. Las transformaciones mas usadas
son las siguientes:
Transformacin logartmica
El modelo lineal indica que los efectos del bloque, el tratamiento y el error experimental,
son aditivos. Si los niveles de los factores provocan un aumento o disminucin de las
variables medidas en proporcin que tiende a ser geomtrica, entonces se dice que los
efectos son multiplicativos y no aditivos. Una transformacin logartmica transformar en
aditiva la relacin multiplicativa. Log(x), es til cuando los datos crecen en sentido
exponencial o cuando las desviaciones estndares de las muestra son aproximadamente
proporcionales a los promedios o hay evidencia de efectos principales multiplicativos de
los tratamientos en vez de aditivos. Cuando hay muchos ceros, dado que log(0) no est
definido se acostumbra utilizar log(x+1).
Transformacin raz cuadrada
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
63
Se aconseja cuando los datos estn dados por nmeros enteros procedentes de conteo
(distribucin discreta), como por ejemplo el nmero de manchas en una hoja o el nmero
de bacterias en una placa, el nmero de insectos de una especie, los das a floracin, etc.,
los nmeros observados tienden a presentar una distribucin de Poisson. La
transformacin X + 0.5 es til cuando los nmeros observados son pequeos (0 10), por
ejemplo son acontecimientos pocos comunes, tienen una posibilidad muy baja de ocurrir
en cualquier individuo. Si las cifras de los conteos estn generalmente por arriba de 100 es
probable que no se requiera transformacin.
Normalmente esta transformacin determina que las varianzas de los grupos sean ms
homogneas. Tambin es aplicable a las distribuciones sesgadas porque acorta la cola
larga.
Transformacin arco-seno raz cuadrada del porcentaje o proporcin
La transformacin Arcoseno X /100 es til cuando los datos son expresados en por ciento
o son proporciones de la muestra total, como por ejemplo el porcentaje de individuos
enfermos, porcentaje de plantas sobrevivientes, proporcin de plantas con doble
mazorca, etc. Por lo general estos datos tienen una distribucin binomial. La
transformacin arcoseno tiende a igualar las varianzas y a normalizar los datos. Esta
transformacin asume que todas las proporciones transformadas tienen el mismo valor de
n. Si n es aproximadamente igual para los distintos grupos an se puede utilizar esta
transformacin. Si los valores de porcentaje estn entre 30 y 70 no se requiere
transformacin,y si todos estn por debajo de 20 puede utilizarse la raz cuadrada.
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
64
PRUEBAS NO PARAMTRICAS
Las transformaciones de datos van dirigidas a forzar a que los supuestos del anlisis de
varianza se cumplan cuando esto no ocurre, pero puede darse el caso de que los datos
transformados sigan sin ajustarse a uno o mas de los supuestos.
Bajo esta situacin muchos opinan que en lugar de transformar los datos hay que trabajar
con ellos conservndolos como son. Para ello existe la alternativa de las pruebas no
paramtricas, que se consideran menos precisas y que no han tenido el mismo desarrollo
que el anlisis de varianza, pero se espera que pronto lo tengan.
Estas pruebas se pueden aplicar bajo cualquier distribucin de probabilidad y en ausencia
de independencia entre variables; en lugar de trabajar con la media utilizan la mediana y
por lo tanto son menos afectadas por valores extremos (atpicos, outliers). En este texto
solo mencionaremos dos de ellas y como aplicarlas con el programa Minitab.
Prueba de Kruskal-Wallis
Es el equivalente no paramtrico del anlisis de varianza de un factor (diseo
completamente al azar) y se prueba la diferencia entre medianas de tres o mas grupos de
datos.
La hiptesis a probar es
Ho: Xmed0 = Xmed1 = Xmed2 =
Ha:Xmed0 Xmed1 Xmed2
En Minitab se sigue la ruta Stat>nonparametrics> Kruskal-Wallis.
Ejemplo: Se cuenta el nmero de insectos polinizadores que visitan una especie en tres
diferentes horarios. Se desea saber si hay diferencias en la cantidad de polinizadores entre
horarios.
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
65
El resultado se muestra a continuacin
Kruskal-Wallis Test on Num inse
horario N Median Ave Rank Z
1 4 70.00 2.8 -2.55
2 4 85.00 10.5 2.72
3 4 76.50 6.3 -0.17
Overall 12 6.5
H = 9.27 DF = 2 P = 0.010
* NOTE * One or more small samples
Como el valor de P es de 0.01 se rechaza la hiptesis nula y se concluye que el nmero de
insectos polinizadores que visitan las flores es diferente en los tres horarios muestreados.
Prueba de Friedman
Es el equivalente no paramtrico del diseo bloques completos al azar o anlisis de
varianza de dos factores. Se aplica a observaciones pareadas.
La hiptesis a probar es
Ho: Xmed0 = Xmed1 = Xmed2 =
Ha:Xmed0 Xmed1 Xmed2
Ejemplo: Se mide la produccin diaria de leche en 7 vacas bajo tres tratamientos: Sin
sonidos, con ruido y con msica clsica.
Los datos aparecen a continuacin
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
66
Vaca 1 2 3 4 5 6 7 1 2 3 4 5 6 7 1 2 3 4 5 6 7
Litros 14 16 12 18 10 14 16 10 8 12 10 10 8 8 16 16 16 16 14 18 18
Tratamiento Sin Sin Sin Sin Sin Sin Sin Ruido Ruido Ruido Ruido Ruido Ruido Ruido Clasica Clasica Clasica Clasica Clasica Clasica Clasica
Se capturan los datos en columnas. Se sigue la ruta Stat > Nonparametrics > Friedman. En
el cuadro de dilogo se seleccionan las variables Response para la produccin de leche,
Treatment para el tratamiento y blocks para las repeticiones o bloques.
Como el valor de P es de 0.009, recordando que el mximo aceptable es de 0.05 se
rechaza la hiptesis nula y se concluye que hay diferencias en la produccin de leche
como respuesta a los tratamientos evaluados.
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
67
DISEO CUADRADO LATINO
El Diseo Cuadrado Latino corresponde al efecto de tres factores sin tomar en cuenta las
interacciones entre ellos. Agrupa los tratamientos (factor 1) tanto en filas (hileras, factor
2) como en columnas (bloques, factor 3), dentro de las cuales stos se distribuyen de
manera aleatoria. Ello permite eliminar la variabilidad asociada con estas fuentes de
variacin, reduciendo a la vez el error experimental. Se tienen las siguientes
caractersticas:
El nmero de tratamientos (t) ser igual tanto al nmero de hileras como al
nmero de columnas.
Cada hilera o columna constituye una repeticin completa de los
tratamientos.
La distribucin de tratamientos debe ser de tal forma que no se repita
ningn tratamiento en filas ni en columnas.
El nmero total de unidades experimentales ser un cuadrado perfecto, es
decir, t2.
El DCL resulta til en los casos siguientes:
Cuando el nmero de tratamientos es de 4 a 10.
Cuando en experimentos agrcolas se tiene un gradiente de variabilidad del
suelo en dos sentidos perpendiculares (razn por la cual se forman filas y
columnas).
Desventajas del DCL:
1) El nmero total de unidades experimentales se incrementa considerablemente a
medida que aumenta el nmero de tratamientos en estudio. No se recomienda
este diseo para casos en que se prueban mas de 10 tratamientos.
2) El nmero de grados de libertad para el error experimental se reduce.
Modelo lineal aditivo
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
68
yijk = + hi + cj + tk(ij) + ijk
donde,
yijk = Variable respuesta
= Media general (alrededor de la cual oscilan todas las observaciones)
hi = Efecto de la hilera i
cj = Efecto de la columna j
tk = Efecto del tratamiento k (siendo k una funcin de i e j)
ijk = Variacin debida al azar (causas no planeadas) = error experimental
Modelo del anlisis de varianza
Al considerar la variacin total, las causas parciales de variacin sern las que se
muestran en el cuadro siguiente:
F.V. G.L. S.C. C.M. Fc
Hileras h-1 SCh CMh CMh/CMe
Columnas c-1 SCc CMc CMc/CMe
Tratamientos t-1 SCt CMt CMt/CMe
Error (t-1)(t-2) SCT (SCh + SCc + SCt) CMe
Total t 2 1 SCT
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
69
Ejemplo (Datos de Jos Lpez Medina, fac. de Agrobiologa, UMSNH)
En un experimento realizado en Plant City, Florida, se evalu el efecto del nitrgeno sobre
el rendimiento de fresa cultivar Sweet Charlie. Para ello, semanalmente se suministraron
dos unidades del elemento va sistema de riego a partir de la floracin, utilizando cuatro
fuentes de fertilizante nitrogenado e incluyendo un tratamiento sin fertilizante. El
experimento se condujo bajo un diseo en cuadrado latino 5 x 5.
Las especificaciones de la plantacin fueron: camas de 1.22 m de ancho; 30 cm entre
plantas y 2 hileras por cama, 2. Esto equivale a una poblacin de 55,556 plantas/ha.
Las especificaciones del experimento fueron:
Nmero de tratamientos: 5
Trat. A: Sulfato de amonio [(NH4)2SO4]
Trat. B: Nitrato de amonio [NH4NO3]
Trat. C: Nitrato de Calcio [Ca(NO3)2]
Trat. D: Nitrato de sodio [NaNO3]
Trat. E: Sin fertilizante (testigo)
Tamao de unidades experimentales: parcelas de 3 m de largo, con un total de 21
plantas.
La distribucin de los tratamientos dentro de hileras y columnas se hizo de la manera
siguiente:
Se trazaron las hileras siguiendo el sentido de las camas.
Se trazaron las columnas de manera perpendicular a las hileras.
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
70
Se distribuyeron los tratamientos de tal forma que ninguno de ellos se repitiera ni
en hileras ni en columnas, tal como se muestra en el cuadro siguiente:
Columnas
Hileras I II III IV V
1 A B C D E
2 E A B C D
3 D E A B C
4 C D E A B
5 B C D E A
A fin de evitar que los tratamientos estn juntos de manera sistemtica (ej.: AB,
CD, etc.), se sortean las hileras y luego las columnas; finalmente, se enumeran las
unidades experimentales de manera progresiva. Ejemplo del cuadro final:
Columnas
Hileras III V II I IV
5
1
D
2
A
3
C
4
B
5
E
2
10
B
9
D
8
A
7
E
6
C
4
11
E
12
B
13
D
14
C
15
A
1
20
C
19
E
18
B
17
A
16
D
3
21
A
22
C
23
E
24
D
25
B
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
71
Toma de datos. Se sugiere recopilar los datos del experimento de la manera siguiente:
No. u. exp.
Hilera
Columna
Trat.
Rendimiento
(kg/parcela)
1 5 3 D 30.3
2 5 5 A 33.3
3 5 2 C 30.3
4 5 1 B 29.9
5 5 4 E 25.8
6 2 4 C 33.0
7 2 1 E 24.8
8 2 2 A 32.6
9 2 5 D 29.0
10 2 3 B 29.5
11 4 3 E 26.7
12 4 5 B 32.8
13 4 2 D 29.9
14 4 1 C 31.4
15 4 4 A 30.4
16 1 4 D 31.1
17 1 1 A 32.1
18 1 2 B 33.1
19 1 5 E 28.2
20 1 3 C 29.1
21 3 3 A 31.9
22 3 5 C 30.6
23 3 2 E 21.7
24 3 1 D 28.8
25 3 4 B 30.1
Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina
UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano
72
Resultados:
El rendimiento acumulado por ao durante el primer ao de evaluacin se presenta en los
cuadros siguientes:
Rendimiento acumulado (en ton/ha) por hileras y columnas
Columnas
Total
hileras
Hileras III V II I IV (h)
5 30.3 33.3 30.3 29.9 25.8 149.6
2 29.5 29 32.6 24.8 33 148.9
4 26.7 32.8 29.9 31.4 30.4 151.2
1 29.1 28.2 33.1 32.1 31.1 153.6
3 31.9 30.6 21.7 28.8 30.1 143.1
Total
colum. (c) 147.5 153.9 147.6