Notas de Matemáticas III -...

155
Notas de Matemáticas III Principios de Diseños Experimentales Incluye manejo básico de R, Sas, Minitab y Excel José López Medina Facultad de Agrobilogía, UMSNH Carlos Alberto Ramírez Mandujano Facultad de Biología, UMSNH Diciembre de 2012

Transcript of Notas de Matemáticas III -...

  • Notas de Matemticas III

    Principios de Diseos Experimentales Incluye manejo bsico de R, Sas, Minitab y Excel Jos Lpez Medina Facultad de Agrobiloga, UMSNH

    Carlos Alberto Ramrez Mandujano Facultad de Biologa, UMSNH

    Diciembre de 2012

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    2

    CONTENIDO

    Principios de experimentacin 3

    Anlisis de varianza (anova, andeva, anva) 7

    Principios de Sas (statistic analysis system) para msdos 13

    Diseo completamente al azar (un factor, one way) 23

    Diseo bloques completos al azar (dos factores, two way) 43

    Anlisis de varianza de una y dos vas (factores) con R 49

    Pruebas de comparaciones mltiples de medias 54

    Transformacin de datos 62

    Pruebas no paramtricas 64

    Diseo cuadrado latino 67

    Contrastes ortogonales 82

    Experimentos factoriales 87

    Diseo parcelas divididas 105

    Diseo jerrquico o anidado 117

    Regresin y correlacin lineal simple y doble 126

    Bibliografa bsica 155

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    3

    PRINCIPIOS DE EXPERIMENTACIN

    Un experimento es un trabajo cientficamente planeado para investigar una o ms

    poblaciones en condiciones controladas.

    Conceptos bsicos

    Factor de un experimento es una variable independiente nominal o categrica cuyos

    niveles son configurados por el experimentador para probar una respuesta a travs de

    ellos. Un experimento puede tener ms de un factor en estudio. Es comn que a los

    niveles de un factor se les llame Tratamiento o Grupo. Estos suelen ser las nuevas

    tecnologas a evaluar, lo que propone como novedoso el investigador. Algunos ejemplos

    de tratamientos son: Variedades a ensayar, concentraciones de un fungicida, dosis de un

    fertilizante, riego artificial o carencia del mismo, localidades, estaciones de ao, etc.

    Tratamientos testigos (control) son tratamientos de referencia que sirven para comparar

    los tratamientos propios del experimento y que pueden ser de dos tipos: Absoluto y

    Relativo. A veces un experimento lleva ambos testigos. El tratamiento absoluto puede ser

    no aplicar tratamiento alguno; el tratamiento relativo puede ser la tecnologa tradicional,

    una situacin normal, lo que se hace de manera corriente, etc., que permite valorar el

    comportamiento relativo de los tratamientos que se estn poniendo a prueba.

    Bloque en principio es un segundo factor; es un conjunto de unidades experimentales ms

    o menos homogneas, en donde se alojan todos los tratamientos del experimento. En

    experimentacin agrcola en campo a menudo los bloques son divisiones del terreno

    experimental; el objetivo de los bloques es disminuir la variabilidad del material

    experimental.

    Repeticin es el nmero de veces que se instala cada tratamiento o nivel de un factor, o la

    combinacin de dos o mas de ellos. Con frecuencia este trmino se usa como equivalente

    a los bloques de un experimento establecido en campo. Para tener confiabilidad en los

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    4

    resultados de un experimento, el nmero mnimo de repeticiones no debera ser menor a

    cuatro.

    Unidad Experimental es la unidad bsica empleada para experimentar. Cada unidad

    experimental comprende uno de los niveles de un factor o combinacin de niveles de dos

    o mas factores a evaluar. Con frecuencia a una unidad experimental se le denomina

    parcela. Puede ser una persona, una comunidad, una planta, etc. Es la unidad donde se

    hace la toma de datos. El tamao y nmero de elementos vara segn los objetivos de la

    investigacin.

    Tamao de un experimento es el nmero de unidades experimentales del experimento.

    Diseo del experimento es el arreglo espacial y en el tiempo de los tratamientos. Cuando

    ms complicado es el diseo, ms grados de libertad pierde modelo, pero se controla

    mejor el error experimental si se conocen las direcciones de los gradiente de las causas de

    perturbacin. En este sentido hay un equilibrio dinmico, un diseo ms complejo y que

    no tiene un mejor el control del error puede ser ms ineficiente que un diseo simple. El

    investigador debe determinar cul es el mejor diseo para su experimento y este

    depender de la irregularidad del rea experimental, del nmero de tratamientos y de la

    orientacin espacial de las causas que perturban el experimento. El diseo ms simple de

    todos es el Diseo Completamente al Azar, DCA, sin embargo el diseo ms utilizado en la

    agricultura en el de Bloques completos al azar, BCA.

    Planeacin de experimentos. El mtodo cientfico sugiere que en la planeacin de

    experimentos se tomen en cuenta las siguientes etapas: a) Definir el problema; Una vez

    que hayamos comprendido el problema, debemos ser capaces de formular preguntas que,

    una vez contestadas, conduzcan a la solucin del mismo. En esta etapa se debe

    determinar los antecedentes, importancia, objetivos, hiptesis a probar y revisin de la

    bibliografa. b) Diseo del experimento; Se debe tener en cuenta: Lugar de ejecucin del

    experimento, tamao de la parcela o unidad experimental, nmero de repeticiones por

    tratamiento, las variables a medir, los equipos e instrumentos a utilizar y los mtodos de

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    5

    evaluacin de los resultados. c) Ejecucin del experimento. d) Recoleccin de datos del

    experimento. e) Ordenamiento de la informacin experimental. f) Anlisis de la

    informacin y discusin de los resultados obtenidos. g) En lo posible, realizar anlisis

    econmico de los tratamientos que se probaron e identificar la utilidad prctica. h)

    Conclusin final y recomendacin.

    Supuestos del modelo estadstico

    Los supuestos en que se fundamenta el modelo estadstico son:

    a) Aditividad: La variable respuesta es la suma de los efectos del modelo estadstico.

    b) Linealidad: La relacin existente entre los factores o componentes del modelo

    estadstico es lineal (no curvilnea), es decir, se ajusta a una recta.

    c) Normalidad: Los valores resultantes del experimento tienen una buena

    aproximacin a la distribucin Normal.

    d) Independencia: Los resultados observados de un experimento son independientes

    entre s.

    e) Homocedasticidad (varianza homognea): Las poblaciones generadas por la

    aplicacin de dos o ms tratamientos tienen varianzas mas o menos de igual

    magnitud.

    Tipos de modelos estadsticos

    De acuerdo a la seleccin de los tratamientos y otros factores, se tiene la siguiente

    clasificacin:

    Modelos de Efectos Fijos: Es cuando los tratamientos y dems factores que intervienen en

    un experimento constituyen el todo y no una muestra de una poblacin; si se repite el

    experimento los tratamientos son los mismos. En estos casos las conclusiones del anlisis

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    6

    de varianza solamente son vlidas para los tratamientos y otros factores usados en el

    experimento.

    Modelos de Efectos aleatorios: Los tratamientos y dems factores que intervienen en un

    experimento son una muestra aleatoria de una poblacin; si el experimento se repite los

    elementos que conforman los tratamientos son diferentes. Las conclusiones del anlisis de

    varianza son vlidos tanto para los tratamientos y dems factores que se incluyeron en el

    experimento, como para la poblacin de donde fueros tomados.

    Modelos Mixtos: Es la combinacin de los dos anteriores y se presenta cuando algunos

    factores son fijos y otros son elegidos al azar. Las conclusiones del anlisis de varianza

    sern vlidas para toda la poblacin de factores cuando stos son elegidos al azar, y

    solamente para los factores usados cuando estos son fijos.

    Nos referiremos en el presente texto a modelos fijos, pero debemos estar conscientes de

    que en la experimentacin en campo a menudo tendremos que trabajar con factores

    aleatorios. Por ejemplo, si establecemos una prueba en tres localidades representativas

    de una regin, el factor localidad es aleatorio. Si probamos dos frmulas de medio de

    cultivo para un hongo las frmulas son niveles de un factor fijo, pero la poblacin del

    hongo que est siendo representada es un factor aleatorio. Los modelos mixtos los

    abordaremos en una futura versin.

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    7

    ANLISIS DE VARIANZA (Anova, Andeva, Anva)

    El ANOVA sirve como base para probar nuestra hiptesis. Consiste en separar de la

    variacin total observada, las diferentes causas o fuentes de variacin que influyen en los

    resultados de un experimento en particular y que afectan en distinto grado el efecto de

    los tratamientos en estudio.

    Tiene como objetivo identificar la importancia relativa de los diferentes factores o

    tratamientos en estudio y determinar cmo stos interactan entre s.

    Variacin planeada

    Si comparamos diferentes mtodos de control de maleza, diferentes frmulas de

    fertilizacin, diferentes marcas de un agroqumico, diferentes niveles de una hormona,

    etc. estamos introduciendo variacin intencionalmente. A esto llamamos tratamientos o

    niveles de un factor en un experimento. Los dos trminos son equivalentes.

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    8

    Variacin no planeada

    Adems de los tratamientos o factores que ponemos a prueba, hay causas diversas que no

    introducimos pero que estn all y provocan variacin que modifica el resultado final del

    efecto de los tratamientos. Si el efecto es grande, los resultados se alteran tanto que nos

    pueden llevar a cometer un error al comparar el efecto de los diferentes tratamientos.

    Esto afecta la validez de las observaciones.

    La variacin entre los tratamientos evaluados nos estima la variacin planeada. La

    variacin dentro de los tratamientos nos estima la variacin no planeada o varianza del

    error experimental. Pada dar por vlidas las observaciones la varianza planeada debe ser

    mucho mayor que la varianza no planeada y la proporcin mnima requerida est dada

    por la prueba de F, que se aplica a la cantidad de veces que la variacin planeada es mayor

    que la no planeada (razn de varianzas).

    Clasificacin anidada y cruzada

    Cuando cada nivel de un factor se aplica a todos los niveles de un segundo factor estamos

    hablando de clasificacin cruzada. Por ejemplo, si en cuatro medios de cultivo se prueban

    tres cepas de un hongo y en cada uno de los cuatro medios estn las tres cepas. Todos los

    medios de cultivo tienen a todas las cepas.

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    9

    Por el contrario, cuando cada nivel de un primer factor se aplica a diferentes niveles de un

    segundo factor estamos hablando de un caso de clasificacin anidada. Por ejemplo, si se

    evalan cruzamientos de 10 toros, cada uno con cuatro vacas, pero ninguna vaca cruzada

    con el toro 1 se cruz con otro toro. Cada toro tuvo sus cuatro vacas y cada vaca tuvo un

    solo toro.

    Esto afecta el procedimiento del anlisis de varianza y para ejemplificar se muestran los

    cuadros de anlisis de varianza que corresponden a los dos diseos bsicos.

    Clasificacin anidada, un solo factor, diseo completamente al azar. Las repeticiones estn

    anidadas en los tratamientos y no son un factor de variacin planeada. La variacin total

    tiene solo dos componentes: Planeada (tratamientos o factor) y no planeada o error.

    Fuentes de Variacin Grados

    de

    libertad

    Sumas de Cuadrados Cuadrados

    Medios

    F calculada

    Tratamientos t 1 SCtrat SCtrat/t-1 CMtrat/CMe

    Error (rep/trat) (r-1)t Por diferencia SCe/t(r-1)

    Total tr 1 SCTotal

    Clasificacin cruzada, dos factores, diseo bloques completos al azar. Todos los

    tratamientos estn en todos los bloques y ambos son factores de variacin planeada. La

    variacin total tiene tres componentes: Tratamientos o factor 1, bloques o factor 2, y

    variacin no planeada o error.

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    10

    Fuentes de

    Variacin

    Grados de

    Libertad

    Sumas de Cuadrados Cuadrados Medios F calculada

    Tratamientos t 1 SCt SCt/t-1 CMt/CMe

    Bloques b 1 SCb SCb/b-1 CMb/CMe

    Error (trat*bl) (t-1)(b-1) SCT (SCt + SCb) SCe/(t-1)(b-1)

    Total tb 1 SCT

    Operaciones en el anlisis de varianza

    La variacin total se desglosa en componentes y esto implica llevar a cabo operaciones

    que incluyen sumatorias de datos, sumatorias de cuadrados de datos individuales y

    sumatorias de cuadrados de totales, y divisiones.

    Previamente se construye un cuadro de concentracin de datos, como vemos a

    continuacin para el caso de clasificacin cruzada con tres tratamientos y tres bloques

    (tres niveles para ambos factores).

    Tratamientos

    1 2 3 Total

    Bloques

    1 X11 X21 X31 X.1

    2 X12 X22 X32 X.2

    3 X13 X23 X33 X.3

    Total X1. X2. X3. X..

    Donde

    X1. significa que se sumaron todas las observaciones para el tratamiento 1.

    X.1 significa que se sumaron todas las observaciones para el bloque 1.

    X.. es el gran total.

    Veamos ahora las frmulas para el anlisis de varianza de dos factores.

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    11

    F.V. G.L. S.C. C.M. Fc

    Tratamientos t - 1 (Xi.2/b) (X..2/tb) SCt/t-1 CMt/CMe

    Bloques b 1 (X.j2/b) (X..2/tb) SCb/b-1 CMb/CMe

    Error (Trat*Bloq) (t-1)(b-1) SCTot (SCt + SCb) SCe/(t-1)(b-1)

    Total tb 1 Xij2 (X..2/tb)

    Donde

    Xi.2 es la sumatoria de los cuadrados de los totales de cada tratamiento.

    X.j2 es la sumatoria de los cuadrados de los totales de cada bloque.

    Xij2 es la sumatoria de los cuadrados de cada uno de los datos.

    X..2/tb es llamado factor o trmino de correccin, gran total al cuadrado entre nmero de

    unidades experimentales.

    t es el nmero de tratamientos o niveles del factor tratamientos.

    b es el nmero de bloques o niveles del factor bloques.

    La suma de cuadrados incluye a los totales de todos los niveles de un factor (tratamientos

    o bloques) y se divide entre el nmero de elementos que se sumaron para calcular dicho

    total. A la suma de cuadrados de una interaccin se le restan las sumas de cuadrados de

    los factores que estn interactuando, en este caso el error es la interaccin de

    tratamientos y bloques. Para interacciones en clasificacin anidada, solo se resta la suma

    de cuadrados del factor que anida. A todas se les resta el factor de correccin.

    Los componentes de la tabla son:

    Fuentes de Variacin u origen de las variaciones, es decir las causas tanto planeadas como

    no planeadas que provocan diferencias dentro del experimento.

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    12

    Grados de libertad, que son el nmero de elementos menos uno.

    Sumas de cuadrados, que son parte del procedimiento de clculo de varianzas.

    Cuadrados medios o varianzas para cada fuente de variacin.

    Fc o valor de F calculada, magnitud relativa de la varianza.

    Los cuadrados medios se obtienen al dividir la suma de cuadrados entre sus

    correspondientes grados de libertad. Fc es la divisin del cuadrado medio de un factor

    (tratamientos o bloques) entre el cuadrado medio del error. El valor de Fc se compara con

    un valor de tabla para decidir si las diferencias observadas entre los tratamientos pueden

    ser validadas. Puede ser complementada o sustituida con el valor de P, que nos indica el

    riesgo de error si rechazamos la hiptesis de igualdad de tratamientos. El mximo valor de

    P aceptado es de 0.05.

    Las operaciones pueden ser hechas paso a paso con calculadora o en hoja de clculo,

    aunque todo el procedimiento puede realizarse con ayuda de uno de los mltiples

    programas de cmputo disponibles. En este texto se incluyen Excel, Minitab, Sas y R.

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    13

    PRINCIPIOS DE SAS (STATISTIC ANALYSIS SYSTEM) PARA MSDOS

    El paquete estadstico SAS es uno de los mas utilizados en la investigacin. A continuacin

    se muestra el manejo de una forma primitiva del mismo. Posteriormente hablaremos de

    R, Excel y Minitab, que tambin son utilizados como herramientas de anlisis.

    Nota importante: La programacin es la misma en la versin 9 para Windows.

    Lo primero

    Sas para MSDOS viene en una carpeta llamada SAS que se copia al disco duro en el

    directorio raz C o a una memoria USB.

    No debe estar dentro de otra carpeta.

    No necesita instalarse.

    Se abre la carpeta SAS y se da doble click en el archivo SAS.

    Programa abierto

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    14

    Cuando se quiere cerrar se escribe bye en la lnea de comando y se presiona Enter

    Ventanas de SAS

    Program editor: captura

    Output: resultado

    Log: bitcora del programa que se acaba de correr

    Teclas bsicas

    F5 es para cambiar de ventana.

    F7 es la lupa o zoom para ampliar una ventana o regresar a la vista de las tres ventanas.

    F10 corre el programa desde la ventana del editor.

    F9 en la ventana del editor reaparece los datos de un programa que ya corri.

    Programacin

    Pueden capturarse los datos en Excel y all mismo elaborar todo el programa.

    Cada dato recabado para una o mas variables evaluadas lleva en la fila en que se registra,

    a todo el historial de l mismo: Tratamiento, repeticin, planta, etc., a que pertenece.

    Luego se copia todo al block de notas y se guarda, o se guarda como texto separado por

    tabulaciones. El nombre del archivo no puede exceder los 8 caracteres, que pueden ser

    letras o nmeros y no puede tener espacios. Tendr la extensin .txt.

    Se guarda en la carpeta SAS o en una memoria fuera de cualquier carpeta.

    Pasos para anlisis de datos

    Organizar los datos.

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    15

    Primero se anota un comando DATA.

    Existen comandos PROC para analizar los datos.

    Sintaxis

    Los enunciados siempre terminan con punto y coma ;

    Luego el programa espera otro enunciado.

    Cuando el programa no entiende algo marca un error.

    Espaciamiento

    Se puede colocar mas de un enunciado en una lnea o cada enunciado en diferente lnea.

    Se usan MAYSCULAS o minsculas.

    Ejemplo: tres enunciados en una sola lnea.

    data new; input x; cards;

    O bien: cada enunciado en una lnea diferente

    data new;

    input x;

    Cards;

    Reglas bsicas de escritura

    Los nombres de las bases de datos y de las variables deben iniciar con letra, luego se

    pueden incluir nmeros.

    El nombre no debe ser mayor de 8 caracteres.

    El nombre no puede llevar espacios intermedios.

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    16

    Ejemplo

    options nodate pagesize=70 linesize= 70; data grasac; input sexo $ pctgr; cards; m 13.3 f 22 f 23.2 m 20 F . m 16 ; proc print data= grasac; title 'datos de grasa corporal'; run; proc sort data=grasac; by sexo; run; proc means data=grasac ; by sexo; var pctgr; title 'promedio de grasa corporal' ; run;

    Que significa cada lnea?

    Options: algunas opciones.

    Nodate nonumber: no anotar fecha ni nmeros de pgina.

    Pagesize = 50: 50 lneas (renglones) por hoja.

    Linesize = 70: 70 espacios por lnea.

    Data: se crear una base de datos.

    Data grasac: la base de datos se llamar grasac

    Input: nombres y tipo de variables y orden en que aparecern en columnas.

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    17

    Input sexo $ pctgr; La variable sexo ocupar la primera columna y la variable pctgr

    ocupar la segunda columna.

    La variable sexo es categrica o alfanumrica. Despus de escribirla se anota el signo $.

    la variable pctgr es numrica.

    Datos perdidos se anotan como punto.

    Cards; indica que en seguida se anotan las lneas de datos.

    Al final de la captura se anota una lnea con solo punto y coma ;

    Proc print data = grasac; le indica imprimir los datos de la base llamada grasac en la

    primera hoja de resultados

    Title datos de grasa corporal; es el ttulo

    Run; le indica ejecutar los comandos escritos

    proc sort data=grasac; by sexo; reordena los datos de dicha base por categora de sexo

    para que luego se haga el anlisis

    proc means data=grasac ; by sexo; var pctgr;

    Se pide que obtenga las medias de la variable pctgr por categora de sexo para la base de

    datos creada

    Programa para anlisis de varianza de dos factores (diseo bloques al azar)

    Options nodate nonumber; Se pide que no ponga la fecha ni nmero de pgina.

    Data pino; La base de datos se llamar pino.

    Input bloque origen alt; Tres columnas: bloque, origen, altura.

    Cards;

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    18

    AQU SIGUEN LAS LNEAS DE DATOS

    ;

    PROC ANOVA; Se har anlisis de varianza.

    CLASS bloque origen; Son las fuentes de variacin planeada.

    Model alt = bloque origen; Alt (altura) es la variable respuesta.

    Todo lo que no se incluye en el modelo ser parte del error.

    Means origen / Tukey lines; Prueba de Tukey (comparacin de medias)

    Run; Corre el programa.

    Para anlisis de varianza de un factor (diseo completamente al azar)

    Lo nico que cambia respecto al diseo bloques al azar es que el modelo no incluye

    bloques.

    Model alt = origen; Altura (alt) es la variable respuesta.

    Fuente de variacin planeada es solamente origen.

    Lo que no incluye el modelo ser el error.

    Todo lo dems es igual al diseo bloques al azar.

    Anlisis de regresin

    Options nodate; Se pide que no ponga la fecha.

    Data pino; La base de datos se llamar pino.

    Input bloque origen alt db d130; Cinco columnas: bloque, origen, altura dimetro basal

    y dimetro a 1.30.

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    19

    Cards;

    AQU SIGUEN LAS LNEAS DE DATOS

    ;

    PROC Reg; Se har anlisis de regresin.

    Model alt = db d130; Altura es la variable dependiente.

    db y d130 son las variables independientes.

    Run; Corre el programa.

    Captura de datos y programa

    Recordando. Se captura en Excel. Se copia todo y se pega en el block de notas.

    Se guarda con un nombre de no mas de 8 caracteres y sin espacios.

    En el block de notas los archivos tienen la extensin .txt. Se guarda fuera de cualquier

    carpeta en la memoria USB o en el disco duro C.

    Para abrir el archivo en SAS

    Se abre en la ventana del PROGRAM EDITOR. Si el cursor estuviera fuera de la lnea de

    comando se presiona la tecla Inicio (Home).

    Utilizar el comando include seguido de la ruta de acceso. Luego dar Enter.

    INCLUDE E:examen.txt. Significa que en la computadora la memoria aparece como E y

    que el archivo se llama examen. Es necesario anotar la extensin .txt.

    Notas importantes

    Es comn que el teclado cambie su configuracin y que no coincidan las teclas con los

    smbolos. En este caso habr que buscar donde aparece cada uno.

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    20

    Si el archivo que se abrir est guardado en la carpeta SAS la instruccin ser

    Include examen.txt. Si est en una memoria USB registrada por la PC como E.

    Si est guardado en el disco duro

    Include c:examen.txt. En seguida presionamos la tecla Enter.

    Guardando

    Despus de correr el programa presionando la tecla F10, aparece el resultado en la

    ventana OUTPUT. Vamos all con la tecla F5.

    Para guardar el resultado se usa el comando file.

    file ruta:nombre.ext y se presiona Enter.

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    21

    Se puede utilizar la extensin txt para crear archivo de texto para block de notas o rtf o

    doc para archivo perfectamente compatible con Word.

    Ejemplo file e:examenr.txt

    Queda guardado en la memoria e.

    File pinus.txt lo guarda en la carpeta SAS.

    Figuras antes y despus de presionar la tecla Enter

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    22

    La instruccin es que guarde los resultados en la carpeta SAS en un archivo llamado

    examenr con la extensin txt, que es archivo de texto y se abre con el block de notas.

    Para borrar cada ventana se usa el comando clear y se presiona Enter. Luego se puede

    abrir otro archivo.

    Si tenemos la versin de SAS para Windows

    En este caso copiamos todo el programa desde Excel y lo pegamos en la ventana del

    editor. Para correr el programa damos click en el dibujo del monito, donde en la figura

    aparece en un cuadrito blanco la palabra submit.

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    23

    DISEO COMPLETAMENTE AL AZAR (UN FACTOR, ONE WAY)

    El Diseo Completamente al Azar o de un solo factor es de los ms sencillos y consiste en

    la asignacin al azar de los tratamientos en estudio a un conjunto de unidades

    experimentales. Algunas condiciones en las que se puede usar esta distribucin son:

    Cuando el lugar y las unidades experimentales son muy uniformes; suelo homogneo,

    laboratorio, invernadero, o cuando solamente interesa poner a prueba un cierto nmero

    de niveles de un factor que provoque variacin, como por ejemplo las estaciones del ao

    o varios sitios de muestreo, etc. y el conjunto de las observaciones en cada nivel son las

    repeticiones. Es uno de los mas utilizados en experimentacin con animales.

    Puede probarse cualquier nmero de tratamientos, asignando preferentemente el mismo

    nmero de unidades experimentales a cada tratamiento (aunque esto no es esencial). El

    nmero de unidades experimentales ser igual al nmero de tratamientos multiplicado

    por el nmero de veces que stos se repitan.

    Modelo lineal aditivo

    El modelo para este diseo es:

    yij = + ti + ij

    donde,

    yij = Variable respuesta

    = Media general (alrededor de la cual oscilan todas las observaciones)

    ti = Efecto del tratamiento i

    ij = Variacin debida al azar (causas no pertinentes) = error experimental

    Al considerar la variacin total, las causas parciales de variacin sern: 1) Variacin entre

    tratamientos y 2) variacin dentro de tratamientos (variacin atribuible al error

    experimental). Lo anterior se resume en el cuadro siguiente:

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    24

    F.V. G.L. S.C. C.M. Fc

    Tratamientos t 1 SCt CMt CMt/CMe

    Error (rep/trat) t(r-1) Por diferencia CMe

    Total tr 1 SCTot

    Ejemplo (datos de Jos Lpez Medina, Fac. de Agrobiologa, UMSNH):

    Supongamos que queremos probar el efecto de fertilizante fosforado sobre la

    produccin de fresa en Zamora. Para ello, al momento de preparar las camas, previo a

    la plantacin, adicionamos tres dosis de superfosfato triple de calcio equivalentes a 25,

    50 y 100 Kg/ha, respectivamente e incluyendo un cuarto tratamiento sin fertilizante.

    Las especificaciones del experimento son:

    - Nmero de tratamientos: 4 (A= 0; B = 25; C = 50; D = 100 Kg/ha de P2O5) - Nmero de repeticiones: 4 - Tamao de u. exp.: 5 m de surco (1.2 m ancho x 5 m largo = 6 m2)

    La distribucin de los tratamientos dentro de las unidades experimentales se puede

    hacer de la forma siguiente:

    1) Se enumeran las unidades experimentales (ya sea, de manera progresiva o al azar).

    2) Se distribuyen los tratamientos al azar dentro de las unidades experimentales, tal

    como se presenta a continuacin:

    1

    B4

    2

    C4

    3

    A3

    4

    A2

    8

    C3

    7

    C2

    6

    D3

    5

    B2

    9

    D4

    10

    D2

    11

    A4

    12

    B3

    16

    A1

    15

    B1

    14

    D1

    13

    C1

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    25

    Los nmeros del 1 al 16 son las unidades experimentales y el subndice de las letras o

    niveles del factor tratamientos denota el nmero de repeticin.

    En una libreta de campo se llevar el registro de los frutos obtenidos cada vez que

    stos se cosechen. A continuacin se presentan los datos finales:

    No. de

    U. Exp.

    Tratamiento

    Rep.

    Rendimiento

    acumulado

    (Kg/parcela)

    1 B 4 9.0

    2 C 4 9.0

    3 A 3 9.5

    4 A 2 8.5

    5 B 2 8.7

    6 D 3 10.7

    7 C 2 8.6

    8 C 3 10.2

    9 D 4 9.2

    10 D 2 9.8

    11 A 4 8.4

    12 B 3 10.0

    13 C 1 9.0

    14 D 1 8.7

    15 B 1 8.3

    16 A 1 8.0

    Los datos obtenidos se concentran en un cuadro de la forma siguiente:

    Trat. P2O5 Repeticiones

    (kg/ha) I II III IV Total Media

    A 0 8.0 8.5 9.5 8.4 34.4 8.6

    B 25 8.3 8.7 10.0 9.0 36.0 9.0

    C 50 9.0 8.6 10.2 9.0 36.8 9.2

    D 100 8.7 9.8 10.7 9.2 38.4 9.6

    G = 145.6 9.1

    Hiptesis:

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    26

    Ho: ti = 0; es decir, no hay efecto de tratamientos, o todos los tratamientos son

    iguales, o las diferencias de medias de tratamientos no son

    significativas.

    Ha: ti 0; es decir, al menos uno de los tratamientos es diferente de los dems.

    Construccin del anlisis de varianza

    1) Determinacin de los grados de libertad

    F.V. G.L.

    Tratamientos t 1 = 4-1 = 3

    Error t(r-1) = 15-3 = 12

    Total tr 1 = (4x4)-1 = 15

    2) Clculo del factor o trmino de correccin (C): El gran total elevado al cuadrado y

    dividido entre el nmero total de datos.

    rt

    XC

    2..)(= =

    rt

    G 2

    16

    6.145 2= = 1,324.96

    3) Sumas de cuadrados: Recordar que la variacin total tiene dos componentes que

    son tratamientos y error. El esquema del huevo se aplica tambin a las sumas de

    cuadrados y grados de libertad. Si a la suma de cuadrados total le restamos la de

    tratamientos queda la suma de cuadrados del error.

    menos igual a

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    27

    Para la suma de cuadrados total ocupamos cada uno de los datos de las unidades

    experimentales elevados al cuadrado. Como son datos individuales no se dividen. Se resta

    el factor de correccin.

    CxSCTot ij = 2)(

    = (82 + 8.32 + . . . + 9.22) 1,324.96 = 8.54

    Para la suma de cuadrados de tratamientos ocupamos los totales de cada uno de ellos

    elevado al cuadrado. Como son el resultado de sumar cuatro repeticiones se dividen entre

    cuatro. Se resta el factor de correccin.

    Cr

    XSCtrat

    i = 2.)(

    96.324,14

    )4.388.360.364.34( 2222

    +++= = 2.08

    La suma de cuadrados del error la calculamos por diferencia.

    SCe = SCTot SCtrat

    = 8.54 2.08 = 6.46

    4) Cuadrados medios. Suma de cuadrados entre sus correspondientes grados de libertad.

    1=

    t

    SCCMtrat trat = 2.08/3 = 0.693

    elg

    SCeCMe

    ..= = 6.46/12 = 0.538

    5) Relacin F (Fc) y comparacin con F de tablas. Los valores de cuadrado medio son

    varianzas y se compara la variacin planeada correspondiente a los tratamientos

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    28

    con la variacin no planeada correspondiente al error experimental. Esto se hace

    con una divisin que nos dice la magnitud relativa de la variacin planeada

    respecto a la no planeada.

    e

    t

    CM

    CMFc = = 0.693/0.538 = 1.288

    La variacin provocada por los niveles del factor fertilizacin fosfrica es 1.29 veces mayor

    que la variacin provocada por causas no planeadas.

    Expresada en porcentaje la variacin por el factor planeado

    es el 56.3 % de la variacin total. Para rechazar la hiptesis

    nula de igualdad entre tratamientos se requiere un

    porcentaje sensiblemente mayor que este.

    Nuestro cuadro del anlisis de varianza queda como sigue:

    FV GL SC CM Fc F0.05 F0.01

    Trats. 3 2.08 0.693 1.288 ns 3.49 5.95

    Error 12 6.46 0.538

    TOTAL 15 8.54

    ns = no significativo al 5% de probabilidad

    Ahora comparamos el valor de F calculada con un valor de

    tabla para 3 y 12 grados de libertad respectivamente para el

    numerador (tratamientos) y el denominador (error) a los

    niveles de significancia de 0.05 y 0.01 en el extremo derecho

    inferior del fragmento de la tabla de la distribucin F que aqu se presenta.

    Interpretacin. Como la F calculada es menor que el valor de F de tablas al lmite de

    significancia determinado (5% de probabilidad), podemos concluir que nuestra

    hiptesis de igualdad es cierta; por lo tanto, las dosis de fsforo evaluadas no

    incrementaron el rendimiento de fresa de manera significativa.

    Tratamientos

    Error

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    29

    Conclusin: Se acepta nuestra hiptesis nula; los tratamientos son iguales, tienen el

    mismo efecto en la variable respuesta medida (kg).

    Clculo del coeficiente de variacin

    100.. xX

    CMVC

    e=

    = 1001.9

    538.0x = 100

    1.9

    733.0x = 8.0%

    Resolviendo con la hoja de clculo Excel

    Para llevar a cabo las operaciones podemos auxiliarnos de la hoja de clculo.

    Excel tiene funciones de suma y suma de cuadrados que pueden facilitarnos las

    operaciones aritmticas. Para ello los datos se capturan igual que en el cuadro de

    concentracin de datos

    Para calcular los totales de tratamientos, de repeticiones y gran total se utiliza la funcin

    suma sealando el rango de celdas que contienen los datos que se desea sumar. En la

    figura se muestra como se obtiene el total de las cuatro repeticiones del tratamiento A.

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    30

    Estamos calculando .1x

    Si queremos una suma de cuadrados utilizamos la funcin suma.cuadrados.

    Estamos calculando 2)( ijx

    De esta forma podemos ir calculando todos los componentes necesarios para construir el

    cuadro de anlisis de varianza.

    Sin embargo, Excel puede realizar todos los clculos si previamente se instala el

    complemento anlisis de datos (para su instalacin ver ayuda de Excel; no se requiere el

    disco de instalacin del programa).

    Entonces entramos al men datos y al submen anlisis de datos.

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    31

    Aparece el siguiente cuadro de dilogo, donde seleccionamos Anlisis de varianza de un

    factor.

    Se da click en aceptar y aparece otro cuadro de dilogo. Seleccionamos como rango de

    entrada a todos los datos del experimento

    Como el factor o tratamientos est ordenado en filas (hileras o renglones), seleccionamos

    agrupado por filas.

    Alfa es el nivel de significancia o riesgo de error que deseamos aplicar. Por omisin

    aparece 0.05 pero puede modificarse.

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    32

    El rango de salida ser por defecto en una hoja nueva, pero podemos modificarlo. Si

    optamos por Rango de salida seleccionamos una celda y a partir de ah se despliega el

    resultado. Si seleccionamos la celda A8.

    Podemos editar el contenido para presentar el cuadro de anlisis de varianza como sigue:

    ANLISIS DE VARIANZA

    Fuentes de

    variacin

    Sumas de

    cuadrados G. L.

    Cuadrados

    medios

    F

    calculada P > F

    Valor

    crtico para

    F

    Tratamientos 2.08 3 0.69333333 1.2879257 0.32320003 3.49029482

    Error 6.46 12 0.53833333

    Total 8.54 15

    Comparando con el cuadro anterior vemos que el valor crtico de F calculada es el que

    corresponde al valor tabulado para el nivel de significancia de 0.05.

    FV GL SC CM Fc F0.05 F0.01

    Trats. 3 2.08 0.693 1.288 ns 3.49 5.95

    Error 12 6.46 0.538

    TOTAL 15 8.54

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    33

    El valor de Probabilidad, que editamos como P > F, nos dice directamente el riesgo de

    cometer un error si rechazamos la hiptesis nula de igualdad entre tratamientos. En este

    ejemplo Excel nos dice que ese riesgo es 0.32 o 32%; siempre que el valor de P sea mayor

    de 0.05 se considera que debemos aceptar la hiptesis nula de igualdad.

    Anlisis de varianza con Sas

    Para el paquete SAS y otros programas de anlisis estadstico los datos se manejan en la

    forma en que vienen en el libro de campo que aqu se repite.

    No. de U. Exp.

    Tratamiento

    Rep.

    Rendimiento acumulado

    (Kg/parcela)

    1 B 4 9.0

    2 C 4 9.0

    3 A 3 9.5

    4 A 2 8.5

    5 B 2 8.7

    6 D 3 10.7

    7 C 2 8.6

    8 C 3 10.2

    9 D 4 9.2

    10 D 2 9.8

    11 A 4 8.4

    12 B 3 10.0

    13 C 1 9.0

    14 D 1 8.7

    15 B 1 8.3

    16 A 1 8.0

    Las instrucciones como se vieron anteriormente, son las siguientes:

    data fresa; input ue trat $ rep Kg; cards; 1 B 4 9 2 C 4 9 3 A 3 9.5 4 A 2 8.5 5 B 2 8.7 6 D 3 10.7

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    34

    7 C 2 8.6 8 C 3 10.2 9 D 4 9.2 10 D 2 9.8 11 A 4 8.4 12 B 3 10 13 C 1 9 14 D 1 8.7 15 B 1 8.3 16 A 1 8 ; proc anova; class trat; model Kg = trat; run;

    Despus de correr el programa la salida es la siguiente:

    SAS Analysis of Variance Procedure Class Level Information Class Levels Values TRAT 4 A B C D Number of observations in data set = 16 Dependent Variable: KG Sum of Mean Source DF Squares Square F Value Pr > F Model 3 2.08000000 0.69333333 1.29 0.3232 Error 12 6.46000000 0.53833333 Corrected Total 15 8.54000000 R-Square C.V. Root MSE KG Mean 0.243560 8.062769 0.733712 9.10000000

    NOTA: PRIMERAMENTE SE MUESTRA EL RESULTADO PARA EL MODELO COMPLETO Y EL ERROR. LUEGO APARECEN LOS COMPONENTES DEL MODELO. En este caso el modelo incluye solo a tratamientos. Source DF Anova SS Mean Square F Value Pr > F TRAT 3 2.08000000 0.69333333 1.29 0.3232

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    35

    El nico factor (tratamientos) tiene una P > F superior a 0.05 y como conclusin se acepta

    la hiptesis nula concluyendo que los diferentes tratamientos de fertilizacin no modifican

    sensiblemente el rendimiento en Kg de fresa.

    Anlisis de varianza con Minitab, versin 13

    Este programa requiere el mismo arreglo de datos que el SAS. Se anotan las etiquetas

    (rtulos, encabezados, ttulos, labels) en una primera fila

    destinada para ese fin. Los datos pueden capturarse en Excel y

    luego copiarlos y pegarlos en Minitab.

    Para llevar a cabo el anlisis se sigue la siguiente ruta dentro

    del men: Stat > Anova > One way.

    Y aparece el siguiente cuadro de dilogo:

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    36

    Debemos anotar la columna de la variable respuesta, en este caso Kg/parcela (c4) y el

    factor de variacin planeada, en este caso los tratamientos (c2). Puede escribirse el

    nombre de columna que aparece en el cuadro de dilogo o puede darse doble click sobre

    ese mismo cuadro de dilogo en las filas que hacen referencia a las columnas

    correspondientes y en seguida seleccionar dando click en Select. Luego se da click en OK y

    aparece el resultado.

    One-way ANOVA: (Kg/parcela) versus Tratamiento Analysis of Variance for (Kg/parc

    Source DF SS MS F P

    Tratamie 3 2.080 0.693 1.29 0.323

    Error 12 6.460 0.538

    Total 15 8.540

    Individual 95% CIs For Mean

    Based on Pooled StDev

    Level N Mean StDev ---+---------+---------+---------+---

    A 4 8.600 0.638 (--------*---------)

    B 4 9.000 0.726 (---------*--------)

    C 4 9.200 0.693 (---------*---------)

    D 4 9.600 0.860 (---------*---------)

    ---+---------+---------+---------+---

    Pooled StDev = 0.734 8.00 8.80 9.60 10.40

    Ejemplo 2

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    37

    En el zoolgico se prueban tres frmulas de alimento enriquecido para murcilagos. Se

    tiene a la dieta actual como testigo y se alimenta a tres murcilagos con cada una de las

    cuatro. Se pesan los doce animales un mes despus de alimentarlos con las cuatro

    frmulas.

    Peso de Murcilagos con dieta normal y con tres frmulas enriquecidas

    Dieta normal Enriquecida 1 Enriquecida 2 Enriquecida 3

    Murcilago 1 98 120 130 140

    Murcilago 2 105 123 118 135

    Murcilago 3 110 115 120 138

    El factor es la dieta con cuatro niveles y tres repeticiones (individuos) por nivel.

    Procedemos a calcular las sumas de cuadrados con la ayuda de Excel. Primero

    necesitamos el factor de correccin, gran total al cuadrado entre el nmero de unidades

    experimentales, 12 en este caso.

    Ahora la suma de cuadrados de total, todos los datos al cuadrado menos el factor de

    correccin.

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    38

    Seguimos con la suma de cuadrados de tratamientos. Ocupamos el total de

    cada una de las dietas.

    Como son la suma de tres murcilagos dividimos entre 3.

    Finalmente la suma de cuadrados del error, restando a la total la de tratamientos, C15 -

    C16.

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    39

    El cuadro de anlisis de varianza ser el siguiente, resuelto por el mismo Excel con la

    herramienta Anlisis de datos.

    Ntese que se toma la opcin agrupado por columnas y luego se da click en aceptar.

    F. de V. S. C. g. l. C. M. Fc P F 0.05

    Dietas 1683.33 3 561.11 22.37 0.00 4.07

    Error 200.67 8 25.08 Total 1884.00 11

    Conclusin: como el valor de F calculada es mucho mayor que el de tabla a nivel de 0.05

    (22.37 > 4.07) y el valor de P es prcticamente de cero, podemos afirmar que hay

    diferencias en el peso de los murcilagos alimentados con las diferentes frmulas.

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    40

    Si ahora deseamos resolver con Sas o Minitab debemos acomodar los datos tal y como

    vienen en el libro de campo, o sea que cada una de las 12 medidas de peso ocupa una fila

    con toda la informacin referente a la misma.

    Peso Dieta Sujeto

    98 Normal 1

    120 E1 4

    130 E2 7

    140 E3 10

    105 Normal 2

    123 E1 5

    118 E2 8

    135 E3 11

    110 Normal 3

    115 E1 6

    120 E2 9

    138 E3 12

    Podemos prescindir de la columna del sujeto porque no es un factor de variacin

    planeada. Hay que notar que los murcilagos sometidos a cada dieta fueron diferentes, es

    decir estn anidados dentro de las dietas.

    Copiando los datos en Minitab seguimos la ruta Stat > Anova > One way y luego en el

    cuadro de dilogo seleccionamos como respuesta al peso y como factor a la dieta.

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    41

    Para tener el resultado.

    Analysis of Variance for Peso

    Source DF SS MS F P

    Dieta 3 1683.3 561.1 22.37 0.000

    Error 8 200.7 25.1

    Total 11 1884.0

    En Sas tendramos lo siguiente en el block de notas:

    data murci; input peso dieta $ sujeto; cards;

    98 Normal 1

    120 E1 4

    130 E2 7

    140 E3 10

    105 Normal 2

    123 E1 5

    118 E2 8

    135 E3 11

    110 Normal 3

    115 E1 6

    120 E2 9

    138 E3 12

    proc anova; class dieta; model peso = dieta;

    run;

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    42

    Con el resultado siguiente:

    Sum of Mean Source DF Squares Square F Value Pr > F Model 3 1683.333333 561.111111 22.37 0.0003 Error 8 200.666667 25.083333 Corrected total 11 1884.000000

    Omitimos el resto del resultado porque el modelo incluye solamente al factor dieta.

    La variacin causada por el factor dieta es 22.37 veces mayor que la causada por factores

    no planeados.

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    43

    DISEO BLOQUES COMPLETOS AL AZAR (DOS FACTORES, TWO WAY)

    Generalidades

    El DBCA es quizs el de mayor uso en los experimentos de campo. Las unidades

    experimentales se agrupan en estratos o bloques (segundo factor, comnmente llamado

    repeticiones), dentro de los cuales se asignan aleatoriamente los tratamientos en estudio.

    Nota: En la experimentacin agrcola en suelo es comn que se divida el terreno en partes

    iguales y cada una de ellas es un bloque. El factor que est actuando es la variabilidad

    natural del suelo. La experiencia ha demostrado que comnmente s hay diferencias entre

    los bloques de suelo.

    El error se reduce en comparacin con el diseo completamente al azar, por lo que debe

    haber una verdadera influencia del factor de bloqueo para justificar su implementacin.

    Es necesario mantener la variabilidad entre unidades experimentales dentro de un bloque

    lo mas pequea posible, pero maximizando a la vez las diferencias entre bloques. Esto

    resulta en minimizacin del error experimental.

    El DBCA resulta til en los casos siguientes:

    1) Cuando el nmero de tratamientos es de 3 a 15. En caso de que el nmero de

    tratamientos sea de 3 a 5, deben tenerse como mnimo seis bloques a fin de

    contar con suficientes grados de libertad para el error experimental.

    2) Cuando se tiene un gradiente de variabilidad o productividad, en cuyo caso

    deben observarse los cuidados siguientes:

    Los bloques deben orientarse de manera perpendicular al gradiente.

    Las unidades experimentales (tratamientos) dentro de cada bloque

    deben disponerse en la misma direccin del gradiente.

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    44

    Modelo lineal aditivo

    yij = + ti + bj + ij

    donde,

    yij = Variable respuesta.

    = Media general (alrededor de la cual oscilan todas las observaciones).

    ti = Efecto del tratamiento i

    bj = Efecto del bloque j

    ij = Variacin debida al azar (causas no pertinentes) = error experimental

    Modelo del anlisis de varianza

    Al considerar la variacin total, las causas parciales de variacin sern: 1) Variacin entre

    tratamientos, 2) variacin entre bloques y 3) variacin dentro de unidades

    experimentales (variacin atribuible al error experimental, o interaccin de los dos

    factores). Lo anterior se resume en el cuadro siguiente:

    F.V. G.L. S.C. C.M. Fc

    Tratamientos t 1 SCt CMt CMt/CMe

    Bloques b 1 SCb CMb CMb/CMe

    Error (t-1)(b-1) SCT (SCt + SCb) CMe

    Total tb 1 SCT

    Ejemplo (datos de Juan Paulo Rojas Murillo, Fac. de Agrobiologa, UMSNH)

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    45

    Se aplicaron cinco dosis de fertilizacin a plantas de zarzamora en cinco bloques que

    fueron variaciones naturales de suelo. Los resultados para la variable de respuesta altura

    de planta fueron los siguientes:

    Dosis Fert B 1 B 2 B 3 B 4 B 5 1 2.45 3.4 2.87 3.52 3.52 2 3.75 3.1 3.37 3.42 3.25 3 2.2 2.37 3.27 3.45 2.77 4 4 2.62 3.52 2.92 3.65 5 3.22 3.42 3.9 2.75 3.62

    Este arreglo nos sirve para hacer el anlisis de datos con Excel.

    El procedimiento es igual al del

    diseo Completamente al Azar, con

    la diferencia de que se selecciona

    anlisis de varianza para dos

    factores con una sola muestra por

    grupo

    En este ejemplo

    Desplegando el siguiente resultado

    ANLISIS DE VARIANZA

    Origen de las

    variaciones

    Suma de

    cuadrados

    Grados de

    libertad

    Promedio de los

    cuadrados Fc P > F

    Valor crtico

    para F

    Fertilizacin 1.184744 4 0.296186 1.2567108 0.32737056 3.00691728

    Bloques 0.567064 4 0.141766 0.60151008 0.66700923 3.00691728

    Error 3.770936 16 0.2356835

    Total 5.522744 24

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    46

    Como al capturar los datos en Excel las filas correspondieron a las dosis de fertilizacin y

    las columnas a los bloques, se edita el cuadro de resultados anotando dichos nombres en

    el lugar correspondiente.

    Interpretacin de los resultados

    Dado que los valores de P > F son

    superiores a 0.05, tanto para dosis de

    fertilizacin como para bloques se

    concluye que cualquiera de las dosis

    utilizadas produce el mismo crecimiento

    en altura de planta y que en este caso

    los bloques en realidad no

    representaron un segundo factor. El factor fertilizacin fue responsable del 44 % de la

    variacin total y los bloques del 21 %, mientras que el error contiene el 35 %.

    Anlisis con Sas

    El arreglo necesario es el mismo que tiene la libreta de campo. De este modo el programa

    quedar como se muestra a continuacin:

    data zarza; input fer bloq alt ; cards; 1 1 2.45 1 2 3.75 1 3 2.2 1 4 4 1 5 3.22 2 1 3.4 2 2 3.1 2 3 2.37 2 4 2.62 2 5 3.42 3 1 2.87 3 2 3.37 3 3 3.27 3 4 3.52 3 5 3.9 4 1 3.52

    Fertilizacin

    Bloques

    Error

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    47

    4 2 3.42 4 3 3.45 4 4 2.92 4 5 2.75 5 1 3.52 5 2 3.25 5 3 2.77 5 4 3.65 5 5 3.62 ; proc anova; classes fer bloq; model alt = fer bloq; run;

    Que al correrlo muestra la siguiente salida

    SAS Analysis of Variance Procedure Class Level Information Class Levels Values FER 5 1 2 3 4 5 BLOQ 5 1 2 3 4 5 Number of observations in data set = 25 SAS Analysis of Variance Procedure Dependent Variable: ALT Sum of Mean Source DF Squares Square F Value Pr > F Model 8 1.75180800 0.21897600 0.93 0.5192 Error 16 3.77093600 0.23568350 Corrected Total 24 5.52274400 R-Square C.V. Root MSE ALT Mean 0.317199 15.10869 0.485472 3.21320000

    COMPONENTES DEL MODELO. En este caso el modelo incluye a tratamientos y bloques.

    Source DF Anova SS Mean Square F Value Pr > F FER 4 0.56706400 0.14176600 0.60 0.6670 BLOQ 4 1.18474400 0.29618600 1.26 0.3274

    Anlisis con Minitab

    El procedimiento es igual al del diseo anterior con la diferencia de que ahora en el men

    se sigue la ruta

    Stat > ANOVA > Two-way

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    48

    Luego aparece el cuadro de dilogo donde hay que seleccionar la variable respuesta y los

    dos factores.

    Y al dar click en OK aparece el siguiente resultado

    Two-way ANOVA: Altura versus Dosis Fert, Bloque

    Analysis of Variance for Altura

    Source DF SS MS F P

    Dosis Fe 4 0.567 0.142 0.60 0.667

    Bloque 4 1.185 0.296 1.26 0.327

    Error 16 3.771 0.236

    Total 24 5.523

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    49

    ANLISIS DE VARIANZA DE UNA Y DOS VAS O FACTORES (DISEOS COMPLETAMENTE

    AL AZAR Y BLOQUES COMPLETOS AL AZAR) CON R.

    Primero que nada hay que sealar que debemos situarnos en la carpeta (directorio) en

    donde tenemos el archivo de datos en formato txt o block de notas, y que all mismo se

    guarda el archivo de instrucciones o script. Para esto seguimos la ruta Archivo > cambiar

    dir

    Una vez que estamos en la carpeta deseada podemos crear el script. Hay varias

    alternativas para realizar el anlisis de varianza, aqu se muestra una de ellas.

    Ejemplo de script para anlisis de varianza de dos vas o factores

    o

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    50

    flecha hacia la izquierda

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    51

    odf

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    52

    > print(names(odf)) [1] "trat" "rep" "yield" > > mod1 print(summary(mod1)) Df Sum Sq Mean Sq F value Pr(>F)

    trat 4 4995 1248.7 11.233 0.000503 ***

    rep 3 2004 668.0 6.009 0.009681 **

    Residuals 12 1334 111.2

    Interpretacin: La variacin por

    tratamientos es 11.2 veces mayor que

    la atribuida a causas no planeadas, y la

    variacin por repeticiones 6 veces. Hay

    diferencias entre tratamientos (Pr>F =

    0.0005) y tambin entre repeticiones

    (Pr>F = 0.0009). Recordar que la

    hiptesis nula de igualdad se rechaza cuando P < 0.05, como en este caso. Los

    tratamientos son causantes del 62 % de la variacin total, las repeticiones del 33 % y el

    error de solo el 5 %.

    Anlisis de varianza de un factor

    Al medir la longitud del cuerpo de una especie de insecto en tres sitios y dos repeticiones,

    el resultado fue el siguiente.

    Sitio

    Repeticin A B C

    R1 45 63 70 R2 57 77 74

    Y el archivo de datos tendra la siguiente forma:

    repeticion sitio longitud R1 A 45 R1 B 63 R1 C 70

    1248.7

    668

    111.2

    Tratamientos

    Repeticiones

    Error

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    53

    R2 A 57 R2 B 77 R2 C 74

    El script es el siguiente:

    oF = 0.124.

    Como el mximo admitido para

    rechazar la hiptesis nula de igualdad es

    0.05, se concluye que se acepta H0 y por

    lo tanto no hay diferencias en el tamao

    de los insectos en los sitios

    muestreados. La variacin atribuida a los sitios fue 4.5 veces mayor que la variacin por

    otras causas. Esto es el 82 % del total.

    Sitios

    Error

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    54

    COMPARACIONES MLTIPLES DE MEDIAS

    Como la prueba de F solamente nos dice si hay diferencias entre los tratamientos o niveles

    de un factor, pero no nos dice cuales son los mejores o si algunos de ellos son iguales

    entre s pero diferentes del resto, es necesario realizar una comparacin entre los

    tratamientos para determinar las diferencias especficas al compararlos. A continuacin se

    describen las frmulas para algunas de las mas utilizadas. Todas las que se mencionan

    requieren que el tamao de muestra sea uniforme, es decir que el nmero de repeticiones

    o bloques sea el mismo para todos los tratamientos o niveles del factor.

    a) Prueba de t (DMS, LSD)

    r

    CMetSMD

    *2*... )(=

    Donde D.M.S. quiere decir diferencia mnima significativa entre dos

    tratamientos para que puedan considerarse realmente diferentes.

    CMe es el cuadrado medio del error experimental.

    r es el nmero de repeticiones o bloques.

    )(t es un valor tabulado para un nivel de significancia y grados de

    libertad del error.

    b) Prueba de Tukey (DSH, HSD)

    r

    CMeqHSD

    it*... ),( =

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    55

    Donde D.S.H. quiere decir diferencia mnima significativa honesta entre dos

    tratamientos para que puedan considerarse realmente diferentes.

    CMe es el cuadrado medio del error experimental.

    r es el nmero de repeticiones o bloques.

    Importante: Si existe submuestreo, es decir, cada unidad experimental contiene

    mas de un individuo, sustituimos r (ere) por n (ene). Por ejemplo, si se tomaron

    medidas en tres ramas de cada una de cinco plantas n = 15.

    ),( itq es un valor tabulado para un nivel de significancia , un nmero t de

    tratamientos y grados de libertad del error.

    Igual que la anterior, esta prueba solo debe usarse cuando el tamao de las

    muestras es igual.

    c) Prueba de rango mltiple de Duncan

    Esta prueba fue diseada para determinar diferencias entre pares especficos

    de medias. Las medias se ordenan en orden ascendente. Existe un valor de

    diferencia mnima significativa para la comparacin de dos medias,

    determinado por el nmero de medias que se incluyen en la comparacin de

    stas.

    M1 M2 M3 M4 M5

    Si comparamos la media 1 con la 5 habr un valor de DMS para cinco medias

    involucradas; si comparamos la media 2 con la 4 o la 1 con la 3 habr un valor

    de DMS para tres medias involucradas.

    )11

    (*)2

    (*21

    )(rr

    CMetLS +=

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    56

    Donde LS es la diferencia mnima significativa entre un par de tratamientos que

    involucra n medias, para que estos puedan ser considerandos realmente

    diferentes.

    CME es el cuadrado medio del error experimental

    r es el nmero de repeticiones o bloques.

    )(t es un valor tabulado para un nivel de significancia y grados de

    libertad del error.

    d) Prueba de Scheff

    ftr

    CMeSD )1(*

    2.. =

    Donde t = nmero de promedios (tratamientos o niveles) que se comparan

    CMe es el cuadrado medio del error experimental

    r es el nmero de repeticiones

    f0,05 es un valor tabulado. Utiliza la distribucin F.

    En general, la prueba de Scheff es mas rigurosa que la de Tukey para detectar

    diferencias significativas. En experimentos de mejoramiento de plantas, cuando se

    comparan cultivares es comn utilizar la prueba de Tukey, mientras que en experimentos

    mas complicados como pruebas de fertilizacin, se aplica la prueba de Scheff.

    Ejemplo con SAS

    El siguiente conjunto de datos corresponde a la prueba de cinco tratamientos de

    hormonas promotoras de crecimiento en zarzamora en cinco repeticiones midiendo como

    variable respuesta la longitud de tres ramas laterales (Datos de Juan Paulo Rojas Murillo,

    fac. de Agrobiologa, UMSNH).

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    57

    data edgar; input trat rep lateral long; cards; 3 1 1 221 3 1 2 171 3 1 3 194 2 2 1 237.5 2 2 2 240 2 2 3 122.5 4 2 1 89 4 2 2 76.5 4 2 3 45 3 3 1 159 3 3 2 193 3 3 3 82 5 3 1 100.63 5 3 2 94.38 5 3 3 90.5 1 4 1 126.67 1 4 2 136.67 1 4 3 56.67 3 4 1 140 3 4 2 138 3 4 3 108 4 5 1 63.25 4 5 2 81.25 4 5 3 115.88 1 1 1 166.67 1 1 2 128.33 1 1 3 53.33 4 1 1 102.5 4 1 2 161.25 4 1 3 89.63 5 2 1 79.38 5 2 2 47.5 5 2 3 72.25 1 3 1 265 1 3 2 250 1 3 3 190 4 3 1 116.25 4 3 2 93.13 4 3 3 88.75 2 3 1 111.25 2 3 2 110 2 3 3 62.75 4 4 1 75.83 4 4 2 178 4 4 3 107 3 5 1 180 3 5 2 92 3 5 3 99

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    58

    2 5 1 125 2 5 2 133.25 2 5 3 236.67 2 1 1 91 2 1 2 152.5 2 1 3 128.25 5 1 1 47.25 5 1 2 47.75 5 1 3 31.75 1 2 1 220 1 2 2 190 1 2 3 120 3 2 1 86.6 3 2 2 104 3 2 3 144.6 5 4 1 74.88 5 4 2 80.38 5 4 3 87.63 2 4 1 113.75 2 4 2 110 2 4 3 157.5 1 5 1 223.33 1 5 2 131.67 1 5 3 336.67 5 5 1 76.38 5 5 2 57.5 5 5 3 72.13 proc anova; class trat rep; model long = trat rep; means trat / tukey lsd duncan scheffe lines; run;

    Las prueba de separacin de medias de Tukey, T (lsd), Duncan y Scheff se solicitan en el

    penltimo rengln del programa y la salida que proporciona SAS es la siguiente:

    SAS

    Analysis of Variance Procedure

    Class Level Information

    Class Levels Values

    TRAT 5 1 2 3 4 5

    REP 5 1 2 3 4 5

    Number of observations in data set = 75

    SAS

    Analysis of Variance Procedure

    Dependent Variable: LONG

    Sum of Mean

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    59

    Source DF Squares Square F Value Pr > F

    Model 8 102611.8610 12826.4826 4.96 0.0001

    Error 66 170663.7746 2585.8148

    Corrected Total 74 273275.6355

    R-Square C.V. Root MSE LONG Mean

    0.375489 40.64760 50.85091 125.101867

    Source DF Anova SS Mean Square F Value Pr > F

    TRAT 4 97194.56034 24298.64008 9.40 0.0001

    REP 4 5417.30063 1354.32516 0.52 0.7186

    HASTA AQU SE CONCLUYE QUE HAY DIFERENCIAS ENTRE LOS TRATAMIENTOS. AHORA HAY QUE DETERMINAR CUALES

    TRATAMIENTOS SON IGUALES ENTRE S Y CUALES SON DIFERENTES.

    SAS

    Analysis of Variance Procedure

    T tests (LSD) for variable: LONG

    NOTE: This test controls the type I comparisonwise error rate not

    the experimentwise error rate.

    Alpha= 0.05 df= 66 MSE= 2585.815

    Critical Value of T= 2.00

    Least Significant Difference= 37.072

    Means with the same letter are not significantly different.

    T Grouping Mean N TRAT

    A 173.00 15 1

    A

    A 142.13 15 2

    A

    A 140.81 15 3

    B 98.88 15 4

    B

    B 70.69 15 5

    SAS

    Analysis of Variance Procedure

    Duncan's Multiple Range Test for variable: LONG

    NOTE: This test controls the type I comparisonwise error rate, not

    the experimentwise error rate

    Alpha= 0.05 df= 66 MSE= 2585.815

    Number of Means 2 3 4 5

    Critical Range 37.10 39.01 40.27 41.17

    Means with the same letter are not significantly different.

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    60

    Duncan Grouping Mean N TRAT

    A 173.00 15 1

    A

    A 142.13 15 2

    A

    A 140.81 15 3

    B 98.88 15 4

    B

    B 70.69 15 5

    SAS

    Analysis of Variance Procedure

    Tukey's Studentized Range (HSD) Test for variable: LONG

    NOTE: This test controls the type I experimentwise error rate, but

    generally has a higher type II error rate than REGWQ.

    Alpha= 0.05 df= 66 MSE= 2585.815

    Critical Value of Studentized Range= 3.966

    Minimum Significant Difference= 52.076

    Means with the same letter are not significantly different.

    Tukey Grouping Mean N TRAT

    A 173.00 15 1

    A

    B A 142.13 15 2

    B A

    B A 140.81 15 3

    B

    B C 98.88 15 4

    C

    C 70.69 15 5

    SAS

    Analysis of Variance Procedure

    Scheffe's test for variable: LONG

    NOTE: This test controls the type I experimentwise error rate but

    generally has a higher type II error rate than REGWF for all

    pairwise comparisons

    Alpha= 0.05 df= 66 MSE= 2585.815

    Critical Value of F= 2.51083

    Minimum Significant Difference= 58.845

    Means with the same letter are not significantly different.

    Scheffe Grouping Mean N TRAT

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    61

    A 173.00 15 1

    A

    B A 142.13 15 2

    B A

    B A 140.81 15 3

    B

    B C 98.88 15 4

    C

    C 70.69 15 5

    Las pruebas de Tukey y Scheff dan resultados similares.

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    62

    TRANSFORMACIN DE DATOS

    Debemos estar conscientes de que los supuestos del anlisis de varianza no siempre se

    cumplen y que de llevarse a cabo un anlisis estadstico con resultados que no cumplan

    con dichos supuestos se puede llegar a una conclusin equivocada. Aunque todava no es

    prctica generalizada, es muy conveniente aplicar pruebas de bondad de ajuste,

    homocedasticidad e independencia antes de realizar un anlisis de varianza. No las

    abarcaremos en este texto, sino en una prxima versin. Por ahora nos limitamos a

    mencionar que suele utilizarse la chi cuadrada para distribuciones discretas como la

    binomial o la de Piosson, y la de Anderson Darling para distribuciones continuas como la

    normal, o la de Shapiro Wilk especficamente para esta ltima.

    Mediante una transformacin adecuada puede conseguirse que una variable que no se

    distribuye normalmente pase a tener una distribucin cercana a la normal. Las

    poblaciones con varianzas desiguales pueden convertirse en homocedsticas (varianzas

    homogneas) mediante una transformacin apropiada. Las transformaciones mas usadas

    son las siguientes:

    Transformacin logartmica

    El modelo lineal indica que los efectos del bloque, el tratamiento y el error experimental,

    son aditivos. Si los niveles de los factores provocan un aumento o disminucin de las

    variables medidas en proporcin que tiende a ser geomtrica, entonces se dice que los

    efectos son multiplicativos y no aditivos. Una transformacin logartmica transformar en

    aditiva la relacin multiplicativa. Log(x), es til cuando los datos crecen en sentido

    exponencial o cuando las desviaciones estndares de las muestra son aproximadamente

    proporcionales a los promedios o hay evidencia de efectos principales multiplicativos de

    los tratamientos en vez de aditivos. Cuando hay muchos ceros, dado que log(0) no est

    definido se acostumbra utilizar log(x+1).

    Transformacin raz cuadrada

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    63

    Se aconseja cuando los datos estn dados por nmeros enteros procedentes de conteo

    (distribucin discreta), como por ejemplo el nmero de manchas en una hoja o el nmero

    de bacterias en una placa, el nmero de insectos de una especie, los das a floracin, etc.,

    los nmeros observados tienden a presentar una distribucin de Poisson. La

    transformacin X + 0.5 es til cuando los nmeros observados son pequeos (0 10), por

    ejemplo son acontecimientos pocos comunes, tienen una posibilidad muy baja de ocurrir

    en cualquier individuo. Si las cifras de los conteos estn generalmente por arriba de 100 es

    probable que no se requiera transformacin.

    Normalmente esta transformacin determina que las varianzas de los grupos sean ms

    homogneas. Tambin es aplicable a las distribuciones sesgadas porque acorta la cola

    larga.

    Transformacin arco-seno raz cuadrada del porcentaje o proporcin

    La transformacin Arcoseno X /100 es til cuando los datos son expresados en por ciento

    o son proporciones de la muestra total, como por ejemplo el porcentaje de individuos

    enfermos, porcentaje de plantas sobrevivientes, proporcin de plantas con doble

    mazorca, etc. Por lo general estos datos tienen una distribucin binomial. La

    transformacin arcoseno tiende a igualar las varianzas y a normalizar los datos. Esta

    transformacin asume que todas las proporciones transformadas tienen el mismo valor de

    n. Si n es aproximadamente igual para los distintos grupos an se puede utilizar esta

    transformacin. Si los valores de porcentaje estn entre 30 y 70 no se requiere

    transformacin,y si todos estn por debajo de 20 puede utilizarse la raz cuadrada.

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    64

    PRUEBAS NO PARAMTRICAS

    Las transformaciones de datos van dirigidas a forzar a que los supuestos del anlisis de

    varianza se cumplan cuando esto no ocurre, pero puede darse el caso de que los datos

    transformados sigan sin ajustarse a uno o mas de los supuestos.

    Bajo esta situacin muchos opinan que en lugar de transformar los datos hay que trabajar

    con ellos conservndolos como son. Para ello existe la alternativa de las pruebas no

    paramtricas, que se consideran menos precisas y que no han tenido el mismo desarrollo

    que el anlisis de varianza, pero se espera que pronto lo tengan.

    Estas pruebas se pueden aplicar bajo cualquier distribucin de probabilidad y en ausencia

    de independencia entre variables; en lugar de trabajar con la media utilizan la mediana y

    por lo tanto son menos afectadas por valores extremos (atpicos, outliers). En este texto

    solo mencionaremos dos de ellas y como aplicarlas con el programa Minitab.

    Prueba de Kruskal-Wallis

    Es el equivalente no paramtrico del anlisis de varianza de un factor (diseo

    completamente al azar) y se prueba la diferencia entre medianas de tres o mas grupos de

    datos.

    La hiptesis a probar es

    Ho: Xmed0 = Xmed1 = Xmed2 =

    Ha:Xmed0 Xmed1 Xmed2

    En Minitab se sigue la ruta Stat>nonparametrics> Kruskal-Wallis.

    Ejemplo: Se cuenta el nmero de insectos polinizadores que visitan una especie en tres

    diferentes horarios. Se desea saber si hay diferencias en la cantidad de polinizadores entre

    horarios.

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    65

    El resultado se muestra a continuacin

    Kruskal-Wallis Test on Num inse

    horario N Median Ave Rank Z

    1 4 70.00 2.8 -2.55

    2 4 85.00 10.5 2.72

    3 4 76.50 6.3 -0.17

    Overall 12 6.5

    H = 9.27 DF = 2 P = 0.010

    * NOTE * One or more small samples

    Como el valor de P es de 0.01 se rechaza la hiptesis nula y se concluye que el nmero de

    insectos polinizadores que visitan las flores es diferente en los tres horarios muestreados.

    Prueba de Friedman

    Es el equivalente no paramtrico del diseo bloques completos al azar o anlisis de

    varianza de dos factores. Se aplica a observaciones pareadas.

    La hiptesis a probar es

    Ho: Xmed0 = Xmed1 = Xmed2 =

    Ha:Xmed0 Xmed1 Xmed2

    Ejemplo: Se mide la produccin diaria de leche en 7 vacas bajo tres tratamientos: Sin

    sonidos, con ruido y con msica clsica.

    Los datos aparecen a continuacin

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    66

    Vaca 1 2 3 4 5 6 7 1 2 3 4 5 6 7 1 2 3 4 5 6 7

    Litros 14 16 12 18 10 14 16 10 8 12 10 10 8 8 16 16 16 16 14 18 18

    Tratamiento Sin Sin Sin Sin Sin Sin Sin Ruido Ruido Ruido Ruido Ruido Ruido Ruido Clasica Clasica Clasica Clasica Clasica Clasica Clasica

    Se capturan los datos en columnas. Se sigue la ruta Stat > Nonparametrics > Friedman. En

    el cuadro de dilogo se seleccionan las variables Response para la produccin de leche,

    Treatment para el tratamiento y blocks para las repeticiones o bloques.

    Como el valor de P es de 0.009, recordando que el mximo aceptable es de 0.05 se

    rechaza la hiptesis nula y se concluye que hay diferencias en la produccin de leche

    como respuesta a los tratamientos evaluados.

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    67

    DISEO CUADRADO LATINO

    El Diseo Cuadrado Latino corresponde al efecto de tres factores sin tomar en cuenta las

    interacciones entre ellos. Agrupa los tratamientos (factor 1) tanto en filas (hileras, factor

    2) como en columnas (bloques, factor 3), dentro de las cuales stos se distribuyen de

    manera aleatoria. Ello permite eliminar la variabilidad asociada con estas fuentes de

    variacin, reduciendo a la vez el error experimental. Se tienen las siguientes

    caractersticas:

    El nmero de tratamientos (t) ser igual tanto al nmero de hileras como al

    nmero de columnas.

    Cada hilera o columna constituye una repeticin completa de los

    tratamientos.

    La distribucin de tratamientos debe ser de tal forma que no se repita

    ningn tratamiento en filas ni en columnas.

    El nmero total de unidades experimentales ser un cuadrado perfecto, es

    decir, t2.

    El DCL resulta til en los casos siguientes:

    Cuando el nmero de tratamientos es de 4 a 10.

    Cuando en experimentos agrcolas se tiene un gradiente de variabilidad del

    suelo en dos sentidos perpendiculares (razn por la cual se forman filas y

    columnas).

    Desventajas del DCL:

    1) El nmero total de unidades experimentales se incrementa considerablemente a

    medida que aumenta el nmero de tratamientos en estudio. No se recomienda

    este diseo para casos en que se prueban mas de 10 tratamientos.

    2) El nmero de grados de libertad para el error experimental se reduce.

    Modelo lineal aditivo

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    68

    yijk = + hi + cj + tk(ij) + ijk

    donde,

    yijk = Variable respuesta

    = Media general (alrededor de la cual oscilan todas las observaciones)

    hi = Efecto de la hilera i

    cj = Efecto de la columna j

    tk = Efecto del tratamiento k (siendo k una funcin de i e j)

    ijk = Variacin debida al azar (causas no planeadas) = error experimental

    Modelo del anlisis de varianza

    Al considerar la variacin total, las causas parciales de variacin sern las que se

    muestran en el cuadro siguiente:

    F.V. G.L. S.C. C.M. Fc

    Hileras h-1 SCh CMh CMh/CMe

    Columnas c-1 SCc CMc CMc/CMe

    Tratamientos t-1 SCt CMt CMt/CMe

    Error (t-1)(t-2) SCT (SCh + SCc + SCt) CMe

    Total t 2 1 SCT

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    69

    Ejemplo (Datos de Jos Lpez Medina, fac. de Agrobiologa, UMSNH)

    En un experimento realizado en Plant City, Florida, se evalu el efecto del nitrgeno sobre

    el rendimiento de fresa cultivar Sweet Charlie. Para ello, semanalmente se suministraron

    dos unidades del elemento va sistema de riego a partir de la floracin, utilizando cuatro

    fuentes de fertilizante nitrogenado e incluyendo un tratamiento sin fertilizante. El

    experimento se condujo bajo un diseo en cuadrado latino 5 x 5.

    Las especificaciones de la plantacin fueron: camas de 1.22 m de ancho; 30 cm entre

    plantas y 2 hileras por cama, 2. Esto equivale a una poblacin de 55,556 plantas/ha.

    Las especificaciones del experimento fueron:

    Nmero de tratamientos: 5

    Trat. A: Sulfato de amonio [(NH4)2SO4]

    Trat. B: Nitrato de amonio [NH4NO3]

    Trat. C: Nitrato de Calcio [Ca(NO3)2]

    Trat. D: Nitrato de sodio [NaNO3]

    Trat. E: Sin fertilizante (testigo)

    Tamao de unidades experimentales: parcelas de 3 m de largo, con un total de 21

    plantas.

    La distribucin de los tratamientos dentro de hileras y columnas se hizo de la manera

    siguiente:

    Se trazaron las hileras siguiendo el sentido de las camas.

    Se trazaron las columnas de manera perpendicular a las hileras.

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    70

    Se distribuyeron los tratamientos de tal forma que ninguno de ellos se repitiera ni

    en hileras ni en columnas, tal como se muestra en el cuadro siguiente:

    Columnas

    Hileras I II III IV V

    1 A B C D E

    2 E A B C D

    3 D E A B C

    4 C D E A B

    5 B C D E A

    A fin de evitar que los tratamientos estn juntos de manera sistemtica (ej.: AB,

    CD, etc.), se sortean las hileras y luego las columnas; finalmente, se enumeran las

    unidades experimentales de manera progresiva. Ejemplo del cuadro final:

    Columnas

    Hileras III V II I IV

    5

    1

    D

    2

    A

    3

    C

    4

    B

    5

    E

    2

    10

    B

    9

    D

    8

    A

    7

    E

    6

    C

    4

    11

    E

    12

    B

    13

    D

    14

    C

    15

    A

    1

    20

    C

    19

    E

    18

    B

    17

    A

    16

    D

    3

    21

    A

    22

    C

    23

    E

    24

    D

    25

    B

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    71

    Toma de datos. Se sugiere recopilar los datos del experimento de la manera siguiente:

    No. u. exp.

    Hilera

    Columna

    Trat.

    Rendimiento

    (kg/parcela)

    1 5 3 D 30.3

    2 5 5 A 33.3

    3 5 2 C 30.3

    4 5 1 B 29.9

    5 5 4 E 25.8

    6 2 4 C 33.0

    7 2 1 E 24.8

    8 2 2 A 32.6

    9 2 5 D 29.0

    10 2 3 B 29.5

    11 4 3 E 26.7

    12 4 5 B 32.8

    13 4 2 D 29.9

    14 4 1 C 31.4

    15 4 4 A 30.4

    16 1 4 D 31.1

    17 1 1 A 32.1

    18 1 2 B 33.1

    19 1 5 E 28.2

    20 1 3 C 29.1

    21 3 3 A 31.9

    22 3 5 C 30.6

    23 3 2 E 21.7

    24 3 1 D 28.8

    25 3 4 B 30.1

  • Notas de Matemticas III (Diseos experimentales) Jos Lpez Medina

    UMSNH. Diciembre de 2012 Carlos Alberto Ramrez Mandujano

    72

    Resultados:

    El rendimiento acumulado por ao durante el primer ao de evaluacin se presenta en los

    cuadros siguientes:

    Rendimiento acumulado (en ton/ha) por hileras y columnas

    Columnas

    Total

    hileras

    Hileras III V II I IV (h)

    5 30.3 33.3 30.3 29.9 25.8 149.6

    2 29.5 29 32.6 24.8 33 148.9

    4 26.7 32.8 29.9 31.4 30.4 151.2

    1 29.1 28.2 33.1 32.1 31.1 153.6

    3 31.9 30.6 21.7 28.8 30.1 143.1

    Total

    colum. (c) 147.5 153.9 147.6