Modelos de Efectos MixtosModelos de Efectos Mixtos Aplicaciones en mejoramiento gen etico con R Rau...

30
Modelos de Efectos Mixtos Aplicaciones en mejoramiento gen´ etico con R Ra´ ul Eyzaguirre 7 de marzo de 2017 ´ Indice 1. Introducci´ on 3 2. Modelos de efectos mixtos 3 2.1. Descripci´ on general .................................... 3 2.2. Modelos de dise˜ no experimental ............................. 4 2.3. El DBCA como un modelo de efectos mixtos ..................... 4 2.4. Diferencia entre efectos fijos y aleatorios ........................ 5 2.5. BLUEs and BLUPs .................................... 5 2.6. El enfoque bayesiano ................................... 6 2.6.1. El teorema de Bayes ............................... 6 2.6.2. Algunas diferencias entre el enfoque cl´ asico y el bayesiano .......... 6 2.6.3. Distribuciones a priori no informativas ..................... 7 2.6.4. Modelos jer´ arquicos ............................... 7 2.6.5. Planteamiento bayesiano para un modelo de dise˜ no experimental ...... 8 3. Ajuste de modelos de efectos mixtos con R 8 3.1. Ejemplo 1: DBCA .................................... 8 3.1.1. Datos ....................................... 8 3.1.2. Ajuste por el m´ etodo tradicional ........................ 9 3.1.3. Ajuste con el paquete lme4 ........................... 10 3.1.4. Ajuste con el paquete nlme ........................... 12 3.2. Ejemplo 2: MET con DBCA ............................... 13 3.2.1. Datos ....................................... 13 3.2.2. Ajuste por el m´ etodo tradicional ........................ 13 3.2.3. Ajuste con el paquete lme4 ........................... 15 3.2.4. Ajuste con el paquete nlme ........................... 16 3.3. Ejemplo 3: Dise˜ no Alpha ................................. 16 3.3.1. Datos ....................................... 16 3.3.2. Ajuste usando un modelo de efectos mixtos .................. 16 4. Modelos de efectos mixtos con matriz de pedigr´ ı 17 4.1. alculo de la matriz A .................................. 17 4.2. Paquete pedigreemm ................................... 19 4.2.1. Ajuste del modelo ................................ 19 4.2.2. Ejemplo ...................................... 19 4.3. Paquete MCMCglmm .................................. 21 4.3.1. Ajuste del modelo ................................ 22 4.3.2. Ejemplo ...................................... 22 1

Transcript of Modelos de Efectos MixtosModelos de Efectos Mixtos Aplicaciones en mejoramiento gen etico con R Rau...

Page 1: Modelos de Efectos MixtosModelos de Efectos Mixtos Aplicaciones en mejoramiento gen etico con R Rau l Eyzaguirre 7 de marzo de 2017 Indice 1. Introduccion 3 2. Modelos de efectos mixtos3

Modelos de Efectos MixtosAplicaciones en mejoramiento genetico con R

Raul Eyzaguirre

7 de marzo de 2017

Indice

1. Introduccion 3

2. Modelos de efectos mixtos 32.1. Descripcion general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32.2. Modelos de diseno experimental . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42.3. El DBCA como un modelo de efectos mixtos . . . . . . . . . . . . . . . . . . . . . 42.4. Diferencia entre efectos fijos y aleatorios . . . . . . . . . . . . . . . . . . . . . . . . 52.5. BLUEs and BLUPs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52.6. El enfoque bayesiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.6.1. El teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62.6.2. Algunas diferencias entre el enfoque clasico y el bayesiano . . . . . . . . . . 62.6.3. Distribuciones a priori no informativas . . . . . . . . . . . . . . . . . . . . . 72.6.4. Modelos jerarquicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72.6.5. Planteamiento bayesiano para un modelo de diseno experimental . . . . . . 8

3. Ajuste de modelos de efectos mixtos con R 83.1. Ejemplo 1: DBCA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

3.1.1. Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83.1.2. Ajuste por el metodo tradicional . . . . . . . . . . . . . . . . . . . . . . . . 93.1.3. Ajuste con el paquete lme4 . . . . . . . . . . . . . . . . . . . . . . . . . . . 103.1.4. Ajuste con el paquete nlme . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

3.2. Ejemplo 2: MET con DBCA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133.2.1. Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133.2.2. Ajuste por el metodo tradicional . . . . . . . . . . . . . . . . . . . . . . . . 133.2.3. Ajuste con el paquete lme4 . . . . . . . . . . . . . . . . . . . . . . . . . . . 153.2.4. Ajuste con el paquete nlme . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

3.3. Ejemplo 3: Diseno Alpha . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163.3.1. Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163.3.2. Ajuste usando un modelo de efectos mixtos . . . . . . . . . . . . . . . . . . 16

4. Modelos de efectos mixtos con matriz de pedigrı 174.1. Calculo de la matriz A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174.2. Paquete pedigreemm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

4.2.1. Ajuste del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194.2.2. Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

4.3. Paquete MCMCglmm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214.3.1. Ajuste del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 224.3.2. Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

1

Page 2: Modelos de Efectos MixtosModelos de Efectos Mixtos Aplicaciones en mejoramiento gen etico con R Rau l Eyzaguirre 7 de marzo de 2017 Indice 1. Introduccion 3 2. Modelos de efectos mixtos3

5. Modelos con varianzas heterogeneas 255.1. Un modelo bayesiano para experimentos en varios ambientes . . . . . . . . . . . . 255.2. Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

5.2.1. Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265.2.2. Ajuste del modelo bayesiano con varianzas heterogeneas . . . . . . . . . . . 26

Referencias 30

2

Page 3: Modelos de Efectos MixtosModelos de Efectos Mixtos Aplicaciones en mejoramiento gen etico con R Rau l Eyzaguirre 7 de marzo de 2017 Indice 1. Introduccion 3 2. Modelos de efectos mixtos3

1. Introduccion

Los modelos de efectos mixtos son una clase importante de modelos estadısticos usados endistintos campos. Se les denomina de efectos mixtos porque a algunos de los componentes delmodelo se les atribuyen efectos fijos mientras que a otros efectos aleatorios (que es un efecto fijoy que uno aleatorio, y cuales son sus diferencias, se vera en breve). En general estos modelos sonestimados por maxima verosimilitud (ML) o maxima verosimilitud restringida (REML) aunqueen aplicaciones en mejoramiento son comunes tambien los metodos de Monte Carlo con cadenasde Markov (MCMC).

Tanto con los metodos basados en la maximizacion de la funcion de verosimilitud como conlos metodos MCMC, podrıa haber dificultades. Con ML o REML, los modelos son estimados poralgoritmos iterativos, por lo que con modelos complejos se podrıa tener problemas de convergencia.Ademas, con grandes conjuntos de datos se podrıa tener problemas con el tiempo de computo ocon el lımite de memoria; con modelos relativamente sencillos estos problemas empiezan a aparecercuando se tienen varios miles de registros. En cuanto a los metodos MCMC, las estimaciones serealizan a partir de simulaciones que en teorıa deberıan converger a la distribucion de probabilida-des de las cantidades de interes (esta es la “distribucion estacionaria” de la cadena de Markov). Elprincipal problema aquı es que, con modelos relativamente complejos, estas simulaciones podrıanno converger para ciertos componentes del modelo. Personalmente, he observado este problemacon las varianzas de los modelos.

R [16] cuenta con varias librerıas para ajustar modelos de efectos mixtos, algunas mas especıfi-cas y otras mas generales en cuanto al campo de aplicacion. En las siguientes secciones se mostrarael uso de varias de ellas.

2. Modelos de efectos mixtos

2.1. Descripcion general

La forma general de un modelo de efectos mixtos, asumiendo una distribucion normal paratodos los componentes aleatorios, es la siguiente:

y = Xβββ + Zb + εεε, b ∼ N(0,Ψ), εεε ∼ N(0,Λσ2) (1)

donde

y es el vector respuesta de tamano n× 1.

X es una matriz de diseno para los efectos fijos de tamano n× p.

βββ es el vector de efectos fijos de tamano p× 1.

Z es una matriz de diseno para los efectos aleatorios de tamano n× q.

b es el vector de efectos aleatorios de tamano q × 1.

Usualmente se asume que Λ es simplemente la matriz identidad, lo que equivale a asumir que loserrores son independientes y normalmente distribuidos con varianza constante σ2:

ε ∼ N(0, σ2). (2)

Por su parte, Ψ suele depender de unos pocos parametros incluidos en un vector θθθ, por lo quepara hacer esta dependencia explıcita se suele escribir

b ∼ N(0,Ψθθθ).

3

Page 4: Modelos de Efectos MixtosModelos de Efectos Mixtos Aplicaciones en mejoramiento gen etico con R Rau l Eyzaguirre 7 de marzo de 2017 Indice 1. Introduccion 3 2. Modelos de efectos mixtos3

2.2. Modelos de diseno experimental

En mejoramiento genetico se utilizan los llamados modelos de diseno experimental. Sin lugara dudas, el modelo mas utilizado es el correspondiente al diseno de bloques completos al azar(DBCA)

yij = µ+ αi + βj + εij (3)

donde

αi es el efecto del genotipo i.

βj es el efecto del bloque j.

εij es el efecto del error experimental.

Generalmente se asume que los errores son independientes y que tienen una distribucion normalcon media 0 y varianza σ2:

εij ∼ N(0, σ2). (4)

En este modelo hay dos factores, los genotipos y los bloques, cuyos efectos podrıan considerarsecomo fijos o aleatorios. Normalmente los efectos de los genotipos se consideran como fijos y los delos bloques como aleatorios, con lo que este serıa ya un modelo de efectos mixtos. De hecho, sepodrıa decir que todos los modelos de diseno experimental estan incluidos dentro de la clase demodelos de efectos mixtos.

2.3. El DBCA como un modelo de efectos mixtos

Si todos los modelos de diseno experimental pueden incluirse como una subclase dentro dela clase de modelos de efectos mixtos, entonces debe ser posible escribir el modelo del DBCApresentado en (3) bajo el modelo mas general presentado en (1). Por ejemplo, con tres genotiposy dos bloques, el modelo

yij = µ+ αi + βj + εij

para i = 1, 2, 3 y j = 1, 2 podrıa representarse comoy11y12y21y22y31y32

=

1 1 0 0 1 01 1 0 0 0 11 0 1 0 1 01 0 1 0 0 11 0 0 1 1 01 0 0 1 0 1

µα1

α2

α3

β1β2

+

ε11ε12ε21ε22ε31ε32

que a su vez podrıa escribirse como

y11y12y21y22y31y32

=

1 1 0 01 1 0 01 0 1 01 0 1 01 0 0 11 0 0 1

µα1

α2

α3

+

1 00 11 00 11 00 1

[β1β2

]+

ε11ε12ε21ε22ε31ε32

.

Notese que esta ultima forma corresponde con el modelo de efectos mixtos

y = Xβββ + Zb + εεε

con

y =

y11y12y21y22y31y32

, X =

1 1 0 01 1 0 01 0 1 01 0 1 01 0 0 11 0 0 1

, βββ =

µα1

α2

α3

, Z =

1 01 11 00 11 00 1

, b =

[β1β2

], εεε =

ε11ε12ε21ε22ε31ε32

.

4

Page 5: Modelos de Efectos MixtosModelos de Efectos Mixtos Aplicaciones en mejoramiento gen etico con R Rau l Eyzaguirre 7 de marzo de 2017 Indice 1. Introduccion 3 2. Modelos de efectos mixtos3

2.4. Diferencia entre efectos fijos y aleatorios

Los efectos fijos estan relacionados con factores cuyos niveles evaluados son de principal interesen la investigacion, mientras que los efectos aleatorios con factores cuyos niveles responden alresultado de un muestreo aleatorio. En algunos casos, sin embargo, la diferencia puede ser massutil o conceptual.

Supongase por ejemplo que se desea evaluar tres genotipos utilizando un DBCA con dos blo-ques. Los tres genotipos no han sido escogidos al azar, sino que son el resultado de un proceso deseleccion por parte del investigador, y el objetivo del experimento es comparar la media de estostres genotipos para ciertos atributos. El efecto de los genotipos por lo tanto debe considerarsecomo fijo. Por otro lado, para evaluar estos genotipos se necesitan repeticiones aleatorias, queen este caso corresponden a los bloques. No hay un interes por evaluar el rendimiento en estosdos bloques en particular, los bloques pueden considerarse como una muestra aleatoria desde unahipotetica poblacion de bloques, por lo que su efecto debe considerarse como aleatorio.

Hechas estas precisiones, si se considera el modelo (3), se tienen algunas variables aleatorias yalgunas constantes (o parametros):

yij , β1, β2 y εij son variables aleatorias.

µ, α1, α2, α3 y σ2 son parametros.

Como los efectos de los bloques son considerados aleatorios, habrıa que asignarles una distribucionde probabilidades. Tıpicamente se asume que los efectos aleatorios tienen distribucion normal, porlo que se podrıa asumir una normal con media 0 y varianza σ2

β :

βj ∼ N(0, σ2β). (5)

En terminos mas estadısticos se podrıa entonces decir que:

Un efecto fijo es una constante desconocida (parametro) que se desea estimar. En el ejemploanterior serıa de interes estimar α1, α2 y α3, o las medias de cada uno de los genotipos(µ+ α1, µ+ α2 y µ+ α3).

Un efecto aleatorio es una variable aleatoria y el interes suele ser estimar los parametros desu distribucion de probabilidades. En el ejemplo anterior podrıa ser de interes estimar σ2

β y

σ2.

2.5. BLUEs and BLUPs

En algunos casos uno podrıa estar interesado tambien en los valores de las variables corres-pondientes a los efectos aleatorios; en el ejemplo aquı tratado, en los efectos de los bloques. Acasin embargo surge una cuestion de terminologıa: solo los parametros se “estiman”, las variables se“predicen”.

El teorema de Gauss Markov establece que los estimadores de mınimos cuadrados son los demınima varianza entre todos los estimadores insesgados que son lineales (esto es, que son funcioneslineales de los datos). En este caso, dado que las ecuaciones que intervienen en el proceso iterativode estimacion por ML o REML son basicamente las de mınimos cuadrados, a los estimadores delos efectos fijos se les suele llamar BLUEs (Best Linear Unbiased Estimators) y a las prediccionesde los efectos aleatorios BLUPs (Best Linear Unbiesed Predictors).

La diferencia entre los BLUPs y BLUEs va mas alla del nombre. Cuando un efecto es fijo, cadauno de sus niveles se estima solo con los valores registrados para ese nivel en particular. Cuandoun efecto es aleatorio, la informacion de todos los niveles es utilizada para estimar los parametrosde la poblacion a la que pertenecen los niveles evaluados y, por lo tanto, toda la informacion tieneun efecto en la prediccion de cada nivel en particular.

5

Page 6: Modelos de Efectos MixtosModelos de Efectos Mixtos Aplicaciones en mejoramiento gen etico con R Rau l Eyzaguirre 7 de marzo de 2017 Indice 1. Introduccion 3 2. Modelos de efectos mixtos3

2.6. El enfoque bayesiano

Todo lo escrito hasta el momento sobre los modelos de efectos mixtos corresponde al enfoqueclasico. Sin embargo, hay una corriente importante en estos tiempos conocida como el enfoquebayesiano. La diferencia fundamental entre ambos enfoques es a mi juicio filosofica: El enfoqueclasico considera que los parametros con constantes mientras que el enfoque bayesiano consideraque los parametros son variables (y entonces, con el enfoque bayesiano uno se olvida de los BLUPsy BLUEs, o al menos de sus populares acronimos). Sin embargo, soy de la opinion de que en lapractica lo que define el uso de un enfoque o del otro es una cuestion mas de conveniencia quefilosofica: La estimacion de algunos modelos complejos y de ciertos parametros o funciones de para-metros (como por ejemplo la heredabilidad que es una funcion de varianzas) enfrentan dificultadescon REML, dificultades que se solucionan con relativa facilidad con los metodos MCMC. Resultaque mientras REML va de la mano con el enfoque clasico, los metodos MCMC son el motor de losmetodos bayesianos. Dado que mas adelante se presentaran algunas librerıas que utilizan metodosMCMC, y que por lo tanto tienen un declarado tinte bayesiano, es conveniente presentar aquıalgunos conceptos. Una excelente referencia sobre metodos bayesianos en genetica cuantitativa esSorensen y Gianola [17] y sobre estadıstica bayesiana Gelman et al. [8].

2.6.1. El teorema de Bayes

Toda la estadıstica bayesiana se basa en un resultado simple pero fundamental: El teoremade Bayes. Supongase que se tiene interes en cierto parametro θ y que se tienen datos para ciertavariable y. El teorema de Bayes establece que

p(θ|y) =p(θ) p(y|θ)

p(y). (6)

Dado que los datos son conocidos, p(y) resulta ser una constante de la cual se puede prescindir enel analisis. Por esta razon, es usual escribir el teorema simplemente como

p(θ|y) ∝ p(θ) p(y|θ). (7)

En esta expresion

p(θ) es la distribucion a priori de θ, esto es, la distribucion de probabilidades del parametrode interes antes de conocer los datos.

p(y|θ) es la distribucion de y condicionada por el parametro θ.

p(θ|y) es la distribucion posterior de θ, esto es, la distribucion de probabilidades del para-metro de interes luego de conocer los datos.

2.6.2. Algunas diferencias entre el enfoque clasico y el bayesiano

Ademas de la diferencia fundamental ya mencionada, que los parametros son considerados comoconstantes en el enfoque clasico y como variables en el bayesiano, hay algunas otras diferenciasque vale la pena resaltar:

1. El punto mas controvertido en el enfoque bayesiano es sin lugar a dudas la distribucion apriori p(θ). En esta distribucion recaen tanto los argumentos a favor como los en contrade este enfoque. Esta distribucion no depende de los datos, por lo que se debe suponeralgun valor para poder proceder con el analisis bayesiano. Quienes defienden el enfoquebayesiano sostienen que uno nunca esta en un estado de completa ignorancia cuando afrontaun problema, sino que siempre hay un conocimiento previo que debe ser incluido en elanalisis, y es la distribucion a priori la que permite incluir este conocimiento. Quienes estanen contra de este enfoque sostienen que el establecer cualquier tipo de supuesto sobre estadistribucion le quita objetividad al analisis estadıstico, ya que con los mismos datos perodiferentes distribuciones a priori se obtendrıan resultados diferentes. En el enfoque clasicopor supuesto, no hay que preocuparse por ninguna distribucion a priori.

6

Page 7: Modelos de Efectos MixtosModelos de Efectos Mixtos Aplicaciones en mejoramiento gen etico con R Rau l Eyzaguirre 7 de marzo de 2017 Indice 1. Introduccion 3 2. Modelos de efectos mixtos3

2. La funcion p(y|θ) en (6) y (7) es la funcion de verosimilitud. Mientras que el enfoque clasicose basa en esta funcion, el bayesiano se enfoca en la distribucion posterior p(θ|y). Estotiene profundas consecuencias en la interpretacion de los resultados con uno y otro enfoque.Dado que el objetivo de la inferencia estadıstica es el parametro, los resultados del enfoquebayesiano tienen una interpretacion directa ya que estan en terminos de las probabilidadesdel parametro dados los datos. Los resultados del enfoque clasico en cambio son mas difıcilesde interpretar por estar en terminos de las probabilidades de los datos dado el parametro.Para muestra sobre esta ultima aseveracion revise por ejemplo la definicion formal del valorde probabilidad.

2.6.3. Distribuciones a priori no informativas

Una forma de salvar la polemica causada por la eleccion de una distribucion a priori esta enel uso de las llamadas distribuciones a priori no informativas. En teorıa, una distribucion a priorino informativa es aquella que no favorece a priori ningun valor del parametro. Por ejemplo, situviera un parametro discreto que toma valores enteros entre 1 y 10, la distribucion a priori noinformativa implicarıa asignar una probabilidad de 1

10 a cada valor (a esta distribucion se le conocecomo distribucion uniforme); de esta manera, ninguno de los 10 valores es favorecido con mayor omenor probabilidad a priori.

Obtener distribuciones a priori no informativas no siempre es tan sencillo, pero para modelosestandar como los que se trataran en este documento, las cosas estan mas o menos claras. Conmodelos lineales que contienen parametros de posicion (por ejemplo las medias) y escala (porejemplo las varianzas) la receta es la siguiente:

Una distribucion uniforme para los parametros de posicion.

Una distribucion uniforme para el logaritmo de los parametros de escala.

El supuesto mas general para un parametro de posicion serıa asumir que puede tomar cualquiervalor en los reales. Entonces, la distribucion a priori no informativa serıa una uniforme en losreales, denotada usualmente por U(−∞,∞), que es equivalente a una normal con varianza infinita,denotada por N(µ,∞). Dado que la varianza es infinita (que es lo que hace que la distribucion seatotalmente plana y por lo tanto igual a la uniforme), la definicion de la media es intrascendente, porlo que por conveniencia se suele definir una normal con media cero: N(0,∞). Un problema con estadistribucion es que es impropia, esto es, que su integral es ∞ (toda distribucion de probabilidadesdebe integrar 1). Aunque no siempre, el uso de distribuciones impropias puede traer algunosinconvenientes en el calculo de las distribuciones posteriores, y por cuestiones computacionales,generalmente no son aceptadas por los programas de modelos bayesianos. Para salvar el problema,lo que usualmente se hace en la practica es definir distribuciones normales con una varianzamuy grande, lo suficientemente grande como para emular el comportamiento de una distribucionuniforme (por ejemplo N(0, 106) o N(0, 1010)).

En cuanto a los parametros de escala la distribucion uniforme para el logaritmo del parametro esequivalente a una distribucion gamma inversa con sus dos parametros iguales a cero. Sin embargo,esta distribucion, usualmente denotada por IG(0, 0), es tambien impropia, por lo que en la practicaes usual definir distribuciones gamma inversa con ambos parametros iguales a algun valor muypequeno pero sin llegar a ser cero (por ejemplo IG(10−3, 10−3)).

2.6.4. Modelos jerarquicos

En ciertos casos se tienen grupos de parametros que podrıan considerarse como relacionadoso conectados de alguna manera dada la estructura del problema. Este es el caso por ejemplo delos efectos aleatorios en un modelo de efectos mixtos, ya que los distintos parametros que losrepresentan (esto es, los componentes del vector b en (1), que desde el enfoque bayesiano bienpueden considerarse como parametros) estan relacionados entre sı por tener la misma distribucionde probabilidades. Estas situaciones pueden modelarse de forma jerarquica, de modo que los pa-rametros relacionados dependan de cierta distribucion de probabilidades que a su vez depende de

7

Page 8: Modelos de Efectos MixtosModelos de Efectos Mixtos Aplicaciones en mejoramiento gen etico con R Rau l Eyzaguirre 7 de marzo de 2017 Indice 1. Introduccion 3 2. Modelos de efectos mixtos3

otros parametros, a los que se denomina “hiperparametros”. Bajo este esquema, el resultado (7)puede extenderse a

p(θ, φ|y) ∝ p(φ) p(θ|φ) p(y|θ)donde φ representa el hiperparametro y p(φ) su distribucion a priori (tambien conocida comohiperpriori).

2.6.5. Planteamiento bayesiano para un modelo de diseno experimental

A manera de ejemplo considerese el modelo de un diseno de bloques completos al azar

yij = µ+ αi + βj + εij

donde el efecto de los genotipos, αi, es considerado fijo y el de los bloques, βj , aleatorio. Tıpi-camente, tanto en el enfoque clasico como en el bayesiano, se asume que los errores del modelotienen una distribucion normal, esto es

εij ∼ N(0, σ2).

En el enfoque bayesiano sin embargo es necesario ademas definir distribuciones de probabilidadespara todos los parametros. Como se menciono en la seccion 2.6.3, una practica habitual es trabajarcon distribuciones a priori no informativas, que en este caso para los parametros de posicion podrıanser las siguientes:

µ ∼ N(0, 1010).

αi ∼ N(0, 1010).

βj ∼ N(0, σ2β).

Notese la diferencia entre las distribuciones de αi y βj . Mientras que en el primer caso se estafijando una varianza grande (1010) en el segundo se esta planteando un nuevo parametro (σ2

β).Esta es la forma en la que se diferencian los efectos fijos (αi) de los aleatorios (βj). Como semenciono en la seccion 2.6.4, σ2

β es un hiperparametro, y es necesario asignarle una distribucion

hiperpriori. Dado que tanto σ2β como la varianza del error son parametros de escala, una opcion

no informativa podrıa ser la siguiente:

σ2β ∼ IG(10−3, 10−3).

σ2ε ∼ IG(10−3, 10−3).

3. Ajuste de modelos de efectos mixtos con R

Los dos paquetes mas importantes de uso general para ajustar modelos de efectos mixtos enR son nlme [14] y lme4 [2]. Podrıa decirse que nlme es el predecesor de lme4. Sin embargo, haycosas que se pueden hacer con un paquete pero no con el otro y viceversa. Ademas, la sintaxis enambos paquetes es bastante diferente; personalmente la sintaxis en lme4 me parece mucho massencilla. Existe amplia documentacion sobre la teorıa de los modelos de efectos mixtos junto conel uso de estos dos paquetes, como por ejemplo Pinheiro y Bates [15], Bates [1], y Faraway [7]. Enesta seccion se mostrara como ajustar algunos modelos recurrentes en mejoramiento usando estosdos paquetes.

3.1. Ejemplo 1: DBCA

3.1.1. Datos

Los datos estan disponibles en el paquete st4gi [6] y corresponden a resultados experimentalescon 85 genotipos de camote sembrados siguiendo un DBCA con dos bloques. El paquete st4gi noesta en CRAN por lo que para instalarlo debe escribir lo siguiente:

8

Page 9: Modelos de Efectos MixtosModelos de Efectos Mixtos Aplicaciones en mejoramiento gen etico con R Rau l Eyzaguirre 7 de marzo de 2017 Indice 1. Introduccion 3 2. Modelos de efectos mixtos3

> install.packages("devtools")

> devtools::install_github("reyzaguirre/st4gi")

Para hacer las cosas simples se trabajara solo con cinco genotipos y ası evitar el gasto de papel enla impresion de los resultados de los analisis.

> library(st4gi)

> lista <- c("Beauregard", "Blesbok", "Brondal", "Cemsa", "Huambachero")

> misdatos <- pjpz09[pjpz09$geno %in% lista, ]

> misdatos

geno rep nops noph nocr nonc crw ncrw trw vw

1 Beauregard 1 20 15 33 14 21.6 0.90 22.50 27.0

2 Beauregard 2 20 15 21 30 4.9 1.60 6.50 6.4

3 Blesbok 1 20 17 22 36 4.2 1.40 5.60 15.5

4 Blesbok 2 20 17 13 39 2.2 1.06 3.26 9.7

5 Brondal 1 20 18 19 1 9.9 0.10 10.00 19.4

6 Brondal 2 20 17 7 1 3.2 0.02 3.22 12.9

7 Cemsa 1 20 19 47 13 23.2 0.60 23.80 40.6

8 Cemsa 2 20 17 7 7 1.8 0.60 2.40 18.1

9 Huambachero 1 20 20 49 36 6.1 2.00 8.10 39.7

10 Huambachero 2 20 19 24 24 4.6 1.10 5.70 10.2

Los genotipos estan indicados en la columna geno mientras que los bloques en la columna rep.Notese que los bloques, por haber sido codificados con numeros, aparecen con formato numerico(num).

> str(misdatos$rep)

num [1:10] 1 2 1 2 1 2 1 2 1 2

Antes de continuar entonces hay que solucionar este problema. Una opcion es cambiar el formatoa caracter.

> misdatos$rep <- as.character(misdatos$rep)

3.1.2. Ajuste por el metodo tradicional

El modelo del DBCA es un modelo lineal bastante sencillo y puede ser ajustado sin problemascon los comandos basicos de R para modelos lineales: lm y aov. A continuacion se ajusta estemodelo para el rendimiento por parcela (trw) usando el comando aov, que es el que esta parti-cularmente disenado para tratar con los modelos de diseno experimental. Luego, con el comandoanova se extrae el analisis de varianza para este modelo.

> modelo <- aov(trw ~ geno + rep, data = misdatos)

> anova(modelo)

Analysis of Variance Table

Response: trw

Df Sum Sq Mean Sq F value Pr(>F)

geno 4 156 39.0 1.07 0.476

rep 1 239 239.3 6.54 0.063 .

Residuals 4 146 36.6

---

Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

9

Page 10: Modelos de Efectos MixtosModelos de Efectos Mixtos Aplicaciones en mejoramiento gen etico con R Rau l Eyzaguirre 7 de marzo de 2017 Indice 1. Introduccion 3 2. Modelos de efectos mixtos3

Notese que no se ha especificado cuales factores son fijos y cuales aleatorios. En este caso elunico componente aleatorio es el error, y el cuadrado medio del error que aparece en el analisis devarianza sera el estimador de la varianza del error de la expresion (4):

σ2 = 36.6.

Si se asume que los bloques constituyen un factor aleatorio, se podrıa obtener el estimadorde la varianza de los bloques de la expresion (5) desde el analisis de varianza. Resulta que elcuadrado medio de los bloques realmente estima a la varianza del error mas la varianza de losbloques multiplicada por el numero de genotipos, por lo que en este caso se tiene que

239.3 = 36.6 + 5× σ2β

y

σ2β =

239.3− 36.6

5= 40.6.

El enfoque utilizado aquı para calcular la varianza estimada de los bloques consiste en igualarlos cuadrados medios calculados con los cuadrados medios esperados de cada fuente de variaciondel analisis de varianza. Como se ve, en casos muy simples como un DBCA sin valores perdidos, noes difıcil calcular las varianzas correspondientes a los factores que se consideren aleatorios, pero conmodelos mas complejos las cosas ya no son tan sencillas. De hecho, incluso en casos sencillos comoeste se podrıan tener serias dificultades. Por ejemplo, si el cuadrado medio de los bloques fueramenor que el cuadrado medio del error ¡se obtendrıa una varianza para los bloques negativa! Por esoes bueno contar con herramientas que permitan estimar modelos de efectos mixtos directamentemediante la especificacion de los componentes fijos y aleatorios, como los paquetes nlme o lme4

de R.

3.1.3. Ajuste con el paquete lme4

El comando lmer del paquete lme4 permite ajustar modelos de efectos mixtos. Como se vea continuacion la sintaxis es bastante similar a la usada en la seccion anterior con el comandoaov. La unica diferencia es que para indicar que los bloques son aleatorios se utiliza la expresion(1|rep). En esta expresion el 1 a la derecha del sımbolo | representa el intercepto del modelo (lamedia general en este caso) y la expresion rep a la derecha indica que hay un efecto aleatorio paralos bloques sobre la media general. Como se ve bajo el tıtulo Random effects, las estimacionespara las varianzas del error y de los bloques son las mismas que se obtuvieron a partir del analisisde varianza: 40.6 y 36.6.

> library(lme4)

> modelo <- lmer(trw ~ geno + (1|rep), data = misdatos)

> summary(modelo)

Linear mixed model fit by REML ['lmerMod']

Formula: trw ~ geno + (1 | rep)

Data: misdatos

REML criterion at convergence: 37.5

Scaled residuals:

Min 1Q Median 3Q Max

-1.084 -0.491 0.000 0.491 1.084

Random effects:

Groups Name Variance Std.Dev.

rep (Intercept) 40.6 6.37

Residual 36.6 6.05

Number of obs: 10, groups: rep, 2

10

Page 11: Modelos de Efectos MixtosModelos de Efectos Mixtos Aplicaciones en mejoramiento gen etico con R Rau l Eyzaguirre 7 de marzo de 2017 Indice 1. Introduccion 3 2. Modelos de efectos mixtos3

Fixed effects:

Estimate Std. Error t value

(Intercept) 14.50 6.21 2.34

genoBlesbok -10.07 6.05 -1.66

genoBrondal -7.89 6.05 -1.30

genoCemsa -1.40 6.05 -0.23

genoHuambachero -7.60 6.05 -1.26

Correlation of Fixed Effects:

(Intr) gnBlsb gnBrnd genCms

genoBlesbok -0.487

genoBrondal -0.487 0.500

genoCemsa -0.487 0.500 0.500

genoHumbchr -0.487 0.500 0.500 0.500

Por ultimo, falta buscar los BLUEs y los BLUPs. Con los BLUPs la cosa es sencilla. Los BLUPsseran simplemente los efectos de los bloques. Los valores se pueden obtener con el comando ranef:

> ranef(modelo)

$rep

(Intercept)

1 4.1445

2 -4.1445

Lo que se tiene entonces es que el bloque 1 tiene un efecto positivo de 4.1445 y el bloque 2 unefecto negativo de −4.1445.

Con los BLUEs la cosa es un poquito mas complicada. Observese de nuevo la matrix X delejemplo de la seccion 2.3:

X =

1 1 0 01 1 0 01 0 1 01 0 1 01 0 0 11 0 0 1

.

Se observa que esta matriz no es de rango completo, es decir, sus columnas no son linealmenteindependientes: La primera columna es igual a la suma de las otras tres. Esta falta de independencialineal entre las columnas de la matriz trae consecuencias para la estimacion de los parametroscorrespondientes en el modelo. En estadıstica a esto se le llama falta de identificabilidad; lasestimaciones pueden tomar diferentes valores. En la salida del ajuste del modelo ya aparecenciertos valores para los BLUEs bajo el tıtulo Fixed effects: 14.50,−10.07,−7.89,−1.40,−7.60.Con el modelo del DBCA presentado en (3), estos numeros corresponden a:

α1 = 14.50

α2 − α1 = −10.07

α3 − α1 = −7.89

α4 − α1 = −1.40

α5 − α1 = −7.60.

Lo que se tienen aquı es que 14.5 es la media de Beauregard y los otros cuatro numeros son lasestimaciones de las diferencias o efectos de los otros cuatro genotipos con respecto a Beauregard.Beauregard, por ser el primero en orden alfabetico ha sido tomado como referente. Obviamente noserıa difıcil obtener desde estos numeros las medias de cada uno de los genotipos (en este caso los

11

Page 12: Modelos de Efectos MixtosModelos de Efectos Mixtos Aplicaciones en mejoramiento gen etico con R Rau l Eyzaguirre 7 de marzo de 2017 Indice 1. Introduccion 3 2. Modelos de efectos mixtos3

famosos BLUEs no son mas que las medias de los genotipos), pero si se quiere que las estimacionesde los efectos fijos coincidan con las medias de los genotipos, hay que indicar una parametrizaciondistinta del modelo. En este caso la solucion es ajustar el modelo sin intercepto como se muestraabajo. Luego, los BLUEs se pueden obtener con el comando fixef. Para ajustar un modelo sinintercepto basta con aumentar -1 en el lado derecho de la especificacion del modelo. Por supuestolos BLUPs no se ven afectados por este cambio.

> modelo <- lmer(trw ~ -1 + geno + (1|rep), data = misdatos)

> ranef(modelo)

$rep

(Intercept)

1 4.1445

2 -4.1445

> fixef(modelo)

genoBeauregard genoBlesbok genoBrondal genoCemsa genoHuambachero

14.50 4.43 6.61 13.10 6.90

3.1.4. Ajuste con el paquete nlme

Con el paquete nlme el comando para ajustar estos modelos es lme. La sintaxis es un pocodiferente. Primero hay que especificar una formula para la parte de los efectos fijos (notese queigual que en el caso anterior se puede incluir -1 para obtener un modelo sin intercepto de modoque los efectos fijos estimados o BLUEs correspondan con las medias de los genotipos), luego seindica donde estan los datos, y por ultimo se especifica una formula para la parte de los efectosaleatorios. Igual que con el paquete lme4 se puede usar los comandos fixef y ranef para obtenerlos BLUEs y BLUPs respectivamente.

> library(nlme)

> modelo <- lme(trw ~ -1 + geno, misdatos, ~ 1|rep)

> modelo

Linear mixed-effects model fit by REML

Data: misdatos

Log-restricted-likelihood: -18.765

Fixed: trw ~ -1 + geno

genoBeauregard genoBlesbok genoBrondal genoCemsa genoHuambachero

14.50 4.43 6.61 13.10 6.90

Random effects:

Formula: ~1 | rep

(Intercept) Residual

StdDev: 6.3679 6.047

Number of Observations: 10

Number of Groups: 2

> fixef(modelo)

genoBeauregard genoBlesbok genoBrondal genoCemsa genoHuambachero

14.50 4.43 6.61 13.10 6.90

> ranef(modelo)

(Intercept)

1 4.1445

2 -4.1445

12

Page 13: Modelos de Efectos MixtosModelos de Efectos Mixtos Aplicaciones en mejoramiento gen etico con R Rau l Eyzaguirre 7 de marzo de 2017 Indice 1. Introduccion 3 2. Modelos de efectos mixtos3

3.2. Ejemplo 2: MET con DBCA

3.2.1. Datos

Para este ejemplo se utilizan datos de ocho genotipos de camote evaluados en doce ambientescon un DBCA con tres bloques en cada ambiente. La variable respuesta es el rendimiento porparcela. A continuacion se muestran las primeras seis filas de los datos y la estructura de losmismos.

> head(met8x12)

env geno rep y

1 HCO0N ARB535 1 0.25

2 HCO0N ARB535 2 1.11

3 HCO0N ARB535 3 0.29

4 HCO0N DLP2462 1 0.48

5 HCO0N DLP2462 2 0.53

6 HCO0N DLP2462 3 0.62

> str(met8x12)

'data.frame': 288 obs. of 4 variables:

$ env : Factor w/ 12 levels "HCO0N","HCO80N",..: 1 1 1 1 1 1 1 1 1 1 ...

$ geno: Factor w/ 8 levels "ARB535","DLP2462",..: 1 1 1 2 2 2 3 3 3 4 ...

$ rep : Factor w/ 3 levels "1","2","3": 1 2 3 1 2 3 1 2 3 1 ...

$ y : num 0.25 1.11 0.29 0.48 0.53 0.62 3.48 2.95 3.48 0.22 ...

Notese que en este caso los bloques, etiquetados como rep, aun cuando han sido codificadoscon numeros, aparecen ya con formato de factor. La variable respuesta aparece bajo la etiqueta y.El modelo estadıstico correspondiente a este caso es

yijk = µ+ αi + βj + δij + γk(j) + εijk

donde

αi es el efecto del genotipo i.

βj es el efecto del ambiente j.

δij es el efecto de la interaccion entre el genotipo i y el ambiente j.

γk(j) es el efecto del bloque k en el ambiente j.

εijk es el efecto del error experimental.

3.2.2. Ajuste por el metodo tradicional

Este modelo tambien puede ajustarse sin problemas con el comando aov aunque, dado queestos datos tienen valores perdidos, van a surgir algunos problemas. Lo bonito de los modelos dediseno experimental es lo que se conoce como “ortogonalidad”. Lo feo de los modelos de disenoexperimental es que la ortogonalidad casi nunca se logra. El problema es que cuando hay datosperdidos esta ortogonalidad se pierde y eso tiene sus consecuencias (cuando no hay datos perdidosse dice tambien que el modelo esta balanceado, mientras que con valores perdidos se pierde elbalance). Para que quede claro de que se esta hablando, a continuacion se ajusta el modelo y semuestra la tabla del analisis de varianza para estos datos dos veces: La unica diferencia entre losdos ajustes es el orden en el que aparecen los factores en el modelo.

> modelo <- aov(y ~ geno + env + rep %in% env + geno:env, data = met8x12)

> anova(modelo)

13

Page 14: Modelos de Efectos MixtosModelos de Efectos Mixtos Aplicaciones en mejoramiento gen etico con R Rau l Eyzaguirre 7 de marzo de 2017 Indice 1. Introduccion 3 2. Modelos de efectos mixtos3

Analysis of Variance Table

Response: y

Df Sum Sq Mean Sq F value Pr(>F)

geno 7 151.0 21.57 76.27 < 2e-16 ***

env 11 40.4 3.67 12.99 < 2e-16 ***

env:rep 24 17.2 0.72 2.54 0.00032 ***

geno:env 77 34.9 0.45 1.60 0.00694 **

Residuals 155 43.8 0.28

---

Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

> modelo <- aov(y ~ env + geno + rep %in% env + geno:env, data = met8x12)

> anova(modelo)

Analysis of Variance Table

Response: y

Df Sum Sq Mean Sq F value Pr(>F)

env 11 40.5 3.68 13.02 < 2e-16 ***

geno 7 150.9 21.55 76.21 < 2e-16 ***

env:rep 24 17.2 0.72 2.54 0.00032 ***

env:geno 77 34.9 0.45 1.60 0.00694 **

Residuals 155 43.8 0.28

---

Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Se observa una discrepancia entre las sumas de cuadrados en ambos modelos. Por ejemplo,en el primero la suma de cuadrados para los genotipos es 151.0 mientras que en el segundo es150.9. La diferencia es pequena en este caso, pero tambien podrıa ser muy grande. ¿A que se debeesta diferencia? Pues a la falta de ortogonalidad causada por los valores perdidos. Al perderse laortogonalidad las sumas de cuadrados de los distintos factores ya no son independientes y entoncesdependen del orden en el que aparecen en el modelo. El primer factor en el modelo obtiene lassumas de cuadrados que le corresponden sin importar el resto del modelo, pero el segundo factorobtiene las que corresponden dado que el primer factor ya esta presente. Por eso a estas sumas decuadrados les llaman “secuenciales”, y hay quienes las han bautizado como sumas de cuadradostipo I (lo que deja la idea de que tal vez existan otras, digamos tipo II o tipo III). Personalmentesoy de los que cree que no hay distintos tipos de sumas de cuadrados, las sumas de cuadradosson sumas de cuadrados y punto. Lo que hay es diferentes modelos y diferentes hipotesis paraevaluar (estas hipotesis diferentes comparando distintos modelos son las que corresponderıan a lasllamadas sumas de cuadrados tipo I, II o III).

Al igual que en el ejemplo anterior, no se ha especificado si los efectos son fijos o al azar, peroexisten ecuaciones para estimar los componentes de varianza y efectuar las pruebas de hipotesiscorrespondientes en caso algunos de los efectos sean considerados al azar. Las pruebas F mostradasen las tablas de analisis de varianza son solo validas bajo la consideracion de que todos los efectosson fijos (por supuesto considerando tambien que la falta de balance u ortogonalidad no fuera unproblema). En cuanto a la estimacion de las varianzas para los efectos aleatorios, las ecuacionesson un poquito mas complicadas que en el ejemplo anterior y no estan libres del problema deobtener varianzas negativas.

Obviamente tambien se puede ajustar este modelo usando los paquetes para modelos mixtos,ya sea usando ML o REML. La buena noticia es que usando REML se soluciona el problema de laestimacion de las varianzas. La mala noticia es que REML no soluciona el problema en las pruebasde hipotesis del analisis de varianza para los efectos fijos ocasionado por la falta de balance. Alfinal no hay que olvidar que sumas de cuadrados son sumas de cuadrados y no van a cambiar nicon REML ni con ningun otro metodo de estimacion.

14

Page 15: Modelos de Efectos MixtosModelos de Efectos Mixtos Aplicaciones en mejoramiento gen etico con R Rau l Eyzaguirre 7 de marzo de 2017 Indice 1. Introduccion 3 2. Modelos de efectos mixtos3

3.2.3. Ajuste con el paquete lme4

Este modelo puede ajustarse con el comando lmer. Si se considera que los genotipos son fijosy los ambientes y bloques aleatorios, la sintaxis serıa la siguiente (se coloca ya mismo el -1 en laespecificacion de la formula para obtener las estimaciones de las medias de los genotipos):

> modelo <- lmer(y ~ - 1 + geno + (1|env/rep) + (1|geno:env), data = met8x12)

El termino (1|env/rep) indica efectos aleatorios para los ambientes y para las repeticiones obloques dentro de los ambientes. El termino (1|geno:env) indica el efecto aleatorio de la interac-cion entre los genotipos y los ambientes (tengase en cuenta que la interaccion entre un efecto fijoy uno aleatorio es aleatoria).

> summary(modelo)

Linear mixed model fit by REML ['lmerMod']

Formula: y ~ -1 + geno + (1 | env/rep) + (1 | geno:env)

Data: met8x12

REML criterion at convergence: 536.1

Scaled residuals:

Min 1Q Median 3Q Max

-2.878 -0.290 -0.032 0.203 9.207

Random effects:

Groups Name Variance Std.Dev.

geno:env (Intercept) 0.0589 0.243

rep:env (Intercept) 0.0586 0.242

env (Intercept) 0.1178 0.343

Residual 0.2841 0.533

Number of obs: 275, groups: geno:env, 96; rep:env, 36; env, 12

Fixed effects:

Estimate Std. Error t value

genoARB535 0.584 0.163 3.59

genoDLP2462 0.658 0.161 4.09

genoJEWEL 2.781 0.156 17.86

genoJPKY16.005 0.599 0.156 3.85

genoSR92.49923 1.354 0.156 8.69

genoTANZANIA 0.877 0.156 5.63

genoWAGABOLIGE 0.472 0.157 3.01

genoXUSHU18 0.505 0.156 3.24

Correlation of Fixed Effects:

gARB53 gDLP24 gJEWEL gJPKY1 gSR92. gTANZA gWAGAB

genoDLP2462 0.438

genoJEWEL 0.452 0.457

gJPKY16.005 0.452 0.457 0.472

gSR92.49923 0.452 0.457 0.472 0.472

genTANZANIA 0.452 0.457 0.472 0.472 0.472

gWAGABOLIGE 0.450 0.454 0.469 0.469 0.469 0.469

genoXUSHU18 0.452 0.457 0.472 0.472 0.472 0.472 0.469

Con el comando summary se obtiene, entre otros resultados, las varianzas estimadas para cadaefecto aleatorio bajo el tıtulo Random effects (las varianzas estimadas son 0.0589 para la inter-accion genotipo por ambiente, 0.0586 para los bloques, 0.1178 para los ambientes y 0.2841 para elerror). Bajo el tıtulo Fixed effects se obtienen las estimaciones de las medias de los genotipos(BLUEs). Para obtener los BLUPs habrıa que escribir ranef(modelo). A continuacion se muestrallos BLUEs calculados para los doce ambientes:

15

Page 16: Modelos de Efectos MixtosModelos de Efectos Mixtos Aplicaciones en mejoramiento gen etico con R Rau l Eyzaguirre 7 de marzo de 2017 Indice 1. Introduccion 3 2. Modelos de efectos mixtos3

> ranef(modelo)$env

(Intercept)

HCO0N -0.083305

HCO80N -0.146651

LM0N -0.170414

LM80N -0.112469

OXA0N 0.580048

OXA80N 0.498037

SR0N -0.190806

SR80N 0.346638

TAC0N -0.293352

TAC80N -0.206270

TM0N -0.168168

TM80N -0.053287

3.2.4. Ajuste con el paquete nlme

Con el paquete nlme las cosas son mas complicadas. Este paquete esta disenado para tratar confactores aleatorios anidados (por ejemplo, en el modelo aquı tratado los bloques estan anidados enlos ambientes), pero no para factores aleatorios cruzados (en este caso los genotipos y ambientesson factores cruzados). Entonces no hay una forma directa de incluir el efecto de los ambientesmas el efecto de la interaccion entre los genotipos y los ambientes en el modelo.

3.3. Ejemplo 3: Diseno Alpha

3.3.1. Datos

Se tienen datos de treinta genotipos (columna geno) de papa sembrados con dos repeticiones(columna rep) siguiendo un diseno alpha. Cada repeticion se divide en veinte bloques (columnablock) de tamano tres. La variable respuesta (columna yield) representa el rendimiento porparcela.

> head(alpha01data)

block geno rep yield

1 1 geno18 1 5

2 1 geno09 1 2

3 1 geno12 1 7

4 2 geno11 1 6

5 2 geno19 1 4

6 2 geno01 1 9

3.3.2. Ajuste usando un modelo de efectos mixtos

En el diseno alpha, los bloques estan anidados en las repeticiones. En teorıa, cualquier factoranidado debiera considerarse como aleatorio. Se puede ajustar el modelo de efectos mixtos corres-pondiente usando la librarıa lme4. Los genotipos, por ser de principal interes (interesa estimar susmedias) son un factor fijo, mientras que las repeticiones y los bloques son aleatorios. Luego deestimar el modelo se pueden obtener las estimaciones de las medias de los genotipos (los BLUEs)con el comando fixef.

> modelo <- lmer(yield ~ -1 + geno + (1|rep/block), data = alpha01data)

> fixef(modelo)

genogeno01 genogeno02 genogeno03 genogeno04 genogeno05 genogeno06 genogeno07 genogeno08

6.5048 2.8795 5.7346 3.9783 3.3414 4.5634 3.4951 2.4399

genogeno09 genogeno10 genogeno11 genogeno12 genogeno13 genogeno14 genogeno15 genogeno16

16

Page 17: Modelos de Efectos MixtosModelos de Efectos Mixtos Aplicaciones en mejoramiento gen etico con R Rau l Eyzaguirre 7 de marzo de 2017 Indice 1. Introduccion 3 2. Modelos de efectos mixtos3

2.9996 3.6282 4.7936 4.8739 4.2860 4.1654 4.4240 6.1925

genogeno17 genogeno18 genogeno19 genogeno20 genogeno21 genogeno22 genogeno23 genogeno24

3.0521 5.4727 3.3790 6.7149 4.7415 4.5870 5.4547 3.9435

genogeno25 genogeno26 genogeno27 genogeno28 genogeno29 genogeno30

2.1863 4.1976 7.7287 5.1404 5.0693 6.0321

Notese que las estimaciones de las medias de los genotipos con el modelo son diferentes de lasmedias simples de cada genotipo. Las estimaciones con el modelo estan ajustadas por los efectosde los bloques. A continuacion se presentan las medias simples.

> tapply(alpha01data$yield, alpha01data$geno, mean)

geno01 geno02 geno03 geno04 geno05 geno06 geno07 geno08 geno09 geno10 geno11 geno12 geno13

7.5 1.0 5.5 4.0 4.0 3.5 2.0 3.0 3.5 4.5 5.5 4.0 4.0

geno14 geno15 geno16 geno17 geno18 geno19 geno20 geno21 geno22 geno23 geno24 geno25 geno26

3.5 4.5 6.5 4.0 6.5 3.0 8.0 4.5 6.5 5.0 3.0 1.5 3.5

geno27 geno28 geno29 geno30

8.0 6.5 3.5 6.0

4. Modelos de efectos mixtos con matriz de pedigrı

Cuando se conoce el pedigrı, esta informacion puede incluirse en un modelo de efectos mixtos.A estos modelos se les conoce tambien como“animal models”y pueden ajustarse en R con paquetescomo MCMCglmm [9] o pedigreemm [3].

Si se incluye una matriz de pedigrı, entonces los genotipos deben ser considerados como efectosaleatorios. Como ya se ha notado en las secciones anteriores, aunque no es una condicion necesaria,es usual asumir independencia entre los efectos aleatorios. Ası por ejemplo en el modelo (3) es usualasumir que tanto los errores como los bloques son independientes (o lo que es lo mismo en estecaso, que no estan correlacionados), por lo que sus distribuciones de probabilidad, en la notaciondel modelo de efectos mixtos (1), podrıan escribirse como

εεε ∼ N(0, Iσ2), b ∼ N(0, Iσ2b ).

La independencia se hace explıcita en la definicion de las matrices de varianza, Iσ2 y Iσ2b ,

que son matrices diagonales, esto es, con todas las covarianzas (elementos fuera de la diagonal)iguales a cero, pero si los genotipos estan relacionados a traves de parentescos, entonces sus ca-racterısticas ya no son independientes; se esperarıa que individuos con mayor grado de parentescosean mas similares entre sı que individuos con menor grado o sin parentesco. Entonces, conside-rando por ejemplo un DBCA, el modelo con genotipos aleatorios y relaciones de parentesco podrıarepresentarse como

yij = µ+ αi + βj + εij

conααα ∼ N(0,Aσ2

α). (8)

En esta ultima expresion A es la “numerator relationship matrix” (Wright [20]) o matriz de re-laciones geneticas aditivas. Esta matriz se calcula a partir del pedigrı y representa la proporcionde genes que se esperarıa que dos individuos compartan por descendencia. La inclusion de estamatriz en modelos de efectos mixtos se debe a Henderson [11, 12].

4.1. Calculo de la matriz A

Hay varios paquetes en R para crear la matriz A o su inversa A−1, como por ejemplo pedigree

[4], pedigreemm, y MCMCglmm. Considerese por ejemplo el siguiente pedigrı:

17

Page 18: Modelos de Efectos MixtosModelos de Efectos Mixtos Aplicaciones en mejoramiento gen etico con R Rau l Eyzaguirre 7 de marzo de 2017 Indice 1. Introduccion 3 2. Modelos de efectos mixtos3

> geno <- c("A", "B", "C", "D", "E", "F", "G", "H")

> pedigri <- data.frame(geno = geno,

+ padre = c(NA, NA, NA, NA, "A", "A", "A", "C"),

+ madre = c(NA, NA, NA, NA, "B", "B", "C", "D"))

> pedigri

geno padre madre

1 A <NA> <NA>

2 B <NA> <NA>

3 C <NA> <NA>

4 D <NA> <NA>

5 E A B

6 F A B

7 G A C

8 H C D

Notese que E y F tienen los mismos padres, E y G solo un padre en comun, y E y H ningunpadre en comun. La matriz A se puede obtener con el comando makeA del paquete pedigree. Estecomando genera un resultado que es guardado en el directorio de trabajo en un archivo de textocon el nombre A.txt:

> library(pedigree)

> makeA(pedigri, which = rep(TRUE, 8))

> temp <- read.table("A.txt")

El resultado no tiene realmente un formato de matriz, por lo que hay que manipular un poco losnumeros para obtener la matriz A:

> A <- matrix(0, 8, 8, dimnames = list(geno, geno))

> A[as.matrix(temp[, 1:2])] <- temp[, 3]

> d <- diag(A)

> A <- A + t(A)

> diag(A) <- d

> A[5:8, 5:8]

E F G H

E 1.00 0.50 0.25 0.00

F 0.50 1.00 0.25 0.00

G 0.25 0.25 1.00 0.25

H 0.00 0.00 0.25 1.00

El valor resultante entre E y F que son hermanos es 0.5, entre E y G que son medios hermanoses 0.25 y entre E y H que no tienen parentesco es 0. Para obtener la matriz A−1 se puede usar elcomando makeAinv:

> makeAinv(pedigri)

> temp <- read.table("Ainv.txt")

Igual que en el caso anterior hay que manipular un poco los numeros para formar la matriz A−1:

> Ainv <- matrix(0, 8, 8, dimnames = list(geno, geno))

> Ainv[as.matrix(temp[, 1:2])] <- temp[, 3]

> d <- diag(Ainv)

> Ainv <- Ainv + t(Ainv)

> diag(Ainv) <- d

> Ainv

A B C D E F G H

A 2.5 1 0.5 0.0 -1 -1 -1 0

B 1.0 2 0.0 0.0 -1 -1 0 0

18

Page 19: Modelos de Efectos MixtosModelos de Efectos Mixtos Aplicaciones en mejoramiento gen etico con R Rau l Eyzaguirre 7 de marzo de 2017 Indice 1. Introduccion 3 2. Modelos de efectos mixtos3

C 0.5 0 2.0 0.5 0 0 -1 -1

D 0.0 0 0.5 1.5 0 0 0 -1

E -1.0 -1 0.0 0.0 2 0 0 0

F -1.0 -1 0.0 0.0 0 2 0 0

G -1.0 0 -1.0 0.0 0 0 2 0

H 0.0 0 -1.0 -1.0 0 0 0 2

Obviamente tambien se podrıa calcular directamente la inversa desde la matriz A ya calculada:

> solve(A)

A B C D E F G H

A 2.5 1 0.5 0.0 -1 -1 -1 0

B 1.0 2 0.0 0.0 -1 -1 0 0

C 0.5 0 2.0 0.5 0 0 -1 -1

D 0.0 0 0.5 1.5 0 0 0 -1

E -1.0 -1 0.0 0.0 2 0 0 0

F -1.0 -1 0.0 0.0 0 2 0 0

G -1.0 0 -1.0 0.0 0 0 2 0

H 0.0 0 -1.0 -1.0 0 0 0 2

4.2. Paquete pedigreemm

4.2.1. Ajuste del modelo

El paquete pedigreemm fue desarrollado como una extension del paquete lme4 para ajustarmodelos mixtos con efectos aleatorios correlacionados [19] (que es el caso de los genotipos relacio-nados por parentescos). Siguiendo el metodo de Harville y Callanan [10], la correlacion entre losniveles del factor aleatorio se incluye en el modelo post multiplicando la matriz de incidencia delfactor aleatorio (matriz Z en (1)) por el factor de Cholesky de la matriz de covarianzas (matriz Aen (8)).

Considerese el modelo general de efectos mixtos presentado en (1)

y = Xβββ + Zb + εεε (9)

donde los efectos aleatorios de los genotipos estan incluidos en b. Entonces, considerando que seconoce las relaciones de parentesco entre los genotipos, y siguiendo la idea presentada en 8, sepodria asumir que

b ∼ N(0,Aσ2b ). (10)

Dado que A es una matriz positiva definida (o positiva semidefinida si es que se incluyen clonesen el pedigrı), se puede aplicar la descomposicion de Choleski A = LL′. Defınase ahora Z∗ = ZLy b∗ = L−1b. Entonces, (9) se puede reescribir como

y = Xβββ + Z∗b∗ + εεε (11)

donde

V (b∗) = V (L−1b) = L−1V (b)L′−1 = L−1AL′−1σ2b = L−1LL′L′−1σ2

b = Iσ2b .

Con esto, (11) ahora es un modelo con efectos aleatorios independientes, y puede ser ajustadoutilizando lme4. Por supuesto, de todo este trabajo se encarga pedigreemm.

4.2.2. Ejemplo

Para este ejemplo se va a usar datos simulados para un conjunto de seis individuos relacionadosbajo cierto pedigrı. Este ejemplo sigue mas o menos la misma idea del ejemplo mostrado en elcomando pedigreemm del paquete del mismo nombre (puede verse escribiendo ?pedigreemm enR). Considere las siguientes relaciones:

19

Page 20: Modelos de Efectos MixtosModelos de Efectos Mixtos Aplicaciones en mejoramiento gen etico con R Rau l Eyzaguirre 7 de marzo de 2017 Indice 1. Introduccion 3 2. Modelos de efectos mixtos3

> library(pedigreemm)

> p1 <- new("pedigree", sire = as.integer(c(NA, NA, 1, 1, 4, 5)),

+ dam = as.integer(c(NA, NA, 2, NA, 3, 2)),

+ label = as.character(1:6))

> p1

sire dam

1 <NA> <NA>

2 <NA> <NA>

3 1 2

4 1 <NA>

5 4 3

6 5 2

El uso de los terminos sire y dam es obligado para la generacion del objeto p1 que es de clasepedigree. Lo que se tiene es seis individuos donde:

1 y 2 no tienen padres registrados.

3 es hijo de 1 y 2.

4 es hijo de 1.

5 es hijo de 4 y 3, que a su vez son medios hermanos (un poquito de endogamia o“inbreeding”)

6 es hijo de 5 y 2.

Con estas relaciones de parentesco se puede obtener la matriz A con el comando getA (en laseccion 4.1 se habıa utilizado el comando makeA del paquete pedigree):

> A <- getA(p1)

> A

6 x 6 sparse Matrix of class "dsCMatrix"

1 2 3 4 5 6

1 1.00 . 0.5000 0.5000 0.5000 0.2500

2 . 1.000 0.5000 . 0.2500 0.6250

3 0.50 0.500 1.0000 0.2500 0.6250 0.5625

4 0.50 . 0.2500 1.0000 0.6250 0.3125

5 0.50 0.250 0.6250 0.6250 1.1250 0.6875

6 0.25 0.625 0.5625 0.3125 0.6875 1.1250

Notese el valor 1.125 obtenido en la quinta y sexta celda de la diagonal de la matriz resultante,que refleja la endogamia en estos individuos. Lo siguiente es simular los datos experimentales. Estaparte del codigo puede ser algo engorrosa pero no necesario prestarle atencion pues en la practicalos datos vienen directamente del experimento:

> cholA <- chol(A)

> varU <- 0.4

> varE <- 0.6

> rep <- 3

> n <- rep * 6

> set.seed(1)

> bStar <- rnorm(6, sd = sqrt(varU))

> b <- crossprod(as.matrix(cholA), bStar)

> ID <- rep(1:6, each = rep)

> e0 <- rnorm(n, sd = sqrt(varE))

> y <- b[ID] + e0

Lo que se ha simulado aquı son datos para tres repeticiones con estos seis individuos. Los datosestan el objeto y y los nombres o identificadores para cada dato en el objeto ID.

20

Page 21: Modelos de Efectos MixtosModelos de Efectos Mixtos Aplicaciones en mejoramiento gen etico con R Rau l Eyzaguirre 7 de marzo de 2017 Indice 1. Introduccion 3 2. Modelos de efectos mixtos3

> data.frame(ID, y)

ID y

1 1 -0.018643

2 1 0.175700

3 1 0.049794

4 2 -0.120407

5 2 1.287167

6 2 0.418118

7 3 -0.994944

8 3 -2.229233

9 3 0.357634

10 4 0.640864

11 4 0.663128

12 4 1.406762

13 5 0.864443

14 5 0.688362

15 5 0.940165

16 6 0.422804

17 6 -0.125278

18 6 -1.723981

Ahora, se puede ajustar el modelo de efectos mixtos con efectos aleatorios para los individuosde la siguiente manera:

> fm1 <- pedigreemm(y ~ (1|ID) , pedigree = list(ID = p1))

El comando summary da algunos detalles del modelo, como las varianzas estimadas (0.585 para losindividuos y 0.662 para el error) y el efecto fijo estimado (en este caso, el intercepto del modelo).

> summary(fm1)

Linear mixed model fit by REML ['lmerpedigreemm']

Formula: y ~ (1 | ID)

REML criterion at convergence: 48.7

Scaled residuals:

Min 1Q Median 3Q Max

-2.2168 -0.1224 0.0565 0.5908 1.3503

Random effects:

Groups Name Variance Std.Dev.

ID (Intercept) 0.585 0.765

Residual 0.662 0.814

Number of obs: 18, groups: ID, 6

Fixed effects:

Estimate Std. Error t value

(Intercept) 0.315 0.556 0.57

4.3. Paquete MCMCglmm

A diferencia del paquete pedigreemm que utiliza metodos basados en la maximizacion de laverosimilitud para estimar el modelo, el paquete MCMCglmm utiliza metodos MCMC, que como yase menciono, van de la mano con el enfoque bayesiano. MCMCglmm permite ajustar modelos no solocon respuesta gaussiana, sino con otras distribuciones dentro de la familia exponencial, esto es, losmodelos lineales de efectos mixtos generalizados (de hecho, esta es la razon por la que este paqueteutiliza los metodos MCMC, ya que cuando la respuesta no es gaussiana, la verosimilitud no puedeobtenerse de manera analıtica). Sin embargo, para no complicar las cosas en esta seccion, solo sealudira al modelo con respuesta gaussiana.

21

Page 22: Modelos de Efectos MixtosModelos de Efectos Mixtos Aplicaciones en mejoramiento gen etico con R Rau l Eyzaguirre 7 de marzo de 2017 Indice 1. Introduccion 3 2. Modelos de efectos mixtos3

4.3.1. Ajuste del modelo

Considerando una respuesta gaussiana el modelo es el mismo especificado en (9) y (10). Sinembargo, desde la perspectiva bayesiana, tanto βββ como b y εεε son variables aleatorias, por lo quees necesario asignarles una distribucion de probabilidades. Lo que hace MCMCglmm es asumir queestos tres componentes son independientes con distribuciones normales:

βββ ∼ N(βββ0,B) (12)

b ∼ N(0,G) (13)

εεε ∼ N(0,R) (14)

βββ0 en (12) son las medias a priori para los efectos fijos (usualmente se igualan a cero cuando seconsideran distribuciones a priori no informativas), la matriz G en (13) depende de la matriz A en(10), y dado que tanto b como εεε en (13) y (14) corresponden a efectos aleatorios, el tratamientode las matrices G y R es similar. La distincion entre efectos fijos y aleatorios en el enfoquebayesiano generalmente se hace en la especificacion de las matrices B, G y R. Mientras que B, quecorresponde a los efectos fijos, es completamente especificada a priori, G y R suelen depender deotros parametros, como las varianzas, para las cuales a su vez hay que especificar una distribucionde probabilidades (las llamadas hiperprioris.)

4.3.2. Ejemplo

Considerese los siguientes datos para un experimento con nueve genotipos y dos repeticiones.El uso del termino animal (que en este caso representa los genotipos) es obligatorio con el paqueteMCMCglmm.

> ped <- data.frame(

+ animal = c('703197', '703421', '703825', '703831', '704218', '704393', '704481',

+ '303797.102', '303797.103', '303803.122', '303803.162', '303826.42',

+ '303827.163', '303841.101', '303841.81', '303841.93'),

+ female = c(NA, NA, NA, NA, NA, NA, NA, '704481', '704481', '703197', '703197',

+ '703831', '703421', '704393', '704393', '704393'),

+ male = c(NA, NA, NA, NA, NA, NA, NA, '704218', '704218', '704218', '704218',

+ '703825', '703825', '703421', '703421', '703421')

+ )

> misdatos <- data.frame(

+ animal = c('303797.102', '303797.103', '303803.122', '303803.162', '303826.42',

+ '303827.163', '303841.101', '303841.81', '303841.93', '303797.102',

+ '303797.103', '303803.122', '303803.162', '303826.42', '303827.163',

+ '303841.101', '303841.81', '303841.93'),

+ block = c(1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2),

+ y = c(23.76, 26.31, 26.90, 27.86, 32.87, 22.42, 30.58, 19.54, 30.51, 25.62,

+ 26.14, 26.43, 23.44, 31.43, 23.67, 34.65, 19.23, 31.67)

+ )

> ped

animal female male

1 703197 <NA> <NA>

2 703421 <NA> <NA>

3 703825 <NA> <NA>

4 703831 <NA> <NA>

5 704218 <NA> <NA>

6 704393 <NA> <NA>

7 704481 <NA> <NA>

8 303797.102 704481 704218

9 303797.103 704481 704218

10 303803.122 703197 704218

22

Page 23: Modelos de Efectos MixtosModelos de Efectos Mixtos Aplicaciones en mejoramiento gen etico con R Rau l Eyzaguirre 7 de marzo de 2017 Indice 1. Introduccion 3 2. Modelos de efectos mixtos3

11 303803.162 703197 704218

12 303826.42 703831 703825

13 303827.163 703421 703825

14 303841.101 704393 703421

15 303841.81 704393 703421

16 303841.93 704393 703421

> misdatos

animal block y

1 303797.102 1 23.76

2 303797.103 1 26.31

3 303803.122 1 26.90

4 303803.162 1 27.86

5 303826.42 1 32.87

6 303827.163 1 22.42

7 303841.101 1 30.58

8 303841.81 1 19.54

9 303841.93 1 30.51

10 303797.102 2 25.62

11 303797.103 2 26.14

12 303803.122 2 26.43

13 303803.162 2 23.44

14 303826.42 2 31.43

15 303827.163 2 23.67

16 303841.101 2 34.65

17 303841.81 2 19.23

18 303841.93 2 31.67

Si se considera que tanto los genotipos como los bloques tienen efectos aleatorios, el modelo aestimar serıa

yij = µ+ αi + βj + εij

conεij ∼ N(0, σ2).

Luego hay que especificar las distribuciones a priori para todos los parametros. Para µ que es elunico parametro con efecto fijo, una buena opcion serıa (que ademas es la opcion que MCMCglmm

usa por omision)µ ∼ N(0, 1010). (15)

Para αi y βj que corresponden a efectos aleatorios, las distribuciones a priori podrıan ser (y denuevo esto es lo que asume MCMCglmm por omision)

αi ∼ N(0, σ2α) βj ∼ N(0, σ2

β). (16)

Para la varianza del error, como se menciono en la seccion 2.6.5, lo usual es definir una distribuciongamma inversa con parametros cercanos a cero. MCMCglmm especifica las distribuciones a priori paralas varianzas en terminos de una distribucion Wishart inversa, que se podrıa considerar como unageneralizacion multivariada de la gamma inversa. En la parametrizacion de la distribucion Wishartinversa, los valores que utiliza MCMCglmm por omision corresponderıan a una gamma inversa conambos parametros iguales a 0. Esto no es problema para MCMCglmm pero para estar en concordanciacon lo expuesto en la seccion 2.6.5, se va a definir aca una distribucion gamma inversa con ambosparametros iguales a 10−3:

σ2 ∼ IG(10−3, 10−3). (17)

Por ultimo, falta definir la distribucion hiperpriori de los hiperparametros introducidos en (16).Dado que tambien son varianzas, se utilizara la misma distribucion usada en (17), esto es:

σ2α ∼ IG(10−3, 10−3) σ2

β ∼ IG(10−3, 10−3). (18)

23

Page 24: Modelos de Efectos MixtosModelos de Efectos Mixtos Aplicaciones en mejoramiento gen etico con R Rau l Eyzaguirre 7 de marzo de 2017 Indice 1. Introduccion 3 2. Modelos de efectos mixtos3

Todas estas distribuciones son definidas en la siguiente seccion de codigo. (15) es definida enel objeto B, (17) en el objeto R, y (18) en el objeto G (tanto en R como en G se define V = 1 y nu

= 0.002. Los parametros de la gamma inversa son nu/2 y nu/2×V).

> prior = list(B = list(mu = 0, V = 10^10),

+ R = list(V = 1, nu = 0.002),

+ G = list(G1 = list(V = 1, nu = 0.002),

+ G2 = list(V = 1, nu = 0.002)))

Finalmente, se puede ajustar el modelo con el comando MCMCglmm del paquete del mismo nombrecomo se muestra a continuacion:

> library(MCMCglmm)

> modelo.mcmc <- MCMCglmm(y ~ 1,

+ random = ~ animal + block,

+ family = 'gaussian',

+ data = misdatos,

+ prior = prior,

+ verbose = FALSE,

+ pr = TRUE,

+ burnin = 1000,

+ nitt = 10000,

+ thin = 10)

Lo que hace MCMCglmm es simular datos para cadenas de Markov que deberıan converger ala distribucion de probabilidades de los parametros de interes. En este caso se estan simulando10000 valores (nitt = 10000). Este proceso de convergencia y la definicion misma de una cadenade Markov tienen dos inconvenientes salvables:

1. Las cadenas pueden tardar un poco en lograr la convergencia por lo que los primeros valoressimulados podrıan estar bastante lejos de las distribuciones de probabilidad que se deseaestimar. Para solucionar este problema se descartan los valores de las primeras simulaciones.En este ejemplo se estan descartando las primeras 1000 simulaciones (burnin = 1000).

2. Los valores simulados por una cadena de Markov no son independientes, sino que estancorrelacionados. Para estimar una distribucion de probabilidades por simulacion se necesitansimulaciones independientes. En terminos probabilısticos el resultado de una simulacion enuna cadena de Markov depende solo del resultado anterior, por lo que la correlacion entredos valores va disminuyendo conforme haya mas valores intermedios. Para asegurar ciertaindependencia entre los valores simulados lo que se hace es no considerar a todos, sino solouna muestra sistematica. En este caso, se esta seleccionando solo uno de cada 10 valoressimulados (thin = 10)

En el enfoque bayesiano toda la informacion obtenida se encuentra en las llamadas distribucio-nes posteriores, que son las distribuciones que se han obtenido con la simulacion. Si por ejemplose quisiera obtener los BLUEs y BLUPs se procederıa de la siguiente manera (tanto los BLUEscomo los BLUPs son las modas de las distribuciones posteriores correspondientes):

> posterior.mode(modelo.mcmc$Sol)

(Intercept) animal.303797.102 animal.303797.103 animal.303803.122 animal.303803.162

20.90486 -1.13136 -0.15139 -0.18319 -1.05980

animal.303826.42 animal.303827.163 animal.303841.101 animal.303841.81 animal.303841.93

5.52952 -3.06631 5.00095 -7.61280 3.51148

block.1 block.2

5.82717 5.30380

24

Page 25: Modelos de Efectos MixtosModelos de Efectos Mixtos Aplicaciones en mejoramiento gen etico con R Rau l Eyzaguirre 7 de marzo de 2017 Indice 1. Introduccion 3 2. Modelos de efectos mixtos3

5. Modelos con varianzas heterogeneas

Uno de los supuestos mas discutibles en los modelos de diseno experimental es que todas lasobservaciones provienen de distribuciones con la misma varianza, supuesto que ha aparecido eneste documento ya varias veces (ver por ejemplo las expresiones (2) y (4)) al indicar que paratodas las observaciones hay un solo valor de σ.

El supuesto de homogeneidad de varianzas puede ser discutible por ejemplo en experimentosen varios ambientes, donde algunos ambientes podrıan ser propicios para mostrar mas variabilidadentre los genotipos, o cuando se tienen algunos genotipos muy estables y otros muy sensibles alas diferencias entre ambientes. En todos estos casos, podrıa ser conveniente construir modelosque permitan varianzas diferentes dependiendo de los genotipos o ambientes. El problema es queestos modelos no tienen formas simples para la funcion de verosimilitud, y entonces su estimacionpor REML es complicada. Por esta razon, cuando se afronta el problema de heterogeneidad devarianzas, se suele recurrir al enfoque bayesiano y los metodos MCMC.

5.1. Un modelo bayesiano para experimentos en varios ambientes

Considerese por ejemplo el siguiente modelo lineal:

yijk = µ+ αi + βj + δij + εijk (19)

donde

αi es el efecto aleatorio para el genotipo i.

βj es el efecto aleatorio para el ambiente j.

δij es el efecto aleatorio para la interaccion entre el genotipo i y el ambiente j.

Asumase una distribucion normal para todos los componentes aleatorios, esto es:

αi ∼ N(0, σ2α) βj ∼ N(0, σ2

β) δij ∼ N(0, σ2δ ) εijk ∼ N(0, σ2

ε ). (20)

Al igual que en la seccion 4.3.2 se podrıa considerar una distribucion a priori normal con unavarianza grande para los efectos fijos, en este caso

µ ∼ N(0, 1010), (21)

y una distribucion a priori gamma inversa con parametros cercanos a cero para la varianza delerror

σ2ε ∼ IG(10−3, 10−3)

y para las varianzas de los efectos aleatorios

σ2α ∼ IG(10−3, 10−3) σ2

β ∼ IG(10−3, 10−3) σ2δ ∼ IG(10−3, 10−3). (22)

Como es evidente, nuevamente se esta asumiendo que la varianza σ2ε es la misma para todas las

observaciones. Sin embargo, es facil considerar (al menos teoricamente) varianzas heterogeneaspara el error. Una alternativa serıa expandir este modelo considerando un modelo lineal para ellogaritmo del error (ver por ejemplo [5]):

log σ2εij = µε + αεi + βεj + δεij (23)

con distribuciones normales para µε, αεi , βεj y δεij . De esta manera, la varianza del error dependede los genotipos, ambientes, y de la interaccion entre los genotipos y los ambientes.

25

Page 26: Modelos de Efectos MixtosModelos de Efectos Mixtos Aplicaciones en mejoramiento gen etico con R Rau l Eyzaguirre 7 de marzo de 2017 Indice 1. Introduccion 3 2. Modelos de efectos mixtos3

5.2. Ejemplo

5.2.1. Datos

El objeto megaclones2 del paquete st4gi contiene datos para catorce genotipos cultivados encinco ambientes con cuatro repeticiones. A continuacion se muestran las medias y desviacionesestandar de los rendimientos de raız en toneladas por hectarea para cada combinacion genotipopor ambiente.

> tapply(megaclones2$rytha, list(megaclones2$geno, megaclones2$env), mean)

AW09 GD08 GW08 GW09 UD08

Beauregard 13.525 8.350 20.025 15.850 7.000

Blesbok 16.275 10.200 24.550 17.475 3.625

Brondal 20.450 11.275 20.750 14.150 3.825

Cemsa 21.675 7.425 25.375 12.900 9.700

Jewel 11.375 2.850 16.100 15.950 4.450

Jonathan 14.975 1.600 13.600 15.300 1.775

Mohc 21.250 6.225 20.250 25.275 3.175

Naveto 12.450 5.625 19.700 9.500 1.975

ncsu1560 17.850 12.825 28.400 22.925 8.800

Resisto 14.250 6.150 15.675 18.925 4.250

SantoAmaro 24.100 3.875 9.825 7.900 1.575

Tanzania 11.250 10.800 18.000 12.925 3.375

Xushu18 22.650 7.000 23.175 18.500 10.025

Yanshu 7.650 0.625 4.675 16.500 2.525

> tapply(megaclones2$rytha, list(megaclones2$geno, megaclones2$env), sd)

AW09 GD08 GW08 GW09 UD08

Beauregard 3.1436 5.03090 2.5838 2.4201 4.02078

Blesbok 10.0457 8.37735 4.3654 8.3468 1.55000

Brondal 6.0247 5.98909 4.0046 5.9248 4.25314

Cemsa 13.0272 4.11936 5.9556 3.2527 2.24499

Jewel 5.4119 1.77106 1.9613 8.4469 0.90000

Jonathan 1.8283 1.33666 4.5011 5.1910 1.43846

Mohc 12.0746 5.92192 4.2782 10.6950 1.16440

Naveto 7.8164 5.83631 7.1260 4.7223 0.47871

ncsu1560 3.1775 5.83631 2.5612 15.5328 4.79096

Resisto 12.2206 2.50400 4.2469 5.9354 1.25565

SantoAmaro 23.9522 4.01777 3.3718 9.6398 0.78475

Tanzania 4.8911 10.47887 5.2313 8.4279 1.83916

Xushu18 11.2944 3.06268 8.7842 3.8944 2.99040

Yanshu 3.9535 0.65511 0.4113 14.8526 1.30224

Notese que hay gran variabilidad entre las desviaciones estandar, que van desde 0.4113 paraYanshu-GW08 hasta 23.9522 para Santo Amaro-AW09.

5.2.2. Ajuste del modelo bayesiano con varianzas heterogeneas

Ahora se ajustara el modelo definido en la seccion 5.1 expandido con el modelo lineal para lavarianza del error mostrado en (23). Para ajustar el modelo se usara el programa OpenBUGS [13],software libre que puede descargarse desde http://www.openbugs.net/w/Downloads. OpenBUGSpuede ejecutarse desde R con el paquete R2OpenBUGS [18].

Antes de continuar, hay que acomodar los datos en una forma adecuada para que puedan serusados por OpenBUGS. Lo que hay que hacer es crear una lista de objetos que contenga el numerode genotipos (I = 14), el numero de ambientes (J = 5), el numero de repeticiones (K = 4), y losdatos en un arreglo de 3 dimensiones (Y), una para genotipos, una para ambientes y una pararepeticiones.

26

Page 27: Modelos de Efectos MixtosModelos de Efectos Mixtos Aplicaciones en mejoramiento gen etico con R Rau l Eyzaguirre 7 de marzo de 2017 Indice 1. Introduccion 3 2. Modelos de efectos mixtos3

> misdatos <- list(I = 14, J = 5, K = 4,

+ Y = structure(.Data = megaclones2$rytha, .Dim = c(14, 5, 4)))

Lo siguiente es definir los parametros a estimar:

> params <- c("mu0", "gen", "env", "gen.env", "s2G", "s2E", "s2GxE",

+ "mu_e", "geno_e", "env_e", "gen.env_e")

En el codigo anterior mu0 corresponde a µ en (21), gen, env y gen.env corresponden a αi, βj y δken (19), s2G, s2E y s2GxE corresponden a σ2

α, σ2β y σ2

δ en (22), y finalmente mu_e, geno_e, env_ey gen.env_e a los componentes del modelo lineal para el error en (23).

Para ajustar el modelo se usaran tres cadenas de Markov (es usual usar varias cadenas de Mar-kov con puntos de partida diferentes para verificar que todas convergen a la misma distribucion).Se deben definir los valores iniciales que utilizara el algoritmo de simulacion para cada parametroen cada cadena:

> inits1 <- list(mu0 = 10, gen = c(NA, rep(0, 13)), env = c(NA, rep(0, 4)),

+ gen.env = structure(.Data = c(rep(NA, 14), rep(c(NA, rep(0, 13)), 4)),

+ .Dim = c(14, 5)),

+ mu_e = 0, geno_e = c(NA, rep(0, 13)), env_e = c(NA, rep(0, 4)),

+ gen.env_e = structure(.Data = c(rep(NA, 14), rep(c(NA, rep(0, 13)), 4)),

+ .Dim = c(14, 5)),

+ t2G = 0.1, t2E = 0.1, t2GxE = 0.1)

> inits2 <- list(mu0 = 12, gen = c(NA, rep(0, 13)), env = c(NA, rep(0, 4)),

+ gen.env = structure(.Data = c(rep(NA, 14), rep(c(NA, rep(0, 13)), 4)),

+ .Dim = c(14, 5)),

+ mu_e = 0, geno_e = c(NA, rep(0, 13)), env_e = c(NA, rep(0, 4)),

+ gen.env_e = structure(.Data = c(rep(NA, 14), rep(c(NA, rep(0, 13)), 4)),

+ .Dim = c(14, 5)),

+ t2G = 0.02, t2E = 0.02, t2GxE = 0.02)

> inits3 <- list(mu0 = 14, gen = c(NA, rep(0, 13)), env = c(NA, rep(0, 4)),

+ gen.env = structure(.Data = c(rep(NA, 14), rep(c(NA, rep(0, 13)), 4)),

+ .Dim = c(14, 5)),

+ mu_e = 0, geno_e = c(NA, rep(0, 13)), env_e = c(NA, rep(0, 4)),

+ gen.env_e = structure(.Data = c(rep(NA, 14), rep(c(NA, rep(0, 13)), 4)),

+ .Dim = c(14, 5)),

+ t2G = 0.01, t2E = 0.01, t2GxE = 0.01)

> inits <- list(inits1, inits2, inits3)

Ya en la seccion 3.1.3 se habıa mencionado el problema de identificabilidad. Esta situaciones comun a todos los modelos de diseno experimental, y es solucionada facilmente incorporandorestricciones en el modelo, en particular, que todos los efectos de un factor suman cero. En estecaso se tiene exactamente el mismo problema, por lo que es necesario incluir estar restriccionesde alguna manera. Esto se hace en el codigo que aparece arriba en la definicion de cada factorincluyendo un valor NA. Por ejemplo, en la primera lınea, gen = c(NA, rep(0, 13)) implica quede los catorce niveles que tiene el factor genotipo, el primero sera excluido y solo se estimaranefectos para los otros trece (luego en el modelo que aparece mas abajo se especifica que este primergenotipo sera igual a menos la suma de los otros trece, de modo que la suma de los catorce seacero).

En el codigo anterior aparecen los terminos t2G, t2E y t2GxE. Estos no son mas que losrecıprocos de las varianzas s2G, s2E y s2GxE. Lo que ocurre es que la sintaxis de OpenBUGSno trabaja con varianzas sino con sus recıprocos (al recıproco de la varianza se le suele llamar laprecision). Como dato adicional es conveniente mencionar que si una variable tiene una distribuciongamma inversa, su recıproco tiene una distribucion gamma, por lo que en la especificacion delmodelo se usaran distribuciones gamma.

El siguiente paso es definir el modelo. Este debe estar guardado en un archivo de texto en eldirectorio de trabajo de R para poder ser invocado. Para este ejemplo el modelo, que se muestraa continuacion, esta guardado en el archivo model.R (usted debe copiar este texto, pegarlo en un

27

Page 28: Modelos de Efectos MixtosModelos de Efectos Mixtos Aplicaciones en mejoramiento gen etico con R Rau l Eyzaguirre 7 de marzo de 2017 Indice 1. Introduccion 3 2. Modelos de efectos mixtos3

archivo de texto usando Notepad o algun programa similar, y guardar el archivo en su directoriode trabajo con el nombre adecuado):

model {

# model's likelihood

for (i in 1:I){

for (j in 1:J){

for (k in 1:K){

Y[i, j, k] ~ dnorm(mu[i, j], t2[i, j])

}

mu[i, j] <- mu0 + gen[i] + env[j] + gen.env[i, j]

t2[i, j] <- exp(- mu_e - geno_e[i] - env_e[j] - gen.env_e[i,j])

s2[i, j] <- 1 / t2[i, j]

}

}

# Constraints

gen[1] <- - sum(gen[2:I])

env[1] <- - sum(env[2:J])

for (i in 1:I){gen.env[i, 1] <- - sum(gen.env[i, 2:J])}

for (j in 2:J){gen.env[1, j] <- - sum(gen.env[2:I, j])}

geno_e[1] <- - sum(geno_e[2:I])

env_e[1] <- - sum(env_e[2:J])

for (i in 1:I){gen.env_e[i, 1] <- - sum(gen.env_e[i, 2:J])}

for (j in 2:J){gen.env_e[1, j] <- - sum(gen.env_e[2:I, j])}

# Priors

mu0 ~ dnorm(0, 0.0000000001)

for (i in 2:I){gen[i] ~ dnorm(0, t2G)}

for (j in 2:J){env[j] ~ dnorm(0, t2E)}

for (i in 2:I){

for (j in 2:J){

gen.env[i, j] ~ dnorm(0, t2GxE)

}

}

t2G ~ dgamma(0.001, 0.001)

s2G <- 1 / t2G

t2E ~ dgamma(0.001, 0.001)

s2E <- 1 / t2E

t2GxE ~ dgamma(0.001, 0.001)

s2GxE <- 1 / t2GxE

mu_e ~ dnorm(0, 0.0000000001)

for (i in 2:I) {geno_e[i] ~ dnorm(0, 0.0000000001)}

for (j in 2:J) {env_e[j] ~ dnorm(0, 0.0000000001)}

for (i in 2:I){

for (j in 2:J){

gen.env_e[i, j] ~ dnorm(0, 0.0000000001)

}

}

}

28

Page 29: Modelos de Efectos MixtosModelos de Efectos Mixtos Aplicaciones en mejoramiento gen etico con R Rau l Eyzaguirre 7 de marzo de 2017 Indice 1. Introduccion 3 2. Modelos de efectos mixtos3

Finalmente, ya se puede correr el modelo. Para eso se utiliza el comando bugs de R2OpenBUGS.A continuacion se especifica que se realizaran simulaciones para 3 cadenas, con 5000 iteracionespara cada cadena, que se descartaran las primeras 1000 y que se tomara de las 4000 restantes solo1 de cada 10. Esto deja 1200 simulaciones cuasiindependientes para aproximar las distribucionesposteriores de interes.

> library(R2OpenBUGS)

> model.sim <- bugs(misdatos, inits, params, "model.R", n.chains = 3,

+ n.iter = 5000, n.burnin = 1000, n.thin = 10, debug = F)

Los resultados de la simulacion han sido guardados en el objeto model.sim. Dado que las simula-ciones aproximan las distribuciones posteriores de los parametros, a partir de estas simulaciones sepuede obtener cualquier tipo de resultado. Por ejemplo, si el interes esta en estimar la varianza delos genotipos, se podrıa obtener una estimacion puntual calculando la moda de la correspondientedistribucion posterior (la moda es el valor que maximiza una distribucion):

> dp <- density(model.sim$sims.list$s2G)

> moda <- dp$x[which.max(dp$y)]

> moda

[1] 6.9752

De igual manera se podrıa calcular un intervalo de probabilidad (en el enfoque bayesiano el termino“confianza” carece de sentido), alguna probabilidad, o incluso graficar la distribucion posterior:

> plot(dp, main = "Varianza genotıpica", xlab = paste("moda =", format(moda, digits = 4)),

+ xlim = c(0, quantile(model.sim$sims.list$s2G, probs = 0.99)))

> abline(v = moda)

0 5 10 15 20 25

0.00

0.02

0.04

0.06

0.08

0.10

Varianza genotípica

moda = 6.975

Den

sity

Si el interes es comparar un par de genotipos, serıa muy sencillo calcular un intervalo para ladiferencia de sus medias, o quiza incluso mas interesante, la probabilidad de que uno supere alotro. Por ejemplo, la probabilidad de que el genotipo 4 supere al 3 se estima en:

> mean(model.sim$sims.list$gen[,4] > model.sim$sims.list$gen[, 3])

[1] 0.7445

29

Page 30: Modelos de Efectos MixtosModelos de Efectos Mixtos Aplicaciones en mejoramiento gen etico con R Rau l Eyzaguirre 7 de marzo de 2017 Indice 1. Introduccion 3 2. Modelos de efectos mixtos3

Referencias

[1] Bates D (2010). lme4: Mixed-Effects Modelling with R. Springer.

[2] Bates D, Maechler M, Bolker B, Walker S (2015). Fitting Linear Mixed-Effects Models Usinglme4. Journal of Statistical Software, 67(1), 1-48. doi:10.18637/jss.v067.i01.

[3] Bates D, Vazquez A (2014). pedigreemm: Pedigree-based mixed-effects models. R packageversion 0.3-3. https://CRAN.R-project.org/package=pedigreemm.

[4] Coster A (2013). pedigree: Pedigree functions. R package version 1.4. https://CRAN.

R-project.org/package=pedigree

[5] Edwards JW, Jannink J-L (2006). Bayesian Modeling of Heterogeneous Error and Genotype× Environment Interaction Variances. Crop Sci. 46: 820-833.

[6] Eyzaguirre R (2016). st4gi: Statistical tools for genetic improvement. R package version 0.9.11.

[7] Faraway J (2006). Extending the Linear Model with R. Chapman & Hall/CRC.

[8] Gelman A, Carlin J, Stern H, Rubin D (2004). Bayesian Data Analysis, second edition. Chap-man & Hall/CRC.

[9] Hadfield J (2010). MCMC Methods for Multi-Response Generalized Linear Mixed Models:The MCMCglmm R Package. Journal of Statistical Software, 33(2): 1-22. http://www.

jstatsoft.org/v33/i02/.

[10] Harville D, Callanan T (1989). Computational aspects of likelihood-based inference for varian-ce components. Pages 136-176 in Advances in Statistical Methods for Genetic Improvementof Livestock. Gianola and Hammond, ed. Springer-Verlag, Berlin, Germany.

[11] Henderson CR (1975). A rapid method for computing the inverse of a relationship matrix. J.Dairy Sci. 58: 1727-1730.

[12] Henderson CR (1976). A simple way for calculating the inverse of a numerator relationshipmatrix used in prediction of breeding values. Biometrics 32: 69-83.

[13] Lunn D, Spiegelhalter D, Thomas A, Best N (2009). The BUGS project: Evolution, critiqueand future directions (with discussion). Statistics in Medicine 28: 3049–3082.

[14] Pinheiro J, Bates D, DebRoy S, Sarkar D and R Core Team (2016). nlme: Linear and NonlinearMixed Effects Models. R package version 3.1-128, http://CRAN.R-project.org/package=nlme.

[15] Pinheiro J, Bates D (2010). Mixed-Effects Models in S and S-Plus. Springer.

[16] R Core Team (2016). R: A language and environment for statistical computing. R Foundationfor Statistical Computing, Vienna, Austria. https://www.R-project.org/.

[17] Sorensen D, Gianola D (2002). Likelihood, Bayesian and MCMC Methods in QuantitativeGenetics. Springer.

[18] Sturtz S, Ligges U, Gelman A (2005). R2WinBUGS: A Package for Running WinBUGS fromR. Journal of Statistical Software, 12(3): 1-16.

[19] Vazquez A, Bates D, Rosa G, Gianola D, Weigel K (2010). Technical note: An R package forfitting generalized linear mixed models in animal breeding. J. Anim. Sci. 88: 497-504.

[20] Wright S (1922). Coefficients of inbreeding and relationship. Amer. Nat. 56: 330-338. (Avai-lable online at http://aipl.arsusda.gov/publish/other/wright1922.pdf).

30