Selegen Nov 11-2010

46

Transcript of Selegen Nov 11-2010

Page 1: Selegen Nov 11-2010
Page 2: Selegen Nov 11-2010

Análisis de datos de ensayos genéticos forestales a través del programa SELEGEN

(REML/BLUP)

Iván Javier Pastrana Vargas, Ingeniero Agrónomo, Est. MCA énfasis en Fitomejoramiento

[email protected]; [email protected]

Universidad de CórdobaFacultad de Ciencias Agrícolas

Oficina de PostgradosMontería

2010

Page 3: Selegen Nov 11-2010

CONTENIDO

1. Introducción2. Generalidades3. Historia4. Importancia del uso de modelos mixtos para el análisis de datos

genéticos5. Algunas investigaciones desarrolladas usando SELEGEN

REML/BLUP6. Usos y aplicaciones del programa7. Metodologías de uso del programa

7.1 Instalación7.2 Preparación de los datos7.3 Ejecución del programa7.4 Resultados (Salidas)

8. Consideraciones finales

Page 4: Selegen Nov 11-2010

1. INTRODUCCIÓN

• Estimación de parámetros genéticos (PG) asociados a laselección en MG de plantas anuales ha sido ampliamentedescrito (Vencovsky, 1987; Vencovsky & Barriga, 1992;Ramalho et al., 1993; Cruz & Regazzi, 1994; Cruz, 1997;Ramalho et al., 2000).

• Especies perennes: estimaciones más precisas.

• Mejoramiento de especies forestales: técnicas deevaluación genética desempeñan un papel fundamental→ predicción de valores genéticos aditivos y genotípicosde candidatos a selección (Resende, 2000).

Page 5: Selegen Nov 11-2010

1. INTRODUCCIÓN

• Eficiencia del MG de especies forestales: selección precisay de alta confiabilidad.

• Selección → identificación de plantas con los mejoresgenotipos.

• Forestales: Caracteres de interés: cuantitativos: elevadainfluencia ambiental.

• Selección precisa: métodos estadísticos adecuados →Selección basada en valores genéticos libres de lasinfluencias ambientales (Resende et al., 2007).

Page 6: Selegen Nov 11-2010

1. INTRODUCCIÓN

• Métodos: corregir datos para efectos ambientales (debloques, parcelas, localidades, etc.) y ponderan estosvalores corregidos por la heredabilidad del carácterseleccionado (Resende et al., 2007).

• Necesidad en MGF: Herramienta → estimacionesfidedignas de valores genéticos aditivos y genotípicos.

• Selegen REML/BLUP: Estimar con precisión componentesde VG de interés → Ayuda a hacer selección de individuosy/o familias de arboles con mayor confiabilidad yesperanza de éxito en un PMG forestal.

Page 7: Selegen Nov 11-2010

2. GENERALIDADES

A. Ciclo de MG de especies forestales.

Page 8: Selegen Nov 11-2010

2. GENERALIDADES

B. Objetivo p/pal de un PMG de especies forestales.

Page 9: Selegen Nov 11-2010

2. GENERALIDADES

Clones Fam. PC Fam. PA Mez. HS APS

B. Objetivo p/pal de un PMG de especies forestales.

Page 10: Selegen Nov 11-2010

2. GENERALIDADES

C. Eficiencia de la selección en un PMG forestal.

Page 11: Selegen Nov 11-2010

2. GENERALIDADES

C. Eficiencia de la selección en un PMG forestal.

Page 12: Selegen Nov 11-2010

2. GENERALIDADES

D. Diseño de ensayo genético en especies forestales.

Page 13: Selegen Nov 11-2010

2. GENERALIDADES

E. Avances genéticos con la selección en forestales.

Page 14: Selegen Nov 11-2010

2. GENERALIDADES

F. Efectos a controlar en la evaluación genética.

Localidad 1 Localidad 2

Interacción genotipo por ambiente

Page 15: Selegen Nov 11-2010

3. HISTORIA

• Década 90’: Perfeccionamiento de metodologías deselección genética: análisis matemático y estadístico dedatos.

• En contexto de SR en MG de plantas; métodos deselección evolucionaron siguiendo aproximadamente lasiguiente cronología:– Selección de familias

• Entre medias de familia (Vencovsky, 1987)• BLP de familias (White & Hodge, 1989; Bueno Filho, 1997)• BLP de familias en varias localidades (Resende et al., 1993)• REML/BLUP de familias (Resende et al., 1996; Duarte, 2000)

Page 16: Selegen Nov 11-2010

3. HISTORIA

• Continuación…– Selección de individuos

• Entre familias y dentro de parcela (Kageyama & Vencovsky, 1983)• Entre familias corregida y dentro de familia en el experimento

(Resende, 1991)• Individual por la selección combinada (Resende, 1991; Bueno Filho,

1992; Morais, 1994)• Individual por el índice multi-efectos (IME) o BLUP individual

(Resende & Higa, 1994)• Individual por la selección combinada modificada (Pires et al.,

1996)• REML/BLUP individual (Resende & Fernandes, 1999; Resende,

1999, Resende & Dias, 2000)

Page 17: Selegen Nov 11-2010

3. HISTORIA

• 1990: Industrias celulosa de Eucalipto (Brasil): demandarmétodos precisos de selección con base en valoresgenéticos y no fenotípicos.

• 1992: Índice multi-efectos (IME) para selección óptima anivel de individuos.

• 1993: inicio de Selegen y uso de metodología de modeloslineales mixtos (vía mejor predicción lineal) en MG (enBrasil).

Page 18: Selegen Nov 11-2010

3. HISTORIA

• 1997/1998: demostración de que IME = BLUP a nivelindividual.

• 1995: aplicación del procedimiento REML/BLUP individualen MGF a nivel individual (Borralho et al., 1995).

• 2000: Software Selegen-REML/BLUP; Atender la rutina dePMG vegetal, en especies perennes.

Page 19: Selegen Nov 11-2010

4. Importancia del uso de modelos mixtos para el análisis de datos genéticos

• Estimación y predicción de PG asociados a la selección:MGF: metodología de modelos mixtos (REML/BLUP) anivel individual.

• Experimentos de campo: ensayos genéticos:desbalanceados (Resende et al., 2007).

• Procedimiento adecuado de análisis y selección enexperimentos debe tener los siguientes atributos:– Propiciar selección con base en valores genotípicos libres de

efectos ambientales;– Considerar de forma adecuada el desbalance de los datos.

Page 20: Selegen Nov 11-2010

4. Importancia del uso de modelos mixtos para el análisis de datos genéticos

• Método: Datos balanceados: mejor predicción lineal insesgada(BLUP) de valores genéticos a nivel individual (Henderson & Quaas,1976) = índices de selección multi-efectos (Resende & Higa, 1994).

• Predicción con BLUP o IME: componentes de varianza sonconocidos.

• Datos desbalanceados: Método de la máxima verosimilitudrestringida (REML) (Patterson & Thompson, 1971).

• Técnicas óptimas de evaluación genética: Predicción de valoresgenéticos y estimación de componentes de varianza (PG) →REML/BLUP (Resende et al., 2007).

Page 21: Selegen Nov 11-2010

5. Algunas investigaciones desarrolladas usando Selegen REML/BLUP

Especie Variable Parámetro estimado Fuente

Bactris gasipaes

Altura de plantas

h2e Farías y Resende, 2001

Diametro a la altura del cuello Tamaño del palmitoDiametro del palmitoPeso del palmito apicalPeso del palmito basalPeso del palmito liquido

Eucalyptus grandisDiámetro a la altura del pecho

h2e, GG Barros et al., 2006Altura total

Volumen individualEucalyptus spp. Volumen h2

e, GG García y Nogueira, 2005Acacia mearnsii Altura h2

e Dunlop y Resende, 2005

Pinus caribaea var. HondurensisVolumen

h2(Varios), GG, rAxy

Sampaio et al., 2000Forma de fusteSobrevivencia

Archontophoenix spp.

Diámetro

h2e Bovi et al., 2003

AlturaNúmero de hojas verdesLongitud del limbo de la 2ª hoja

Hevea brasiliensis

# anillos de vasos laticíferos

h2e, GG Costa et al., 2000

Producción de cauchoGrosor de la cortezaCircunferencia del tallo

Mimosa scabrella var. Aspericarpa Diámetro a la altura del pecho h2e, GG Sturion et al., 1994

h2e: Heredabilidad; GG: ganancia genética; rAxy: Correlación aditiva

Page 22: Selegen Nov 11-2010

6. Usos y Aplicaciones de SELEGEN

• Selegen-REML/BLUP: fue desarrollado para atender larutina de los PMG y contempla las siguientes categoríasde plantas:

– alógamas,– autógamas,– de sistema reproductivo mixto y– de propagación clonal.

• Además considera:– varios diseños experimentales,– varios diseños de cruzamiento,– interacción genotipo x ambiente y– experimentos repetidos en varias localidades, medidas repetidas, progenies

pertenecientes a varias poblaciones,– entre otros factores.

Page 23: Selegen Nov 11-2010

6. Usos y Aplicaciones de SELEGEN

• Selegen REML/BLUP: No se restringe a ajustar los efectos ypresentar los componentes de varianza: valores genéticos [a],[d] y genotípicos de individuos, GG, tamaño efectivopoblacional entre otros parámetros interesantes almejoramiento vegetal (Resende, 2000).

• Proporciona (Resende et al., 2007):

– Estimaciones de todos los PG y fenotípicos de interés, al igual que valores genéticospredichos de todos los individuos de los experimentos y también de lasprocedencias y progenies.

– Un análisis genético multivariado considerando varios caracteres simultáneamente,lo que permite la selección simultanea de varios caracteres, el estudio de ladivergencia genética y el agrupamiento de los materiales genéticos.

Page 24: Selegen Nov 11-2010

6. Usos y Aplicaciones de SELEGEN

• Selegen REML/BLUP: Versiones en DOS y Windows:

• Actualmente contempla más de 150 modelos de análisis:varían con los diseños experimentales y con la estructuragenética de las pruebas.

• Selegen-REML/BLUP es de fácil uso e interpretación,permitiendo usarlo en forma eficiente con la mayoría desituaciones comunes en el mejoramiento vegetal.

Page 25: Selegen Nov 11-2010

7. Metodología de uso del programa

Page 26: Selegen Nov 11-2010

7.1. Instalación

A. El programa no necesita ser instalado, consta de un archivo.EXE, el cual se ubica en una carpeta, en la Unidad de trabajo(“Disco D:/”).

Page 27: Selegen Nov 11-2010

7.2. Preparación de los datos

A. Escogencia del ModeloModelo 1 (diseño en “Bloques completos al azar, progenies demedios hermanos, varias plantas por parcela”).

B. Preparación del ArchivoLos datos colectados en campo se deben preparar en una matriz enel programa Microsoft Excel.

• Ejemplo:– Especie: Eucalipto– Objetivo: Determinar PG; evaluación de progenies de medios hermanos.– Datos: Ensayo de progenie.– Variables: Altura total y sobrevivencia.– No. De familias: 39.– Diseño experimental: BCA con 5 repeticiones.– U.E.: 4 árboles.

Page 28: Selegen Nov 11-2010

– A continuación se muestra el arreglo de la matriz de datos:

Figura 1. Modelo de matriz para la ejecución del programa Selegen.

7.2. Preparación de los datos

Page 29: Selegen Nov 11-2010

C. Archivo de datos: Guardar: Carpeta contenida en la mismaubicación de la carpeta (preferiblemente) en la que se encuentra elarchivo .EXE de ejecución del programa Selegen REML/BLUP.

7.2. Preparación de los datos

Page 30: Selegen Nov 11-2010

D. ¿Como guardar el archivo?– El archivo generado en Microsoft Excel, debe grabarse en la

extensión .PRN (Texto separado por tabulaciones) ó .TXT (Archivode texto plano) (Figura 2a y 2b).

7.2. Preparación de los datos

Page 31: Selegen Nov 11-2010

Figura 2a. Procedimiento para salvar los datos bajo la extensión .PRN (Texto delimitado por tabulaciones).

7.2. Preparación de los datos

Page 32: Selegen Nov 11-2010

Figura 2b. Procedimiento para salvar los datos bajo la extensión .PRN (Texto delimitado por tabulaciones).

Page 33: Selegen Nov 11-2010

A. Luego de tener organizada la matriz de datos en un archivo de“Texto separado por tabulaciones” (.prn) ó de “texto plano”(.txt), se procede al análisis de los mismos mediante el ingresoal programa SELEGEN REML/BLUP.

– Acceder al programa mediante su ubicación en el PC,– se abrirá una ventana como se muestra en la Figura 3, en la cual se

presentan los procedimientos matemáticos, estadísticos y genéticosque son desarrollados por el software.

– Seleccionar el procedimiento con el cual se va a trabajar. Para nuestrocaso, con el ejemplo propuesto, debemos seleccionar el link que indica“Modelos mistos: Delineamientos experimentais / Materiais genéticos/ Ambientes”.

7.3. Ejecución del programa

Page 34: Selegen Nov 11-2010

Figura 3. Ventana de inicio del programa Selegen REML/BLUP.

7.3. Ejecución del programa

Page 35: Selegen Nov 11-2010

B. Inmediatamente se despliega otra ventana, en la cual se debenseguir los siguientes pasos (Figura 4):

1. Archivo: se selecciona el archivo (.PRN ó .TXT) preparado con los datoscolectados en campo para el análisis, el cual previamente se ha tabuladoen Microsoft Excel;

2. Se escoge el modelo a utilizar, en este caso será el modelo 1correspondiente al diseño en “Bloques completos al azar, progenies demedios hermanos, varias plantas por parcela”;

3. Se escribe el número de variables evaluada, para el caso del ejemplo sondos;

4. luego se escribe el orden de la variable a ser analizada (En el ejemplo haydos variables –Altura y Sobrevivencia –, las cuales por columna tienen elorden 1 y 2 respectivamente), en este caso se analizara la variable altura,la cual está en el orden uno (1), y;

5. Finalmente se ejecuta el programa, presionando click en el link“executar”.

7.3. Ejecución del programa

Page 36: Selegen Nov 11-2010

1

2

34

5

Figura 4. Secuencia del procedimiento de análisis de datos en Selegen REML/BLUP.

7.3. Ejecución del programa

Page 37: Selegen Nov 11-2010

C. Si el programa ejecutó bien los datos, entonces debeaparecer en pantalla una ventana de trabajo en SistemaDOS (Figura 5), en caso contrario, entonces aparecerásolo la información que muestra la figura 6.

7.3. Ejecución del programa

Page 38: Selegen Nov 11-2010

Figura 5. Ejecución de datos mediante el programa Selegen REML/BLUP.

7.3. Ejecución del programa

Page 39: Selegen Nov 11-2010

Figura 6. Información de salida, cuando la ejecución del análisis no se realizó en forma satisfactoria.

7.3. Ejecución del programa

Page 40: Selegen Nov 11-2010

D. De los procedimientos anteriores se obtiene una salidadel análisis de datos (Figura 7), con todos loscomponentes de varianza estimados, los cuales ayudarána tomar decisiones en cuanto a la selección dentro yentre progenies para la selección de individuossuperiores.

7.3. Ejecución del programa

Page 41: Selegen Nov 11-2010

7.4. Resultados (Salidas)

Figura 7. Salida de un análisis de ensayo genético en Selegen REML/BLUP.

Page 42: Selegen Nov 11-2010

– h2ad: heredabilidad aditiva dentro de parcela.

– CVgi%: coeficiente de variación genética aditiva individual.

– CVgp%: coeficiente de variación genotípica entre progenies.

– CVe%: coeficiente de variación residual.

– CVr = CVgp/CVe = coeficiente de variación relativa.

– PEV: varianza del error de predicción de los valores genotípicos de progenie, asumiendo sobrevivencia completa.

– SEP: desviación estándar del valor genotípico predicho de progenie, asumiendo sobrevivencia completa.

– Media general del experimento.

7.4. Resultados (Salidas)

– Va: varianza genética aditiva.

– Vparc: varianza ambiental entre parcelas.

– Ve: varianza residual (ambiental + no aditiva).

– Vf: varianza fenotípica individual.

– h2a = h2: heredabilidad individual en sentido estricto, es decir, de los efectos aditivos.

– h2aj: heredabilidad individual en sentido estricto, ajustada para los efectos de parcela.

– c2parc = c2: coeficiente de determinación de los efectos de parcela.

– h2mp: heredabilidad de la media de progenies, asumiendo sobrevivencia completa.

– Acprog: Precisión de la selección de progenies, asumiendo sobrevivencia completa.

A. Para el análisis realizado al ejemplo de evaluación de progenie de eucalipto, con el modelo 1, se tienen los siguientes componentes de varianza (REML individual):

Page 43: Selegen Nov 11-2010

B. Asimismo, el programa arroja una lista de las medias de losprogenitores teniendo en cuenta la ganancia genética del carácterrespecto a su heredabilidad (Para cada familia), haciendo un rankingde las familias evaluadas (Figura 8), facilitando así la selección de losmejores individuos y/o familias. En esta salida,

– la primera columna se refiere al orden rankeado por el programa de las familiasevaluadas el término,

– la segunda columna se refiere a las familias evaluadas en su orden,– el término “a” de la tercera columna se refiere al efecto genético aditivo

predicho para cada una de las familias evaluadas,– luego aparece en la siguiente columna la ganancia estimada para el carácter

evaluado (en este caso, el carácter Altura) y,– finalmente aparece en la última columna la nueva media ajustada por la

heredabilidad del carácter.

7.4. Resultados (Salidas)

Page 44: Selegen Nov 11-2010

Figura 8. Media de los progenitores teniendo en cuenta la ganancia genética.

7.4. Resultados (Salidas)

Page 45: Selegen Nov 11-2010

8. Consideraciones finales

• Selegen REML/BLUP, es un software muy versátil y muestra granimportancia en el análisis de datos de ensayos genéticos forestales,generando confiabilidad y facilidad en la interpretación de losresultados.

• El uso de Selegen REML/BLUP, permite seleccionar y/o desarrollarde forma más confiable los programas de mejoramiento forestal,conforme los resultados generados por el programa.

• El programa es fácil de manejar y su autor permanentemente loestán actualizando de acuerdo a los requerimientos de losinvestigadores, con el desarrollo de nuevos modelos de análisis.

Page 46: Selegen Nov 11-2010