Analisis de componentes pples Biología.docx

download Analisis de componentes pples Biología.docx

of 22

Transcript of Analisis de componentes pples Biología.docx

ANLISIS DE COMPONENTES PRINCIPALES

Qu es el Anlisis de componentes principales (ACP)?Es una tcnica estadstica multivariada cuyo objetivo es el anlisis de la informacin contenida en una tabla del tipo Xn, k, donde:n: son las filas (individuos).k: son las columnas (variables de tipo cuantitativo).xi, j: valor para el individuo i de la variable j.Las variables de tipo cuantitativo son aquellas que se miden, tal como el peso, la talla, el nmero de individuos, etc.IndividuoV1V2Vk

1X11X12X1k

2X21X22X2k

3X31X32X3k

...............

nXn1Xn2Xnk

Media

DesvEsts.1s.2s.k

Qu se busca con un anlisis de componentes principales (ACP)?1. Evaluar la semejanza de los individuos a travs de las variables consideradas. Existen tipos de individuos semejantes? Se observa una tipologa de individuos?2. Evaluar la relacin existente entre las variables Existen grupos de variables correlacionadas? Se observa una tipologa de variables?

Introduccin al ACP.Inicialmente se pretende entender el concepto de anlisis multivariado, para ello se plantea el siguiente ejercicio:Ejercicio 1. a) Se desea conocer qu individuos son ms semejantes entre ellos, de acuerdo a la variable Edad. Para lo que se dispone de la tabla 1:

Tabla 1. Edad (aos)

IndividuoPedroJuanMaraGonzaloLucaGloriaInslvaroEduardoHernandoAnitaMarianaDavidPablo

Edad (aos)2015181729585955155323242829

Se observa que Eduardo y Pedro son ms parecidos en cuanto a la edad, que Pedro y Luca (figura 1).

Figura 1. Edad En este caso la relacin entre los individuos se determin a travs de una lnea recta (espacio R1).b) Si desea conocer qu individuos son ms semejantes entre ellos, de acuerdo a las variables Edad (aos) y Estatura (cm): tabla 2.

Tabla 2. Edad (aos) y Estatura (cm)

IndividPedroJuanMaraGonzaloLucaGloriaInslvaroEduardHernandAnitaMarianDavidPablo

Edad2015181729585955155323242829

Estatura170160181145160156172186175178157160169170

Es claro que Mara y Eduardo son ms parecidos en cuanto a la edad y a la estatura, que Mara e Ins (figura 2).

Figura 2. Edad (aos) vs. Estatura (cm)La relacin entre los individuos se determin a travs de un plano (espacio R2).c) Se desea conocer qu individuos son ms semejantes entre ellos, de acuerdo a las variables Edad (aos), Peso (kg) y Estatura (cm): Tabla 3.

Tabla 3. Edad (aos), Estatura (cm) y Peso (kg)

IndividPedroJuanMaraGonzaloLucaGloriaInslvaroEduardHernandAnitaMarianDavidPablo

Edad2015181729585955155323242829

Estatura170160181145160156172186175178157160169170

Peso6365715155547181789061647568

Figura 3. Edad, Peso y EstaturaLa relacin entre los individuos se determina a travs de un espacio en R3, y se observa por ejemplo que Anita y Luca son ms parecidos en cuanto a la edad, peso y estatura, que Juan e Ins (figura 3). d) Qu ocurre cuando se desea conocer la cercana entre individuos o la correlacin entre variables y se tiene k de estas ltimas, k > 3?Note en la figura 3 que si tomsemos una fotografa del plano edad vs estatura, Ins, lvaro y Hernando apareceran muy cercanos, pero si tal fotografa fuera del plano peso vs. edad, se hace evidente que Ins y lvaro no son tan similares en estas variables, como Hernando y lvaro.Se recomienda entonces, acudir al ACP, para encontrar la mejor fotografa o fotografas en R2, que permitan analizar en la prctica tales cercanas o correlaciones.Despus de tener la matriz de individuos y variables cuantitativas, Qu sigue?Se obtienen los valores y vectores propios de la matriz de correlaciones; posteriormente, al graficar los vectores propios, se llega al grafico de sedimentacin o al histograma de valores propios (figuras 4 y 5), los que permiten seleccionar aquellos valores propios mayores a la unidad, en este caso nicamente el primero (pero dejaremos los dos primeros para al menos tener un plano xy). Tales valores propios explican el 94.97% de la variacin total de los datos y generan dos vectores propios (factores) que producen un plano xy.En el histograma de valores propios se analiza la tendencia de tal histograma para seleccionar el nmero de valores propios a retener.

Figura 4. Grfico de sedimentacin

Figura 5. Histograma de valores propios

Los 3 valores propios se asocian a 3 vectores propios, los que generan el nuevo sistema (xyz) donde se ubican los puntos individuos y variables (figura 6).

Figura 6. Coordenadas de las variables en el nuevo sistema coordenado

La figura 6 permite:a) Definir los 3 componentes principales (factores) que son:

C1 =0.38614*EDAD +0.652431*PESO+0.652096*TALLA

C2 =-0.92244*EDAD+0.271918*PESO+0.274166*TALLA

C3 =0.001558*EDAD-0.70739*PESO+0.706826*TALLA

La media de los componentes es cero, sus varianzas son los autovalores y no son correlacionados.b) Establecer las coordenadas de los individuos en el nuevo sistema coordenado:Al reemplazar Edad (X), Peso (Y) y Talla (Z), por los valores de las variables en la matriz centrada y estandarizada, obtenemos las coordenadas de cada individuo en el nuevo sistema de ejes (figuras 7, 8 y 9 y tabla 4).

Tabla 4. Coordenadas de los individuos en el nuevo sistema de coordenadas

IndividuoPedroJuanMaraGonzalLucaGloriaInslvaroEduardHernanAnitaMarianDavidPablo

Coordenad Compon 1-0,37-0,950,70-2,60-1,22-0,851,112,430,692,45-1,18-0,800,470,13

Coordenad Compon 20,590,671,17-0,15-0,34-2,05-1,29-0,491,36-0,350,060,160,430,22

Coordenad Compon 30,48-0,280,66-0,320,370,180,100,33-0,17-0,75-0,21-0,21-0,350,16

Figura 7. Representacin de los puntos individuos en el espacio de componentes

Figura 8. Representacin de los puntos individuos en el espacio de los dos primeros componentes

Figura 9. Representacin de los puntos individuos en el espacio de los dos primeros componentes

d) Con las coordenadas de los individuos se encuentra la calidad de representacin de los mismos y su contribucin al nuevo sistema coordenado (figura 10).

Figura 10. Coordenadas, contribuciones y calidad de la representacin (coseno cuadrado) de los puntos individuos al nuevo sistema coordenado

La calidad de la representacin (coseno cuadrado) de los individuos en cada eje factorial, estar dada por: Para Pedro en el eje1 = (coordenada en el factor 1)2 = 0,19 ((-0,37)2+(0,59)2+(0,48)2)Para Pedro en el eje 2 = (coordenada en el factor 2)2 = 0,49 ((-0,37)2+(0,59)2+(0,48)2)Para Pedro en el eje 3 = (coordenada en el factor 3)2 = 0,32 ((-0,37)2+(0,59)2+(0,48)2)Lo que indica que Pedro est mejor representado en el plano YZ que en el plano XY. Note que la suma del coseno cuadrado en los tres ejes debe ser la unidad.La contribucin de cada individuo al nuevo sistema coordenado, estar dado por la norma de cada vector individuo (coordenada del individuo en cada factor), con relacin a la norma total (suma de normas para todos los individuos).

e) Las coordenadas de las variables peso, estatura y talla en el nuevo sistema, estarn dadas por la correlacin de cada una de ellas con cada uno de los componentes:

Entonces, se obtiene:Coordenada 1Coordenada 2Coordenada 3

Edad-0,5500938670,8351-0,000605

Peso-0,929450873-0,2461730,27481

Talla-0,928973477-0,248208-0,274592

Figura 11. Variables activas e individuos en el Primer plano factorial

La calidad de la representacin de las variables se observa de acuerdo a la proximidad de la norma del vector a la unidad (figura 11), donde la Edad est mejor representada en el plano que las variables peso y estatura.Se observa que las coordenadas de las variables Edad, Peso y Talla (figura 6), son iguales a las correlaciones, pues se trabaj con la matriz centrada y estandarizada.

Conclusiones. 1. La variable Peso y estatura se encuentran correlacionadas de manera directa, la Edad es independiente de ellas.2. Ins es de las mayores y tiene un peso alto y estatura alta.3. Cecilia es de las mayores y tiene un peso alto y estatura baja.4. lvaro y Hernando son de los mayores y tiene un peso alto y estatura muy altos.5. Gonzalo es el que menos pesa y el ms pequeo.6. Luca tiene una edad promedio, pero un peso y una estatura por debajo de la media.7. Mara y Eduardo son jvenes, pero tienen peso y estatura por encima de la media.

Ejercicio 2Variables nominales: si a una modalidad de una variable categrica le corresponde un valor test superior en valor absoluto 1.98, sobre un factor s, se debe rechazar la hiptesis nula (o sea que la modalidad est bien representada sobre ese eje).

La Federacin de Cafeteros realiz un estudio comparativo de 35 marcas de caf que actualmente se venden en Europa, a fin de seleccionar aquellos que presentan la relacin calidad/precio ms favorable.La calidad del caf vara fundamentalmente en funcin del % de orgnicos utilizados en su proceso de cultivo y el tiempo de fermentacin. Es por ello que estos elementos son argumentos de publicidad de las marcas de categora superior. Pero, dos marcas de caf con esas variables similares, pueden sinembargo, ser de calidad muy diferente en razn de sus procesos de recoleccin, molienda, tostado, etc. Por ello, se decidi medir la calidad del caf mediante tres descriptores: el % de orgnicos, el tiempo de fermentacin y una nota de calidad global atribuida por un panel de expertos catadores.El objetivo de este estudio es seleccionar las marcas de caf que presentan en Europa, la relacin calidad/precio ms favorable para el consumidor final. La Categora, figura obligatoriamente en la etiqueta del caf y juega un papel muy importante en las campaas publicitarias de las marcas, puede ser excelso (3), de lujo (2) y estndar (1).

Caf No.Precio de la libra (centavos de euro)% Orgnicos utilizadosCategoraTiempo de fermentacin (horas)Calific por expertos

17020153

26020152

3652017.52

474251122

570251123

67330150

77030180

85530152

9773015.50

1093301120

1182301122

12733326.51

136233283

1487332123

1578352102

167340210.54

17874028.52

18804028.52

19854029.52

20874028.54

21804029.52

22834029.51

239040212.52

24110402123

25874025.52

26113452124

2796452123

2882452123

2912710038.54

301601003123

31901003124

32861003122

331001003103

341001003113

35951003120

a) Cules son las 3 marcas de caf ms caras? Y las ms baratas?b) Cul es el valor medio, mediano y el coeficiente de variacin del tiempo de fermentacin de las marcas estudiadas?c) Cul es la distribucin de las marcas de caf segn las categoras de las mismas?d) La variable Categora es una variable continua? Por qu debe ser definida como variable suplementaria?e) Qu tipo de anlisis de componentes principales sugiere usted en este caso, el de descomposicin factorial de la matriz de correlaciones o el de descomposicin factorial de la matriz de varianzas/covarianzas?f) Cuntos ejes factoriales deben ser conservados en la interpretacin del anlisis?g) Cules son las marcas de caf que son poco contributivas a la inercia proyectada sobre el primer plano y que estn mal representadas en dicho plano?h) Cules son las caractersticas comunes de las marcas 16, 20 y 26?i) Cules son las caractersticas comunes de las marcas 30, 33 y 34?j) Cules son las caractersticas comunes de las marcas 2, 3 y 8?k) Cules son las caractersticas comunes de las marcas 6, 7 y 9?l) Por qu el primer plano factorial permite ver que las variables Precio, % de orgnicos y Tiempo de fermentacin, presentan correlaciones positivas y relativamente altas entre ellas?m) Por qu el primer plano factorial permite ver que la variable Calificacin presenta correlaciones positiva, pero no muy alta con las variables Precio, % de orgnicos y Tiempo de fermentacin?n) Podemos considerar que el primer eje es una buena combinacin lineal de las cuatro variables activas?o) Cules son las variables mejor correlacionadas con el segundo eje factorial?p) Cules son las marcas de caf que presentan una relacin calidad/precio ms interesante para el consumidor?q) Cules son las marcas de caf que presentan una relacin calidad/precio menos interesante para el consumidor?r) Comprara usted el caf No. 32?s) Qu relacin observa entre la calidad del caf y la categora anunciada en el empaque?

Ejercicio 3. SITUACION SOCIO-ECONMICA EN LATINO AMRICA1. OBJETIVOSDeterminar si el ndice de desarrollo Humano (IDH), es un ndice adecuado para representar la situacin socio econmica de un pas.

2. DATOSSe dispone de un conjunto de indicadores generales en el sector de la salud y de la economa para 10 pases de Amrica Latina a 1990. Tambin se tiene informacin demogrfica. Las variables disponibles son las siguientes:

VariableNombre VariableDescripcin de la variable

1

EVEsperanza de vida (aos)

2TMETiempo medio de escolarizacin (aos)

3PIBProducto interior bruto, per capita (US$)

4IDHndice de Desarrollo Humano

5PNBProducto nacional bruto, per capita (US$)

6GPIGasto pbl. En la instruccin (en % del PNB)

7ACCAporte calrico cotidiano (%de las necesidades normalizadas)

8T_MORTTasa de mortalidad en menores de 15 aos (por 1000 nacidos vivos)

9T_ALFTasa de alfabetizacin de las mujeres (%poblacin femenina mayor de 15 aos)

10PRPoblacin rural (% del total de la poblacin)

11HMCantidad de habitantes por mdico

12CTCantidad de telfonos por 1000 habitantes

13TFTasa de fertilidad

14DEUDMonto de la deuda total (% del PNB)

15CARGAImportancia de la carga de la deuda (% de las exportaciones y bienes de servicios)

16ESSEmpleados del sector servicios (%Poblacin activa)

Los datos se muestran adelante.a) Cules son los 3 pases con mayor tasa de mortalidad infantil?b) Cul es el valor medio, mediano y el coeficiente de variacin de la esperanza de vida?c) Cul es la distribucin del IDH?d) Qu tipo de anlisis de componentes principales sugiere usted en este caso, el de descomposicin factorial de la matriz de correlaciones o el de descomposicin factorial de la matriz de varianzas/covarianzas?e) Cuntos ejes factoriales deben ser conservados en la interpretacin del anlisis?f) Cules son los pases que son poco contributivas a la inercia proyectada sobre el primer plano y que estn mal representadas en dicho plano?g) Cules son las caractersticas comunes de Ecuador y Paragay?h) Cules son las caractersticas comunes de Bolivia y Per?i) Cules son las caractersticas comunes de Venezuela, Colombia y Urugay?j) Cules son las caractersticas comunes de Argentina y Chile?k) Qu variables estn correlacionadas en el primer plano factorial?l) Cul es la variable que presenta menor correlacin con las dems en el primer plano factorial?m) Podemos considerar que el primer eje es una buena combinacin lineal de las variables activas?n) Cmo definira a Colombia de acuerdo al primer plano factorial?o) Cmo define a Bolivia de acuerdo con el primer plano factorial?p) El IDH es un ndice adecuado para representar la situacin socio econmica de un pas?

PasEVTMEPIBIDHPNBGPIACCT_MORTT_ALFPRHMCTTFDEUDCARGAESS

URU72,27,859160,88126203,31012196145101632,4474167

CHI71,87,550990,86419502,91021793141230682,7742652

ARG718,742950,83223801,51313095143701152,8623453

VEN706,361690,82425604,19934909700923,2712156

COL68,87,142370,7712602,91063886301230812,7453968

BRA65,63,947180,7326803,91145980251080962,9252147

EQU665,630740,6469602,7105598444820363,81213346

PAR67,14,927900,641109011164888521460274,4411131

PER636,426220,59211003,5878079301040313,7591153

BOL54,5415720,3986302,4848971491530294,71014034

Ejercicio 4. En un estudio sobre sobrevivencia del ms fuerte, se trabaj con 49 gorriones hembras que fueron encontradas despus de una tormenta. Entre otras variables se les midi la longitud total, extensin de las alas, longitud pico-cabeza, longitud del hmero y la longitud de la quilla (esternn o pecho); todas en milmetros. Adems se observ si el animal sobrevivi o no (tomado de Multivariate Statistical Methods A Primer, Third Edition - Bryan F.J. Manly, 2005).

NoLongitudExtensin alasLong pico-cabezaLong hmeroLong quillaEstado

115624531,618,520,5Sobreviv

215424030,417,919,6Sobreviv

31532403118,420,6Sobreviv

415323630,917,720,2Sobreviv

515524331,518,620,3Sobreviv

6163247321920,9Sobreviv

715723830,918,420,2Sobreviv

815523932,818,621,2Sobreviv

916424832,719,121,1Sobreviv

101582383118,822Sobreviv

1115824031,318,622Sobreviv

1216024431,118,620,5Sobreviv

1316124632,319,321,8Sobreviv

141572453219,120Sobreviv

1515723531,518,119,8Sobreviv

1615623730,91820,3Sobreviv

1715824431,418,521,6Sobreviv

1815323830,518,220,9Sobreviv

1915523630,318,520,1Sobreviv

2016324632,518,621,9Sobreviv

2115923631,51821,5Sobreviv

2215524031,41820,7Muri

2315624031,518,220,6Muri

2416024232,618,821,7Muri

2515223230,317,219,8Muri

2616025031,718,822,5Muri

271552373118,520Muri

2815724532,219,521,4Muri

2916524533,119,822,7Muri

3015323130,117,319,8Muri

3116223930,31823,1Muri

3216224331,618,821,3Muri

3315924531,818,521,7Muri

3415924730,918,119Muri

3515524330,918,521,3Muri

3616225230,919,122,2Muri

3715223030,417,318,6Muri

3815924230,818,220,5Muri

3915523831,217,919,3Muri

4016324933,419,522,8Muri

411632423118,120,7Muri

4215623731,718,220,3Muri

4315923831,518,420,3Muri

4416124532,119,120,8Muri

4515523530,717,719,6Muri

4616224730,919,120,4Muri

4715323730,618,620,4Muri

4816224532,518,521,1Muri

4916424832,318,820,9Muri

a) Determine el nmero de ejes a retener.b) Qu concluye de la matriz de correlaciones?c) Qu variables constituyen el eje 1?d) Qu variables constituyen el eje 2?e) Qu aves estn bien representadas en el eje1?f) Considera usted que todos los individuos estn bien representados en el primer plano factorial?g) Considera usted que todas las variables estn bien representadas en el primer plano factorial?h) Qu caractersticas comunes presentan las aves 10 y 11?i) Qu caractersticas comunes presentan las aves 39 y 34?j) Qu variables se muestran independientes?k) Influye las mediciones realizadas en la sobrevivencia del animal?

PRINCIPAL COMPONENTS ANALYSISSUMMARY STATISTICS OF CONTINUOUS VARIABLESTOTAL COUNT : 49 TOTAL WEIGHT : 49.00+-------------------------------------------------------+----------------------+----------------------+| NUM . IDEN - LABEL COUNT WEIGHT | MEAN STD.DEV. | MINIMUM MAXIMUM |+-------------------------------------------------------+----------------------+----------------------+| 1 . Long - Longitud 49 49.00 | 157.98 3.62 | 152.00 165.00 || 2 . Exte - Extensin alas 49 49.00 | 241.33 5.02 | 230.00 252.00 || 3 . Long - Long pico-cabeza 49 49.00 | 31.42 0.79 | 30.10 33.40 || 4 . Long - Long hmero 49 49.00 | 18.47 0.56 | 17.20 19.80 || 5 . Long - Long quilla 49 49.00 | 20.83 0.98 | 18.60 23.10 |+-------------------------------------------------------+----------------------+----------------------+CORRELATION MATRIX | Long Exte Long Long Long-----+-----------------------------------Long | 1.00Exte | 0.73 1.00Long | 0.60 0.59 1.00Long | 0.65 0.77 0.70 1.00Long | 0.61 0.53 0.50 0.61 1.00-----+----------------------------------- | Long Exte Long Long LongTEST-VALUES MATRIX | Long Exte Long Long Long-----+-----------------------------------Long | 99.99Exte | 6.58 99.99Long | 4.88 4.72 99.99Long | 5.37 7.12 6.11 99.99Long | 4.91 4.12 3.84 4.93 99.99-----+----------------------------------- | Long Exte Long Long LongEIGENVALUESCOMPUTATIONS PRECISION SUMMARY : TRACE BEFORE DIAGONALISATION.. 5.0000 SUM OF EIGENVALUES............ 5.0000HISTOGRAM OF THE FIRST 5 EIGENVALUES+--------+------------+-------------+-------------+----------------------------------------------------------------------------------+| NUMBER | EIGENVALUE | PERCENTAGE | CUMULATED | || | | | PERCENTAGE | |+--------+------------+-------------+-------------+----------------------------------------------------------------------------------+| 1 | 3.5227 | 70.45 | 70.45 | ******************************************************************************** || 2 | 0.5255 | 10.51 | 80.96 | ************ || 3 | 0.4480 | 8.96 | 89.92 | *********** || 4 | 0.3355 | 6.71 | 96.63 | ******** || 5 | 0.1683 | 3.37 | 100.00 | **** |+--------+------------+-------------+-------------+----------------------------------------------------------------------------------+

COORDINATES OF VARIABLES ON AXES 1 TO 5ACTIVE VARIABLES----------------------------+------------------------------------+-------------------------------+------------------------------- VARIABLES | COORDINATES | VARIABLE-FACTOR CORRELATIONS | NORMED EIGENVECTORS----------------------------+------------------------------------+-------------------------------+-------------------------------IDEN - SHORT LABEL | 1 2 3 4 5 | 1 2 3 4 5 | 1 2 3 4 5----------------------------+------------------------------------+-------------------------------+-------------------------------Long - Longitud | 0.86 -0.07 0.29 -0.39 -0.15 | 0.86 -0.07 0.29 -0.39 -0.15 | 0.46 -0.09 0.43 -0.67 -0.37Exte - Extensin alas | 0.87 0.16 0.36 0.17 0.25 | 0.87 0.16 0.36 0.17 0.25 | 0.46 0.22 0.53 0.29 0.61Long - Long pico-cabeza | 0.81 0.31 -0.45 -0.20 0.11 | 0.81 0.31 -0.45 -0.20 0.11 | 0.43 0.43 -0.67 -0.34 0.26Long - Long hmero | 0.89 0.14 -0.07 0.34 -0.26 | 0.89 0.14 -0.07 0.34 -0.26 | 0.48 0.20 -0.10 0.58 -0.62Long - Long quilla | 0.76 -0.61 -0.18 0.07 0.08 | 0.76 -0.61 -0.18 0.07 0.08 | 0.41 -0.84 -0.27 0.11 0.19----------------------------+------------------------------------+-------------------------------+-------------------------------FACTOR SCORES, CONTRIBUTIONS AND SQUARED COSINES OF CASESAXES 1 TO 5+---------------------------------------+-------------------------------+--------------------------+--------------------------+| CASES | FACTOR SCORES | CONTRIBUTIONS | SQUARED COSINES ||---------------------------------------+-------------------------------+--------------------------+--------------------------|| IDENTIFIER REL.WT. DISTO | 1 2 3 4 5 | 1 2 3 4 5 | 1 2 3 4 5 |+---------------------------------------+-------------------------------+--------------------------+--------------------------+| 1 2.04 1.00 | 0.08 0.61 0.08 0.50 0.61 | 0.0 1.4 0.0 1.5 4.6 | 0.01 0.37 0.01 0.25 0.37 || 2 2.04 5.55 | -2.17 0.34 0.69 0.37 0.32 | 2.7 0.4 2.1 0.8 1.3 | 0.85 0.02 0.08 0.03 0.02 || 3 2.04 2.32 | -1.13 0.01 -0.31 0.94 0.25 | 0.7 0.0 0.4 5.3 0.8 | 0.55 0.00 0.04 0.38 0.03 || 4 2.04 5.76 | -2.32 -0.13 -0.41 -0.02 0.44 | 3.1 0.1 0.8 0.0 2.4 | 0.93 0.00 0.03 0.00 0.03 || 5 2.04 1.14 | -0.28 0.70 -0.13 0.69 0.29 | 0.0 1.9 0.1 2.9 1.0 | 0.07 0.42 0.01 0.42 0.07 || 6 2.04 4.66 | 1.96 0.57 0.60 -0.30 -0.22 | 2.2 1.3 1.6 0.6 0.6 | 0.82 0.07 0.08 0.02 0.01 || 7 2.04 1.37 | -1.03 0.11 0.15 0.07 -0.51 | 0.6 0.0 0.1 0.0 3.2 | 0.78 0.01 0.02 0.00 0.19 || 8 2.04 4.16 | 0.43 0.45 -1.90 0.01 0.40 | 0.1 0.8 16.4 0.0 2.0 | 0.04 0.05 0.87 0.00 0.04 || 9 2.04 8.53 | 2.73 0.84 0.16 -0.61 -0.05 | 4.3 2.7 0.1 2.2 0.0 | 0.87 0.08 0.00 0.04 0.00 || 10 2.04 2.50 | 0.23 -1.27 -0.38 0.46 -0.69 | 0.0 6.3 0.7 1.3 5.7 | 0.02 0.65 0.06 0.09 0.19 || 11 2.04 1.58 | 0.41 -1.09 -0.39 0.24 -0.12 | 0.1 4.6 0.7 0.4 0.2 | 0.11 0.75 0.09 0.04 0.01 || 12 2.04 0.92 | 0.30 0.22 0.86 0.01 -0.20 | 0.1 0.2 3.4 0.0 0.5 | 0.10 0.05 0.80 0.00 0.04 || 13 2.04 6.01 | 2.40 0.08 -0.30 0.30 -0.20 | 3.4 0.0 0.4 0.5 0.5 | 0.96 0.00 0.02 0.01 0.01 || 14 2.04 3.14 | 0.73 1.45 -0.10 0.70 -0.13 | 0.3 8.1 0.0 3.0 0.2 | 0.17 0.67 0.00 0.16 0.01 || 15 2.04 3.21 | -1.40 0.54 -0.51 -0.71 -0.42 | 1.1 1.1 1.2 3.1 2.1 | 0.61 0.09 0.08 0.16 0.06 || 16 2.04 2.47 | -1.55 -0.14 -0.03 -0.20 -0.06 | 1.4 0.1 0.0 0.2 0.0 | 0.97 0.01 0.00 0.02 0.00 || 17 2.04 0.91 | 0.59 -0.55 0.08 0.28 0.43 | 0.2 1.2 0.0 0.5 2.2 | 0.38 0.33 0.01 0.08 0.20 || 18 2.04 3.93 | -1.64 -0.69 -0.14 0.86 0.13 | 1.6 1.8 0.1 4.5 0.2 | 0.68 0.12 0.01 0.19 0.00 || 19 2.04 4.37 | -1.75 -0.14 0.22 0.68 -0.87 | 1.8 0.1 0.2 2.8 9.3 | 0.70 0.00 0.01 0.11 0.17 || 20 2.04 5.93 | 2.21 -0.20 -0.14 -0.88 0.46 | 2.8 0.2 0.1 4.7 2.5 | 0.83 0.01 0.00 0.13 0.04 || 21 2.04 2.40 | -0.44 -0.97 -0.62 -0.94 -0.07 | 0.1 3.6 1.7 5.4 0.1 | 0.08 0.39 0.16 0.37 0.00 || 22 2.04 1.47 | -0.96 -0.05 -0.36 -0.01 0.64 | 0.5 0.0 0.6 0.0 5.0 | 0.63 0.00 0.09 0.00 0.28 || 23 2.04 0.67 | -0.65 0.13 -0.34 -0.05 0.33 | 0.2 0.1 0.5 0.0 1.3 | 0.64 0.03 0.17 0.00 0.16 || 24 2.04 3.72 | 1.61 -0.01 -0.99 -0.40 0.06 | 1.5 0.0 4.4 1.0 0.0 | 0.69 0.00 0.26 0.04 0.00 || 25 2.04 14.46 | -3.73 -0.45 -0.25 -0.37 0.35 | 8.1 0.8 0.3 0.8 1.5 | 0.96 0.01 0.00 0.01 0.01 || 26 2.04 6.69 | 2.18 -0.83 0.40 0.53 0.88 | 2.8 2.7 0.7 1.7 9.4 | 0.71 0.10 0.02 0.04 0.12 || 27 2.04 2.42 | -1.32 0.37 -0.24 0.42 -0.54 | 1.0 0.5 0.3 1.1 3.6 | 0.72 0.06 0.02 0.07 0.12 || 28 2.04 5.34 | 1.76 0.49 -0.73 1.19 -0.24 | 1.8 0.9 2.4 8.6 0.7 | 0.58 0.05 0.10 0.27 0.01 || 29 2.04 18.17 | 4.05 -0.23 -0.95 -0.23 -0.86 | 9.5 0.2 4.1 0.3 9.0 | 0.90 0.00 0.05 0.00 0.04 || 30 2.04 14.41 | -3.72 -0.59 -0.09 -0.43 -0.05 | 8.0 1.4 0.0 1.1 0.0 | 0.96 0.02 0.00 0.01 0.00 || 31 2.04 9.54 | 0.22 -2.95 0.64 -0.63 -0.11 | 0.0 33.7 1.8 2.4 0.1 | 0.01 0.91 0.04 0.04 0.00 || 32 2.04 1.98 | 1.24 -0.22 0.32 -0.34 -0.43 | 0.9 0.2 0.5 0.7 2.3 | 0.77 0.02 0.05 0.06 0.10 || 33 2.04 1.65 | 1.06 -0.39 -0.06 -0.01 0.60 | 0.7 0.6 0.0 0.0 4.3 | 0.69 0.09 0.00 0.00 0.22 || 34 2.04 5.69 | -0.70 1.38 1.73 -0.24 0.48 | 0.3 7.4 13.7 0.3 2.7 | 0.09 0.34 0.53 0.01 0.04 || 35 2.04 1.46 | -0.28 -0.53 0.12 0.96 0.40 | 0.0 1.1 0.1 5.6 1.9 | 0.05 0.19 0.01 0.63 0.11 || 36 2.04 9.43 | 2.32 -0.87 1.56 0.89 0.26 | 3.1 2.9 11.1 4.9 0.8 | 0.57 0.08 0.26 0.08 0.01 || 37 2.04 19.03 | -4.28 0.58 -0.23 -0.56 -0.20 | 10.6 1.3 0.2 1.9 0.5 | 0.96 0.02 0.00 0.02 0.00 || 38 2.04 1.06 | -0.51 -0.15 0.86 -0.20 0.01 | 0.2 0.1 3.3 0.3 0.0 | 0.25 0.02 0.69 0.04 0.00 || 39 2.04 4.65 | -1.92 0.92 0.00 -0.31 0.18 | 2.1 3.3 0.0 0.6 0.4 | 0.79 0.18 0.00 0.02 0.01 || 40 2.04 18.03 | 4.12 -0.03 -0.99 -0.05 0.28 | 9.8 0.0 4.5 0.0 1.0 | 0.94 0.00 0.05 0.00 0.00 || 41 2.04 2.68 | 0.10 -0.35 1.13 -1.12 -0.19 | 0.0 0.5 5.8 7.6 0.4 | 0.00 0.05 0.47 0.46 0.01 || 42 2.04 1.69 | -0.94 0.37 -0.74 -0.34 -0.03 | 0.5 0.5 2.5 0.7 0.0 | 0.53 0.08 0.33 0.07 0.00 || 43 2.04 0.83 | -0.41 0.30 -0.14 -0.55 -0.50 | 0.1 0.3 0.1 1.8 3.1 | 0.20 0.11 0.02 0.36 0.31 || 44 2.04 3.26 | 1.62 0.71 0.07 0.00 -0.36 | 1.5 2.0 0.0 0.0 1.5 | 0.80 0.15 0.00 0.00 0.04 || 45 2.04 6.56 | -2.52 0.18 0.05 -0.44 -0.07 | 3.7 0.1 0.0 1.2 0.1 | 0.97 0.00 0.00 0.03 0.00 || 46 2.04 4.41 | 1.11 0.46 1.53 0.40 -0.69 | 0.7 0.8 10.6 1.0 5.7 | 0.28 0.05 0.53 0.04 0.11 || 47 2.04 3.96 | -1.54 -0.10 -0.27 1.12 -0.50 | 1.4 0.0 0.3 7.6 3.1 | 0.60 0.00 0.02 0.32 0.06 || 48 2.04 3.73 | 1.58 0.43 -0.13 -0.94 0.40 | 1.4 0.7 0.1 5.4 1.9 | 0.67 0.05 0.00 0.24 0.04 || 49 2.04 6.15 | 2.17 0.69 0.60 -0.77 0.12 | 2.7 1.8 1.7 3.6 0.2 | 0.77 0.08 0.06 0.10 0.00 |+---------------------------------------+-------------------------------+--------------------------+--------------------------+COORDINATES AND TEST-VALUES OF CATEGORIESAXES 1 TO 5+---------------------------------------------+-------------------------------+------------------------------------+----------+| CATEGORIES | TEST-VALUES | COORDINATES | ||---------------------------------------------|-------------------------------|------------------------------------|----------|| IDEN - LABEL COUNT ABS.WT | 1 2 3 4 5 | 1 2 3 4 5 | DISTO. |+---------------------------------------------+-------------------------------+------------------------------------+----------+| 6 . Estado || m1 - Muri 28 28.00 | 0.3 -0.3 1.1 -1.2 0.1 | 0.06 -0.03 0.09 -0.09 0.01 | 0.02 || m2 - Sobreviv 21 21.00 | -0.3 0.3 -1.1 1.2 -0.1 | -0.08 0.03 -0.12 0.12 -0.01 | 0.04 |+---------------------------------------------+-------------------------------+------------------------------------+----------+

Anlisis de clasificacin jerrquica

DESCRIPTION AND CHARACTERISATION OF PARTITIONSDESCRIPTION OF: CUT "a" OF THE TREE INTO 2 CLUSTERCLUSTERS CHARACTERISATION BY CATEGORIESCLUSTERS CHARACTERISATION BY CONTINUOUS VARIABLESCHARACTERISATION BY CATEGORIES OF CLUSTERS OR CATEGORIESOF CUT "a" OF THE TREE INTO 2 CLUSTERSCluster 1 / 2----------------------------------------------------------------------------------------------------------------------------------T.VALUE PROB. ---- PERCENTAGES ---- CHARACTERISTIC IDEN WEIGHT GRP/CAT CAT/GRP GLOBAL CATEGORIES OF VARIABLES----------------------------------------------------------------------------------------------------------------------------------Cluster 2 / 2----------------------------------------------------------------------------------------------------------------------------------T.VALUE PROB. ---- PERCENTAGES ---- CHARACTERISTIC IDEN WEIGHT GRP/CAT CAT/GRP GLOBAL CATEGORIES OF VARIABLES----------------------------------------------------------------------------------------------------------------------------------CHARACTERISATION BY CONTINUOUS VARIABLES OF CLUSTERS OR CATEGORIESOF CUT "a" OF THE TREE INTO 2 CLUSTERSCluster 1 / 2+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+| T.VALUE| PROB. | MEANS | STD. DEVIATION | CHARACTERISTIC VARIABLES || | | GROUP OVERALL | GROUP OVERALL | NUM.LABEL IDEN |+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+| Cluster 1 / 2 ( WEIGHT = 25.00 COUNT = 25 ) aa1a || || 5.12 | 0.000 | 160.60 157.98 | 2.67 3.62 | 1.Longitud Long || 4.84 | 0.000 | 244.76 241.33 | 3.39 5.02 | 2.Extensin alas Exte || 4.74 | 0.000 | 18.84 18.47 | 0.42 0.56 | 4.Long hmero Long || 4.65 | 0.000 | 21.47 20.83 | 0.79 0.98 | 5.Long quilla Long || 4.18 | 0.000 | 31.88 31.42 | 0.76 0.79 | 3.Long pico-cabeza Long |+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+Cluster 2 / 2+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+| T.VALUE| PROB. | MEANS | STD. DEVIATION | CHARACTERISTIC VARIABLES || | | GROUP OVERALL | GROUP OVERALL | NUM.LABEL IDEN |+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+| Cluster 2 / 2 ( WEIGHT = 24.00 COUNT = 24 ) aa2a || || | | | | || -4.18 | 0.000 | 30.93 31.42 | 0.45 0.79 | 3.Long pico-cabeza Long || -4.65 | 0.000 | 20.15 20.83 | 0.65 0.98 | 5.Long quilla Long || -4.74 | 0.000 | 18.08 18.47 | 0.40 0.56 | 4.Long hmero Long || -4.84 | 0.000 | 237.75 241.33 | 3.79 5.02 | 2.Extensin alas Exte || -5.12 | 0.000 | 155.25 157.98 | 2.17 3.62 | 1.Longitud Long |+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+DESCRIPTION OF: CUT "b" OF THE TREE INTO 3 CLUSTERCLUSTERS CHARACTERISATION BY CATEGORIESCLUSTERS CHARACTERISATION BY CONTINUOUS VARIABLESCHARACTERISATION BY CATEGORIES OF CLUSTERS OR CATEGORIESOF CUT "b" OF THE TREE INTO 3 CLUSTERSCluster 1 / 3----------------------------------------------------------------------------------------------------------------------------------T.VALUE PROB. ---- PERCENTAGES ---- CHARACTERISTIC IDEN WEIGHT GRP/CAT CAT/GRP GLOBAL CATEGORIES OF VARIABLES----------------------------------------------------------------------------------------------------------------------------------Cluster 2 / 3----------------------------------------------------------------------------------------------------------------------------------T.VALUE PROB. ---- PERCENTAGES ---- CHARACTERISTIC IDEN WEIGHT GRP/CAT CAT/GRP GLOBAL CATEGORIES OF VARIABLES----------------------------------------------------------------------------------------------------------------------------------Cluster 3 / 3----------------------------------------------------------------------------------------------------------------------------------T.VALUE PROB. ---- PERCENTAGES ---- CHARACTERISTIC IDEN WEIGHT GRP/CAT CAT/GRP GLOBAL CATEGORIES OF VARIABLES----------------------------------------------------------------------------------------------------------------------------------CHARACTERISATION BY CONTINUOUS VARIABLES OF CLUSTERS OR CATEGORIESOF CUT "b" OF THE TREE INTO 3 CLUSTERSCluster 1 / 3+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+| T.VALUE| PROB. | MEANS | STD. DEVIATION | CHARACTERISTIC VARIABLES || | | GROUP OVERALL | GROUP OVERALL | NUM.LABEL IDEN |+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+Cluster 2 / 3+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+| T.VALUE| PROB. | MEANS | STD. DEVIATION | CHARACTERISTIC VARIABLES || | | GROUP OVERALL | GROUP OVERALL | NUM.LABEL IDEN |+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+| Cluster 2 / 3 ( WEIGHT = 13.00 COUNT = 13 ) bb2b || || 4.82 | 0.000 | 32.33 31.42 | 0.60 0.79 | 3.Long pico-cabeza Long || 4.54 | 0.000 | 161.92 157.98 | 2.06 3.62 | 1.Longitud Long || 4.52 | 0.000 | 246.77 241.33 | 2.52 5.02 | 2.Extensin alas Exte || 4.47 | 0.000 | 19.07 18.47 | 0.36 0.56 | 4.Long hmero Long || 3.61 | 0.000 | 21.68 20.83 | 0.68 0.98 | 5.Long quilla Long |+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+Cluster 3 / 3+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+| T.VALUE| PROB. | MEANS | STD. DEVIATION | CHARACTERISTIC VARIABLES || | | GROUP OVERALL | GROUP OVERALL | NUM.LABEL IDEN |+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+| Cluster 3 / 3 ( WEIGHT = 17.00 COUNT = 17 ) bb3b || || | | | | || -3.88 | 0.000 | 30.81 31.42 | 0.45 0.79 | 3.Long pico-cabeza Long || -4.19 | 0.000 | 20.01 20.83 | 0.54 0.98 | 5.Long quilla Long || -4.30 | 0.000 | 17.99 18.47 | 0.43 0.56 | 4.Long hmero Long || -5.06 | 0.000 | 154.35 157.98 | 1.57 3.62 | 1.Longitud Long || -5.07 | 0.000 | 236.29 241.33 | 2.89 5.02 | 2.Extensin alas Exte |+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+

Ejercicio 5. Los siguientes datos (Manly, 1986, pg 165) corresponden a mediciones hechas sobre 16 colonias de mariposas Euphydryaus edita (Porc gen mov: porcentaje de genes con movilidad 0,4; 0,6; 0,8; 1,0; 1,16 y 1,30). Se pretende explorar la posible asociacin entre los factores ambientales y las caractersticas genticas presentes en estos insectos.ColoniaAltitud (pies)Precip anual (pulg)Temp mx anual (F)Temp mn anual (F)Porc gen mov 0,4Porc gen mov 0,6Porc gen mov 0,8Porc gen mov 1,0Porc gen mov 1,16Porc gen mov 1,30

SS500439817032257171

SB80020923201620381313

WSB570289826062846173

JRC550289826041947273

JRH55028982601850356

SJ380159928021944323

CR930219928001550278

UO65010101271021402540

LO60010101271426322800

DP150019992301680121

PZ17502210127143433226

MC20005810018071466130

IF25003410216091547218

AF200021105203717322714

GH7850428450578440

GL105005081-120319240

PRINCIPAL COMPONENTS ANALYSISSUMMARY STATISTICS OF CONTINUOUS VARIABLESTOTAL COUNT : 16 TOTAL WEIGHT : 16.00+-------------------------------------------------------+----------------------+----------------------+| NUM . IDEN - LABEL COUNT WEIGHT | MEAN STD.DEV. | MINIMUM MAXIMUM |+-------------------------------------------------------+----------------------+----------------------+| 1 . Alti - Altitud (pies) 16 16.00 | 2101.88 2787.93 | 380.00 10500.00 || 2 . Prec - Precip anual (pulg) 16 16.00 | 28.06 13.55 | 10.00 58.00 || 3 . Temp - Temp mx anual (F) 16 16.00 | 97.25 6.18 | 81.00 105.00 || 4 . Temp - Temp mn anual (F) 16 16.00 | 20.88 10.61 | -12.00 32.00 ||-------------------------------------------------------|----------------------|-----------------------| 5 . Porc - Porc gen mov 0,4 16 16.00 | 1.75 4.01 | 0.00 14.00 || 6 . Porc - Porc gen mov 0,6 16 16.00 | 7.19 7.26 | 0.00 26.00 || 7 . Porc - Porc gen mov 0,8 16 16.00 | 18.56 10.43 | 1.00 40.00 || 8 . Porc - Porc gen mov 1,0 16 16.00 | 51.19 19.43 | 25.00 92.00 || 9 . Porc - Porc gen mov 1,16 16 16.00 | 17.19 10.44 | 0.00 35.00 || 10 . Porc - Porc gen mov 1,30 16 16.00 | 4.13 4.48 | 0.00 14.00 |+-------------------------------------------------------+----------------------+----------------------+CORRELATION MATRIX | Alti Prec Temp Temp-----+----------------------------Alti | 1.00Prec | 0.57 1.00Temp | -0.83 -0.48 1.00Temp | -0.94 -0.70 0.72 1.00-----+---------------------------- | Alti Prec Temp TempTEST-VALUES MATRIX | Alti Prec Temp Temp-----+----------------------------Alti | 99.99Prec | 2.58 99.99Temp | -4.72 -2.09 99.99Temp | -6.82 -3.51 3.62 99.99-----+---------------------------- | Alti Prec Temp TempEIGENVALUESCOMPUTATIONS PRECISION SUMMARY : TRACE BEFORE DIAGONALISATION.. 4.0000 SUM OF EIGENVALUES............ 4.0000HISTOGRAM OF THE FIRST 4 EIGENVALUES+--------+------------+-------------+-------------+----------------------------------------------------------------------------------+| NUMBER | EIGENVALUE | PERCENTAGE | CUMULATED | || | | | PERCENTAGE | |+--------+------------+-------------+-------------+----------------------------------------------------------------------------------+| 1 | 3.1394 | 78.49 | 78.49 | ******************************************************************************** || 2 | 0.5752 | 14.38 | 92.87 | *************** || 3 | 0.2533 | 6.33 | 99.20 | ******* || 4 | 0.0321 | 0.80 | 100.00 | * |+--------+------------+-------------+-------------+----------------------------------------------------------------------------------+ANDERSON'S LAPLACE INTERVALSWITH 0.95 THRESHOLD+--------+--------------------------------------------------------+| NUMBER | LOWER LIMIT EIGENVALUE UPPER LIMIT |+--------+--------------------------------------------------------+| 1 | 0.8926 3.1394 5.3863 || 2 | 0.1635 0.5752 0.9868 || 3 | 0.0720 0.2533 0.4346 || 4 | 0.0091 0.0321 0.0551 |+--------+--------------------------------------------------------+LENGTH AND RELATIVE POSITION OF INTERVALS1 . . . . . . . . . . .*----------------------------------------------------+-----------------------------------------------------*2 . .*---------+---------*. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3 .*---+----* . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4 +*. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .COORDINATES OF VARIABLES ON AXES 1 TO 4ACTIVE VARIABLES----------------------------+------------------------------------+-------------------------------+------------------------------- VARIABLES | COORDINATES | VARIABLE-FACTOR CORRELATIONS | NORMED EIGENVECTORS----------------------------+------------------------------------+-------------------------------+-------------------------------IDEN - SHORT LABEL | 1 2 3 4 0 | 1 2 3 4 0 | 1 2 3 4 0----------------------------+------------------------------------+-------------------------------+-------------------------------Alti - Altitud (pies) | -0.95 -0.21 0.18 0.13 0.00 | -0.95 -0.21 0.18 0.13 0.00 | -0.54 -0.27 0.36 0.71 0.00Prec - Precip anual (pulg) | -0.76 0.63 -0.16 0.03 0.00 | -0.76 0.63 -0.16 0.03 0.00 | -0.43 0.83 -0.32 0.16 0.00Temp - Temp mx anual (F) | 0.86 0.37 0.35 0.04 0.00 | 0.86 0.37 0.35 0.04 0.00 | 0.49 0.48 0.70 0.20 0.00Temp - Temp mn anual (F) | 0.96 -0.04 -0.27 0.12 0.00 | 0.96 -0.04 -0.27 0.12 0.00 | 0.54 -0.05 -0.53 0.65 0.00----------------------------+------------------------------------+-------------------------------+-------------------------------SUPPLEMENTARY VARIABLES----------------------------+------------------------------------+-------------------------------+------------------------------- VARIABLES | COORDINATES | VARIABLE-FACTOR CORRELATIONS | NORMED EIGENVECTORS----------------------------+------------------------------------+-------------------------------+-------------------------------IDEN - SHORT LABEL | 1 2 3 4 0 | 1 2 3 4 0 | 1 2 3 4 0----------------------------+------------------------------------+-------------------------------+-------------------------------Porc - Porc gen mov 0,4 | 0.34 -0.33 0.37 -0.13 0.00 | 0.34 -0.33 0.37 -0.13 0.00 |Porc - Porc gen mov 0,6 | 0.28 -0.28 0.11 -0.02 0.00 | 0.28 -0.28 0.11 -0.02 0.00 |Porc - Porc gen mov 0,8 | 0.63 -0.09 0.07 0.01 0.00 | 0.63 -0.09 0.07 0.01 0.00 |Porc - Porc gen mov 1,0 | -0.82 0.09 -0.13 -0.07 0.00 | -0.82 0.09 -0.13 -0.07 0.00 |Porc - Porc gen mov 1,16 | 0.42 0.27 -0.06 0.06 0.00 | 0.42 0.27 -0.06 0.06 0.00 |Porc - Porc gen mov 1,30 | 0.34 -0.06 0.04 0.32 0.00 | 0.34 -0.06 0.04 0.32 0.00 |----------------------------+------------------------------------+-------------------------------+-------------------------------

DESCRIPTION AND CHARACTERISATION OF PARTITIONSDESCRIPTION OF: CUT "a" OF THE TREE INTO 2 CLUSTERCLUSTERS CHARACTERISATION BY CONTINUOUS VARIABLESCHARACTERISATION BY CONTINUOUS VARIABLES OF CLUSTERS OR CATEGORIESOF CUT "a" OF THE TREE INTO 2 CLUSTERSCluster 1 / 2+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+| T.VALUE| PROB. | MEANS | STD. DEVIATION | CHARACTERISTIC VARIABLES || | | GROUP OVERALL | GROUP OVERALL | NUM.LABEL IDEN |+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+| Cluster 1 / 2 ( WEIGHT = 14.00 COUNT = 14 ) aa1a || || 3.49 | 0.000 | 99.36 97.25 | 2.79 6.18 | 3.Temp mx anual (F) Temp || 3.36 | 0.000 | 24.36 20.88 | 4.62 10.61 | 4.Temp mn anual (F) Temp || 2.04 | 0.021 | 20.64 18.56 | 9.41 10.43 | 7.Porc gen mov 0,8 Porc || | | | | || -2.77 | 0.003 | 45.93 51.19 | 14.41 19.43 | 8.Porc gen mov 1,0 Porc || -3.71 | 0.000 | 1091.43 2101.88 | 681.24 2787.93 | 1.Altitud (pies) Alti |+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+Cluster 2 / 2+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+| T.VALUE| PROB. | MEANS | STD. DEVIATION | CHARACTERISTIC VARIABLES || | | GROUP OVERALL | GROUP OVERALL | NUM.LABEL IDEN |+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+| Cluster 2 / 2 ( WEIGHT = 2.00 COUNT = 2 ) aa2a || || 3.71 | 0.000 | 9175.00 2101.88 | 1325.00 2787.93 | 1.Altitud (pies) Alti || 2.77 | 0.003 | 88.00 51.19 | 4.00 19.43 | 8.Porc gen mov 1,0 Porc || | | | | || -2.04 | 0.021 | 4.00 18.56 | 3.00 10.43 | 7.Porc gen mov 0,8 Porc || -3.36 | 0.000 | -3.50 20.88 | 8.50 10.61 | 4.Temp mn anual (F) Temp || -3.49 | 0.000 | 82.50 97.25 | 1.50 6.18 | 3.Temp mx anual (F) Temp |+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+DESCRIPTION OF: CUT "b" OF THE TREE INTO 3 CLUSTERCLUSTERS CHARACTERISATION BY CONTINUOUS VARIABLESCHARACTERISATION BY CONTINUOUS VARIABLES OF CLUSTERS OR CATEGORIESOF CUT "b" OF THE TREE INTO 3 CLUSTERSCluster 1 / 3+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+| T.VALUE| PROB. | MEANS | STD. DEVIATION | CHARACTERISTIC VARIABLES || | | GROUP OVERALL | GROUP OVERALL | NUM.LABEL IDEN |+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+| Cluster 1 / 3 ( WEIGHT = 3.00 COUNT = 3 ) bb1b || || 2.33 | 0.010 | 45.00 28.06 | 9.90 13.55 | 2.Precip anual (pulg) Prec || | | | | |+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+Cluster 2 / 3+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+| T.VALUE| PROB. | MEANS | STD. DEVIATION | CHARACTERISTIC VARIABLES || | | GROUP OVERALL | GROUP OVERALL | NUM.LABEL IDEN |+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+| Cluster 2 / 3 ( WEIGHT = 11.00 COUNT = 11 ) bb2b || || 2.97 | 0.001 | 26.36 20.88 | 2.87 10.61 | 4.Temp mn anual (F) Temp || | | | | || -2.41 | 0.008 | 934.55 2101.88 | 528.04 2787.93 | 1.Altitud (pies) Alti || -2.42 | 0.008 | 43.00 51.19 | 14.42 19.43 | 8.Porc gen mov 1,0 Porc || -3.34 | 0.000 | 20.18 28.06 | 6.21 13.55 | 2.Precip anual (pulg) Prec |+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+Cluster 3 / 3+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+| T.VALUE| PROB. | MEANS | STD. DEVIATION | CHARACTERISTIC VARIABLES || | | GROUP OVERALL | GROUP OVERALL | NUM.LABEL IDEN |+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+| Cluster 3 / 3 ( WEIGHT = 2.00 COUNT = 2 ) bb3b || || 3.71 | 0.000 | 9175.00 2101.88 | 1325.00 2787.93 | 1.Altitud (pies) Alti || 2.77 | 0.003 | 88.00 51.19 | 4.00 19.43 | 8.Porc gen mov 1,0 Porc || | | | | || -2.04 | 0.021 | 4.00 18.56 | 3.00 10.43 | 7.Porc gen mov 0,8 Porc || -3.36 | 0.000 | -3.50 20.88 | 8.50 10.61 | 4.Temp mn anual (F) Temp || -3.49 | 0.000 | 82.50 97.25 | 1.50 6.18 | 3.Temp mx anual (F) Temp |+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+

BUILDING UP PARTITIONSCUT "a" OF THE TREE INTO 2 CLUSTERSCLUSTERS FORMATION (ON ACTIVE CASES)SUMMARY DESCRIPTION+---------+----------+------------+------------+| CLUSTER | COUNT | WEIGHT | CONTENT |+---------+----------+------------+------------+| aa1a | 14 | 14.00 | 1 TO 14 || aa2a | 2 | 2.00 | 15 TO 16 |+---------+----------+------------+------------+COORDINATES AND TEST-VALUES BEFORE CONSOLIDATIONAXES 1 A 4+---------------------------------------------+-------------------------------+------------------------------------+----------+| CLUSTERS | TEST-VALUES | COORDINATES | ||---------------------------------------------|-------------------------------|------------------------------------|----------|| IDEN - LABEL COUNT ABS.WT. | 1 2 3 4 0 | 1 2 3 4 0 | DISTO. |+---------------------------------------------+-------------------------------+------------------------------------+----------+| CUT "a" OF THE TREE INTO 2 CLUSTERS || || aa1a - Cluster 1 / 2 14 14.00 | 3.6 1.2 -0.1 -0.3 0.0 | 0.62 0.09 0.00 0.00 0.00 | 0.39 || aa2a - Cluster 2 / 2 2 2.00 | -3.6 -1.2 0.1 0.3 0.0 | -4.33 -0.64 0.03 0.03 0.00 | 19.16 |+---------------------------------------------+-------------------------------+------------------------------------+----------+CLUSTERING CONSOLIDATIONAROUND CENTERS OF THE 2 CLUSTERS ACHIEVED BY 10 ITERATIONS WITH MOVING CENTERSINTER-CLUSTER INERTIA INCREASE+-----------+---------------+---------------+---------------+| ITERATION | TOTAL INERTIA | INTER-CLUSTER | RATIO || | | INERTIA | |+-----------+---------------+---------------+---------------+| 0 | 4.00000 | 2.73755 | 0.68439 || 1 | 4.00000 | 2.73755 | 0.68439 || 2 | 4.00000 | 2.73755 | 0.68439 |+-----------+---------------+---------------+---------------+STOP AFTER ITERATION 2. RELATIVE INCREASE OF INTER-CLUSTER INERTIAWITH RESPECT TO THE PREVIOUS ITERATION IS ONLY 0.000 %.INERTIA DECOMPOSITIONCOMPUTED ON 4 AXES.+------------------+-----------------+-------------+-------------------+-----------------+| | INERTIAS | COUNTS | WEIGHTS | DISTANCES || INERTIAS | BEFORE AFTER |BEFORE AFTER | BEFORE AFTER | BEFORE AFTER |+------------------+-----------------+-------------+-------------------+-----------------+| | | | | || INTER-CLUSTER | 2.7376 2.7376 | | | || | | | | || INTRA-CLUSTER | | | | || | | | | || CLUSTER 1 / 2 | 1.1358 1.1358 | 14 14 | 14.00 14.00 | 0.3911 0.3911 || CLUSTER 2 / 2 | 0.1267 0.1267 | 2 2 | 2.00 2.00 |19.1629 19.1629 || | | | | || TOTAL INERTIA | 4.0000 4.0000 | | | |+------------------+-----------------+-------------+-------------------+-----------------+RATIO INTER INERTIA / TOTAL INERTIA) : BEFORE .. 0.6844 AFTER .. 0.6844COORDINATES AND TEST-VALUES AFTER CONSOLIDATIONAXES 1 A 4+---------------------------------------------+-------------------------------+------------------------------------+----------+| CLUSTERS | TEST-VALUES | COORDINATES | ||---------------------------------------------|-------------------------------|------------------------------------|----------|| IDEN - LABEL COUNT ABS.WT. | 1 2 3 4 0 | 1 2 3 4 0 | DISTO. |+---------------------------------------------+-------------------------------+------------------------------------+----------+| CUT "a" OF THE TREE INTO 2 CLUSTERS || || aa1a - Cluster 1 / 2 14 14.00 | 3.6 1.2 -0.1 -0.3 0.0 | 0.62 0.09 0.00 0.00 0.00 | 0.39 || aa2a - Cluster 2 / 2 2 2.00 | -3.6 -1.2 0.1 0.3 0.0 | -4.33 -0.64 0.03 0.03 0.00 | 19.16 |+---------------------------------------------+-------------------------------+------------------------------------+----------+COMPOSITION OF: CUT "a" OF THE TREE INTO 2 CLUSTERSCluster 1 / 2SS SB WSB JRC JRH SJ CR UO LO DP PZ MC IF AFCluster 2 / 2GH GL

BUILDING UP PARTITIONSCUT "a" OF THE TREE INTO 3 CLUSTERSCLUSTERS FORMATION (ON ACTIVE CASES)SUMMARY DESCRIPTION+---------+----------+------------+------------+| CLUSTER | COUNT | WEIGHT | CONTENT |+---------+----------+------------+------------+| aa1a | 2 | 2.00 | 1 TO 2 || aa2a | 12 | 12.00 | 3 TO 14 || aa3a | 2 | 2.00 | 15 TO 16 |+---------+----------+------------+------------+COORDINATES AND TEST-VALUES BEFORE CONSOLIDATIONAXES 1 A 4+---------------------------------------------+-------------------------------+------------------------------------+----------+| CLUSTERS | TEST-VALUES | COORDINATES | ||---------------------------------------------|-------------------------------|------------------------------------|----------|| IDEN - LABEL COUNT ABS.WT. | 1 2 3 4 0 | 1 2 3 4 0 | DISTO. |+---------------------------------------------+-------------------------------+------------------------------------+----------+| CUT "a" OF THE TREE INTO 3 CLUSTERS || || aa1a - Cluster 1 / 3 2 2.00 | -0.5 3.1 -0.8 -0.9 0.0 | -0.58 1.61 -0.28 -0.11 0.00 | 3.02 || aa2a - Cluster 2 / 3 12 12.00 | 3.1 -1.4 0.6 0.5 0.0 | 0.82 -0.16 0.04 0.01 0.00 | 0.70 || aa3a - Cluster 3 / 3 2 2.00 | -3.6 -1.2 0.1 0.3 0.0 | -4.33 -0.64 0.03 0.03 0.00 | 19.16 |+---------------------------------------------+-------------------------------+------------------------------------+----------+CLUSTERING CONSOLIDATIONAROUND CENTERS OF THE 3 CLUSTERS ACHIEVED BY 10 ITERATIONS WITH MOVING CENTERSINTER-CLUSTER INERTIA INCREASE+-----------+---------------+---------------+---------------+| ITERATION | TOTAL INERTIA | INTER-CLUSTER | RATIO || | | INERTIA | |+-----------+---------------+---------------+---------------+| 0 | 4.00000 | 3.29595 | 0.82399 || 1 | 4.00000 | 3.35934 | 0.83984 || 2 | 4.00000 | 3.35934 | 0.83984 || 3 | 4.00000 | 3.35934 | 0.83984 |+-----------+---------------+---------------+---------------+STOP AFTER ITERATION 3. RELATIVE INCREASE OF INTER-CLUSTER INERTIAWITH RESPECT TO THE PREVIOUS ITERATION IS ONLY 0.000 %.INERTIA DECOMPOSITIONCOMPUTED ON 4 AXES.+------------------+-----------------+-------------+-------------------+-----------------+| | INERTIAS | COUNTS | WEIGHTS | DISTANCES || INERTIAS | BEFORE AFTER |BEFORE AFTER | BEFORE AFTER | BEFORE AFTER |+------------------+-----------------+-------------+-------------------+-----------------+| | | | | || INTER-CLUSTER | 3.2960 3.3593 | | | || | | | | || INTRA-CLUSTER | | | | || | | | | || CLUSTER 1 / 3 | 0.0509 0.1317 | 2 3 | 2.00 3.00 | 3.0174 1.9186 || CLUSTER 2 / 3 | 0.5265 0.3822 | 12 11 | 12.00 11.00 | 0.6979 0.8789 || CLUSTER 3 / 3 | 0.1267 0.1267 | 2 2 | 2.00 2.00 |19.1629 19.1629 || | | | | || TOTAL INERTIA | 4.0000 4.0000 | | | |+------------------+-----------------+-------------+-------------------+-----------------+RATIO INTER INERTIA / TOTAL INERTIA) : BEFORE .. 0.8240 AFTER .. 0.8398COORDINATES AND TEST-VALUES AFTER CONSOLIDATIONAXES 1 A 4+---------------------------------------------+-------------------------------+------------------------------------+----------+| CLUSTERS | TEST-VALUES | COORDINATES | ||---------------------------------------------|-------------------------------|------------------------------------|----------|| IDEN - LABEL COUNT ABS.WT. | 1 2 3 4 0 | 1 2 3 4 0 | DISTO. |+---------------------------------------------+-------------------------------+------------------------------------+----------+| CUT "a" OF THE TREE INTO 3 CLUSTERS || || aa1a - Cluster 1 / 3 3 3.00 | -0.5 3.2 0.2 -0.7 0.0 | -0.43 1.31 0.05 -0.06 0.00 | 1.92 || aa2a - Cluster 2 / 3 11 11.00 | 2.9 -1.8 -0.2 0.4 0.0 | 0.91 -0.24 -0.02 0.01 0.00 | 0.88 || aa3a - Cluster 3 / 3 2 2.00 | -3.6 -1.2 0.1 0.3 0.0 | -4.33 -0.64 0.03 0.03 0.00 | 19.16 |+---------------------------------------------+-------------------------------+------------------------------------+----------+COMPOSITION OF: CUT "a" OF THE TREE INTO 3 CLUSTERSCluster 1 / 3SS MC IFCluster 2 / 3SB WSB JRC JRH SJ CR UO LO DP PZ AFCluster 3 / 3GH GLMEMBERSHIP OF EACH CASE TO : CUT "a" OF THE TREE INTO 3 CLUSTERSSS : 1 SB : 2 WSB : 2 JRC : 2 JRH : 2 SJ : 2CR : 2 UO : 2 LO : 2 DP : 2 PZ : 2 MC : 1IF : 1 AF : 2 GH : 3 GL : 3CLUSTERS REPRESENTATIVESCLUSTER 1/ 3COUNT: 3------------------------------------------------------------------------------|RK | DISTANCE | IDENT. |+---+-----------+------------------------------------------------------------+| 1| 0.30166|SS || 2| 0.86216|IF || 3| 0.94386|MC |+---+-----------+------------------------------------------------------------+CLUSTER 2/ 3COUNT: 11------------------------------------------------------------------------------|RK | DISTANCE | IDENT. |+---+-----------+------------------------------------------------------------+| 1| 0.02829|CR || 2| 0.15008|DP || 3| 0.19373|PZ || 4| 0.21049|SJ || 5| 0.38784|WSB || 6| 0.38977|JRC || 7| 0.38977|JRH || 8| 0.66536|UO || 9| 0.66934|LO || 10| 1.39576|AF |+---+-----------+------------------------------------------------------------+CLUSTER 3/ 3COUNT: 2------------------------------------------------------------------------------|RK | DISTANCE | IDENT. |+---+-----------+------------------------------------------------------------+| 1| 1.01356|GH || 2| 1.01356|GL |+---+-----------+------------------------------------------------------------+DISTANCE'S MATRIX BETWEEN CLUSTERS | 1 2 3-----+--------------------------- 1 | 0.000 2 | 2.054 0.000 3 | 4.360 5.251 0.000-----+--------------------------- | 1 2 3