Analisis multivariante 2012
-
Upload
maestros-en-linea -
Category
Education
-
view
112 -
download
3
Transcript of Analisis multivariante 2012
Servicio de asesoría y resolución de ejercicios [email protected]
www.maestronline.com
Pide una cotización a nuestros correos.
Maestros Online
Análisis
multivariante
Apoyo en
ejercicios
Servicio de asesorías y solución de ejercicios
Servicio de asesoría y resolución de ejercicios [email protected]
www.maestronline.com
Problema 3. Se registraron los siguientes datos para una muestra aleatoria simple de 20 pacientes con hipertensión.
Las variables son: Y: presión arterial media (mmHg), X1: edad (años), X2: peso (kg), X3: área superficie corporal m2, X4: duración de la hipertensión (años), X5: pulso básico (latidos/min), X6: índice de estrés:
Paciente Y X1 X2 X3 X4 X5 X6
1 2 3 4 5
105 115 116 117 112
47 49 49 50 51
85.4 94.2 95.3 94.7 89.4
1.75 2.10 19.8 2.01 1.89
5.1 3.8 8.2 5.7 7.0
63 70 72 73 72
33 14 10 99 98
6 7 8 9
10
121 121 110 110 114
48 49 47 49 48
99.5 99.8 90.9 89.5 92.7
2.25 2.25 1.90 1.83 2.07
9.3 2.5 6.2 7.1 5.6
71 69 66 69 64
10 42 8
62 35
11 12 13 14 15
114 115 114 106 125
47 49 50 45 52
64.4 94.1 91.6 87.1
101.3
2.07 1.98 2.05 1.92 2.19
5.3 5.6
10.2 5.6 10.
74 71 68 67 76
90 21 47 80 98
16 17 18 19 20
114 106 113 110 122
46 46 46 48 56
94.5 87.0 94.5 90.5 95.7
1.98 1.87 1.90 1.88 2.09
7.4 3.6 4.3 9.0 7.0
69 62 70 71 75
95 18 12 99 99
a. Encontrar el análisis de regresión simple entre la presión arterial media y la edad a fin de determinar la ecuación lineal que la rige.
b. ¿Qué presión arterial se espera para una persona que tiene 51 años? c. ¿Qué edad se espera que tenga una persona con presión arterial media de
111? d. Encuentra la matriz de correlación de todas las variables y determina qué par
de variables presentan una mayor correlación. e. Determina el modelo lineal de los datos anteriores mediante el análisis de
regresión múltiple. f. Encuentra el coeficiente de determinación múltiple R2e interpreta el análisis
de varianza que presentan tus resultados.
Problema 4. Para los mismos datos:
Aplica el análisis factorial y presenta:
Matriz de correlación y aplica análisis de componentes Realiza todas las pruebas para determinar el número de factores necesarios:
Servicio de asesoría y resolución de ejercicios [email protected]
www.maestronline.com
o Valores propios o Porcentaje de varianza o Diagrama de sedimentación
¿Es clara la selección del número de factores? Explica. ¿Cuál es la cantidad adecuada de factores?
o Interpreta los factores extraídos. o Si tuvieras variables sustitutas, ¿cuáles escogerías? o Examina el ajuste del modelo y determina si el análisis factorial es la
mejor técnica para tratar estos datos.
Instrucciones:
Problema 1. Una empresa distribuidora de vinos tiene interés en encontrar clasificación de distintos productos a fin de poder diversificar y especializar su mercado. Hace un estudio de composición de los vinos a fin de determinar de acuerdo a sus características qué ofrecer y a qué tipo de público. Los valores que midió son los siguientes:
Tipo de vino: A, B, o C (según la región) Alcohol Ácido Málico (ácido orgánico de la uva) Cenizas Flavonoides: antioxidantes Fenoles no flavonoides: antioxidantes Intensidad de color
Tipo Alcohol Ácido Málico
Cenizas flavonoides Fenoles no flavonoides
Intensidad color
A 14.21 4.04 2.44 2.65 0.3 5.24
A 14.38 3.59 2.28 3.17 0.27 4.9
A 13.9 1.68 2.12 3.39 0.21 6.1
A 14.1 2.02 2.4 2.92 0.32 6.2
A 13.94 1.73 2.27 3.54 0.32 8.9
A 13.05 1.73 2.04 3.27 0.17 7.2
A 13.83 1.65 2.6 2.99 0.22 5.6
A 13.82 1.75 2.42 3.74 0.32 7.05
B 13.49 1.66 2.24 1.84 0.27 3.74
B 12.99 1.67 2.6 2.89 0.21 3.35
B 11.96 1.09 2.3 2.14 0.13 3.21
B 11.66 1.88 1.92 1.57 0.34 3.8
Servicio de asesoría y resolución de ejercicios [email protected]
www.maestronline.com
B 13.03 0.9 1.71 2.03 0.24 4.6
B 11.84 2.89 2.23 1.32 0.43 2.65
B 12.33 0.99 1.95 1.85 0.35 3.4
C 12.53 5.51 2.64 0.6 0.63 5
C 13.49 3.59 2.19 0.48 0.58 5.7
C 12.84 2.96 2.61 0.6 0.53 4.92
C 12.93 2.81 2.7 0.5 0.53 4.6
C 13.36 2.56 2.35 0.5 0.37 5.6
C 13.52 3.17 2.72 0.52 0.5 4.35
C 13.62 4.95 2.35 0.8 0.47 4.4
Utiliza como variable de agrupación el lugar de procedencia del vino, es decir, el tipo de vino.
1. ¿Qué variable, de acuerdo a la agrupación realizada, tiene más peso en la composición del vino?
2. Analizando la tabla del resumen de datos, ¿cómo puedes identificar si hay diferencia entre los distintos grupos con respecto a los parámetros?
3. Identifica, mediante el examen de medias, si las medias son estadísticamente iguales para ambos grupos.
4. Analiza los valores de la λ de Wilks para los datos solos y posteriormente para los datos agrupados junto con su transformación en chi cuadrada. A partir de los resultados, indica el nivel de significancia del análisis.
5. De acuerdo a la matriz de correlaciones agrupadas, identifica si hay alguna que presente correlación con alguna otra variable.
6. Ahora realiza la interpretación de datos. Puedes utilizar las cargas canónicas, los coeficientes estandarizados o los no estandarizados, o los signos de los centroides, para hacerlo.
7. Finalmente, comenta la validez del análisis discriminante y menciona el % de validez que hay en los datos agrupados originales.
8. Arma la función discriminante para el modelo en particular. 9. Elabora tus conclusiones respecto a lo que podría hacer el distribuidor de
vinos con esta información.
Problema 2. Para determinar aspectos significativos de selección de vino l, se realizó una encuesta en la que se consideraron los siguientes parámetros a calificar:
Tipo: blanco (1), rosado (2), tinto (3). Tamaño: 250ml (1), 750 ml (2), 1500 ml (3). Cantidad de azúcares: seco (1), semiseco (2), dulce (3). Edad: sin crianza (1), crianza (2), reserva (3), gran reserva (4).
Aun cuando las combinaciones que resultan son más, se tomaron solamente 9, las cuales se determinó que eran las más significativas para la tarjeta de encuesta, presentada a continuación:
Servicio de asesoría y resolución de ejercicios [email protected]
www.maestronline.com
Tarjeta (PREF)
Tipo Tamaño Azúcares Edad
1 2 3 4 5 6 7 8 9
Blanco Blanco Blanco Blanco Rosado Rosado
Tinto Tinto Tinto
250 ml 750 ml 750 ml 1500 ml 750 ml 750ml 250 ml 750 ml 1500 ml
Seco Semiseco
Seco Dulce Seco
Semiseco Seco
Semiseco Dulce
Gran reserva Reserva Reserva
Sin crianza Crianza Reserva Crianza Reserva
Gran reserva
Se presenta la tarjeta con las 9 combinaciones a diferentes personas que pretenden consumir vino, a fin de que ordenen sus preferencias. Las respuestas se presentan en la siguiente tabla:
ENCUESTA
PREF 1
PREF 2
PREF 3
PREF 4
PREF 5
PREF 6
PREF 7
PREF 8
PREF 9
1 7 8 5 9 6 4 2 1 3
2 6 9 7 8 5 2 1 4 3
3 9 7 6 8 5 4 3 1 2
4 6 9 5 8 7 3 2 1 4
5 7 8 6 9 5 4 1 2 3
6 6 9 7 8 5 4 2 3 1
7 5 8 6 7 9 2 1 3 4
8 6 9 5 7 8 4 2 1 3
9 9 8 5 7 6 1 3 2 4
10 8 9 6 7 5 2 1 3 4
11 7 8 9 5 6 3 2 1 4
12 7 9 8 6 5 2 1 4 3
13 9 7 8 5 6 3 2 1 4
14 8 9 7 2 5 6 1 3 4
15 9 6 8 7 5 4 2 1 3
16 8 9 5 6 7 2 1 3 4
17 9 7 8 6 5 4 2 1 3
18 6 9 8 7 4 5 1 2 3
19 9 7 5 8 6 4 2 1 3
20 8 7 6 9 5 3 4 2 1
a. Utiliza SPSS y elabora un archivo PLAN con los datos de la primera tabla (tarjeta de encuesta) y un archivo de preferencias con la segunda tabla (respuestas de la encuesta aplicada).
Servicio de asesoría y resolución de ejercicios [email protected]
www.maestronline.com
b. Utiliza el código que se explica en el tema 7: “Análisis conjunto I”, a fin de determinar los parámetros que describen el análisis conjunto.
Interpreta los resultados.
Problema 1. Se realizó un estudio acerca de la duración de dolores de cabeza tipo migraña y su duración en horas por semana medida durante cinco semanas cuando se da tratamiento al enfermo. La variable dependiente es la duración de los dolores de cabeza medida cinco veces.
Los datos cambian mucho más en la semana 1 y 2 que en el resto.
semana1 semana2 semana3 semana4 semana5 promedio
21 22 8 6 6 12.6
20 19 10 4 9 12.4
7 5 5 4 5 5.2
25 30 13 12 4 16.8
30 33 10 8 6 17.4
19 27 8 7 4 13
26 16 5 2 5 10.8
13 4 8 1 5 6.2
26 24 14 8 17 17.8
a. Encuentra la matriz de correlación de todas las semanas a fin de ver si existe alguna relación entre ellas.
b. Determina si existe alguna correlación entre los datos de: semana1 – semana 3, semana1 – semana5, semana3 – semana5.
c. Encuentra el modelo lineal que determine la duración de dolor de cabeza de acuerdo al número de semanas de tratamiento.
Problema 2. En un experimento agrícola se busca identificar diferencias de siembra de maíz mediante el uso de 3 tipos de fertilizante. La producción de búshels por acre son los siguientes:
Variedad
Fertilizante A B C D
1 2 3
86 92 75
88 91 80
77 81 83
84 93 79
a. ¿Puede pensarse que cualquier de los fertilizantes produce un resultado equivalente?
Servicio de asesoría y resolución de ejercicios [email protected]
www.maestronline.com
b. Interpretar los resultados.
Problema 3. Un psicólogo está trabajando con tres tipos de pruebas de aptitud que se aplican a trainees que trabajarán en la Bolsa Mexicana de Valores. Se aplican las tres pruebas a personas que están agrupadas de acuerdo a su sociabilidad que se distingue como poca, regular, buena y muy buena y que se obtuvo de entrevistas previas. Los resultados son los siguientes:
Tipo de prueba
Sociabilidad Ajusta al perfil Adaptable Estabilidad
Poca Regular Buena
Muy buena
65 74 64 89
68 79 72 82
62 76 65 84
69 72 68 78
71 69 73 78
67 69 75 75
75 70 78 76
75 69 82 77
78 65 80 75
Determinar con un nivel de confianza del 95% si existe alguna diferencia entre la sociabilidad y los resultados en las pruebas.
Actividad integradora 4
Instrucciones:
En la revista Anthrozoös el Dr. Wuensch y su equipo hicieron un estudio para medir actitudes acerca de los derechos de los animales y la experimentación en animales mediante un cuestionario de 28 preguntas con cinco opciones cada una (1 = totalmente en desacuerdo, 5 = totalmente de acuerdo). Para este trabajo utilizaremos solo las primeras 15 preguntas a fin de no hacer un estudio demasiado complicado y los terceros 30 encuestados.
Se presentan las 15 primeras preguntas del cuestionario:
1. Los humanos no tienen derecho a desplazar animales salvajes para convertir los espacios en granjas, sitios de pastoreo, ciudades, carreteras, etc.
2. La investigación en animales no tiene justificación y debe detenerse. 3. Es moralmente incorrecto beber leche y comer huevo. 4. Un humano no tiene derecho a utilizar un caballo como medio de transporte
ni entretenimiento. 5. Es incorrecto utilizar atuendos hechos con piel. 6. La mayoría de la investigación médica hecha en animales es innecesaria y
no válida. 7. He pensado seriamente convertirme en vegetariano a fin de salvar vidas
animales. 8. Los propietarios de mascotas son responsables de prevenir que sus
mascotas maten otras especies (gatos que matan ratones, serpientes que comen ratones vivos).
9. Necesitamos más regulaciones por parte del gobierno en el uso de investigación en animales.
Servicio de asesoría y resolución de ejercicios [email protected]
www.maestronline.com
10. Es moralmente incorrecto comer res y otras carnes ‘rojas’. 11. Las plagas (mosquitos, moscas, cucarachas, etc.) deben ser retiradas del
hogar más que exterminadas. 12. Los animales deben tener los mismos derechos que los humanos. 13. Es incorrecto utilizar cinturones de piel y zapatos de piel. 14. Prefiero que mueran o sufran de enfermedades los humanos a que se
investigue en animales la cura y tratamiento de dichas enfermedades. 15. Ya que se han extendido los derechos humanos hacia las mujeres y las
minorías, se deben extender también hacia los animales.
Además en la columna sexo se tiene (1 = mujer, 2 = hombre)
Revisado en: http://core.ecu.edu/psyc/wuenschk/Animals/Anim-Rights-Q.htm el 7 de diciembre de 2010 y publicado en: Wuensch, K. L., Jenkins, K. W., & Poteat, G. M. (Misanthropy, idealism, and attitudes towards animals. Anthrozoös, 2002, 15, 139-149)
P 1 P 2 P 3 P 4 P 5 P 6 P 7 P 8 P 9 P 10 P 11 P 12 P 13 P 14 P 15 sexo
3 2 2 2 2 4 2 2 4 2 4 2 2 2 2 1
2 2 1 2 2 2 2 1 2 1 1 1 1 1 1 2
4 2 1 3 2 2 1 2 4 2 1 3 2 1 4 1
3 4 2 3 2 4 3 2 5 3 3 3 2 2 3 1
2 2 1 1 1 2 1 2 4 1 3 1 1 1 2 1
4 2 1 2 2 2 1 4 4 1 2 1 2 1 2 1
3 3 1 1 2 2 1 3 4 1 1 1 1 1 1 1
4 3 1 2 2 2 2 3 3 2 4 3 2 1 2 1
2 2 1 1 1 2 2 2 2 1 1 2 1 1 2 1
2 2 1 2 2 2 2 2 2 2 1 2 2 1 2 1
4 5 1 2 2 2 2 4 5 2 3 1 2 2 3 1
3 1 1 1 1 1 3 2 3 1 1 2 1 3 3 1
2 1 1 1 1 2 5 3 2 2 1 1 1 2 2 1
3 3 2 2 3 2 3 3 4 2 3 3 2 3 3 1
4 2 4 1 2 2 2 3 3 2 3 3 2 3 3 1
4 4 2 2 3 4 2 2 5 2 3 4 3 1 3 1
3 3 1 2 2 2 2 3 4 2 2 2 2 1 2 1
2 1 2 2 2 3 1 1 3 1 1 1 2 1 1 2
2 2 1 1 1 3 3 5 3 1 1 3 1 1 1 1
2 1 1 1 1 1 2 1 1 1 1 2 1 1 2 1
4 2 1 2 1 2 1 1 4 1 3 2 1 1 2 2
2 2 2 2 4 2 5 4 5 3 2 4 2 1 3 1
4 2 1 1 1 1 1 1 2 1 2 2 1 1 1 1
Servicio de asesoría y resolución de ejercicios [email protected]
www.maestronline.com
3 2 1 2 1 2 2 2 3 2 4 3 2 1 3 1
3 3 1 2 2 3 2 2 4 1 1 3 2 2 2 1
4 2 2 3 2 2 3 2 4 2 2 3 2 2 4 1
4 3 2 1 2 2 2 2 3 2 2 3 2 2 3 1
2 2 1 1 2 1 2 1 2 1 2 2 2 1 1 2
5 2 2 2 5 4 1 4 2 4 4 3 3 3 2
2 2 2 2 2 3 1 1 3 2 1 2 2 2 2 1
a. Analiza los datos a fin de identificar si hay alguna forma de agruparlos de acuerdo a las respuestas proporcionadas.
b. Identifica si entre los encuestados hay alguna forma de agruparlos de acuerdo a uso de animales o la investigación en animales.
c. Realiza los siguientes análisis por conglomerado: i. Procedimiento de enlace ii. Procedimiento de k-medias con 2 o 3 grupos
d. Encuentra:
i. la matriz de distancia ii. el historial del conglomerado
iii. el conglomerado de pertenencia iv. el diagrama de témpano y el v. dendograma a fin de hacer tu análisis completo
e. Presenta las conclusiones argumentando con tus resultados.
Envía la actividad a tu tutor, en formato de reporte.
Instrucciones
Entrega a tu profesor el proyecto final, el cual debe contener lo siguiente:
Copia del enunciado de cada problema. Especificación del método multivariante aplicado por problema y
justificación de su selección. Solución del problema por el método multivariante que se seleccionó. Interpretación de los resultados.
Para cada uno de los problemas que se te presentan a continuación, se debe aplicar alguna técnica multivariante. Indica qué técnica es más adecuada, por qué y realiza el análisis conveniente.
1. McDonald’s es un restaurante de comida rápida que ha incursionado en el mercado de ensaladas. Las ensaladas que ofrece son las siguientes: César, Ranch, Diosa Verde y Rusa. Se probó en 14 restaurantes, durante 14 días, a fin de ver la respuesta de los clientes y los datos encontrados se presentan a continuación:
Servicio de asesoría y resolución de ejercicios [email protected]
www.maestronline.com
Día César Ranch Diosa Verde
Rusa
1 2 3 4 5 6 7
155 157 151 146 181 160 168
143 146 141 136 180 152 157
149 152 146 141 173 170 174
135 136 131 126 115 150 147
8 9 10 11 12 13 14
157 139 144 158 184 161 165
167 159 154 169 195 177 178
141 129 167 145 178 201 185
130 119 134 144 177 151 160
a. Determina si existe alguna diferencia significativa entre las preferencias de los consumidores hacia alguna ensalada.
2. En el análisis taxonómico de las flores para distinguir sus distintas especies se toma en cuenta cinco aspectos: longitud de los sépalos, anchura de los sépalos, longitud de los pétalos y anchura de los pétalos y su especie. Se desea probar si las cuatro variables (longitud sépalo, ancho sépalo, longitud pétalo y ancho pétalo) presentadas permiten identificar la especie en cuestión (visualizar los datos de forma gráfica para comprobar si están correctamente diferenciadas). Se toma una muestra de 50 observaciones que se presentan a continuación:
OBS Long
sépalo Ancho sépalo
Long pétalo
Ancho pétalo
Especie
Obs1 50 33 14 2 Setosa
Obs2 64 28 56 22 Virginica
Obs3 65 28 46 15 Versicolor
Obs4 67 31 56 24 Virginica
Obs5 63 28 51 15 Virginica
Obs6 46 34 14 3 Setosa
Obs7 69 31 51 23 Virginica
Obs8 62 22 45 15 Versicolor
Obs9 59 32 48 18 Versicolor
Obs10 46 36 10 2 Setosa
Obs11 61 30 46 14 Versicolor
Obs12 60 27 51 16 Versicolor
Obs13 65 30 52 20 Virginica
Servicio de asesoría y resolución de ejercicios [email protected]
www.maestronline.com
Obs14 56 25 39 11 Versicolor
Obs15 65 30 55 18 Virginica
Obs16 58 27 51 19 Virginica
Obs17 68 32 59 23 Virginica
Obs18 51 33 17 5 Setosa
Obs19 57 28 45 13 Versicolor
Obs20 62 34 54 23 Virginica
Obs21 77 38 67 22 Virginica
Obs22 63 33 47 16 Versicolor
Obs23 67 33 57 25 Virginica
Obs24 76 30 66 21 Virginica
Obs25 49 25 45 17 Virginica
Obs26 55 35 13 2 Setosa
Obs27 67 30 52 23 Virginica
Obs28 70 32 47 14 Versicolor
Obs29 6 32 45 15 Versicolor
Obs30 61 28 40 13 Versicolor
Obs31 48 31 16 2 Setosa
Obs32 59 30 51 18 Virginica
Obs33 55 24 38 11 Versicolor
Obs34 63 25 50 19 Virginica
Obs35 64 32 53 23 Virginica
Obs36 52 34 14 2 Setosa
Obs37 49 36 14 1 Setosa
Obs38 54 30 45 15 Versicolor
Obs39 79 38 64 20 Virginica
Obs40 44 32 13 2 Setosa
Obs41 67 33 57 21 Virginica
Obs42 50 35 16 6 Setosa
Obs43 58 26 40 12 Versicolor
Obs44 44 30 13 2 Setosa
Obs45 77 28 67 20 Virginica
Obs46 63 27 49 18 Virginica
Obs47 47 32 16 2 Setosa
Obs48 55 26 44 12 Versicolor
Obs49 50 23 33 10 Versicolor
Obs50 72 32 60 18 Virginica
Datos tomados de Fisher M. (1936). “The Use of Multiple Measurements in Taxonomic Problems”, Annals of Eugenics, 7, pp. 179 – 188).
Servicio de asesoría y resolución de ejercicios [email protected]
www.maestronline.com
Para contestar lo anterior (subrayado) se te sugiere:
a. Encontrar la matriz de correlación entre las variables. b. Realizar un análisis de regresión múltiple a fin de determinar el modelo lineal
que permita explicar los datos. c. Hacer el análisis de varianza correspondiente de la muestra completa e
interpretar. d. Hacer el análisis discriminante e interpretar.
3. La empresa Kimberly-Clark es líder en el mercado de la industria de los pañales desde 1960 que inició en este campo. A la fecha vende más de 3500 millones de dólares, únicamente en Estados Unidos. Los atributos principales en la fabricación de pañales son los siguientes:
Estilo: estampado/ color, blanco. Absorbencia: regular, superabsorbente. Cierre: cinta normal, cinta resellable. Escurrimiento: regular, antiescurrimiento.
b. Diseña los 16 perfiles completos en términos de preferencia. Calcula las funciones de valor parcial y la importancia de cada atributo.
4. Los siguientes datos corresponden a personas que pertenecen a una comunidad en donde se realizaron distintas medidas físicas a fin de determinar si existe diferencia entre las medidas de hombres y mujeres. Responde lo siguiente:
a. ¿Qué análisis multivariante aplicarías? ¿Por qué? b. Aplica el análisis que mencionaste en el inciso ‘a’ a los datos e
interpreta los resultados. c. Identifica si hay alguna relación entre las medidas del cuerpo e
interprétalas.
Sexo Estatura Peso Pie Largo brazo
Ancho espalda
Diámetrocráneo Distancia rodilla - tobillo
1 0.00 159.00 49.00 36.00 68.00 42.00 57.00 40.00
2 1.00 164.00 62.00 39.00 73.00 44.00 55.00 44.00
3 0.00 172.00 65.00 38.00 75.00 48.00 58.00 44.00
4 0.00 167.00 52.00 37.00 73.00 41.50 58.00 44.00
5 0.00 164.00 51.00 36.00 71.00 44.50 54.00 40.00
6 0.00 161.00 67.00 38.00 71.00 44.00 56.00 42.00
7 0.00 168.00 48.00 39.00 72.50 41.00 54.50 43.00
8 1.00 181.00 74.00 43.00 74.00 50.00 60.00 47.00
9 1.00 183.00 74.00 41.00 79.00 47.50 59.50 47.00
Servicio de asesoría y resolución de ejercicios [email protected]
www.maestronline.com
10 0.00 158.00 50.00 36.00 68.50 44.00 57.00 41.00
11 0.00 156.00 65.00 36.00 68.00 46.00 58.00 41.00
12 1.00 173.00 64.00 40.00 79.00 48.00 56.50 47.00
13 0.00 158.00 43.00 36.00 68.00 43.00 55.00 39.00
14 1.00 178.00 74.00 42.00 75.00 50.00 59.00 45.00
15 1.00 181.00 76.00 43.00 83.00 51.00 57.00 43.00
16 1.00 182.00 91.00 41.00 83.00 53.00 59.00 43.00
17 1.00 176.00 73.00 42.00 78.00 48.00 58.00 45.00
18 0.00 162.00 68.00 39.00 72.00 44.00 59.00 42.00
19 0.00 156.00 52.00 36.00 67.00 36.00 56.00 41.00
20 0.00 152.00 45.00 34.00 66.00 40.00 55.00 38.00
21 1.00 181.00 80.00 43.00 76.00 49.00 57.00 46.00
22 1.00 173.00 69.00 41.00 74.00 48.00 56.00 44.00
23 0.00 155.00 53.00 36.00 67.00 43.00 56.00 38.00
24 1.00 189.00 87.00 45.00 82.00 53.00 61.00 52.00
25 0.00 170.00 70.00 38.00 73.00 45.00 56.00 43.00
26 1.00 170.00 67.00 40.00 77.00 46.50 58.00 44.50
27 0.00 168.00 56.00 37.50 70.50 48.00 60.00 40.00
5. Los datos presentados a continuación representan 21 observaciones de 8 variables que corresponden a publicaciones científicas en distintos países recogidas durante 1982 – 1984. Las variables se organizaron por área:
InterA (interdisciplinaria), InterB (interdisciplinaria), Agric. (Agricultura), Biolo. (Biología), Medic. (Medicina), Quimi. (Química), Ingen. (Ingeniería) y Física.
INTER.A INTER.B AGRIC. BIOLO. MEDIC. QUIMI. INGEN. FÍSICA
EE.UU 815319 379851 88663 58104 255864 440134 111015 162288
UK 162103 90332 35158 29802 59630 92725 6409 34349
JP 105856 78811 13978 16758 55634 308926 32039 40538
F 118935 76186 13818 11253 49938 120065 9984 35792
G 91099 85037 11740 20337 41233 66087 11304 22093
C 72722 49459 14041 16722 23139 101900 12034 14645
I 42905 29734 7904 13444 31078 36322 5833 11351
A 36121 22236 12419 9863 12186 19641 4898 6299
H 29912 18036 6563 7548 13721 23029 3798 6775
S 28568 16190 3985 9502 14852 18341 2387 3549
CH 26495 14518 3378 3636 11096 19304 2556 5784
E 16425 11818 3089 3981 7196 15493 1258 2692
B 17311 11791 3240 4011 8098 11964 1772 3417
Servicio de asesoría y resolución de ejercicios [email protected]
www.maestronline.com
D 14677 555 2635 5667 8368 14266 1197 1999
AU 10957 13154 1433 2372 5928 6713 1318 2278
FI 11012 6457 2028 4756 5731 6647 1001 1669
N 9075 5432 1803 3299 4801 5326 912 853
Y 4686 2957 2031 1194 1806 7046 801 1861
GR 3720 2749 692 1293 1518 2415 896 1366
IR 6786 214 432 1119 1355 98 522 941
P 1221 1929 388 386 564 12 493 413
a. Identifica si existe redundancia entre los datos, es decir, si podemos reducir el número de variables para explicar el comportamiento de los datos.
b. Identifica si existe correlación entre las distintas disciplinas y si puedes generar un modelo lineal para el conjunto de datos.
6. Una importante empresa financiera quiere ganar el liderazgo en el manejo de tarjetas de crédito para lo cual busca elaborar un conjunto de perfiles de tarjeta y presentarlo a clientes para conocer sus preferencias. Las características a valorar son las siguientes:
Tasa de interés: baja, media, alta Puntos por uso: sí, no Cargo anual: cero, $200, $400
Diseña el total de perfiles completos en términos de preferencia. Calcula las funciones de valor parcial y la importancia de cada atributo. Algunos atributos son incompatibles (por ejemplo: a tarjetas que tienen tasa de interés baja no se les dan puntos por uso o por ejemplo si la tarjeta tiene cargo anual cero generalmente presenta tasa anual media o alta, o en una tarjeta con cargo anual alto y puntos puede tener tasa de interés baja -¿por qué?-). Determina los perfiles que sería conveniente presentar a los clientes en el diseño de esta nueva tarjeta de crédito.
7. La siguiente tabla pertenece a un grupo de datos constituido por 26 observaciones y 9 variables que corresponden a porcentaje de empleo en los distintos sectores en países europeos. Los sectores son los siguientes:
Agr: agricultura Min: minería Man: manufactura Ene: energía Con: construcción SI: servicios industriales Fin: finanzas Ser: servicios TC: transporte y comunicaciones
Fuente: Euromonitor (1979).
Servicio de asesoría y resolución de ejercicios [email protected]
www.maestronline.com
Agr Min Man Ene Con SI Fin Ser TC
Alemania del E. 4.20 2.90 41.20 1.30 7.60 11.20 1.20 22.10 8.40
Alemania del O. 6.70 1.30 35.80 0.90 7.30 14.40 5.00 22.30 6.10
Austria 12.70 1.10 30.20 1.40 9.00 16.80 4.90 16.80 7.00
Bélgica 3.30 0.90 27.60 0.90 8.20 19.10 6.20 26.60 7.20
Bulgaria 23.60 1.90 32.30 0.60 7.90 8.00 0.70 18.20 6.70
Checoeslovaquia 16.50 2.90 35.50 1.20 8.70 9.20 0.90 17.90 7.00
Dinamarca 9.20 0.10 21.80 0.60 8.30 14.60 6.50 32.20 7.10
España 22.90 0.80 28.50 0.70 11.50 9.70 8.50 11.80 5.50
Finlandia 13.00 0.40 25.90 1.30 7.40 14.70 5.50 24.30 7.60
Francia 10.80 0.80 27.50 0.90 8.90 16.80 6.00 22.60 5.70
Grecia 41.40 0.60 17.60 0.60 8.10 11.50 2.40 11.00 6.70
Hungría 21.70 3.10 29.60 1.90 8.20 9.40 0.90 17.20 8.00
Irlanda 23.20 1.00 20.70 1.30 7.50 16.80 2.80 20.80 6.10
Italia 15.90 0.60 27.60 0.50 10.00 18.10 1.60 20.10 5.70
Luxemburgo 7.70 3.10 30.80 0.80 9.20 18.50 4.60 19.20 6.20
Noruega 9.00 0.50 22.40 0.80 8.60 16.90 4.70 27.60 9.40
Países Bajos 6.30 0.10 22.50 1.00 9.90 18.00 6.80 28.50 6.80
Polonia 31.10 2.50 25.70 0.90 8.40 7.50 0.90 16.10 6.90
Portugal 27.80 0.30 24.50 0.60 8.40 13.30 2.70 16.70 5.70
Reino Unido 2.70 1.40 30.20 1.40 6.90 16.90 5.70 28.30 6.40
Rumania 34.70 2.10 30.10 0.60 8.70 5.90 1.30 11.70 5.00
Suecia 6.10 0.40 25.90 0.80 7.20 14.40 6.00 32.40 6.80
Suiza 7.70 0.20 37.80 0.80 9.50 17.50 5.30 15.40 5.70
Turquía 66.80 0.70 7.90 0.10 2.80 5.20 1.10 11.90 3.20
USSR 23.70 1.40 25.80 0.60 9.20 6.10 0.50 23.60 9.30
Yugoslavia 48.70 1.50 16.80 1.10 4.90 6.40 11.30 5.30 4.00
a. Analiza la tabla de datos anterior por el método de conglomerados de acuerdo con las siguientes técnicas:
i. Jerárquico enlace único (vecino más cercano) ii. Jerárquico procedimiento de centroide
iii. Técnica de Ward
b. Analiza por el método de dos pasos para tratar de encontrar entre 3 y 5 grupos conglomerados bien identificados.
c. Interpreta y analiza cada grupo de resultados a fin de identificar qué cantidad de conglomerados es óptima y cuál es el parámetro que conglomera los datos. Utiliza dendograma o los gráficos que requieras a fin de aclarar tus respuestas.