Analisis multivariante

16
Servicio de asesoría y resolución de ejercicios [email protected] www.maestronline.com Pide una cotización a nuestros correos. Maestros Online Análisis multivariante Apoyo en ejercicios Servicio de asesorías y solución de ejercicios [email protected]

Transcript of Analisis multivariante

Servicio de asesoría y resolución de ejercicios [email protected]

www.maestronline.com

Pide una cotización a nuestros correos.

Maestros Online

Análisis

multivariante

Apoyo en

ejercicios

Servicio de asesorías y solución de ejercicios

[email protected]

Servicio de asesoría y resolución de ejercicios [email protected]

www.maestronline.com

Actividad integradora 1

Instrucciones:

Problema 1. Una encuesta de muestreo entre propietarios de piscinas residenciales en el sudeste de Pensilvania arrojó los siguientes datos con respecto al costo de piscinas y su ingreso anual:

Informante Costo piscina

Miles de dólares Ingreso anual

Miles de dólares Tamaño del lote

Miles de pies cuadrados

1 2 3 4 5 6

3.6 4.8 2.4 7.2 6.9 8.4

9.3 10.2 9.7

11.5 12.0 14.2

30.2 40.1 35.5 45.1 38.0 50.1

7 8 9 10 11 12

10.7 11.2 6.1 7.9 9.5 5.4

18.6 28.4 13.2 10.8 22.7 12.3

60.2 100.4 25.1 40.7 68.4 60.3

a. Encuentra el índice de correlación entre las variables costo-ingreso y determina si existe una relación lineal.

b. Si existe relación lineal encuentra el modelo lineal que la determina. c. Si una persona tiene un ingreso de 25mil dólares anuales ¿qué costo de piscina le

podemos ofrecer? d. ¿Qué ingreso debe tener una persona que pretende gastar 5 mil dólares en una

piscina? e. Encuentra la matriz de correlación entre las variables y determina si existe relación

entre algún par de ellas. f. Por medio de análisis de regresión múltiple encuentra el modelo lineal que la

determina. g. Si el propietario de una piscina tiene un ingreso anual de 12.5 mil dólares y un lote

de 40mil pies cuadrados, ¿qué costo de piscina se puede predecir? h. Encontrar el coeficiente de determinación múltiple R2. Interpreta el resultado así

como los datos que se obtienen en el análisis de varianza.

Problema 2. Se realizó una encuesta acerca de derechos de los animales a un grupo de 20 personas en escala de Likert de 9 puntos (1: en total desacuerdo, 9: totalmente de acuerdo).

Preguntas:

X1: Los humanos no tienen derecho a desplazar animales salvajes de su lugar de origen para siembra, ciudades, carreteras, etc. X2: Es moralmente incorrecto beber leche y comer huevo. X3. La mayoría de la investigación en animales es innecesaria y no válida.

Servicio de asesoría y resolución de ejercicios [email protected]

www.maestronline.com

X4. Las personas dueñas de mascotas son responsables del daño que causen las mismas a otros animales como es gatos que matan conejos/ratas, serpientes que comen ratas vivas. X5. Las plagas (moscas, mosquitos, cucarachas, etc.) deben ser removidos de casa más que asesinados.

Encuestado X1 X2 X3 X4 X5

1 5 3 4 4 1

2 1 6 6 5 5

3 6 4 2 5 7

4 9 2 3 1 6

5 5 9 4 6 3

6 1 2 9 3 5

7 4 6 5 9 2

8 3 4 3 2 3

9 4 6 5 7 9

10 5 7 7 3 6

11 6 5 7 3 3

12 6 7 5 3 4

13 5 6 4 3 4

14 7 7 6 3 2

15 4 3 4 6 4

16 2 3 4 5 5

17 1 3 2 3 6

18 2 4 3 6 4

19 3 3 4 6 7

20 1 1 4 5 5

Aplica el análisis factorial y presenta:

Matriz de correlación y aplica análisis de componentes Realiza todas las pruebas para determinar el número de factores necesarios:

o Valores propios o Porcentaje de varianza o Diagrama de sedimentación

¿Es clara la selección del número de factores? Explica. ¿Cuál es la cantidad adecuada de factores?

o Interpreta los factores extraídos. o Si tuvieras variables sustitutas, ¿cuáles escogerías? o Examina el ajuste del modelo y determina si el análisis factorial es la mejor

Servicio de asesoría y resolución de ejercicios [email protected]

www.maestronline.com

técnica para tratar estos datos.

Actividad integradora 2

Instrucciones:

Problema 1. Una empresa distribuidora de vinos tiene interés en encontrar clasificación de distintos productos a fin de poder diversificar y especializar su mercado. Hace un estudio de composición de los vinos a fin de determinar de acuerdo a sus características qué ofrecer y a qué tipo de público. Los valores que midió son los siguientes:

Tipo de vino: A, B, o C (según la región) Alcohol Ácido Málico (ácido orgánico de la uva) Cenizas Flavonoides: antioxidantes Fenoles no flavonoides: antioxidantes Intensidad de color

Tipo Alcohol Ácido Málico

Cenizas flavonoides Fenoles no flavonoides

Intensidad color

A 14.2 1.76 2.45 3.39 0.34 6.75

A 14.39 1.87 2.45 2.52 0.3 5.25

A 14.06 2.15 2.61 2.51 0.31 5.05

A 14.83 1.64 2.17 2.98 0.29 5.2

A 13.86 1.35 2.27 3.15 0.22 7.22

A 14.1 2.16 2.3 3.32 0.22 5.75

A 14.12 1.48 2.32 2.43 0.26 5

A 13.75 1.73 2.41 2.76 0.29 5.6

B 11.66 1.88 1.92 1.57 0.34 3.8

B 13.03 0.9 1.71 2.03 0.24 4.6

B 11.84 2.89 2.23 1.32 0.43 2.65

B 12.33 0.99 1.95 1.85 0.35 3.4

B 12.7 3.87 2.4 2.55 0.43 2.57

B 12 0.92 2 2.26 0.3 2.5

B 12.72 1.81 2.2 2.53 0.26 3.9

B 12.08 1.13 2.51 1.58 0.4 2.2

C 12.2 3.03 2.32 0.49 0.4 5.5

C 12.77 2.39 2.28 0.51 0.48 9.9

C 14.16 2.51 2.48 0.7 0.44 9.7

Servicio de asesoría y resolución de ejercicios [email protected]

www.maestronline.com

C 13.71 5.65 2.45 0.61 0.52 7.7

C 13.4 3.91 2.48 0.75 0.43 7.3

C 13.27 4.28 2.26 0.69 0.43 10.2

C 13.17 2.59 2.37 0.68 0.53 9.3

C 14.13 4.1 2.74 0.76 0.56 9.2

Utiliza como variable de agrupación el lugar de procedencia del vino, es decir, el tipo de vino.

1. ¿Qué variable, de acuerdo a la agrupación realizada, tiene más peso en la composición del vino?

2. Analizando la tabla del resumen de datos, ¿cómo puedes identificar si hay diferencia entre los distintos grupos con respecto a los parámetros?

3. Identifica, mediante el examen de medias, si las medias son estadísticamente iguales para ambos grupos.

4. Analiza los valores de la λ de Wilks para los datos solos y posteriormente para los datos agrupados junto con su transformación en chi cuadrada. A partir de los resultados, indica el nivel de significancia del análisis.

5. De acuerdo a la matriz de correlaciones agrupadas, identifica si hay alguna que presente correlación con alguna otra variable.

6. Ahora realiza la interpretación de datos. Puedes utilizar las cargas canónicas, los coeficientes estandarizados o los no estandarizados, o los signos de los centroides, para hacerlo.

7. Finalmente, comenta la validez del análisis discriminante y menciona el % de validez que hay en los datos agrupados originales.

8. Arma la función discriminante para el modelo en particular. 9. Elabora tus conclusiones respecto a lo que podría hacer el distribuidor de vinos

con esta información.

Problema 2. Para determinar aspectos significativos de selección de vino, se realizó una encuesta en la que se consideraron los siguientes parámetros a calificar:

Tipo: blanco (1), rosado (2), tinto (3). Tamaño: 250ml (1), 750 ml (2), 1500 ml (3). Cantidad de azúcares: seco (1), semiseco (2), dulce (3). Edad: sin crianza (1), crianza (2), reserva (3), gran reserva (4).

Aun cuando las combinaciones que resultan son más, se tomaron solamente 9, las cuales se determinó que eran las más significativas para la tarjeta de encuesta, presentada a continuación:

Tarjeta (PREF)

Tipo Tamaño Azúcares Edad

1 2 3 4

Blanco Blanco Blanco Blanco

250 ml 750 ml 750 ml 1500 ml

Seco Semiseco

Seco Dulce

Gran reserva Reserva Reserva

Sin crianza

Servicio de asesoría y resolución de ejercicios [email protected]

www.maestronline.com

5 6 7 8 9

Rosado Rosado

Tinto Tinto Tinto

750 ml 750ml 250 ml 750 ml 1500 ml

Seco Semiseco

Seco Semiseco

Dulce

Crianza Reserva Crianza Reserva

Gran reserva

Se presenta la tarjeta con las 9 combinaciones a diferentes personas que pretenden consumir vino, a fin de que ordenen sus preferencias. Las respuestas se presentan en la siguiente tabla:

ENCUESTA PREF

1 PREF

2 PREF

3 PREF

4 PREF

5 PREF

6 PREF

7 PREF

8 PREF

9

1 7 8 5 9 6 4 2 1 3

2 2 1 1 4 7 9 6 2 2

3 8 9 4 4 6 1 4 5 6

4 5 2 3 7 4 4 3 4 4

5 1 7 9 8 7 4 7 8 3

6 7 7 8 2 6 9 2 9 4

7 3 2 3 7 2 8 3 2 5

8 7 9 4 8 1 2 4 9 8

9 2 9 4 9 3 1 1 1 6

10 5 5 7 4 3 4 8 7 9

11 5 8 9 8 6 9 6 1 8

12 7 3 6 3 9 1 7 3 4

13 2 4 7 5 3 7 5 1 6

14 5 4 5 5 5 2 3 3 5

15 2 1 5 6 4 2 8 5 6

16 2 5 6 8 4 2 5 2 3

17 9 4 6 2 1 2 7 9 3

18 3 8 4 2 3 5 3 5 9

19 3 9 8 9 3 6 7 1 5

20 6 5 8 4 6 4 8 1 5

a. Utiliza SPSS y elabora un archivo PLAN con los datos de la primera tabla (tarjeta de encuesta) y un archivo de preferencias con la segunda tabla (respuestas de la encuesta aplicada).

b. Utiliza el código que se explica en el tema 7: “Análisis conjunto I”, a fin de determinar los parámetros que describen el análisis conjunto.

Interpreta los resultados

Servicio de asesoría y resolución de ejercicios [email protected]

www.maestronline.com

Actividad integradora 3

Instrucciones:

En un laboratorio de estudio de la conducta animal se busca determinar qué respuesta se tiene al estimular cierta área del cerebro (0, 1 ó 2) que se mide con tiempo de respuesta y el efecto de la descarga. Los datos encontrados se presentan a continuación:

área tiempo retraso

efecto shock

0 50 25

0 50 30

0 50 28

0 50 40

0 50 20

0 100 30

0 100 25

0 100 27

0 100 35

0 100 23

0 150 28

0 150 31

0 150 26

0 150 20

0 150 35

1 50 11

1 50 18

1 50 26

1 50 15

1 50 14

1 100 31

1 100 20

1 100 22

1 100 23

1 100 19

1 150 23

1 150 28

1 150 35

1 150 27

1 150 21

2 50 23

Servicio de asesoría y resolución de ejercicios [email protected]

www.maestronline.com

2 50 30

2 50 18

2 50 28

2 50 23

2 100 18

2 100 24

2 100 9

2 100 16

2 100 13

2 150 28

2 150 21

2 150 30

2 150 30

2 150 23

a. Determina si existe alguna correlación entre el área estimulada y el tiempo de retraso.

b. Divide el archivo y determina si existe alguna diferencia entre las medias de las dos porciones de la muestra.

c. Encuentra el modelo lineal que determina el comportamiento del animal (efecto shock) al estimular determinada área del cerebro con un tiempo de retraso determinado.

Actividad integradora 4

Instrucciones:

En la revista Anthrozoös el Dr. Wuensch y su equipo hicieron un estudio para medir actitudes acerca de los derechos de los animales y la experimentación en animales mediante un cuestionario de 28 preguntas con cinco opciones cada una (1 = totalmente en desacuerdo, 5 = totalmente de acuerdo). Para este trabajo utilizaremos solo las primeras 15 preguntas a fin de no hacer un estudio demasiado complicado y los segundos 30 encuestados.

Se presentan las 15 primeras preguntas del cuestionario:

1. Los humanos no tienen derecho a desplazar animales salvajes para convertir los espacios en granjas, sitios de pastoreo, ciudades, carreteras, etc.

2. La investigación en animales no tiene justificación y debe detenerse. 3. Es moralmente incorrecto beber leche y comer huevo. 4. Un humano no tiene derecho a utilizar un caballo como medio de transporte

Servicio de asesoría y resolución de ejercicios [email protected]

www.maestronline.com

ni entretenimiento. 5. Es incorrecto utilizar atuendos hechos con piel. 6. La mayoría de la investigación médica hecha en animales es innecesaria y

no válida. 7. He pensado seriamente convertirme en vegetariano a fin de salvar vidas

animales. 8. Los propietarios de mascotas son responsables de prevenir que sus

mascotas maten otras especies (gatos que matan ratones, serpientes que comen ratones vivos).

9. Necesitamos más regulaciones por parte del gobierno en el uso de investigación en animales.

10. Es moralmente incorrecto comer res y otras carnes ‘rojas’. 11. Las plagas (mosquitos, moscas, cucarachas, etc.) deben ser retiradas del

hogar más que exterminadas. 12. Los animales deben tener los mismos derechos que los humanos. 13. Es incorrecto utilizar cinturones de piel y zapatos de piel. 14. Prefiero que mueran o sufran de enfermedades los humanos a que se

investigue en animales la cura y tratamiento de dichas enfermedades. 15. Ya que se han extendido los derechos humanos hacia las mujeres y las

minorías, se deben extender también hacia los animales.

Además en la columna sexo se tiene (1 = mujer, 2 = hombre)

Revisado en: http://core.ecu.edu/psyc/wuenschk/Animals/Anim-Rights-Q.htm el 7 de diciembre de 2010 y publicado en: Wuensch, K. L., Jenkins, K. W., & Poteat, G. M. (Misanthropy, idealism, and attitudes towards animals. Anthrozoös, 2002, 15, 139-149)

P 1 P 2 P 3 P 4 P 5 P 6 P 7 P 8 P 9 P 10 P 11 P 12 P 13 P 14 P 15 sexo

4 2 2 2 2 2 2 2 4 2 2 1 2 1 2 1

3 3 2 3 2 3 1 2 4 2 2 4 2 2 3 1

4 2 2 2 2 2 1 2 4 2 1 3 2 1 4 1

1 1 1 4 4 3 2 1 3 2 2 4 3 2 3 2

5 1 1 1 4 4 1 4 4 4 4 4 4 1 2 1

4 4 2 2 3 3 2 2 5 2 2 3 3 2 4 2

4 2 2 3 3 2 2 2 4 2 2 3 3 2 2 1

4 2 1 1 1 2 1 1 2 1 1 2 1 1 2 2

2 2 1 1 1 1 1 2 4 1 1 3 1 1 3 1

3 3 2 2 2 3 2 2 4 2 2 3 2 2 3 1

3 3 1 1 1 3 2 1 4 2 1 2 1 2 1 1

4 2 1 2 3 2 2 1 2 3 2 3 3 1 3 1

3 3 1 1 1 3 2 1 5 1 1 4 1 2 4 2

3 4 1 2 2 4 2 2 4 1 1 3 2 2 3 1

4 2 2 1 1 2 1 2 3 1 4 3 1 1 3 1

Servicio de asesoría y resolución de ejercicios [email protected]

www.maestronline.com

3 1 1 1 1 1 1 1 4 1 1 2 1 1 1 1

3 2 1 1 1 2 1 1 2 1 1 2 1 1 2 1

5 2 1 3 4 2 4 1 4 4 2 4 4 2 4 1

2 2 2 2 2 2 2 2 4 2 2 2 2 2 2 1

2 3 2 2 2 2 2 2 4 2 2 2 2 1 2 1

2 2 1 1 1 1 1 2 3 1 1 3 1 1 3 1

5 5 2 2 4 5 4 3 5 2 2 5 5 2 4 1

4 5 2 2 3 3 3 4 5 2 1 5 3 3 4 1

2 3 1 1 2 3 1 1 4 1 3 2 1 1 2 1

2 2 2 2 2 2 2 2 3 3 3 3 2 2 2 2

2 1 1 1 1 1 1 2 3 1 1 2 1 1 3 1

5 2 1 2 1 2 5 1 4 5 1 2 1 2 2 2

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

4 2 1 1 1 1 1 1 1 1 1 2 1 1 1 2

4 2 1 1 2 1 2 1 4 1 1 1 1 2 1 1

a. Analiza los datos a fin de identificar si hay alguna forma de agruparlos de acuerdo a las respuestas proporcionadas.

b. Identifica si entre los encuestados hay alguna forma de agruparlos de acuerdo a uso de animales o la investigación en animales.

c. Realiza los siguientes análisis por conglomerado: i. Procedimiento de enlace ii. Procedimiento de k-medias con 2 o 3 grupos

d. Encuentra:

i. la matriz de distancia ii. el historial del conglomerado

iii. el conglomerado de pertenencia iv. el diagrama de témpano y el v. dendograma a fin de hacer tu análisis completo

e. Presenta las conclusiones argumentando con tus resultados.

Instrucciones

Instrucciones:

Entrega a tu profesor el proyecto final, el cual debe contener lo siguiente:

Copia del enunciado de cada problema. Especificación del método multivariante aplicado por problema y justificación de su

selección. Solución del problema por el método multivariante que se seleccionó. Interpretación de los resultados.

Servicio de asesoría y resolución de ejercicios [email protected]

www.maestronline.com

Para cada uno de los problemas que se te presentan a continuación, se debe aplicar alguna técnica multivariante. Indica qué técnica es más adecuada, por qué y realiza el análisis conveniente.

1. McDonald’s es un restaurante de comida rápida que ha incursionado en el mercado de ensaladas. Las ensaladas que ofrece son las siguientes: César, Ranch, Diosa Verde y Rusa. Se probó en 14 restaurantes durante 14 días a fin de ver la respuesta de los clientes y los datos encontrados se presentan a continuación:

Día César Ranch Diosa Verde

Rusa

1 2 3 4 5 6 7

155 157 151 146 181 160 168

143 146 141 136 180 152 157

149 152 146 141 173 170 174

135 136 131 126 115 150 147

8 9

10 11 12 13 14

157 139 144 158 184 161 165

167 159 154 169 195 177 178

141 129 167 145 178 201 185

130 119 134 144 177 151 160

a. Determina si existe alguna diferencia significativa entre las preferencias de los consumidores hacia alguna ensalada.

2. Los siguientes datos corresponden a personas que pertenecen a una comunidad, en donde se realizaron distintas medidas físicas, a fin de determinar si existe diferencia entre las medidas de hombres y mujeres. Responde lo siguiente:

a. ¿Qué análisis multivariante aplicarías? ¿Por qué? b. Aplica el análisis que mencionaste en el inciso ‘a’ a los datos e interpreta

los resultados.

Sexo Estatura Peso Pie Largo brazo

Ancho espalda

Diámetrocráneo Distancia rodilla - tobillo

1 0.00 159.00 49.00 36.00 68.00 42.00 57.00 40.00

2 1.00 164.00 62.00 39.00 73.00 44.00 55.00 44.00

3 0.00 172.00 65.00 38.00 75.00 48.00 58.00 44.00

4 0.00 167.00 52.00 37.00 73.00 41.50 58.00 44.00

5 0.00 164.00 51.00 36.00 71.00 44.50 54.00 40.00

Servicio de asesoría y resolución de ejercicios [email protected]

www.maestronline.com

6 0.00 161.00 67.00 38.00 71.00 44.00 56.00 42.00

7 0.00 168.00 48.00 39.00 72.50 41.00 54.50 43.00

8 1.00 181.00 74.00 43.00 74.00 50.00 60.00 47.00

9 1.00 183.00 74.00 41.00 79.00 47.50 59.50 47.00

10 0.00 158.00 50.00 36.00 68.50 44.00 57.00 41.00

11 0.00 156.00 65.00 36.00 68.00 46.00 58.00 41.00

12 1.00 173.00 64.00 40.00 79.00 48.00 56.50 47.00

13 0.00 158.00 43.00 36.00 68.00 43.00 55.00 39.00

14 1.00 178.00 74.00 42.00 75.00 50.00 59.00 45.00

15 1.00 181.00 76.00 43.00 83.00 51.00 57.00 43.00

16 1.00 182.00 91.00 41.00 83.00 53.00 59.00 43.00

17 1.00 176.00 73.00 42.00 78.00 48.00 58.00 45.00

18 0.00 162.00 68.00 39.00 72.00 44.00 59.00 42.00

19 0.00 156.00 52.00 36.00 67.00 36.00 56.00 41.00

20 0.00 152.00 45.00 34.00 66.00 40.00 55.00 38.00

21 1.00 181.00 80.00 43.00 76.00 49.00 57.00 46.00

22 1.00 173.00 69.00 41.00 74.00 48.00 56.00 44.00

23 0.00 155.00 53.00 36.00 67.00 43.00 56.00 38.00

24 1.00 189.00 87.00 45.00 82.00 53.00 61.00 52.00

25 0.00 170.00 70.00 38.00 73.00 45.00 56.00 43.00

26 1.00 170.00 67.00 40.00 77.00 46.50 58.00 44.50

27 0.00 168.00 56.00 37.50 70.50 48.00 60.00 40.00

3. Los datos presentados a continuación representan 21 observaciones de 8 variables que corresponden a publicaciones científicas recogidas durante 1982 – 1984. Las variables se organizaron por área:

InterA (interdisciplinaria), InterB (interdisciplinaria), Agric. (Agricultura), Biolo. (Biología), Medic. (Medicina), Quimi. (Química), Ingen. (Ingeniería) y Física.

INTER.A INTER.B AGRIC. BIOLO. MEDIC. QUIMI. INGEN. FÍSICA

EE.UU 815319 379851 88663 58104 255864 440134 111015 162288

UK 162103 90332 35158 29802 59630 92725 6409 34349

JP 105856 78811 13978 16758 55634 308926 32039 40538

F 118935 76186 13818 11253 49938 120065 9984 35792

G 91099 85037 11740 20337 41233 66087 11304 22093

C 72722 49459 14041 16722 23139 101900 12034 14645

I 42905 29734 7904 13444 31078 36322 5833 11351

A 36121 22236 12419 9863 12186 19641 4898 6299

H 29912 18036 6563 7548 13721 23029 3798 6775

Servicio de asesoría y resolución de ejercicios [email protected]

www.maestronline.com

S 28568 16190 3985 9502 14852 18341 2387 3549

CH 26495 14518 3378 3636 11096 19304 2556 5784

E 16425 11818 3089 3981 7196 15493 1258 2692

B 17311 11791 3240 4011 8098 11964 1772 3417

D 14677 555 2635 5667 8368 14266 1197 1999

AU 10957 13154 1433 2372 5928 6713 1318 2278

FI 11012 6457 2028 4756 5731 6647 1001 1669

N 9075 5432 1803 3299 4801 5326 912 853

Y 4686 2957 2031 1194 1806 7046 801 1861

GR 3720 2749 692 1293 1518 2415 896 1366

IR 6786 214 432 1119 1355 98 522 941

P 1221 1929 388 386 564 12 493 413

a. Identifica si existe redundancia entre los datos, es decir, si podemos reducir el número de variables para explicar el comportamiento de los datos.

b. Identifica si existe correlación entre las distintas disciplinas y si puedes generar un modelo lineal para el conjunto de datos.

4. La empresa Kimberly-Clark es líder en el mercado de la industria de los pañales desde 1960 que inició en este campo. A la fecha vende más de 3,500 millones de dólares, únicamente en Estados Unidos. Los atributos principales en la fabricación de pañales son los siguientes:

Estilo: estampado / color, blanco Absorbencia: regular, superabsorbente Cierre: cinta normal, cinta resellable Escurrimiento: regular, antiescurrimiento

b. Diseña los 16 perfiles completos en términos de preferencia. Calcula las funciones de valor parcial y la importancia de cada atributo.

5. Se realiza un estudio de mercado para sacar una nueva botana saludable en el cual se analizan distintas características del producto que será vendido en la nueva bolsa biodegradable ecológica:

Sabor. Dulce o salado Base. Harina (maíz y/o trigo), nueces, frutas Condimento. Chipotle, guajillo, limón

b. Diseña una encuesta que permita calificar las combinaciones. No es necesario hacer todas las combinaciones. Genera al menos 12 combinaciones que resulten representativas para realizar el análisis.

c. Aplica la encuesta diseñada al menos a 10 personas y realiza el análisis conjunto.

d. Incluye tarjetas de encuesta, datos de resultados e interpretación. e. ¿Crees que esos resultados son estadísticamente significativos? Explica.

Servicio de asesoría y resolución de ejercicios [email protected]

www.maestronline.com

6. La siguiente tabla pertenece a un grupo de datos constituido por 26 observaciones y 9 variables que corresponden a porcentaje de empleo, en los distintos sectores, en países europeos. Los sectores son:

Agr: agricultura Min: minería Man: manufactura Ene: energía Con: construcción SI: servicios industriales Fin: finanzas Ser: servicios TC: transporte y comunicaciones

Fuente: Euromonitor (1979).

Agr Min Man Ene Con SI Fin Ser TC

Alemania del E. 4.20 2.90 41.20 1.30 7.60 11.20 1.20 22.10 8.40

Alemania del O. 6.70 1.30 35.80 0.90 7.30 14.40 5.00 22.30 6.10

Austria 12.70 1.10 30.20 1.40 9.00 16.80 4.90 16.80 7.00

Bélgica 3.30 0.90 27.60 0.90 8.20 19.10 6.20 26.60 7.20

Bulgaria 23.60 1.90 32.30 0.60 7.90 8.00 0.70 18.20 6.70

Checoeslovaquia 16.50 2.90 35.50 1.20 8.70 9.20 0.90 17.90 7.00

Dinamarca 9.20 0.10 21.80 0.60 8.30 14.60 6.50 32.20 7.10

España 22.90 0.80 28.50 0.70 11.50 9.70 8.50 11.80 5.50

Finlandia 13.00 0.40 25.90 1.30 7.40 14.70 5.50 24.30 7.60

Francia 10.80 0.80 27.50 0.90 8.90 16.80 6.00 22.60 5.70

Grecia 41.40 0.60 17.60 0.60 8.10 11.50 2.40 11.00 6.70

Hungría 21.70 3.10 29.60 1.90 8.20 9.40 0.90 17.20 8.00

Irlanda 23.20 1.00 20.70 1.30 7.50 16.80 2.80 20.80 6.10

Italia 15.90 0.60 27.60 0.50 10.00 18.10 1.60 20.10 5.70

Luxemburgo 7.70 3.10 30.80 0.80 9.20 18.50 4.60 19.20 6.20

Noruega 9.00 0.50 22.40 0.80 8.60 16.90 4.70 27.60 9.40

Países Bajos 6.30 0.10 22.50 1.00 9.90 18.00 6.80 28.50 6.80

Polonia 31.10 2.50 25.70 0.90 8.40 7.50 0.90 16.10 6.90

Portugal 27.80 0.30 24.50 0.60 8.40 13.30 2.70 16.70 5.70

Reino Unido 2.70 1.40 30.20 1.40 6.90 16.90 5.70 28.30 6.40

Rumania 34.70 2.10 30.10 0.60 8.70 5.90 1.30 11.70 5.00

Suecia 6.10 0.40 25.90 0.80 7.20 14.40 6.00 32.40 6.80

Suiza 7.70 0.20 37.80 0.80 9.50 17.50 5.30 15.40 5.70

Turquía 66.80 0.70 7.90 0.10 2.80 5.20 1.10 11.90 3.20

USSR 23.70 1.40 25.80 0.60 9.20 6.10 0.50 23.60 9.30

Servicio de asesoría y resolución de ejercicios [email protected]

www.maestronline.com

Yugoslavia 48.70 1.50 16.80 1.10 4.90 6.40 11.30 5.30 4.00

a. Analiza la tabla de datos anterior por el método de conglomerados de acuerdo con las siguientes técnicas:

i. Jerárquico enlace único (vecino más cercano) ii. Jerárquico procedimiento de centroide iii. Técnica de Ward

b. Analiza por el método de dos pasos para tratar de encontrar entre 3 y 5 grupos conglomerados bien identificados.

c. Interpreta y analiza cada grupo de resultados a fin de identificar qué cantidad de conglomerados es óptima y cuál es el parámetro que conglomera los datos. Utiliza dendograma o los gráficos que requieras a fin de aclarar tus respuestas.

7. La tabla siguiente proporciona información tomada en una cadena de tiendas de conveniencia para 20 de sus sucursales en la que se tiene la siguiente información:

TIENDA: Número de sucursal VENTAS ANUALES: Ventas anuales en miles de dólares TRÁFICO PROMEDIO: Promedio de autos que pasan por la tienda cada día. Tráfico POBLACIÓN: Población total que vive en un perímetro de 2 millas a la redonda, de acuerdo al censo de 1990 INGRESO PROMEDIO: Ingreso medio de las familias que viven a 2 millas a la redonda, de acuerdo al censo de 1990

TIENDA VENTAS

ANUALES TRÁFICO

PROMEDIO POBLACIÓN

INGRESO PROMEDIO

1 1121 61655 17800 28991

2 766 35236 13742 14731

3 595 35403 19741 8114

4 899 52832 23246 15324

5 915 40809 24485 11438

6 782 40820 20410 11730

7 833 49147 28997 10589

8 571 24953 9981 10706

9 692 40828 8982 23591

10 1005 39195 18814 15703

11 589 34574 16941 9015

12 671 26639 13319 10065

13 903 55083 21482 17365

14 703 37892 26524 7532

15 556 24019 14412 6950

Servicio de asesoría y resolución de ejercicios [email protected]

www.maestronline.com

16 657 27791 13896 9855

17 1209 53438 22444 21589

18 997 53835 18096 22659

19 844 32916 16458 12660

20 883 29139 16609 11618

a. ¿Cuál de las 3 variables predice mejor las ventas? b. Elabora la regresión de ventas como función del tráfico. c. Elabora la regresión de ventas como función de la población. d. Elabora una matriz de correlaciones a fin de determinar posibles relaciones

entre variables. e. Realiza el análisis de regresión múltiple y determina si existe alguna

relación lineal entre las ventas y las variables en cuestión.