Presentación de PowerPoint8.pdf/81057665/...Existe una elevada correlación entre el buzón de...

31
TEMA 8: TRATAMIENTO DE LA INFORMACIÓN II: ANÁLISIS BIVARIANTE DR. JAVIER DE ESTEBAN CURIEL Dpto. de Economía de la Empresa

Transcript of Presentación de PowerPoint8.pdf/81057665/...Existe una elevada correlación entre el buzón de...

TEMA 8:

TRATAMIENTO DE LA INFORMACIÓN II:

ANÁLISIS BIVARIANTE

DR. JAVIER DE ESTEBAN CURIEL

Dpto. de Economía de la Empresa

2

Ya en el capítulo anterior, se definió el análisis bivariante como aquel que se realiza sobre dos variables de forma conjunta. La pretensión de este tipo de análisis es la búsqueda de relaciones de asociación, dependencia o causa-efecto.

Así, el análisis bivariante se puede clasificar teniendo en cuenta el tipo de variables consideradas. Dividiendo los tipos de variables en métricas (intervalo, ratio) y no métricas (nominales y ordinales), se pueden diferenciar tres tipos de análisis:

Tema 8

3

Clasificación del análisis bivariante

Variable 1 Variable 2 Tipo de análisis

No métrica Métrica Análisis bivariante de medias:

Medias, desviaciones, ANOVA.

No métrica No métrica Tablas de contingencia:

Chi Cuadrado

Métrica Métrica Correlación lineal

Tema 8

4

8.1. Bivariante de medias.

8.1.1. Objetivos y tipo de variables utilizadas

en el análisis bivariante de medias. El objetivo del análisis bivariante de medias es el de segmentar

una muestra, utilizando normalmente una variable de clasificación,

con la finalidad de encontrar diferencias significativas en la

respuesta a otra variable entre los distintos grupos formados. Las

diferencias se determinan a partir de la comparación entre las

medias de las variables analizadas para los distintos grupos.

Para conseguir estos objetivos, las variables empleadas deben

cumplir las siguientes características:

Una variable dependiente: tiene que ser una variable métrica, ya que

vamos a calcular la media.

Una variable independiente: tiene que ser una variable no métrica

que permita dividir la muestra.

Tema 8

5

8.1.2. Interpretación de las medias y las

desviaciones típicas.

A continuación se desarrolla un ejemplo del

cuestionario antes descrito. En él se pretende

comprobar si existen diferencias significativas

entre el sexo de los entrevistados y la

importancia concedida por éstos a la posibilidad

de recibir información postal de las cadenas de

tiendas de ropa en las que realizan sus

compras.

VARIABLE DEPENDIENTE ?

VARIABLE INDEPENDIENTE ?

Tema 8

6

Tema 8

7

Tema 8

8

8.1.3. Existencia de diferencias

significativas. Análisis de la varianza.

El análisis de las medias nos permite identificar posibles diferencias entre los segmentos utilizados. Sin embargo, para saber si esas diferencias son significativas, estadísticamente hablando, es necesario un análisis de varianza.

El análisis de la varianza pretende analizar la dispersión existente con respecto a determinada variable dependiente. Así, se pretende analizar la variabilidad en las respuestas del colectivo analizado distinguiendo entre: Variabilidad inter-grupos o entre-grupos

Variabilidad intra-grupos

Variabilidad total

Tema 8

9

Ejemplo de análisis ANOVA (I)

Tema 8

10

Ejemplo de análisis ANOVA (II)

Tema 8

11

8.2. Tabulaciones cruzadas o tablas de

contingencia.

8.2.1. Objetivos y tipo de variables utilizadas en el análisis de tabulaciones cruzadas.

El análisis de tabulaciones cruzadas, también denominado tablas de contingencia, permite la búsqueda de relaciones de asociación o dependencia entre dos variables, interpretando el sentido de la relación. Resulta un análisis sumamente útil ya que permite trabajar con variables nominales.

8.2.2. Contraste de Chi cuadrado.

Para la explicación del contraste de Chi cuadrado, procedemos a la ilustración (Ejemplo 2) a partir de Ejemplo 1: Variable sexo

Variable parking: importancia concedida al parking a la hora de escoger un centro comercial

Se estima inicialmente una posible influencia del sexo sobre la variable parking

Tema 8

12

Tema 8

13

Tema 8

14

El contraste de Chi Cuadrado permite rechazar o aceptar la hipótesis nula de independencia:

Si el valor es alto y la significatividad asociada es inferior a 0,05: rechazamos la hipótesis nula (las variables están relacionadas)

Si el valor es bajo y la significatividad asociada es superior a 0,05: aceptamos la hipótesis nula (las variables no están relacionadas)

Tema 8

15

Tema 8

16

Tema 8

17

Un aspecto de gran importancia en el análisis de tabulaciones cruzadas es el de la posible falta de datos. No hay que olvidar que en el análisis de tabulaciones cruzadas la muestra se divide en subgrupos. La falta de datos en las diferentes casillas puede afectar y sesgar los resultados obtenidos, impidiendo la extrapolación de la muestra al público objetivo.

Cuando el número de celdas con frecuencia esperada es inferior a 5 supera el 20% del total de celdas, no es posible concluir, por falta de datos, ni a favor de la independencia ni de la dependencia.

Tema 8

18

8.2.3. Interpretación de los resultados:

análisis de los residuos y de los

porcentajes básicos.

A- RESIDUOS

Los residuos permiten interpretar el sentido de la

relación.

El residuo es igual al valor observado menos el valor

esperado bajo el supuesto de independencia.

Si existe relación entre las variables el residuo tiene

que ser grande. ¿Cómo de grande?

El residuo corregido (ajustado) se comporta como una

normal por lo que puede compararse con los valores

conocidos de esta distribución.

Tema 8

19

El residuo es, por tanto, una medida individualizada que permite analizar el comportamiento de la tabla celda por celda.

Para corroborar la existencia de relación entre las variables, los residuos corregidos (ajustados) deben ser superiores a 1,96 (en valor absoluto).

Una vez que se comprueba que el residuo es significativo, se interpreta su signo.

Tema 8

20

Tema 8

21

Residuo “hombre-muy poco importante”: negativo.

Hay menos hombres que han indicado esta opción

de los que correspondería en caso de independencia.

Residuo “hombre-muy importante”: positivo. Hay más

hombres que han indicado esta opción de los que

correspondería en caso de independencia.

Residuo “mujer-muy poco importante”: positivo. Hay

más mujeres que han escogido esta opción que las que

cabría esperar bajo el supuesto de independencia.

Residuo “mujer-muy importante”: negativo. Hay menos

mujeres que han escogido esta opción que las que cabría

esperar bajo el supuesto de independencia.

Tema 8

22

CONCLUSIÓN:

Comparativamente, los hombres

conceden más importancia al parking a

la hora de escoger un centro comercial.

Tema 8

23

B- Análisis de los porcentajes

básicos

Porcentaje por filas

Porcentaje por columnas

Porcentaje total

Tema 8

24

Tema 8

25¡Cuidado! Se han hecho más encuesta a mujeres

Tema 8

26

8.3. Correlación lineal.

OBJETIVOS DEL ANÁLISIS

El análisis de correlación lineal permite determinar el grado de asociación entre dos variables (métricas).

Se puede conocer la dirección de dicha asociación en función del signo de coeficiente de Pearson.

Tema 8

27

TIPO DE VARIABLES QUE

INTERVIENEN EN EL ANÁLISIS

Dos variables métricas. En el ejemplo

que se expone a continuación, se trata de

medidas con escala de intervalo:

evaluación del 1 al 5 de una serie de

acciones de fidelización.

Tema 8

28

COEFICIENTE DE CORRELACIÓN

Toma valores entre -1 y 1:

0 implica ausencia de correlación.

Si es positivo implica una relación directa

entre las dos variables.

Si es negativo implica una relación inversa

entre las dos variables.

Tema 8

29

Tema 8

30

INTERPRETACIÓN DE LA MATRIZ DE CORRELACIÓN

Los resultados indican que las relaciones entre las variables son, en todo caso, directas.

Existe una elevada correlación entre el envío postal de información y el envío de catálogo.

Existe una elevada correlación entre el buzón de sugerencias y el cuestionario en el punto de venta.

El resto de relaciones son débiles.

Esta información debe relacionarse con los datos obtenidos en los análisis univariantes de medias y desviaciones típicas.

Esta información puede ser la base para la aplicación de técnicas más complejas como es el caso del análisis factorial.

Tema 8

31

García Ferrer, G. (2005) La Investigación Comercial.

Esic, Madrid. Capítulo 8.

BIBLIOGRAFÍA

Tema 8