Gabriela Azcar de la Cruz
Estadstica IV Carrera Sociologa Universidad de Chile
Tema: Anlisis Correspondencias
Introduccin: Qu es un mapa de correspondencias?
Es una forma grfica de representar la estructura de relacin entre las categoras de variables cualitativas.
Categoras variable Etapa de Vida Categoras variable tiempo libre
Adultos Jvenes
Adultos
Adultos Mayores
Ir al Mall
Compartir con familia
Descansar
Practicar Deportes / Ejercicios
Anlisis Correspondencias Simple
Tcnica de Multivariable de Anlisis de Datos que
opera sobre la informacin
contenida en tablas de contingencia .
cuyo objetivo es situar en un
plano cartesiano las categoras de las variables
en funcin de un punto de
gravedad
Adultos Jvenes
Adultos
Adultos Mayores
Practicar Deportes / Ejercicios
Ir al Mall
Compartir con familia
Descansar
Objetivos de la Tcnica
Perspectiva Estadstica
Simplificar la informacin contenida en una tabla de contingencia, sobre la asociacin entre variables
Generar ejes/ factores explicativos que resuman la informacin del conjunto de variables y categoras.
Posicionar las categoras de las variables en un mapa que de cuenta de la inercia entre estas (distancia / dispersin).
Perspectiva Terica
Profundizar en el anlisis de la asociacin entre 2 variables cualitativas.
Analizar la estructura de relacin entre categoras de variables asociadas
Identificar dimensiones que representen esquemas conceptuales de anlisis.
Condiciones de aplicacin
Mtrica variables
Variables cualitativas (nominales / ordinales) Variables escalares si se recodifican en variables
ordinales Mnimo categoras = 3
Relacin entre
variables
Variables asociadas ( verificar a travs de chi2) Es recomendable diferenciar entre variable
independiente y dependiente
Tamao muestral
Tamao pequeos y grandes. Mnimo muestral = verificar condiciones aplicacin chi2
(menos de un 20% de celdas esperadas con frecuencia menor a 5 / es esperable que no existan celdas con valor 0)
Puntuaciones Categoras = Clculo Perfiles
La asignacin de puntuaciones a las categoras de las variables se realiza a partir del clculo de los perfiles fila y columna.
Consiste en dividir el valor de cada celda interna de la tabla por su marginal fila o columna, segn sea el perfil que se est calculando.
Se obtienen 2 tablas de perfiles. Estos valores corresponden a las coordenadas iniciales de ubicacin de las categoras.
Ejemplo Perfil Columna Democracia preferible a otra forma de Gobierno /GSE Alto =
77/ 732 = 0,105
Perfil Fila Democracia preferible a otra forma de Gobierno /GSE Alto =
77/ 111= 0,694
TABLA CONTINGENCIA
Opinin Democracia
NSE
La democracia preferible a otra forma de gobierno
A veces mejor gobierno autoritario que democrtico
Gente como uno da igual gobierno democrtico que autoritario Total
Alto 77 24 10 111
Medio 324 164 145 634
Bajo 330 96 281 708
Total 732 284 436 1.452
Representacin grfica perfiles fila
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.
Democracia preferible a otra forma de gobierno
A veces mejor gobierno autoritario que democrtico
1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0
Gente como uno da igual gobierno democrtico que autoritario
Medio
Bajo
A partir de las tablas de frecuencias relativas (perfiles)es posible establecer coordenadas de puntos y medir la distancia entre ellos.
En la representacin grfica de los perfiles fila, las categoras de las variables columna pasan a ser los ejes de un mapa multidimensional donde las categoras fila son posicionadas.
Perfiles Fila
NSE
Opinin Democracia
La democracia preferible a otra
forma de gobierno
A veces mejor gobierno
autoritario que democrtico
Gente como uno da igual
gobierno democrtico
que autoritario Alto ,694 ,220 ,086 Medio ,512 ,259 ,229 Bajo ,467 ,136 ,397
Alto
Representacin grfica perfiles fila
Democracia preferible a otra forma de gobierno
A veces mejor gobierno autoritario que democrtico
Gente como uno da igual gobierno democrtico que autoritario
Alto
Medio
Bajo Centroide
El mapa tridimensional se puede transformar en un plano en el que los ejes iniciales forman una figura bidimensional. Esto se realiza con el fin de simplificar la representacin grfica del posicionamiento de las categoras.
Es el caso del ejemplo la figura asume la forma de un tringulo
El centroide de esta representacin corresponde al valor promedio de los perfiles
Perfiles Fila
NSE
Opinin Democracia
La democracia preferible a otra
forma de gobierno
A veces mejor gobierno
autoritario que democrtico
Gente como uno da igual
gobierno democrtico
que autoritario Alto ,694 ,220 ,086 Medio ,512 ,259 ,229 Bajo ,467 ,136 ,397
Inercia del modelo
Medio
Alto
Bajo Centroide
La inercia corresponde a la dispersin de las categoras del modelo y es medida en trminos de distancia.
La distancia de Benzecri es la medida ms comn utilizada para medir la inercia y corresponde a la sumatoria de las diferencias de las frecuencias relativas respecto al centroide, dividida por el nmero total de puntos (categoras). Se calcula en funcin de los perfiles filas y columnas. Se denomina tambin distancia chi2.
La inercia total permite evaluar la dispersin de la nube de puntos respecto del centroide general, por ende es la suma de las inercias fila y columna dividida por el nmero total de categoras. Geomtricamente la inercia mide lo lejos/cerca que se encuentran los perfiles fila/columna de su perfil medio, el cual simboliza la hiptesis de homogeneidad.
PresenterPresentation NotesDistancia de Benzecri se calcula para perfiles fila y para perfiles columna.Podemos expresar la inercia de manera que la podamos interpretar como una media ponderada de las distancias 2 entre los perfiles fila y su perfil medio (deforma similar, entre los perfiles columna y su media). Es la raz cuadrada de la sumatoria al cuadrado de la diferencia entre el perfil fil y el centroide partido por el centroide.
La Inercia Total es igual la suma de las distancias fila, columna, partida por el nmero de categoras
Clculo de Ejes (Factores)
Eje 1
Medio
Alto
Bajo Centroide
Eje 2
Punto de origen de los ejes corresponde al centroide de la nube de puntos.
Los ejes se obtienen bajo el criterio de maximizar la explicacin de dispersin de las categoras en el mapa.
Los ejes se obtienen en forma jerrquica en funcin de la proporcin de inercia total que logran explicar.
Los ejes se interpretan como factores y son independientes (ortogonales) entre s.
El nmero de ejes a obtener corresponden al nmero mnimo de categoras menos 1.
El mapa se construye a partir de los 2 primeros ejes ms explicativos.
Los ejes se trazan buscando representar la inercia del modelo, la idea es que mediante su trazado no se modifique la posicin de los puntos, que no se altere la dispersin entre ellos.
Normalizacin Es el proceso mediante el cual
se distribuye la inercia del modelo en las filas y o
columnas, optimizando la distancia entre las categoras.
Este proceso No altera la
solucin inicial de trazado de ejes, solo afecta las
puntuaciones.
Mediante la normalizacin se
simplifica la lectura del mapa y su interpretacin.
Interpretacin Se interpretan como coeficientes de correlacin, miden la relacin entre
puntuaciones filas y columnas.
El valor propio al cuadrado corresponde a la inercia explicada por cada eje, la que luego se traduce en % de inercia explicada.
Valores propios de los ejes
Dan cuenta de la importancia de las categoras en los factores
Permiten interpretarlos y denominarlos
Contribucin puntosa a inercia
ejes
Puntos cercanos indican relacin entre categoras
Puntos cercanos al centroide del mapa indican nula asociacin o variabilidad
Distancia entre puntos del mapa
INTERPRETACIN ANLISIS CORRESPONDENCIAS SIMPLE
EJEMPLO 1
Variables en Anlisis
Grupo Clasificacin: 1. Mapuche Urbano 2. Mapuche Rural 3. No Mapuche Urbano 4. No Mapuche Rural Si Ud. pudiera elegir, qu tipo de trabajo remunerado le gustara que tuvieran sus hijos hombres? 1. Que fuera obrero 2. Que fuera comerciante 3. Que tuviera un oficio 4. Que tuviera una profesin 5. Que trabajara en el campo o en un bosque 6. Que fuera oficinista, secretario
Referencia del Ejemplo Mascareo Aldo. 2007 Sociologa de la Cultura. La deconstruccin de lo mapuche Estudios Pblicos. N105. Verano 2007. En: http://www.cepchile.cl/dms/lang_1/doc_3892.html#.T-yFJ7Xj7ng (Junio, 2012)
Anlisis inicial del comportamiento conjunto de las variables
El anlisis de la distribucin
conjunta de las variables indica que estas se encuentran asociadas y que
la relacin observada es dbil
Anlisis Correspondencias Simples: Capacidad Explicativa de los Ejes
El mapa de correspondencias se construye a partir de los 2 primeros ejes, los que presentan la mayor capacidad explicativa de la inercia del modelo.
El primer eje explica un 80,1% de la inercia del modelo y el segundo eje un 18,9%.
En la tabla se presenta el resultado de la prueba Chi2. El nivel de significacin de la prueba indica que existe asociacin entre las variables
Anlisis Correspondencias Simples: Anlisis Variable Fila
La columna masa presenta el peso de cada categora de la variable Expectativas sobre el trabajo de los hijos, este dato corresponde a la proporcin de casos que representa cada categora. Se observa que la categora con mayor proporcin de respuestas es que tuviera una profesin.
Los puntajes en la dimensin son las coordenadas de ubicacin de las categoras en los ejes (dimensiones) del mapa.
Interesa el anlisis de la contribucin de las categoras (puntos) a la inercia de cada dimensin. Se observa que en la dimensin 1 pesas mas las categora que tuviera un oficio ,que trabajara en el campo o el bosque y que tuviera una profesin . En la segunda dimensin pesa mas que fuera oficinista, secretario.
Anlisis Correspondencias Simples: Anlisis Variable Columna
La columna masa presenta el peso de cada categora de la variable Grupo de Clasificacin este dato corresponde a la proporcin de casos que representa cada categora. Se observa que las categoras con mayor proporcin de casos son no mapuche urbano y mapuche urbano).
Los puntajes en la dimensin son las coordenadas de ubicacin de las categoras en los ejes (dimensiones) del mapa.
Interesa el anlisis de la contribucin de las categoras (puntos) a la inercia de cada dimensin. Se observa que en la dimensin 1 pesas mas las categora mapuche rural. En la segunda dimensin pesa mas no mapuche rural.
Se observa que las expectativas de Mapuche y No Mapuche Urbanos son comunes, en tanto ambos grupos aspiran principalmente a que sus hijos tengan una profesin. Ambos grupos presentan comportamientos muy semejantes en tanto la distancia entre ellos es pequea. Mapuche y No Mapuche Rurales se caracterizan por desear, en mayor proporcin que el resto, que sus hijos sean comerciantes o que tengan un oficio. Estos grupos, sin embargo, son mas distantes entre s que los anteriores, lo que da cuenta de comportamientos diferenciados entre las expectativas de las personas que habitan en zonas rurales relativas a su identificacin con la cultura mapuche.
Anlisis del Mapa de Correspondencias
Expectativas tales como que los hijos trabajen en el campo o bosque y que sean obreros no se asocian a ninguno de los grupos analizados, lo que significa que en todos ellos es posible observar una baja proporcin -que se deduce de la tabla de contingencia- de sujetos que aspiran a que sus hijos trabajen en estas reas.
Se concluye por lo tanto que las diferencias de expectativas no se relacionan con la distincin Mapuche/ No Mapuche, sino por la distincin Urbano/ Rural. La interpenetracin simblica (o su indistincin) al interior de estos grupos es mas alta entre Mapuche y No Mapuche urbanos.
INTERPRETACIN ANLISIS CORRESPONDENCIAS SIMPLE
EJEMPLO 2
Elementos tericos Pregunta de Investigacin
Cmo se estructura la relacin entre el
nivel socioeconmico y la opinin sobre la democracia?
Concepto central
Relacin entre NSE y Opinin sobre democracia
Hiptesis La relacin indica valoracin por parte de los segmentos de mayores recursos
e indiferencia por parte de los segmentos de menores recursos
Variables
NSE Alto
Medio Bajo
Opinion sobre democracia
Prefiere democracia a otra forma de gobierno.
A veces es mejor un gobierno autoritario que uno democrtico.
A gente como uno da lo mismo un gobierno democrtico que uno autoritario
Muestra PNUD 2009= 1500 casos
Tabla Contingencia
La tabla de contingencia muestra la
distribucin conjunta de las categoras de las variables
Mediante la prueba chi2 verificamos que ambas variables se
encuentren asociadas.
Tambin observamos que no hay celdas con casos 0 en la tabla de frecuencias observada ni en la de
frecuencias esperadas
Clculo Perfiles Fila y Columna
Los valores corresponden a la divisin de las celdas originales de la tabla de contingencia por
su respectivo marginal.
Representan proporciones de casos, por eso la suma es =1.
Son las coordenadas iniciales de ubicacin de las categoras
La masa de cada categora corresponde a su peso, la
proporcin del total de casos que representa.
Tabla Resumen
La tabla resumen muestra informacin sobre los ejes. Se presenta:
Valor propio de cada eje
Inercia asociada cada eje (valor propio al cuadrado)
La proporcin de inercia explicada por cada eje.
Se muestra adems el resultado de la prueba Chi2 de la tabla de contingencia original
Contribucin Fila / Columnas
En estas tablas figuran los puntajes de las categoras en cada uno de los ejes. A partir de ellas se puede construir el mapa de posicionamiento.
Se muestra adems la inercia asociada a cada categora y su contribucin a la inercia de cada eje. A partir de esta ltima informacin es factible interpretar y denominar los ejes
Contribucin Fila / Columnas
Contribucin categorias a la inercia
de los ejes NSE EJE 1 EJE 2 Alto ,250 ,674 Medio ,272 ,292 Bajo ,478 ,035 Active Total 1,000 1,000 Opinin Democracia EJE 1 EJE 2 La democracia preferible a otra forma de gobierno ,081 ,415
A veces mejor gobierno autoritario que democrtico ,282 ,523
Gente como uno da igual gobierno democrtico que autoritario ,637 ,063
1,000 1,000
El Eje 1 se explica principalmente por su relacin con la opinin de indiferencia hacia la democracia. Por ende este eje representa el posicionamiento normativo en torno a la democracia El je 2 se explica principalmente por el NSE Alto. Este eje representa por lo tanto la participacin (inclusin) econmica de los sujetos
Mapa categoras columna
Mapa categoras columna
Mapa categoras conjuntas
Escalamiento ptimo (Correspondencias Mltiples)
Objetivos de la Tcnica
Perspectiva Estadstica
Simplificar la informacin contenida en una tabla de contingencia, sobre la asociacin entre variables
Generar ejes/ factores explicativos que resuman la informacin del conjunto de variables y categoras.
Posicionar las categoras de las variables en un mapa que de cuenta de la inercia entre estas (distancia / dispersin).
Perspectiva Terica
Profundizar en el anlisis de la asociacin entre 2 variables cualitativas.
Analizar la estructura de relacin entre categoras de variables asociadas
Identificar dimensiones que representen esquemas conceptuales de anlisis.
Condiciones de aplicacin
Mtrica variables
Variables cualitativas (nominales / ordinales) Variables escalares si se recodifican en variables
ordinales Mnimo categoras = 3
Relacin entre
variables
Variables asociadas ( verificar a travs de chi2) Es recomendable diferenciar entre variable
independiente y dependiente
Tamao muestral
Tamao pequeos y grandes. Mnimo muestral = verificar condiciones aplicacin chi2
(menos de un 20% de celdas esperadas con frecuencia menor a 5 / es esperable que no existan celdas con valor 0)
Puntuaciones Categoras = Clculo Perfiles
La asignacin de puntuaciones a las categoras de las variables se realiza a partir del clculo de los perfiles fila y columna.
Consiste en dividir el valor de cada celda interna de la tabla por su marginal fila o columna, segn sea el perfil que se est calculando.
Se obtienen 2 tablas de perfiles. Estos valores corresponden a las coordenadas iniciales de ubicacin de las categoras.
Ejemplo Perfil Columna Democracia preferible a otra forma de Gobierno /GSE Alto =
77/ 732 = 0,105
Perfil Fila Democracia preferible a otra forma de Gobierno /GSE Alto =
77/ 111= 0,694
TABLA CONTINGENCIA
Opinin Democracia
NSE
La democracia preferible a otra forma de gobierno
A veces mejor gobierno autoritario que democrtico
Gente como uno da igual gobierno democrtico que autoritario Total
Alto 77 24 10 111
Medio 324 164 145 634
Bajo 330 96 281 708
Total 732 284 436 1.452
Representacin grfica perfiles fila
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.
Democracia preferible a otra forma de gobierno
A veces mejor gobierno autoritario que democrtico
1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0
Gente como uno da igual gobierno democrtico que autoritario
Medio
Bajo
A partir de las tablas de frecuencias relativas (perfiles)es posible establecer coordenadas de puntos y medir la distancia entre ellos.
En la representacin grfica de los perfiles fila, las categoras de las variables columna pasan a ser los ejes de un mapa multidimensional donde las categoras fila son posicionadas.
Perfiles Fila
NSE
Opinin Democracia
La democracia preferible a otra
forma de gobierno
A veces mejor gobierno
autoritario que democrtico
Gente como uno da igual
gobierno democrtico
que autoritario Alto ,694 ,220 ,086 Medio ,512 ,259 ,229 Bajo ,467 ,136 ,397
Alto
Representacin grfica perfiles fila
Democracia preferible a otra forma de gobierno
A veces mejor gobierno autoritario que democrtico
Gente como uno da igual gobierno democrtico que autoritario
Alto
Medio
Bajo Centroide
El mapa tridimensional se puede transformar en un plano en el que los ejes iniciales forman una figura bidimensional. Esto se realiza con el fin de simplificar la representacin grfica del posicionamiento de las categoras.
Es el caso del ejemplo la figura asume la forma de un tringulo
El centroide de esta representacin corresponde al valor promedio de los perfiles
Perfiles Fila
NSE
Opinin Democracia
La democracia preferible a otra
forma de gobierno
A veces mejor gobierno
autoritario que democrtico
Gente como uno da igual
gobierno democrtico
que autoritario Alto ,694 ,220 ,086 Medio ,512 ,259 ,229 Bajo ,467 ,136 ,397
Inercia del modelo
Medio
Alto
Bajo Centroide
La inercia corresponde a la dispersin de las categoras del modelo y es medida en trminos de distancia.
La distancia de Benzecri es la medida ms comn utilizada para medir la inercia y corresponde a la sumatoria de las diferencias de las frecuencias relativas respecto al centroide, dividida por el nmero total de puntos (categoras). Se calcula en funcin de los perfiles filas y columnas. Se denomina tambin distancia chi2.
La inercia total permite evaluar la dispersin de la nube de puntos respecto del centroide general, por ende es la suma de las inercias fila y columna dividida por el nmero total de categoras. Geomtricamente la inercia mide lo lejos/cerca que se encuentran los perfiles fila/columna de su perfil medio, el cual simboliza la hiptesis de homogeneidad.
PresenterPresentation NotesDistancia de Benzecri se calcula para perfiles fila y para perfiles columna.Podemos expresar la inercia de manera que la podamos interpretar como una media ponderada de las distancias 2 entre los perfiles fila y su perfil medio (deforma similar, entre los perfiles columna y su media). Es la raz cuadrada de la sumatoria al cuadrado de la diferencia entre el perfil fil y el centroide partido por el centroide.
La Inercia Total es igual la suma de las distancias fila, columna, partida por el nmero de categoras
Clculo de Ejes (Factores)
Eje 1
Medio
Alto
Bajo Centroide
Eje 2
Punto de origen de los ejes corresponde al centroide de la nube de puntos.
Los ejes se obtienen bajo el criterio de maximizar la explicacin de dispersin de las categoras en el mapa.
Los ejes se obtienen en forma jerrquica en funcin de la proporcin de inercia total que logran explicar.
Los ejes se interpretan como factores y son independientes (ortogonales) entre s.
El nmero de ejes a obtener corresponden al nmero mnimo de categoras menos 1.
El mapa se construye a partir de los 2 primeros ejes ms explicativos.
Los ejes se trazan buscando representar la inercia del modelo, la idea es que mediante su trazado no se modifique la posicin de los puntos, que no se altere la dispersin entre ellos.
Normalizacin Es el proceso mediante el cual
se distribuye la inercia del modelo en las filas y o
columnas, optimizando la distancia entre las categoras.
Este proceso No altera la
solucin inicial de trazado de ejes, solo afecta las
puntuaciones.
Mediante la normalizacin se
simplifica la lectura del mapa y su interpretacin.
Interpretacin Se interpretan como coeficientes de correlacin, miden la relacin entre
puntuaciones filas y columnas.
El valor propio al cuadrado corresponde a la inercia explicada por cada eje, la que luego se traduce en % de inercia explicada.
Valores propios de los ejes
Dan cuenta de la importancia de las categoras en los factores
Permiten interpretarlos y denominarlos
Contribucin puntosa a inercia
ejes
Puntos cercanos indican relacin entre categoras
Puntos cercanos al centroide del mapa indican nula asociacin o variabilidad
Distancia entre puntos del mapa
INTERPRETACIN ANLISIS CORRESPONDENCIAS SIMPLE
EJEMPLO 1
Variables en Anlisis
Grupo Clasificacin: 1. Mapuche Urbano 2. Mapuche Rural 3. No Mapuche Urbano 4. No Mapuche Rural Si Ud. pudiera elegir, qu tipo de trabajo remunerado le gustara que tuvieran sus hijos hombres? 1. Que fuera obrero 2. Que fuera comerciante 3. Que tuviera un oficio 4. Que tuviera una profesin 5. Que trabajara en el campo o en un bosque 6. Que fuera oficinista, secretario
Referencia del Ejemplo Mascareo Aldo. 2007 Sociologa de la Cultura. La deconstruccin de lo mapuche Estudios Pblicos. N105. Verano 2007. En: http://www.cepchile.cl/dms/lang_1/doc_3892.html#.T-yFJ7Xj7ng (Junio, 2012)
Anlisis inicial del comportamiento conjunto de las variables
El anlisis de la distribucin
conjunta de las variables indica que estas se encuentran asociadas y que
la relacin observada es dbil
Anlisis Correspondencias Simples: Capacidad Explicativa de los Ejes
El mapa de correspondencias se construye a partir de los 2 primeros ejes, los que presentan la mayor capacidad explicativa de la inercia del modelo.
El primer eje explica un 80,1% de la inercia del modelo y el segundo eje un 18,9%.
En la tabla se presenta el resultado de la prueba Chi2. El nivel de significacin de la prueba indica que existe asociacin entre las variables
Anlisis Correspondencias Simples: Anlisis Variable Fila
La columna masa presenta el peso de cada categora de la variable Expectativas sobre el trabajo de los hijos, este dato corresponde a la proporcin de casos que representa cada categora. Se observa que la categora con mayor proporcin de respuestas es que tuviera una profesin.
Los puntajes en la dimensin son las coordenadas de ubicacin de las categoras en los ejes (dimensiones) del mapa.
Interesa el anlisis de la contribucin de las categoras (puntos) a la inercia de cada dimensin. Se observa que en la dimensin 1 pesas mas las categora que tuviera un oficio ,que trabajara en el campo o el bosque y que tuviera una profesin . En la segunda dimensin pesa mas que fuera oficinista, secretario.
Anlisis Correspondencias Simples: Anlisis Variable Columna
La columna masa presenta el peso de cada categora de la variable Grupo de Clasificacin este dato corresponde a la proporcin de casos que representa cada categora. Se observa que las categoras con mayor proporcin de casos son no mapuche urbano y mapuche urbano).
Los puntajes en la dimensin son las coordenadas de ubicacin de las categoras en los ejes (dimensiones) del mapa.
Interesa el anlisis de la contribucin de las categoras (puntos) a la inercia de cada dimensin. Se observa que en la dimensin 1 pesas mas las categora mapuche rural. En la segunda dimensin pesa mas no mapuche rural.
Se observa que las expectativas de Mapuche y No Mapuche Urbanos son comunes, en tanto ambos grupos aspiran principalmente a que sus hijos tengan una profesin. Ambos grupos presentan comportamientos muy semejantes en tanto la distancia entre ellos es pequea. Mapuche y No Mapuche Rurales se caracterizan por desear, en mayor proporcin que el resto, que sus hijos sean comerciantes o que tengan un oficio. Estos grupos, sin embargo, son mas distantes entre s que los anteriores, lo que da cuenta de comportamientos diferenciados entre las expectativas de las personas que habitan en zonas rurales relativas a su identificacin con la cultura mapuche.
Anlisis del Mapa de Correspondencias
Expectativas tales como que los hijos trabajen en el campo o bosque y que sean obreros no se asocian a ninguno de los grupos analizados, lo que significa que en todos ellos es posible observar una baja proporcin -que se deduce de la tabla de contingencia- de sujetos que aspiran a que sus hijos trabajen en estas reas.
Se concluye por lo tanto que las diferencias de expectativas no se relacionan con la distincin Mapuche/ No Mapuche, sino por la distincin Urbano/ Rural. La interpenetracin simblica (o su indistincin) al interior de estos grupos es mas alta entre Mapuche y No Mapuche urbanos.
Gabriela Azcar de la Cruz
Estadstica IV Carrera Sociologa Universidad de Chile
Tema: Escalamiento Optimo
Introduccin: Qu es un mapa de correspondencias mltiples?
Es una forma grfica de representar la estructura de relacin entre las categoras de 2 o mas variables cualitativas junto con
los objetos que representan esas categoras
Categoras variable Etapas de vida Categoras variable Tiempo libre
Adultos Jvenes
Adultos
Adultos Mayores
Ir al Mall
Compartir con familia
Descansar
Practicar Deportes / Ejercicios
Estudiar
Categoras variable Actividad Principal
Trabajar
Escalamiento ptimo
Tcnica de Multivariable de Anlisis de Datos que
opera sobre las puntuaciones de un conjunto de objetos en un grupo de variables cualitativas.
y cuyo objetivo es situar en un
plano cartesiano los objetos y categoras de las variables
en funcin de ejes trazados en
funcin de un punto de gravedad
Adultos Jvenes
Adultos
Adultos Mayores
Ir al Mall
Compartir con familia
Descansar
Practicar Deportes / Ejercicios
Estudiar
Trabajar
Los objetos corresponden a los individuos, instituciones, pases, etc. que conforman la
muestra y que se encuentran en las filas de la base de datos
Objetivos de la Tcnica
Perspectiva Estadstica
Posicionar objetos, segn sus puntuaciones en un conjunto de variables cualitativas, en un mapa perceptual.
Posicionar las categoras de las variables en un mapa perceptual.
Generar ejes/ factores explicativos que resumen la informacin del conjunto de categoras.
Perspectiva Terica
Profundizar en el anlisis de la relacin entre variables cualitativas.
Analizar la estructura de relacin entre categoras asociadas.
Identificar dimensiones que representen esquemas conceptuales de anlisis.
Condiciones de aplicacin
Mtrica variables
Variables cualitativas (nominales / ordinales) Variables escalares si se recodifican en variables
ordinales 2 o ms variables
Relacin entre
variables
Es recomendable que al menos 2 variables estn asociadas (chi2).
Es recomendable diferenciar entre variables independientes y dependientes, especialmente cuando se persigue posicionar las variables y no necesariamente los objetos.
Tamao muestral
Tamao pequeos y grandes. Si se persigue posicionar los objetos la base de datos
debe ser pequea.
Clculo de puntuaciones objetos y categoras
El punto de partida es el clculo de las puntuaciones objeto.
Estas se obtienen de un algoritmo de clculo (alternancia de mnimos cuadrados) mediante el cual se combinan los valores de los objetos en cada una de las variables.
Lo que se obtiene es una puntuacin final de carcter intervalar.
En un primer grfico de dispersin las puntuaciones objeto generan una serie de nubes de puntos. Es posible identificar tantas nubes como nmero de categoras. Las puntuaciones de las categoras se obtienen como promedio de las puntuaciones objeto en todos los objetos asociados a la categora (que inicialmente tenan valores en esa categora)
Objeto 1
Valor Variable 1
Valor Variable 2
Valor Variable 3
Categora 1 Variable 3
Categora 1 Variable 2
Categora 2 Variable 3
Categora 1 Variable 1
Categora 2 Variable 2
Categora 2 Variable 1
Trazado de ejes o factores
El sistema de referencia para el trazado de los ejes se establece mediante el mismo procedimiento utilizado para anlisis de correspondencias simples.
Una vez calculadas las puntuaciones de las categoras se trazan los ejes, procurando explicar la inercia del modelo en funcin de un valor centroide general.
Los ejes se obtienen de manera jerrquica en relacin con su capacidad explicativa.
Se generan mapas con los dos ejes ms explicativos, con el fin de simplificar la interpretacin.
El mximo de factores posibles es igual a al total de categoras menos el nmero de variables.
Categora 1 Variable 3
Categora 1 Variable 2 Categora 2 Variable 3
Categora 1 Variable 1
Categora 2 Variable 2 Categora 2 Variable 1
Normalizacin
Un proceso de optimizacin de la solucin inicial. La solucin ptima se logra mediante un
proceso iterativo
Se persigue maximizar la dispersin entre categoras de
una misma variable a la vez que la obtencin de grupos de
objetos internamente semejantes
La dispersin de las categoras
se denomina varianza y la dispersin de los objetos se
denomina Loss
Interpretacin
Dan cuenta del peso explicativo de los ejes, se traducen en % de inercia total explicada por el factor.
Valores propios de los ejes, % inercia
explicada
Indican cuanto explica cada variable, del valor propio de cada dimensin. Permiten establecer la relacin entre variables y dimensiones.
Medidas de discriminacin
Presenta la ubicacin de cada objeto en el mapa, dando cuenta de constelaciones de casos asociados a categoras de variables.
Mapa posicionamiento
objetos
Muestra el posicionamiento de las categoras. Categoras cercanas representan asociacin. Categoras cercanas al centro dan cuenta de indiferenciacin. Categoras lejanas del centro dan cuenta de diferenciacin.
Mapa de categoras conjunto
INTERPRETACIN ANLISIS CORRESPONDENCIAS MLTIPLES
EJEMPLO 1
Elementos tericos
Pregunta de Investigacin Qu caractersticas tienen los
participantes en el concurso Santiago en 100 palabras en relacin con su edad y la forma en que aluden a la
ciudad en sus cuentos?
Concepto central
Caractersticas etarias y narrativas de los participantes del concurso
Santiago en 100 palabras
Tipo de participante
Premiado Seleccionado
No seleccionado
Tramo de edad generacional
Pre-Adolescentes Adolescentes
Jvenes Adultos Jvenes
Adultos Adultos Mayores
Tipo de alusin a la ciudad
No habla de la ciuadad
Habla de una accin en la ciudad Habla de un lugar genrico en la ciudad Habla de un lugar especfico enla ciudad
Habla de la ciudad de manera global
Muestra: Participantes en concurso Santiago en 100 palabras = 1028 casos Tesis Doctoral Luis Campos, Socilogo Universidad de Chile
Tablas de Frecuencias
Permiten observas como se distribuyen las variables de manera independiente. Seala la moda de cada variable. En el caso analizado las categoras que representan
una mayor cantidad de casos son:
No seleccionado Jvenes
Habla de la ciudad de manera global
Historial de Iteraciones
Indica como en cada paso iterativo se va aumentando la varianza entre las categoras a la vez que se
disminuye la dispersin (Loss) entre los objetos.
Indica adems en qu paso iterativo se encontr la solucin ptima.
Resumen del Modelo
Da cuenta de la capacidad explicativa de cada dimensin, tanto en trminos de valores propios como
de proporcin de inercia explicada. Se deben considerar como ejes suficientemente explicativos aquellas que presenten una inercia
superior a un 0,2. (20%)
Coordenadas de las categoras
Muestra las puntuaciones finales de cada categora en cada eje o dimensin.
Estas son las que permiten la
construccin del mapa de categoras
conjuntas.
Medidas de Discriminacin
Muestra la contribucin de cada variable a cada eje o dimensin.
Vemos que la dimensin 1 est explicada principalmente por el tipo de participante y la
dimensin 2 por el tipo de alusin a la ciudad y los tramos de edad generacional
Mapa Categoras Variable 1
Mapa Categoras Variable 2
Mapa Categoras Variable 3
Mapa Categoras Conjuntas La categora jvenes se ubica en el medio del mapa dado que los jvenes se encuentran repartidos entre todas las categoras de las dems variables. La categora pre adolescente se encuentra aislada dado que presenta casos en solo algunas categoras de las variables restantes, sin que se evidencie un comportamiento particular, es decir no se relaciona con ninguna otra categora en especial
INTERPRETACIN ANLISIS CORRESPONDENCIAS MLTIPLES
EJEMPLO 2
Elementos tericos
Pregunta de Investigacin
Qu constelaciones de exclusin de jvenes se conforman a partir del comportamiento de las regiones?
Concepto central
Constelaciones de Exclusin de Jvenes
Regiones
I a XIII (Ao 2001)
Indice exclusion educacin
Alto Medio - Bajo
Indice exclusion trabajo
Alto Medio Bajo
Indice exclusion salud
Alto Medio - Bajo
Muestra ndices de Exclusin Regionales INJUV 2001= 13 casos (Regiones)
Tablas de Frecuencias
Permiten observas como se distribuyen las variables de manera independiente. Seala la moda de cada variable. En el caso analizado las categoras que representan
una mayor cantidad de casos son:
Medio nivel de exclusin en educacin Alto nivel de exclusin en trabajo Medio nivel de exclusin en salud
Historial de Iteraciones
Indica como en cada paso iterativo se va aumentando la varianza entre las categoras a la vez que se
disminuye la dispersin (Loss) entre los objetos.
Indica adems en qu paso iterativo se encontr la solucin ptima.
Resumen del Modelo
Da cuenta de la capacidad explicativa de cada dimensin, tanto en trminos de valores propios como
de proporcin de inercia explicada. Se deben considerar como ejes suficientemente explicativos aquellas que presenten una inercia
superior a un 0,2. (20%)
Coordenadas de las categoras y Objetos
Muestra las puntuaciones finales de cada categora en cada eje o dimensin.
Estas son las que permiten la construccin del mapa de categoras conjuntas.
Tambin se obtienen las puntuaciones de los
objetos en las dimensiones
Medidas de Discriminacin
Muestra la contribucin de cada variable a cada eje o dimensin.
Vemos que la dimensin 1 est explicada principalmente por el ndice de exclusin en salud y la dimensin 2 por el ndice de exclusin en educacin
Mapa Objetos
Mapa Categoras Variable 1
Mapa Categoras Variable 2
Mapa Categoras Variable 3
Mapa Categoras y Objetos Conjuntos
Estadstica IVCarrera SociologaUniversidad de ChileSlide Number 2Slide Number 3Slide Number 4Slide Number 5Slide Number 6Slide Number 7Slide Number 8Slide Number 9Slide Number 10Slide Number 11Slide Number 12Slide Number 13Slide Number 14Slide Number 16Slide Number 18Slide Number 19Slide Number 20Slide Number 21Slide Number 22Slide Number 23Slide Number 24Slide Number 25Slide Number 26Slide Number 27Slide Number 28Slide Number 29Slide Number 30Slide Number 31Escalamiento ptimo (Correspondencias Mltiples)Slide Number 33Slide Number 34Slide Number 35Slide Number 36Slide Number 37Slide Number 38Slide Number 39Slide Number 40Slide Number 41Slide Number 42Slide Number 43Slide Number 44Slide Number 45Slide Number 46Slide Number 47Slide Number 48Estadstica IVCarrera SociologaUniversidad de ChileSlide Number 50Slide Number 51Slide Number 52Slide Number 53Slide Number 54Slide Number 55Slide Number 56Slide Number 57Slide Number 58Slide Number 59Slide Number 60Slide Number 61Slide Number 62Slide Number 63Slide Number 64Slide Number 65Slide Number 66Slide Number 67Slide Number 68Slide Number 69Slide Number 70Slide Number 71Slide Number 72Slide Number 73Slide Number 74Slide Number 75Slide Number 76Slide Number 77Slide Number 78Slide Number 79Slide Number 80