Analisis_Correspondencias_Azocar

78
Gabriela Azócar de la Cruz Estadística IV Carrera Sociología Universidad de Chile Tema: Análisis Correspondencias

description

,

Transcript of Analisis_Correspondencias_Azocar

  • Gabriela Azcar de la Cruz

    Estadstica IV Carrera Sociologa Universidad de Chile

    Tema: Anlisis Correspondencias

  • Introduccin: Qu es un mapa de correspondencias?

    Es una forma grfica de representar la estructura de relacin entre las categoras de variables cualitativas.

    Categoras variable Etapa de Vida Categoras variable tiempo libre

    Adultos Jvenes

    Adultos

    Adultos Mayores

    Ir al Mall

    Compartir con familia

    Descansar

    Practicar Deportes / Ejercicios

  • Anlisis Correspondencias Simple

    Tcnica de Multivariable de Anlisis de Datos que

    opera sobre la informacin

    contenida en tablas de contingencia .

    cuyo objetivo es situar en un

    plano cartesiano las categoras de las variables

    en funcin de un punto de

    gravedad

    Adultos Jvenes

    Adultos

    Adultos Mayores

    Practicar Deportes / Ejercicios

    Ir al Mall

    Compartir con familia

    Descansar

  • Objetivos de la Tcnica

    Perspectiva Estadstica

    Simplificar la informacin contenida en una tabla de contingencia, sobre la asociacin entre variables

    Generar ejes/ factores explicativos que resuman la informacin del conjunto de variables y categoras.

    Posicionar las categoras de las variables en un mapa que de cuenta de la inercia entre estas (distancia / dispersin).

    Perspectiva Terica

    Profundizar en el anlisis de la asociacin entre 2 variables cualitativas.

    Analizar la estructura de relacin entre categoras de variables asociadas

    Identificar dimensiones que representen esquemas conceptuales de anlisis.

  • Condiciones de aplicacin

    Mtrica variables

    Variables cualitativas (nominales / ordinales) Variables escalares si se recodifican en variables

    ordinales Mnimo categoras = 3

    Relacin entre

    variables

    Variables asociadas ( verificar a travs de chi2) Es recomendable diferenciar entre variable

    independiente y dependiente

    Tamao muestral

    Tamao pequeos y grandes. Mnimo muestral = verificar condiciones aplicacin chi2

    (menos de un 20% de celdas esperadas con frecuencia menor a 5 / es esperable que no existan celdas con valor 0)

  • Puntuaciones Categoras = Clculo Perfiles

    La asignacin de puntuaciones a las categoras de las variables se realiza a partir del clculo de los perfiles fila y columna.

    Consiste en dividir el valor de cada celda interna de la tabla por su marginal fila o columna, segn sea el perfil que se est calculando.

    Se obtienen 2 tablas de perfiles. Estos valores corresponden a las coordenadas iniciales de ubicacin de las categoras.

    Ejemplo Perfil Columna Democracia preferible a otra forma de Gobierno /GSE Alto =

    77/ 732 = 0,105

    Perfil Fila Democracia preferible a otra forma de Gobierno /GSE Alto =

    77/ 111= 0,694

    TABLA CONTINGENCIA

    Opinin Democracia

    NSE

    La democracia preferible a otra forma de gobierno

    A veces mejor gobierno autoritario que democrtico

    Gente como uno da igual gobierno democrtico que autoritario Total

    Alto 77 24 10 111

    Medio 324 164 145 634

    Bajo 330 96 281 708

    Total 732 284 436 1.452

  • Representacin grfica perfiles fila

    0

    0.1

    0.2

    0.3

    0.4

    0.5

    0.6

    0.7

    0.8

    0.9

    1.

    Democracia preferible a otra forma de gobierno

    A veces mejor gobierno autoritario que democrtico

    1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0

    Gente como uno da igual gobierno democrtico que autoritario

    Medio

    Bajo

    A partir de las tablas de frecuencias relativas (perfiles)es posible establecer coordenadas de puntos y medir la distancia entre ellos.

    En la representacin grfica de los perfiles fila, las categoras de las variables columna pasan a ser los ejes de un mapa multidimensional donde las categoras fila son posicionadas.

    Perfiles Fila

    NSE

    Opinin Democracia

    La democracia preferible a otra

    forma de gobierno

    A veces mejor gobierno

    autoritario que democrtico

    Gente como uno da igual

    gobierno democrtico

    que autoritario Alto ,694 ,220 ,086 Medio ,512 ,259 ,229 Bajo ,467 ,136 ,397

    Alto

  • Representacin grfica perfiles fila

    Democracia preferible a otra forma de gobierno

    A veces mejor gobierno autoritario que democrtico

    Gente como uno da igual gobierno democrtico que autoritario

    Alto

    Medio

    Bajo Centroide

    El mapa tridimensional se puede transformar en un plano en el que los ejes iniciales forman una figura bidimensional. Esto se realiza con el fin de simplificar la representacin grfica del posicionamiento de las categoras.

    Es el caso del ejemplo la figura asume la forma de un tringulo

    El centroide de esta representacin corresponde al valor promedio de los perfiles

    Perfiles Fila

    NSE

    Opinin Democracia

    La democracia preferible a otra

    forma de gobierno

    A veces mejor gobierno

    autoritario que democrtico

    Gente como uno da igual

    gobierno democrtico

    que autoritario Alto ,694 ,220 ,086 Medio ,512 ,259 ,229 Bajo ,467 ,136 ,397

  • Inercia del modelo

    Medio

    Alto

    Bajo Centroide

    La inercia corresponde a la dispersin de las categoras del modelo y es medida en trminos de distancia.

    La distancia de Benzecri es la medida ms comn utilizada para medir la inercia y corresponde a la sumatoria de las diferencias de las frecuencias relativas respecto al centroide, dividida por el nmero total de puntos (categoras). Se calcula en funcin de los perfiles filas y columnas. Se denomina tambin distancia chi2.

    La inercia total permite evaluar la dispersin de la nube de puntos respecto del centroide general, por ende es la suma de las inercias fila y columna dividida por el nmero total de categoras. Geomtricamente la inercia mide lo lejos/cerca que se encuentran los perfiles fila/columna de su perfil medio, el cual simboliza la hiptesis de homogeneidad.

    PresenterPresentation NotesDistancia de Benzecri se calcula para perfiles fila y para perfiles columna.Podemos expresar la inercia de manera que la podamos interpretar como una media ponderada de las distancias 2 entre los perfiles fila y su perfil medio (deforma similar, entre los perfiles columna y su media). Es la raz cuadrada de la sumatoria al cuadrado de la diferencia entre el perfil fil y el centroide partido por el centroide.

    La Inercia Total es igual la suma de las distancias fila, columna, partida por el nmero de categoras

  • Clculo de Ejes (Factores)

    Eje 1

    Medio

    Alto

    Bajo Centroide

    Eje 2

    Punto de origen de los ejes corresponde al centroide de la nube de puntos.

    Los ejes se obtienen bajo el criterio de maximizar la explicacin de dispersin de las categoras en el mapa.

    Los ejes se obtienen en forma jerrquica en funcin de la proporcin de inercia total que logran explicar.

    Los ejes se interpretan como factores y son independientes (ortogonales) entre s.

    El nmero de ejes a obtener corresponden al nmero mnimo de categoras menos 1.

    El mapa se construye a partir de los 2 primeros ejes ms explicativos.

    Los ejes se trazan buscando representar la inercia del modelo, la idea es que mediante su trazado no se modifique la posicin de los puntos, que no se altere la dispersin entre ellos.

  • Normalizacin Es el proceso mediante el cual

    se distribuye la inercia del modelo en las filas y o

    columnas, optimizando la distancia entre las categoras.

    Este proceso No altera la

    solucin inicial de trazado de ejes, solo afecta las

    puntuaciones.

    Mediante la normalizacin se

    simplifica la lectura del mapa y su interpretacin.

  • Interpretacin Se interpretan como coeficientes de correlacin, miden la relacin entre

    puntuaciones filas y columnas.

    El valor propio al cuadrado corresponde a la inercia explicada por cada eje, la que luego se traduce en % de inercia explicada.

    Valores propios de los ejes

    Dan cuenta de la importancia de las categoras en los factores

    Permiten interpretarlos y denominarlos

    Contribucin puntosa a inercia

    ejes

    Puntos cercanos indican relacin entre categoras

    Puntos cercanos al centroide del mapa indican nula asociacin o variabilidad

    Distancia entre puntos del mapa

  • INTERPRETACIN ANLISIS CORRESPONDENCIAS SIMPLE

    EJEMPLO 1

  • Variables en Anlisis

    Grupo Clasificacin: 1. Mapuche Urbano 2. Mapuche Rural 3. No Mapuche Urbano 4. No Mapuche Rural Si Ud. pudiera elegir, qu tipo de trabajo remunerado le gustara que tuvieran sus hijos hombres? 1. Que fuera obrero 2. Que fuera comerciante 3. Que tuviera un oficio 4. Que tuviera una profesin 5. Que trabajara en el campo o en un bosque 6. Que fuera oficinista, secretario

    Referencia del Ejemplo Mascareo Aldo. 2007 Sociologa de la Cultura. La deconstruccin de lo mapuche Estudios Pblicos. N105. Verano 2007. En: http://www.cepchile.cl/dms/lang_1/doc_3892.html#.T-yFJ7Xj7ng (Junio, 2012)

  • Anlisis inicial del comportamiento conjunto de las variables

    El anlisis de la distribucin

    conjunta de las variables indica que estas se encuentran asociadas y que

    la relacin observada es dbil

  • Anlisis Correspondencias Simples: Capacidad Explicativa de los Ejes

    El mapa de correspondencias se construye a partir de los 2 primeros ejes, los que presentan la mayor capacidad explicativa de la inercia del modelo.

    El primer eje explica un 80,1% de la inercia del modelo y el segundo eje un 18,9%.

    En la tabla se presenta el resultado de la prueba Chi2. El nivel de significacin de la prueba indica que existe asociacin entre las variables

  • Anlisis Correspondencias Simples: Anlisis Variable Fila

    La columna masa presenta el peso de cada categora de la variable Expectativas sobre el trabajo de los hijos, este dato corresponde a la proporcin de casos que representa cada categora. Se observa que la categora con mayor proporcin de respuestas es que tuviera una profesin.

    Los puntajes en la dimensin son las coordenadas de ubicacin de las categoras en los ejes (dimensiones) del mapa.

    Interesa el anlisis de la contribucin de las categoras (puntos) a la inercia de cada dimensin. Se observa que en la dimensin 1 pesas mas las categora que tuviera un oficio ,que trabajara en el campo o el bosque y que tuviera una profesin . En la segunda dimensin pesa mas que fuera oficinista, secretario.

  • Anlisis Correspondencias Simples: Anlisis Variable Columna

    La columna masa presenta el peso de cada categora de la variable Grupo de Clasificacin este dato corresponde a la proporcin de casos que representa cada categora. Se observa que las categoras con mayor proporcin de casos son no mapuche urbano y mapuche urbano).

    Los puntajes en la dimensin son las coordenadas de ubicacin de las categoras en los ejes (dimensiones) del mapa.

    Interesa el anlisis de la contribucin de las categoras (puntos) a la inercia de cada dimensin. Se observa que en la dimensin 1 pesas mas las categora mapuche rural. En la segunda dimensin pesa mas no mapuche rural.

  • Se observa que las expectativas de Mapuche y No Mapuche Urbanos son comunes, en tanto ambos grupos aspiran principalmente a que sus hijos tengan una profesin. Ambos grupos presentan comportamientos muy semejantes en tanto la distancia entre ellos es pequea. Mapuche y No Mapuche Rurales se caracterizan por desear, en mayor proporcin que el resto, que sus hijos sean comerciantes o que tengan un oficio. Estos grupos, sin embargo, son mas distantes entre s que los anteriores, lo que da cuenta de comportamientos diferenciados entre las expectativas de las personas que habitan en zonas rurales relativas a su identificacin con la cultura mapuche.

    Anlisis del Mapa de Correspondencias

    Expectativas tales como que los hijos trabajen en el campo o bosque y que sean obreros no se asocian a ninguno de los grupos analizados, lo que significa que en todos ellos es posible observar una baja proporcin -que se deduce de la tabla de contingencia- de sujetos que aspiran a que sus hijos trabajen en estas reas.

    Se concluye por lo tanto que las diferencias de expectativas no se relacionan con la distincin Mapuche/ No Mapuche, sino por la distincin Urbano/ Rural. La interpenetracin simblica (o su indistincin) al interior de estos grupos es mas alta entre Mapuche y No Mapuche urbanos.

  • INTERPRETACIN ANLISIS CORRESPONDENCIAS SIMPLE

    EJEMPLO 2

  • Elementos tericos Pregunta de Investigacin

    Cmo se estructura la relacin entre el

    nivel socioeconmico y la opinin sobre la democracia?

    Concepto central

    Relacin entre NSE y Opinin sobre democracia

    Hiptesis La relacin indica valoracin por parte de los segmentos de mayores recursos

    e indiferencia por parte de los segmentos de menores recursos

    Variables

    NSE Alto

    Medio Bajo

    Opinion sobre democracia

    Prefiere democracia a otra forma de gobierno.

    A veces es mejor un gobierno autoritario que uno democrtico.

    A gente como uno da lo mismo un gobierno democrtico que uno autoritario

    Muestra PNUD 2009= 1500 casos

  • Tabla Contingencia

    La tabla de contingencia muestra la

    distribucin conjunta de las categoras de las variables

    Mediante la prueba chi2 verificamos que ambas variables se

    encuentren asociadas.

    Tambin observamos que no hay celdas con casos 0 en la tabla de frecuencias observada ni en la de

    frecuencias esperadas

  • Clculo Perfiles Fila y Columna

    Los valores corresponden a la divisin de las celdas originales de la tabla de contingencia por

    su respectivo marginal.

    Representan proporciones de casos, por eso la suma es =1.

    Son las coordenadas iniciales de ubicacin de las categoras

    La masa de cada categora corresponde a su peso, la

    proporcin del total de casos que representa.

  • Tabla Resumen

    La tabla resumen muestra informacin sobre los ejes. Se presenta:

    Valor propio de cada eje

    Inercia asociada cada eje (valor propio al cuadrado)

    La proporcin de inercia explicada por cada eje.

    Se muestra adems el resultado de la prueba Chi2 de la tabla de contingencia original

  • Contribucin Fila / Columnas

    En estas tablas figuran los puntajes de las categoras en cada uno de los ejes. A partir de ellas se puede construir el mapa de posicionamiento.

    Se muestra adems la inercia asociada a cada categora y su contribucin a la inercia de cada eje. A partir de esta ltima informacin es factible interpretar y denominar los ejes

  • Contribucin Fila / Columnas

    Contribucin categorias a la inercia

    de los ejes NSE EJE 1 EJE 2 Alto ,250 ,674 Medio ,272 ,292 Bajo ,478 ,035 Active Total 1,000 1,000 Opinin Democracia EJE 1 EJE 2 La democracia preferible a otra forma de gobierno ,081 ,415

    A veces mejor gobierno autoritario que democrtico ,282 ,523

    Gente como uno da igual gobierno democrtico que autoritario ,637 ,063

    1,000 1,000

    El Eje 1 se explica principalmente por su relacin con la opinin de indiferencia hacia la democracia. Por ende este eje representa el posicionamiento normativo en torno a la democracia El je 2 se explica principalmente por el NSE Alto. Este eje representa por lo tanto la participacin (inclusin) econmica de los sujetos

  • Mapa categoras columna

  • Mapa categoras columna

  • Mapa categoras conjuntas

  • Escalamiento ptimo (Correspondencias Mltiples)

  • Objetivos de la Tcnica

    Perspectiva Estadstica

    Simplificar la informacin contenida en una tabla de contingencia, sobre la asociacin entre variables

    Generar ejes/ factores explicativos que resuman la informacin del conjunto de variables y categoras.

    Posicionar las categoras de las variables en un mapa que de cuenta de la inercia entre estas (distancia / dispersin).

    Perspectiva Terica

    Profundizar en el anlisis de la asociacin entre 2 variables cualitativas.

    Analizar la estructura de relacin entre categoras de variables asociadas

    Identificar dimensiones que representen esquemas conceptuales de anlisis.

  • Condiciones de aplicacin

    Mtrica variables

    Variables cualitativas (nominales / ordinales) Variables escalares si se recodifican en variables

    ordinales Mnimo categoras = 3

    Relacin entre

    variables

    Variables asociadas ( verificar a travs de chi2) Es recomendable diferenciar entre variable

    independiente y dependiente

    Tamao muestral

    Tamao pequeos y grandes. Mnimo muestral = verificar condiciones aplicacin chi2

    (menos de un 20% de celdas esperadas con frecuencia menor a 5 / es esperable que no existan celdas con valor 0)

  • Puntuaciones Categoras = Clculo Perfiles

    La asignacin de puntuaciones a las categoras de las variables se realiza a partir del clculo de los perfiles fila y columna.

    Consiste en dividir el valor de cada celda interna de la tabla por su marginal fila o columna, segn sea el perfil que se est calculando.

    Se obtienen 2 tablas de perfiles. Estos valores corresponden a las coordenadas iniciales de ubicacin de las categoras.

    Ejemplo Perfil Columna Democracia preferible a otra forma de Gobierno /GSE Alto =

    77/ 732 = 0,105

    Perfil Fila Democracia preferible a otra forma de Gobierno /GSE Alto =

    77/ 111= 0,694

    TABLA CONTINGENCIA

    Opinin Democracia

    NSE

    La democracia preferible a otra forma de gobierno

    A veces mejor gobierno autoritario que democrtico

    Gente como uno da igual gobierno democrtico que autoritario Total

    Alto 77 24 10 111

    Medio 324 164 145 634

    Bajo 330 96 281 708

    Total 732 284 436 1.452

  • Representacin grfica perfiles fila

    0

    0.1

    0.2

    0.3

    0.4

    0.5

    0.6

    0.7

    0.8

    0.9

    1.

    Democracia preferible a otra forma de gobierno

    A veces mejor gobierno autoritario que democrtico

    1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0

    Gente como uno da igual gobierno democrtico que autoritario

    Medio

    Bajo

    A partir de las tablas de frecuencias relativas (perfiles)es posible establecer coordenadas de puntos y medir la distancia entre ellos.

    En la representacin grfica de los perfiles fila, las categoras de las variables columna pasan a ser los ejes de un mapa multidimensional donde las categoras fila son posicionadas.

    Perfiles Fila

    NSE

    Opinin Democracia

    La democracia preferible a otra

    forma de gobierno

    A veces mejor gobierno

    autoritario que democrtico

    Gente como uno da igual

    gobierno democrtico

    que autoritario Alto ,694 ,220 ,086 Medio ,512 ,259 ,229 Bajo ,467 ,136 ,397

    Alto

  • Representacin grfica perfiles fila

    Democracia preferible a otra forma de gobierno

    A veces mejor gobierno autoritario que democrtico

    Gente como uno da igual gobierno democrtico que autoritario

    Alto

    Medio

    Bajo Centroide

    El mapa tridimensional se puede transformar en un plano en el que los ejes iniciales forman una figura bidimensional. Esto se realiza con el fin de simplificar la representacin grfica del posicionamiento de las categoras.

    Es el caso del ejemplo la figura asume la forma de un tringulo

    El centroide de esta representacin corresponde al valor promedio de los perfiles

    Perfiles Fila

    NSE

    Opinin Democracia

    La democracia preferible a otra

    forma de gobierno

    A veces mejor gobierno

    autoritario que democrtico

    Gente como uno da igual

    gobierno democrtico

    que autoritario Alto ,694 ,220 ,086 Medio ,512 ,259 ,229 Bajo ,467 ,136 ,397

  • Inercia del modelo

    Medio

    Alto

    Bajo Centroide

    La inercia corresponde a la dispersin de las categoras del modelo y es medida en trminos de distancia.

    La distancia de Benzecri es la medida ms comn utilizada para medir la inercia y corresponde a la sumatoria de las diferencias de las frecuencias relativas respecto al centroide, dividida por el nmero total de puntos (categoras). Se calcula en funcin de los perfiles filas y columnas. Se denomina tambin distancia chi2.

    La inercia total permite evaluar la dispersin de la nube de puntos respecto del centroide general, por ende es la suma de las inercias fila y columna dividida por el nmero total de categoras. Geomtricamente la inercia mide lo lejos/cerca que se encuentran los perfiles fila/columna de su perfil medio, el cual simboliza la hiptesis de homogeneidad.

    PresenterPresentation NotesDistancia de Benzecri se calcula para perfiles fila y para perfiles columna.Podemos expresar la inercia de manera que la podamos interpretar como una media ponderada de las distancias 2 entre los perfiles fila y su perfil medio (deforma similar, entre los perfiles columna y su media). Es la raz cuadrada de la sumatoria al cuadrado de la diferencia entre el perfil fil y el centroide partido por el centroide.

    La Inercia Total es igual la suma de las distancias fila, columna, partida por el nmero de categoras

  • Clculo de Ejes (Factores)

    Eje 1

    Medio

    Alto

    Bajo Centroide

    Eje 2

    Punto de origen de los ejes corresponde al centroide de la nube de puntos.

    Los ejes se obtienen bajo el criterio de maximizar la explicacin de dispersin de las categoras en el mapa.

    Los ejes se obtienen en forma jerrquica en funcin de la proporcin de inercia total que logran explicar.

    Los ejes se interpretan como factores y son independientes (ortogonales) entre s.

    El nmero de ejes a obtener corresponden al nmero mnimo de categoras menos 1.

    El mapa se construye a partir de los 2 primeros ejes ms explicativos.

    Los ejes se trazan buscando representar la inercia del modelo, la idea es que mediante su trazado no se modifique la posicin de los puntos, que no se altere la dispersin entre ellos.

  • Normalizacin Es el proceso mediante el cual

    se distribuye la inercia del modelo en las filas y o

    columnas, optimizando la distancia entre las categoras.

    Este proceso No altera la

    solucin inicial de trazado de ejes, solo afecta las

    puntuaciones.

    Mediante la normalizacin se

    simplifica la lectura del mapa y su interpretacin.

  • Interpretacin Se interpretan como coeficientes de correlacin, miden la relacin entre

    puntuaciones filas y columnas.

    El valor propio al cuadrado corresponde a la inercia explicada por cada eje, la que luego se traduce en % de inercia explicada.

    Valores propios de los ejes

    Dan cuenta de la importancia de las categoras en los factores

    Permiten interpretarlos y denominarlos

    Contribucin puntosa a inercia

    ejes

    Puntos cercanos indican relacin entre categoras

    Puntos cercanos al centroide del mapa indican nula asociacin o variabilidad

    Distancia entre puntos del mapa

  • INTERPRETACIN ANLISIS CORRESPONDENCIAS SIMPLE

    EJEMPLO 1

  • Variables en Anlisis

    Grupo Clasificacin: 1. Mapuche Urbano 2. Mapuche Rural 3. No Mapuche Urbano 4. No Mapuche Rural Si Ud. pudiera elegir, qu tipo de trabajo remunerado le gustara que tuvieran sus hijos hombres? 1. Que fuera obrero 2. Que fuera comerciante 3. Que tuviera un oficio 4. Que tuviera una profesin 5. Que trabajara en el campo o en un bosque 6. Que fuera oficinista, secretario

    Referencia del Ejemplo Mascareo Aldo. 2007 Sociologa de la Cultura. La deconstruccin de lo mapuche Estudios Pblicos. N105. Verano 2007. En: http://www.cepchile.cl/dms/lang_1/doc_3892.html#.T-yFJ7Xj7ng (Junio, 2012)

  • Anlisis inicial del comportamiento conjunto de las variables

    El anlisis de la distribucin

    conjunta de las variables indica que estas se encuentran asociadas y que

    la relacin observada es dbil

  • Anlisis Correspondencias Simples: Capacidad Explicativa de los Ejes

    El mapa de correspondencias se construye a partir de los 2 primeros ejes, los que presentan la mayor capacidad explicativa de la inercia del modelo.

    El primer eje explica un 80,1% de la inercia del modelo y el segundo eje un 18,9%.

    En la tabla se presenta el resultado de la prueba Chi2. El nivel de significacin de la prueba indica que existe asociacin entre las variables

  • Anlisis Correspondencias Simples: Anlisis Variable Fila

    La columna masa presenta el peso de cada categora de la variable Expectativas sobre el trabajo de los hijos, este dato corresponde a la proporcin de casos que representa cada categora. Se observa que la categora con mayor proporcin de respuestas es que tuviera una profesin.

    Los puntajes en la dimensin son las coordenadas de ubicacin de las categoras en los ejes (dimensiones) del mapa.

    Interesa el anlisis de la contribucin de las categoras (puntos) a la inercia de cada dimensin. Se observa que en la dimensin 1 pesas mas las categora que tuviera un oficio ,que trabajara en el campo o el bosque y que tuviera una profesin . En la segunda dimensin pesa mas que fuera oficinista, secretario.

  • Anlisis Correspondencias Simples: Anlisis Variable Columna

    La columna masa presenta el peso de cada categora de la variable Grupo de Clasificacin este dato corresponde a la proporcin de casos que representa cada categora. Se observa que las categoras con mayor proporcin de casos son no mapuche urbano y mapuche urbano).

    Los puntajes en la dimensin son las coordenadas de ubicacin de las categoras en los ejes (dimensiones) del mapa.

    Interesa el anlisis de la contribucin de las categoras (puntos) a la inercia de cada dimensin. Se observa que en la dimensin 1 pesas mas las categora mapuche rural. En la segunda dimensin pesa mas no mapuche rural.

  • Se observa que las expectativas de Mapuche y No Mapuche Urbanos son comunes, en tanto ambos grupos aspiran principalmente a que sus hijos tengan una profesin. Ambos grupos presentan comportamientos muy semejantes en tanto la distancia entre ellos es pequea. Mapuche y No Mapuche Rurales se caracterizan por desear, en mayor proporcin que el resto, que sus hijos sean comerciantes o que tengan un oficio. Estos grupos, sin embargo, son mas distantes entre s que los anteriores, lo que da cuenta de comportamientos diferenciados entre las expectativas de las personas que habitan en zonas rurales relativas a su identificacin con la cultura mapuche.

    Anlisis del Mapa de Correspondencias

    Expectativas tales como que los hijos trabajen en el campo o bosque y que sean obreros no se asocian a ninguno de los grupos analizados, lo que significa que en todos ellos es posible observar una baja proporcin -que se deduce de la tabla de contingencia- de sujetos que aspiran a que sus hijos trabajen en estas reas.

    Se concluye por lo tanto que las diferencias de expectativas no se relacionan con la distincin Mapuche/ No Mapuche, sino por la distincin Urbano/ Rural. La interpenetracin simblica (o su indistincin) al interior de estos grupos es mas alta entre Mapuche y No Mapuche urbanos.

  • Gabriela Azcar de la Cruz

    Estadstica IV Carrera Sociologa Universidad de Chile

    Tema: Escalamiento Optimo

  • Introduccin: Qu es un mapa de correspondencias mltiples?

    Es una forma grfica de representar la estructura de relacin entre las categoras de 2 o mas variables cualitativas junto con

    los objetos que representan esas categoras

    Categoras variable Etapas de vida Categoras variable Tiempo libre

    Adultos Jvenes

    Adultos

    Adultos Mayores

    Ir al Mall

    Compartir con familia

    Descansar

    Practicar Deportes / Ejercicios

    Estudiar

    Categoras variable Actividad Principal

    Trabajar

  • Escalamiento ptimo

    Tcnica de Multivariable de Anlisis de Datos que

    opera sobre las puntuaciones de un conjunto de objetos en un grupo de variables cualitativas.

    y cuyo objetivo es situar en un

    plano cartesiano los objetos y categoras de las variables

    en funcin de ejes trazados en

    funcin de un punto de gravedad

    Adultos Jvenes

    Adultos

    Adultos Mayores

    Ir al Mall

    Compartir con familia

    Descansar

    Practicar Deportes / Ejercicios

    Estudiar

    Trabajar

    Los objetos corresponden a los individuos, instituciones, pases, etc. que conforman la

    muestra y que se encuentran en las filas de la base de datos

  • Objetivos de la Tcnica

    Perspectiva Estadstica

    Posicionar objetos, segn sus puntuaciones en un conjunto de variables cualitativas, en un mapa perceptual.

    Posicionar las categoras de las variables en un mapa perceptual.

    Generar ejes/ factores explicativos que resumen la informacin del conjunto de categoras.

    Perspectiva Terica

    Profundizar en el anlisis de la relacin entre variables cualitativas.

    Analizar la estructura de relacin entre categoras asociadas.

    Identificar dimensiones que representen esquemas conceptuales de anlisis.

  • Condiciones de aplicacin

    Mtrica variables

    Variables cualitativas (nominales / ordinales) Variables escalares si se recodifican en variables

    ordinales 2 o ms variables

    Relacin entre

    variables

    Es recomendable que al menos 2 variables estn asociadas (chi2).

    Es recomendable diferenciar entre variables independientes y dependientes, especialmente cuando se persigue posicionar las variables y no necesariamente los objetos.

    Tamao muestral

    Tamao pequeos y grandes. Si se persigue posicionar los objetos la base de datos

    debe ser pequea.

  • Clculo de puntuaciones objetos y categoras

    El punto de partida es el clculo de las puntuaciones objeto.

    Estas se obtienen de un algoritmo de clculo (alternancia de mnimos cuadrados) mediante el cual se combinan los valores de los objetos en cada una de las variables.

    Lo que se obtiene es una puntuacin final de carcter intervalar.

    En un primer grfico de dispersin las puntuaciones objeto generan una serie de nubes de puntos. Es posible identificar tantas nubes como nmero de categoras. Las puntuaciones de las categoras se obtienen como promedio de las puntuaciones objeto en todos los objetos asociados a la categora (que inicialmente tenan valores en esa categora)

    Objeto 1

    Valor Variable 1

    Valor Variable 2

    Valor Variable 3

    Categora 1 Variable 3

    Categora 1 Variable 2

    Categora 2 Variable 3

    Categora 1 Variable 1

    Categora 2 Variable 2

    Categora 2 Variable 1

  • Trazado de ejes o factores

    El sistema de referencia para el trazado de los ejes se establece mediante el mismo procedimiento utilizado para anlisis de correspondencias simples.

    Una vez calculadas las puntuaciones de las categoras se trazan los ejes, procurando explicar la inercia del modelo en funcin de un valor centroide general.

    Los ejes se obtienen de manera jerrquica en relacin con su capacidad explicativa.

    Se generan mapas con los dos ejes ms explicativos, con el fin de simplificar la interpretacin.

    El mximo de factores posibles es igual a al total de categoras menos el nmero de variables.

    Categora 1 Variable 3

    Categora 1 Variable 2 Categora 2 Variable 3

    Categora 1 Variable 1

    Categora 2 Variable 2 Categora 2 Variable 1

  • Normalizacin

    Un proceso de optimizacin de la solucin inicial. La solucin ptima se logra mediante un

    proceso iterativo

    Se persigue maximizar la dispersin entre categoras de

    una misma variable a la vez que la obtencin de grupos de

    objetos internamente semejantes

    La dispersin de las categoras

    se denomina varianza y la dispersin de los objetos se

    denomina Loss

  • Interpretacin

    Dan cuenta del peso explicativo de los ejes, se traducen en % de inercia total explicada por el factor.

    Valores propios de los ejes, % inercia

    explicada

    Indican cuanto explica cada variable, del valor propio de cada dimensin. Permiten establecer la relacin entre variables y dimensiones.

    Medidas de discriminacin

    Presenta la ubicacin de cada objeto en el mapa, dando cuenta de constelaciones de casos asociados a categoras de variables.

    Mapa posicionamiento

    objetos

    Muestra el posicionamiento de las categoras. Categoras cercanas representan asociacin. Categoras cercanas al centro dan cuenta de indiferenciacin. Categoras lejanas del centro dan cuenta de diferenciacin.

    Mapa de categoras conjunto

  • INTERPRETACIN ANLISIS CORRESPONDENCIAS MLTIPLES

    EJEMPLO 1

  • Elementos tericos

    Pregunta de Investigacin Qu caractersticas tienen los

    participantes en el concurso Santiago en 100 palabras en relacin con su edad y la forma en que aluden a la

    ciudad en sus cuentos?

    Concepto central

    Caractersticas etarias y narrativas de los participantes del concurso

    Santiago en 100 palabras

    Tipo de participante

    Premiado Seleccionado

    No seleccionado

    Tramo de edad generacional

    Pre-Adolescentes Adolescentes

    Jvenes Adultos Jvenes

    Adultos Adultos Mayores

    Tipo de alusin a la ciudad

    No habla de la ciuadad

    Habla de una accin en la ciudad Habla de un lugar genrico en la ciudad Habla de un lugar especfico enla ciudad

    Habla de la ciudad de manera global

    Muestra: Participantes en concurso Santiago en 100 palabras = 1028 casos Tesis Doctoral Luis Campos, Socilogo Universidad de Chile

  • Tablas de Frecuencias

    Permiten observas como se distribuyen las variables de manera independiente. Seala la moda de cada variable. En el caso analizado las categoras que representan

    una mayor cantidad de casos son:

    No seleccionado Jvenes

    Habla de la ciudad de manera global

  • Historial de Iteraciones

    Indica como en cada paso iterativo se va aumentando la varianza entre las categoras a la vez que se

    disminuye la dispersin (Loss) entre los objetos.

    Indica adems en qu paso iterativo se encontr la solucin ptima.

  • Resumen del Modelo

    Da cuenta de la capacidad explicativa de cada dimensin, tanto en trminos de valores propios como

    de proporcin de inercia explicada. Se deben considerar como ejes suficientemente explicativos aquellas que presenten una inercia

    superior a un 0,2. (20%)

  • Coordenadas de las categoras

    Muestra las puntuaciones finales de cada categora en cada eje o dimensin.

    Estas son las que permiten la

    construccin del mapa de categoras

    conjuntas.

  • Medidas de Discriminacin

    Muestra la contribucin de cada variable a cada eje o dimensin.

    Vemos que la dimensin 1 est explicada principalmente por el tipo de participante y la

    dimensin 2 por el tipo de alusin a la ciudad y los tramos de edad generacional

  • Mapa Categoras Variable 1

  • Mapa Categoras Variable 2

  • Mapa Categoras Variable 3

  • Mapa Categoras Conjuntas La categora jvenes se ubica en el medio del mapa dado que los jvenes se encuentran repartidos entre todas las categoras de las dems variables. La categora pre adolescente se encuentra aislada dado que presenta casos en solo algunas categoras de las variables restantes, sin que se evidencie un comportamiento particular, es decir no se relaciona con ninguna otra categora en especial

  • INTERPRETACIN ANLISIS CORRESPONDENCIAS MLTIPLES

    EJEMPLO 2

  • Elementos tericos

    Pregunta de Investigacin

    Qu constelaciones de exclusin de jvenes se conforman a partir del comportamiento de las regiones?

    Concepto central

    Constelaciones de Exclusin de Jvenes

    Regiones

    I a XIII (Ao 2001)

    Indice exclusion educacin

    Alto Medio - Bajo

    Indice exclusion trabajo

    Alto Medio Bajo

    Indice exclusion salud

    Alto Medio - Bajo

    Muestra ndices de Exclusin Regionales INJUV 2001= 13 casos (Regiones)

  • Tablas de Frecuencias

    Permiten observas como se distribuyen las variables de manera independiente. Seala la moda de cada variable. En el caso analizado las categoras que representan

    una mayor cantidad de casos son:

    Medio nivel de exclusin en educacin Alto nivel de exclusin en trabajo Medio nivel de exclusin en salud

  • Historial de Iteraciones

    Indica como en cada paso iterativo se va aumentando la varianza entre las categoras a la vez que se

    disminuye la dispersin (Loss) entre los objetos.

    Indica adems en qu paso iterativo se encontr la solucin ptima.

  • Resumen del Modelo

    Da cuenta de la capacidad explicativa de cada dimensin, tanto en trminos de valores propios como

    de proporcin de inercia explicada. Se deben considerar como ejes suficientemente explicativos aquellas que presenten una inercia

    superior a un 0,2. (20%)

  • Coordenadas de las categoras y Objetos

    Muestra las puntuaciones finales de cada categora en cada eje o dimensin.

    Estas son las que permiten la construccin del mapa de categoras conjuntas.

    Tambin se obtienen las puntuaciones de los

    objetos en las dimensiones

  • Medidas de Discriminacin

    Muestra la contribucin de cada variable a cada eje o dimensin.

    Vemos que la dimensin 1 est explicada principalmente por el ndice de exclusin en salud y la dimensin 2 por el ndice de exclusin en educacin

  • Mapa Objetos

  • Mapa Categoras Variable 1

  • Mapa Categoras Variable 2

  • Mapa Categoras Variable 3

  • Mapa Categoras y Objetos Conjuntos

    Estadstica IVCarrera SociologaUniversidad de ChileSlide Number 2Slide Number 3Slide Number 4Slide Number 5Slide Number 6Slide Number 7Slide Number 8Slide Number 9Slide Number 10Slide Number 11Slide Number 12Slide Number 13Slide Number 14Slide Number 16Slide Number 18Slide Number 19Slide Number 20Slide Number 21Slide Number 22Slide Number 23Slide Number 24Slide Number 25Slide Number 26Slide Number 27Slide Number 28Slide Number 29Slide Number 30Slide Number 31Escalamiento ptimo (Correspondencias Mltiples)Slide Number 33Slide Number 34Slide Number 35Slide Number 36Slide Number 37Slide Number 38Slide Number 39Slide Number 40Slide Number 41Slide Number 42Slide Number 43Slide Number 44Slide Number 45Slide Number 46Slide Number 47Slide Number 48Estadstica IVCarrera SociologaUniversidad de ChileSlide Number 50Slide Number 51Slide Number 52Slide Number 53Slide Number 54Slide Number 55Slide Number 56Slide Number 57Slide Number 58Slide Number 59Slide Number 60Slide Number 61Slide Number 62Slide Number 63Slide Number 64Slide Number 65Slide Number 66Slide Number 67Slide Number 68Slide Number 69Slide Number 70Slide Number 71Slide Number 72Slide Number 73Slide Number 74Slide Number 75Slide Number 76Slide Number 77Slide Number 78Slide Number 79Slide Number 80