Análisis de componentes principales en la estimación de ...

49
Análisis de componentes principales en la estimación de índices de empoderamiento en mujeres de Colombia Trabajo Fin de Master Autora: Dayan Paola Peña Méndez Director: Ramón Gutiérrez Sánchez Máster en estadística aplicada Departamento de estadística e investigación operativa Universidad de Granada 2014

Transcript of Análisis de componentes principales en la estimación de ...

Page 1: Análisis de componentes principales en la estimación de ...

Análisis de componentes principales en la estimación de índices de

empoderamiento en mujeres de Colombia

Trabajo Fin de Master

Autora: Dayan Paola Peña Méndez

Director: Ramón Gutiérrez Sánchez

Máster en estadística aplicada

Departamento de estadística e investigación operativa

Universidad de Granada

2014

Page 2: Análisis de componentes principales en la estimación de ...

2

Tabla de Contenido

Introducción ............................................................................................................................................ 3

Análisis de componentes principales ........................................................................................................ 4

1. Obtención de las componentes principales ............................................................................................. 4

2. Variabilidad explicada por las componentes ............................................................................................ 7

3. Representación de una matriz de datos ................................................................................................... 7

4. Inferencia ................................................................................................................................................ 10

4.1 Estimación y distribución asintótica ............................................................................................... 11

4.2 Contraste de hipótesis .................................................................................................................... 12

5. Número de componentes principales .................................................................................................... 15

5.1 Criterio del porcentaje .................................................................................................................... 15

5.2 Criterio de Kaiser ............................................................................................................................ 15

5.3 Test de esfericidad .......................................................................................................................... 16

5.4 Criterio del bastón roto .................................................................................................................. 16

6. Biplot ...................................................................................................................................................... 17

Metodología México .............................................................................................................................. 19

Aplicación caso Colombia ....................................................................................................................... 21

1. Análisis descriptivo de la base de datos ................................................................................................. 22

2. Estimación del índice de poder de decisión ........................................................................................... 25

3. Estimación del índice de autonomía ..................................................................................................... 34

4. Estimación del índice de Roles de género .............................................................................................. 41

Conclusiones .......................................................................................................................................... 48

Bibliografía ............................................................................................................................................ 49

Page 3: Análisis de componentes principales en la estimación de ...

3

Introducción

Este trabajo tiene como objetivo utilizar la metodología de Componentes principales para calcular el

índice de empoderamiento de mujeres colombianas, que participaron en el año 2012 en el programa

de gobierno “Mujeres Ahorradoras en Acción”, el cual busca “Contribuir a la superación de la pobreza

extrema de mujeres en situación de vulnerabilidad, abriéndoles posibilidades de acceso real al

sistema microfinanciero y a la generación de ingresos por medio del fortalecimiento

microempresarial”1.

Dentro de este proyecto se realiza un seguimiento, por medio de encuestas, a las mujeres inscritas al

programa, en donde se analiza su situación económica y se dedica un capítulo completo a preguntas

que conlleven a entender el proceso de empoderamiento de ellas. El análisis de esta información se

ha basado durante muchos años en el resultado de un estudio hecho en México por el Instituto

Nacional de las Mujeres, en donde se utilizó el análisis de componentes principales para generar

índices de empoderamiento y los índices obtenidos allí se aplicaban a la base de Colombia.

El objetivo de este trabajo es realizar la estimación de estos índices con base en la información de

Colombia, recolectada bajo el programa de Mujeres Ahorradoras en Acción, y entregar al programa

estos cálculos para que sean utilizados en el estudio.

1 http://www.dps.gov.co/contenido/contenido.aspx?catID=629&conID=179&pagID=4469

Page 4: Análisis de componentes principales en la estimación de ...

4

Análisis de componentes principales

El análisis de componentes principales es una metodología desarrollada en 1901 por Karl Pearson,

la cual permite obtener información acerca de la interdependencia entre las variables analizadas,

es decir, permite hallar asociaciones entre las variables disponibles y reducir el número de estas

para facilitar su análisis.

El ACP busca la estructuración de un conjunto de datos multivariado mediante la reducción del

número de variables originales a un conjunto más pequeño de estas, las cuales son combinaciones

lineales de aquellas que recogen la mayor parte de la variabilidad del conjunto inicial de variables.

Una de las principales ventajas de esta metodología es que no parte de ninguna distribución de

probabilidad para su análisis y dentro de los objetivos del análisis están:

Generar nuevas variables que expresen información acerca del conjunto de datos

Reducir la dimensión del espacio en el que están contenidos los datos

Eliminar (si es posible) las variables que aportan poca información al estudio del problema

Facilitar la interpretación de la información contenida en los datos

Determinación de unos pocos factores (componentes principales) que retengan la mayor

variabilidad contenida en los datos. Las nuevas variables generadas cumplen con las

características de independencia (bajo el supuesto de normalidad) y no correlación.

1. Obtención de las componentes principales

Sea 𝑿 = [𝑋1, … , 𝑋𝑝] una matriz de datos multivariantes, en donde las filas representan los

individuos y las columnas las p variables continuas analizadas. Las componentes principales son

unas variables compuestas incorrelacionadas tales que unas pocas explican la mayor parte de la

variabilidad de X.

Page 5: Análisis de componentes principales en la estimación de ...

5

Definición 1.1. Las componentes principales son las variables compuestas

𝑌1 = 𝑋𝑡1, 𝑌2 = 𝑋𝑡2, … , 𝑌𝑝 = 𝑋𝑡𝑝,

tales que:

1. Var(Y1) es máxima condicionado a 𝑡1′ 𝑡1 = 1

2. Entre todas las variables compuestas Y tales que Cov(Y1,Y)=0, la variable Y2 es tal que

Var(Y2) es máxima condicionado a 𝑡2′ 𝑡2 = 1

3. Si 𝑝 ≥ 3, la componente Y3 es una variable incorrelacionada con Y1, Y2 con varianza

máxima.

4. Análogamente se definen las demás componentes principales si 𝑝 > 3.

Si 𝑻 = [𝑡1, … , 𝑡𝑝] es la matriz pxp cuyas columnas son los vectores que definen las componentes

principales, entonces la transformación lineal 𝑋 → 𝑌

Y=XT (1.1)

Se llama transformación por componentes principales.

Teorema 1.1. Sean 𝑡1, 𝑡2, … , 𝑡𝑝 los p vectores propios normalizados de la matriz de covarianzas S,

𝑺𝒕𝒊 = 𝝀𝒊𝒕𝒊, 𝒕𝒊′𝒕𝒊 = 𝟏, 𝒊 = 𝟏, … , 𝒑

Entonces:

1. Las variables compuestas 𝒀𝑖 = 𝑿𝑡𝑖, 𝑖 = 1,2, … , 𝑝, son las componentes principales.

2. Las varianzas son los valores propios de S

𝑉𝑎𝑟(𝑌𝑖) = 𝜆𝑖, 𝑖 = 1,2, … , 𝑝

3. Las componentes principales son variables incorrelacionadas:

𝑐𝑜𝑣(𝑌𝑖, 𝑌𝑗) = 0, 𝑖 ≠ 𝑗 = 1, … , 𝑝

Page 6: Análisis de componentes principales en la estimación de ...

6

Demostración: Supongamos 𝜆1 > 𝜆2 > ⋯ 𝜆𝑝 > 0. Probemos que las variables 𝑌𝑖 = 𝑋𝑡𝑖,

𝑖 = 1,2, … , 𝑝, están incorrelacionadas.

Además:

Sea ahora una variable compuesta tal que .

Entonces

Que prueba que Y1 tiene varianza máxima.

Consideremos ahora las variables Y incorrelacionadas con Y1. Las podemos expresar como:

Entonces:

Y por lo tanto Y2 está incorrelacionada con Y1 y tiene varianza máxima. Si 𝑝 ≥ 3, la demostración de que

Y3,…., Yp son también componentes principales es análoga □.

covYi,Yj t iSt j t i

jt j jt it j,

covYj,Yi t jSt i t j

it i it jt i,

j it it j 0, t i

t j 0, covYi,Yj jt it j 0, si i j

Y p

i1

biX i p

i2

iYi condicionado a

p

i2

i2 1

VarY Var

p

i2

iYi p

i2

i2VarYi

p

i2

i2 i

p

i2

i2 2 VarY2

Y p

i1

aiX i p

i1

iYi

p

i1

i2 1

VarY Varp

i1

iYi p

i1

i2VarYi

p

i1

i2 i

p

i1

i2 1 VarY1

VarYi it it j i

Page 7: Análisis de componentes principales en la estimación de ...

7

2. Variabilidad explicada por las componentes

La varianza de la componente principal Yi es 𝑉𝑎𝑟(𝑌𝑖) = 𝜆𝑖 y la variación total es 𝑡𝑟(𝑆) =

∑ 𝜆𝑖𝑝𝑖=1 . Por lo tanto:

1. Yi contribuye con la cantidad 𝜆𝑖 a la variación total tr(S).

2. Si m<p, Y1, ... ,Ym contribuyen con la cantidad ∑ 𝜆𝑖𝑚𝑖=1 a la variación total tr(S).

3. El porcentaje de variabilidad explicada por las m primeras componentes

principales es:

𝑃𝑚 = 100 𝜆1+⋯+ 𝜆𝑚

𝜆1+⋯+ 𝜆𝑝 (1.2)

En las aplicaciones cabe esperar que las primeras componentes expliquen un elevado

porcentaje de la variabilidad total. Por ejemplo, si m=2< p, y P2 = 90 %, las dos primeras

componentes explican una gran parte de la variabilidad de las variables. Entonces podremos

sustituir X1,X2,...,XP por las componentes principales Y1, Y2 . En muchas aplicaciones, tales

componentes tienen interpretación experimental.

3. Representación de una matriz de datos

Sea 𝑿 = [𝑋1, … , 𝑋𝑝] una matriz n x p de datos multivariantes. Queremos representar, en un

espacio de dimensión reducida m (por ejemplo, m = 2), las filas 𝑥1′ , 𝑥2

′ , … , 𝑥𝑛′ de X, por lo que

necesitamos introducir una distancia:

Definición 3.1: La distancia euclídea (al cuadrado) entre dos filas de X

Es

La matriz es la matriz nxn de las distancias entre las filas.

x i x i1 , . . . . ,x ip, x j

x j1 , . . . . ,x jp,

ij2 x i x jx i x j

p

h1

x ih x jh2

ij

Page 8: Análisis de componentes principales en la estimación de ...

8

Podemos representar las n filas de X como n puntos en el espacio Rp distanciados de acuerdo

con la métrica 𝛿𝑖𝑗. Pero si p es grande, esta representación no se puede visualizar. Necesitamos

reducir la dimensión.

Definición 3.2. La variabilidad geométrica de la matriz de distancias ∆ es el promedio de sus

elementos al cuadrado

Si Y=XT es una transformación lineal de X, donde T es una matriz p x m de constantes,

Es la distancia euclídea entre dos filas de Y. La variabilidad geométrica en dimensión 𝑚 ≤ 𝑝 es

Teorema 3.1 La variabilidad geométrica de la distancia euclídea es la traza de la

matriz de covarianzas

Demostración: Si x1,x2,…,xn es una muestra univariante con varianza s2, entonces

(1.3)

En efecto, si x̅ es la media

VX 1

2n 2

n

i,j1

ij2

ij2m yi yjyi yj

m

h1

yih yjh2

VYm 1

2n 2

n

i,j1

ij2m

VX trS p

h1

h

1

n 2

n

i,j1

x i x j 2 1

n 2

n

i,j1

x i x x j x2

1

n 2

n

i,j1

x i x2 1

n 2

n

i,j1

x j x2

2

n 2

n

i,j1

x i xx j x2 1n ns2 1

n ns2 0 2s2

1

2n 2

n

i,j1

x i x j 2 s2

Page 9: Análisis de componentes principales en la estimación de ...

9

Aplicando (1.3) a cada columna de X y sumando obtenemos

Una buena representación en dimensión reducida m (por ejemplo, m=2) será aquella

que tenga máxima variabilidad geométrica, a fin de que los puntos estén lo más

separados posible.

Teorema 3.2. La transformación lineal T que maximiza la variabilidad geométrica en

dimensión m es la transformación por componentes principales Y=XT, es decir,

T=[t1, ... ,tm] contiene los m primeros vectores propios normalizados de S.

Demostración: Utilizando (1.3), la variabilidad geométrica de Z =XV, donde

V=[v1, ... ,vm] es p x m cualquiera, es

siendo 𝑠2(𝑍𝑗) = 𝑣′𝑗𝑆𝑣𝑗; la varianza de la variable compuesta Zj . Alcanzamos la máxima varianza

cuando Zj es una componente principal: 𝑠2(𝑍𝑗) < 𝜆𝑗. Así:

El porcentaje de variabilidad geométrica explicada por Y es

𝑃𝑚 = 100𝑉𝛿(𝑌)𝑚

𝑉𝛿(𝑋)𝑝= 100

𝜆1 + ⋯ + 𝜆𝑚

𝜆1 + ⋯ + 𝜆𝑝

maxVYm m

j1

j

VX p

j1

sjj trS

Page 10: Análisis de componentes principales en la estimación de ...

10

Supongamos ahora m=2. Si aplicamos la transformación Y=XT, la matriz de datos X se reduce a

Entonces, representando los puntos de coordenadas (yi1, yi2), i=1,…,n, obtenemos una

representación óptima en dimensión 2 de las filas de X.

4. Inferencia

Se ha planteado el ACP sobre la matriz S, pero también se puede plantear sobre la matriz de

covarianzas poblacionales Σ. Las componentes principales obtenidas sobre S son, en realidad,

estimaciones de las componentes principales sobre Σ.

Sea X matriz de datos n x p donde las filas son independientes con distribución 𝑁𝑝(𝜇, Σ).

Recordemos que:

1. �̅� 𝑒𝑠 𝑁𝑝(𝜇, Σ/n).

2. U =nS es Wishart 𝑊𝑝(Σ, 𝑛 − 1)

3. �̅� 𝑦 𝑆 son estocásticamente independientes.

Sea Σ = ΓΛΓ′ la diagonalización de Σ Indiquemos

Los vectores propios y valores propios de Σ. Por otra parte, sea S=GLG' la

diagonalización de S. Indiquemos:

𝐺 = [𝑔1, . . . , 𝑔𝑝], 𝑙 = [𝑙1, . . . , 𝑙𝑝], 𝐿 = 𝑑𝑖𝑎𝑔[𝑙1, . . . , 𝑙𝑝]

Y

y11 y12

yi1 yi2

yn1 yn2

|1 , . . . ,p |, |1 , . . . ,p |, diag1 , . . . ,p

Page 11: Análisis de componentes principales en la estimación de ...

11

los vectores propios y valores propios de S. A partir de ahora supondremos

4.1 Estimación y distribución asintótica

Teorema 4.1.1. Se verifica:

1. Si los valores propios son diferentes, los valores y vectores propios obtenidos a

partir de S son estimadores máximo-verosímiles de los obtenidos a partir de 𝛴:

𝜆�̂� = 𝑙𝑖 , 𝛾�̂� = 𝑔𝑖, 𝑖 = 1, … , 𝑝

2. Cuando k > 1 valores propios son iguales a 𝜆

el estimador máximo verosímil de 𝜆 es la media de los correspondientes valores

propios de S

�̂� = (𝑙𝑝−𝑘+1 + ⋯ + 𝑙𝑝)/𝑘

Demostración: Los valores y vectores propios están biunívocamente relacionados con

Σ por lo tanto 1) es consecuencia de la propiedad de invariancia de la estimación

máximo verosímil. La demostración de 2) se encuentra en Anderson (1959).

Teorema 4.1.2. Los vectores propios 𝐺 = [𝑔1, . . . , 𝑔𝑝], y los valores propios 𝑙 = [𝑙1, . . . , 𝑙𝑝]

verifican asintóticamente:

1. 𝑙 𝑒𝑠 𝑁𝑝(𝜆,2𝛬2

𝑛). En particular:

𝑙𝑖 𝑒𝑠 𝑁 (𝜆𝑖,2𝜆𝑖

2

𝑛 ) , 𝑐𝑜𝑣(𝑙𝑖 , 𝑙𝑗) = 0, 𝑖 ≠ 𝑗

Page 12: Análisis de componentes principales en la estimación de ...

12

es decir, 𝑙𝑖 , 𝑙𝑗; son normales e independientes.

2. 𝑔𝑖 𝑒𝑠 𝑁𝑝(𝛾𝑖 ,𝑉𝑖

𝑛) donde

3. 𝑙 es independiente de G.

Demostración: Anderson (1959), Mardia, Kent y Bibby (1979) □.

Como consecuencia de que l𝑖 es N (𝜆𝑖,2λ𝑖

2

𝑛 ), obtenemos el intervalo de confianza asintótico con

coeficiente de confianza 1 − 𝛼,

siendo 𝛼2 =2

𝑛−1 y 𝑃 (|𝑍| > 𝑧𝛼

2⁄ ) = 𝛼/2 , donde Z es N(0, 1).

Se obtiene otro intervalo de confianza como consecuencia de que log l𝑖 es N (𝑙𝑜𝑔𝜆𝑖,2

𝑛−1 )

4.2 Contraste de hipótesis

Determinados contrastes de hipótesis relativos a las componentes principales son casos

particulares de un test sobre la estructura de la matriz Σ.

A. Supongamos que queremos decidir si la matriz Σ; es igual a una matriz

determinada Σ0 . Sea X un matriz n x p con filas independientes 𝑒𝑠 𝑁𝑝(𝜇, Σ). El test es:

𝐻0: Σ = Σ0 (𝜇 𝑑𝑒𝑠𝑐𝑜𝑛𝑜𝑐𝑖𝑑𝑎)

li

1z/21/2 i

li

1z/21/2

liez/2 i lie

z/2

Page 13: Análisis de componentes principales en la estimación de ...

13

Si L es la verosimilitud de la muestra, el máximo de log L bajo H0 es

El máximo no restringido es

El estadístico basado en la razón de verosimilitud 𝜆𝑅 es:

(1.4)

Si 𝐿1, … , 𝐿𝑝 son los valores propios de Σ0−1𝑆 y a, g son las medias aritmética y

geométrica

𝑎 =(𝐿1 + ⋯ + 𝐿𝑝)

𝑝, 𝑔 = (𝐿1 + ⋯ + 𝐿𝑝)1 𝑝⁄ (1.5)

entonces, asintóticamente

(1.6)

siendo q=p(p+1)/2-par(𝛴0) el número de parámetros libres de Σ menos el número de

parámetros libres de Σ0.

B. Test de independencia completa.

Si la hipótesis nula afirma que las p variables son estocásticamente independientes, el

test se formula como

𝐻0: Σ = Σd = 𝑑𝑖𝑎𝑔(𝜎11, … , 𝜎𝑝𝑝) (𝜇 𝑑𝑒𝑠𝑐𝑜𝑛𝑜𝑐𝑖𝑑𝑎)

Page 14: Análisis de componentes principales en la estimación de ...

14

p

Bajo H0 la estimación de Σ𝑑 es S𝑑 = 𝑑𝑖𝑎𝑔(𝑠11, … , 𝑠𝑝𝑝) y 𝑆𝑑−1𝑆 = 𝑅 es la matriz de correlaciones.

De (1.4) y de 𝑙𝑜𝑔|2𝜋𝑆𝑑| − 𝑙𝑜𝑔|2𝜋𝑆| = log|𝑅| , 𝑡𝑟(𝑅) = 𝑝 obtenemos:

Siendo q=p(p+1)/2-p=p(p-1)/2. Si el estadístico −𝑛 log|𝑅|no es significativo, entonces

podemos aceptar que las variables están incorrelacionadas y por lo tanto, como hay

normalidad multivariante, independientes. Entonces las propias variables serían

componentes principales.

C. Test de igualdad de valores propios.

Es éste un test importante en ACP. La hipótesis nula es:

𝐻0: 𝜆1 > ⋯ > 𝜆𝑝−𝑘 = 𝜆𝑝−𝑘+1 = ⋯ = 𝜆𝑝 = 𝜆

Indicamos los valores propios de S y de So (estimación de Σ si H0 es cierta)

𝑆 ∼ (𝑙1, … , 𝑙𝑘 , 𝑙𝑘+1, … 𝑙𝑝), 𝑆0 ∼ (𝑙1, … , 𝑙𝑘 , 𝑎0, … , 𝑎0)

donde 𝑎0 = (𝑙𝑘+1, … , 𝑙𝑝)/(𝑝 − 𝑘) (Teorema 4.1). Entonces

𝑆0−1𝑆 ∼ (1, … ,1, 𝑙𝑘+1/𝑎0, … , 𝑙𝑝/𝑎0)

las medias (1.5) son 𝑎 = 1, 𝑦 𝑔 = (𝑙𝑘+1 × … × 𝑙𝑝)1/𝑝𝑎0(𝑘−𝑝) 𝑝⁄

, y aplicando (1.6)

(1.7)

donde q=(p - k)(p - k + 1)/2-1. Para una versión más general de este test, véase Mardia

et al. (1979).

Page 15: Análisis de componentes principales en la estimación de ...

15

5. Número de componentes principales

En esta sección se presentan algunos criterios para determinar el número m < p de componentes

principales.

5.1 Criterio del porcentaje

El número m de componentes principales se toma de modo que Pm sea próximo a un valor

especificado por el usuario, por ejemplo el 80%. Por otra parte, si la representación de

P1, P2 ,…,Pk,… con respecto de k prácticamente se estabiliza a partir de un cierto m, entonces

aumentar la dimensión apenas aporta más variabilidad explicada.

5.2 Criterio de Kaiser

Obtener las componentes principales a partir de la matriz de correlaciones R equivale a suponer

que las variables observables tengan varianza 1. Por lo tanto una componente principal con

varianza inferior a 1 explica menos variabilidad que una variable observable. El criterio, llamado

de Kaiser, es entonces:

Retenemos las m primeras componentes tales que λ𝑚 ≥ 1 , donde λ1 ≥… ≥ λ𝑝

son los valores propios de R, que también son las varianzas de las componentes.

Estudios de Montecarlo prueban que es más correcto el punto de corte 𝜆∗ = 0.7,

que es más pequeño que 1.

Este criterio se puede extender a la matriz de covarianzas. Por ejemplo, m podría ser tal que

λ𝑚 ≥ 𝑣, donde 𝑣 = 𝑡𝑟(𝑆)/𝑝 es la media de las varianzas. También es aconsejable considerar el

punto de corte 0.7 × 𝑣.

Page 16: Análisis de componentes principales en la estimación de ...

16

1 1

5.3 Test de esfericidad

Supongamos que la matriz de datos proviene de una población normal multivariante

𝑁𝑝(𝜇, Σ). Si la hipótesis

𝐻0(𝑚)

: 𝜆1 > ⋯ > 𝜆𝑚 > 𝜆𝑚+1 = ⋯ => 𝜆𝑝

es cierta, no tiene sentido considerar más de m componentes principales. En efecto,

no hay direcciones de máxima variabilidad a partir de m, es decir, la distribución de los

datos es esférica. El test para decidir sobre 𝐻0(𝑚)

está basado en el estadístico ji-

cuadrado (1.7) y se aplica secuencialmente: Si aceptamos 𝐻0(0)

es decir, m=0, todos los

valores propios son iguales y no hay direcciones principales. Si rechazamos 𝐻0(0)

,

entonces repetimos el test con 𝐻0(1)

. Si aceptamos 𝐻0(1)

entonces m=1, pero si

rechazamos 𝐻0(1)

repetimos el test con 𝐻0(2)

, y así sucesivamente. Por ejemplo si p=4,

tendríamos que m=2 si rechazamos 𝐻0(0)

, 𝐻0(1)

y aceptamos 𝐻0(2)

: 𝜆1 > 𝜆2 > 𝜆3 = 𝜆4.

5.4 Criterio del bastón roto

La suma de los valores propios es Vt= tr(S), que es la variabilidad total. Imaginemos un

bastón de longitud Vt, que rompemos en p trozos al azar (asignando p-1 puntos

uniformemente sobre el intervalo (0, Vt,)) y que los trozos ordenados son los valores

propios 𝑙1 > 𝑙2 > ⋯ 𝑙𝑝. Si normalizamos a Vt=100, entonces el valor esperado de 𝑙𝑗 es

Las m primeras componentes son significativas si el porcentaje de varianza explicada

supera claramente el valor de E(L1)+…+ E(Lm)· Por ejemplo, si p=4 los valores son

Porcentaje E(L1) E(L2 ) E(L3 ) E(L4 )

Esperado 52.08 27.08 14.58 6.25

Acumulado 52.0 79.16 93.74 100

Page 17: Análisis de componentes principales en la estimación de ...

17

Si V2 = 93.92 pero V3 = 97.15, entonces tomaremos sólo dos componentes.

6. Biplot

Un biplot es una representación, en un mismo gráfico, de las filas (individuos) y las columnas

(variables) de una matriz de datos X (n x p). Suponiendo X matriz centrada, el biplot clásico (debido

a K. R. Gabriel), se lleva a cabo mediante la descomposición singular

donde U es una matriz nxp con columnas ortonormales, V es una matriz pxp ortogonal, y Λ es

una matriz diagonal con los valores singulares de X ordenados de mayor a menor. Es

decir, 𝑈′𝑈 = 𝐼𝑛, 𝑉′𝑉 = 𝐼𝑝, Λ = 𝑑𝑖𝑎𝑔(𝜆1, … , 𝜆𝑝) .Como X′X = U′Λ2𝑈 vemos que 𝑋𝑉 = 𝑈Λ es la

transformación en componentes principales (1.1), luego las coordenadas para representar las n

filas están contenidas en 𝑈Λ. Las coordenadas de las p columnas son las filas de la matriz 𝑉. Filas

y columnas se pueden representar (tomando las dos primeras coordenadas) sobre el mismo

gráfico, como en la figura siguiente.

En general la solución biplot consiste en representar simultáneamente las matrices

𝑨 = 𝑼𝚲𝜶 𝒚 𝑩 = 𝑽𝚲𝟏−𝜶, para un 𝜶 tal que 𝟎 ≤ 𝜶 ≤ 𝟏. Entonces AB’=X y el gráfico reproduce las

filas y columnas de X. La calidad en la representación depende del valor asignado al parámetro

α. Si α=1 se representan las filas con máxima resolución, si α=0 la mejor resolución corresponde

a las columnas. Se puede tomar el valor intermedio α=1/2.

Page 18: Análisis de componentes principales en la estimación de ...

18

Podemos plantear el biplot de una manera alternativa (propuesta por J. C. Gower). La

transformación por componentes principales Y=XT permite representar las filas. Para

representar también las columnas, podemos entender una variable Xj como el conjunto de

puntos de coordenadas

𝑥𝑗(𝛼𝑗) = (0, … , 𝛼𝑗, … ,0) 𝑚𝑗 ≤ 𝛼𝑗 ≤ 𝑀𝑗

donde 𝛼𝑗 es un parámetro que varía entre el mínimo valor mj y el máximo valor Mj de

Xj. Entonces la representación de Xj; es simplemente el eje 𝑥𝑗(𝛼)𝑇.

Siguiendo este procedimiento, es fácil ver que mediante la transformación Y=XT, la

representación de las variables se identifica con el haz de segmentos

(𝛼1𝑡1, … , 𝛼𝑝𝑡𝑝)

donde t1,…,tP son las filas de T. Véase Greenacre (2010) para una moderna versión práctica de

esta interesante técnica.

Page 19: Análisis de componentes principales en la estimación de ...

Metodología México

La Encuesta Nacional sobre la Dinámica de las Relaciones en los Hogares (ENDIREH), es un

estudio que se ha llevado a cabo en México durante varios años y busca entender la violencia

de género que sufren las mujeres casadas de más de 15 años de edad tanto en el ámbito público

como el privado. De allí se generó un trabajo presentado como “Violencia de género en las

parejas mexicanas2”, el cual se basó en los datos de ENDIREH 2006, y analizó la violencia que

sufren las mujeres por parte de sus parejas o esposos, debido a que esta es la de mayor

prevalencia y posiblemente la que mayor cantidad de secuelas deja debido a: el lazo emocional

que tiene la mujer con su pareja y a que la mujer debe convivir diariamente con este maltrato.

Dentro del contenido desarrollado en él se identificaron las mujeres con mayor propensión a

sufrir violencia de pareja de acuerdo con las condiciones socioeconómicas, sus antecedentes de

violencia en la niñez y la aplicación de estos resultados en políticas públicas. Adicionalmente, se

construyeron índices de empoderamiento de las mujeres: índice de poder de decisión, índice de

autonomía o libertad de movimientos e índice de roles de género.

De acuerdo con el autor3, el cálculo de estos índices nace de la necesidad de entender la

situación de empoderamiento en las mujeres mexicanas, ya que la adquisición de este repercute

en un mayor control de las vidas de ellas y su participación en actividades a las que

tradicionalmente no tienen acceso.

Para medir este empoderamiento la metodología planteada consiste en estimar índices atados

a tres dimensiones del empoderamiento: índice de poder de decisión, índice de autonomía e

índice de roles de género.

2 Este estudio fue realizado por el Instituto Nacional de las Mujeres, en el marco del Programa Nacional para la

igualdad entre mujeres y hombres 2008-2012 y de la Ley General de Acceso de las Mujeres a una vida libre de

violencia.

3 Coordinadores del proyecto: Roberto Castro e Irene Casique

Page 20: Análisis de componentes principales en la estimación de ...

20

Los datos en los que basaron el desarrollo de la metodología fueron tomados de ENDIREH 2006

y con base en las preguntas allí planteadas se realizaron análisis de componentes principales,

con grupos de variables que permitían la definición de ellos.

Page 21: Análisis de componentes principales en la estimación de ...

21

Aplicación caso Colombia

Basado en la metodología utilizada para la creación de los indicadores de empoderamientos en

México, se decidió tomar los datos de un estudio colombiano para determinar el índice de

empoderamiento de la mujer y lograr entender su comportamiento dentro de la sociedad.

El estudio tomado se desarrolla en el marco del proyecto gubernamental Mujeres Ahorradoras

en Acción, el cual busca “Contribuir a la superación de la pobreza extrema de mujeres en

situación de vulnerabilidad, abriéndoles posibilidades de acceso real al sistema microfinanciero

y a la generación de ingresos por medio del fortalecimiento microempresarial. Este objeto se

logra a través de:

1. La Educación Financiera y la generación de una cultura del ahorro.

2. La vinculación formal al Sistema Microfinanciero: Bancarización, ahorro y microcrédito.

3. La aplicación de un incentivo al ahorro.

4. La formación integral con enfoque de género.

5. La instalación de capacidades socioempresariales.

6. El fortalecimiento de emprendimientos productivos de las mujeres.

7. El intercambio de saberes y experiencias entre las participantes.

8. La promoción de las organizaciones de mujeres.

9. El uso de microseguros.

10. La articulación institucional, en especial con la Red de Superación de la pobreza extrema

JUNTOS.4”

Con base en una muestra de 7.267 mujeres de toda Colombia, inscritas en el estudio

mencionado anteriormente en el año 2012, se replicó la metodología utilizada en México

obteniendo los resultados que se exponen a continuación.

4 http://www.dps.gov.co/contenido/contenido.aspx?catID=629&conID=179&pagID=4469

Page 22: Análisis de componentes principales en la estimación de ...

22

1. Análisis descriptivo de la base de datos

La base analizada cuenta con 7.267 mujeres de diferentes regiones del país, tanto urbanas como

rurales, quienes para ser parte de este estudio se inscribieron al programa de gobierno “Mujeres

ahorradoras en acción” con el fin de empezar a hacer crecer sus negocios propios por medio de

incentivos y capacitaciones que brinda el gobierno; de esta forma ellas empiezan a tener

educación y apoyo que les permite empezar a ahorrar y hacer progresar sus negocios.

A nivel departamental, la muestra se distribuye como se muestra en el gráfico.

Gráfico 1. Distribución por departamentos y ruralidad

En el gráfico 1 se puede observar que la mayor proporción de la muestra se encuentra en los

departamentos del Tolima (13%), Boyacá (9.7%) y Cauca (9.3%). Del total de la muestra el 58%

de las mujeres habitan en zona urbana, mientras que el 42% lo hacen en zona rural y los

departamentos que tiene mayor porcentaje de personas en área urbana son Tolima, Cesar,

Atlántico, Bolívar, Arauca y Córdoba.

0

100

200

300

400

500

600

700

800

900

1000

Distribución por departamentos y ruralidad

RURAL URBANO

Page 23: Análisis de componentes principales en la estimación de ...

23

Gráfico 2. Distribución por edad

Al examinar la variable edad se observa que el 59% de las mujeres entrevistadas se encuentran

en edades de 30 a 49 años. El porcentaje de mujeres jóvenes (18 a 24) es el menor de todos

(5.7%), siendo incluso más pequeño que el de las mujeres de más de 60 años (7.6%). Por lo tanto

estamos hablando de una muestra de mujeres en su gran mayoría adultas. Esto se debe en

mayor medida a que para ser parte de este programa las mujeres debían tener ya su negocio y

esta característica se presenta en mayor proporción en personas adultas.

Gráfico 3. Distribución por nivel educativo

El nivel educativo de las mujeres analizadas se puede calificar como bajo, debido a que el 89%

de ellas tienen como máximo nivel alcanzado secundaria completa, y el 47% tienen hasta nivel

18-24

25-29

30-34

35-39

40-44

45-49

50-54

55-59

60 o más

5,7

9,8

13,7

15,4

16,0

13,7

10,9

7,1

7,6

Distribución porcentual por edad

,3%

24,8%

21,4%

18,2%

24,4%

6,4%

1,2% ,1%

3,0%

,1%

Nivel educativo

Page 24: Análisis de componentes principales en la estimación de ...

24

de primaria. Este nivel educativo es de esperarse en personas que se inscriben a programas de

gobierno, debido a que la mayoría de ellas tienen acceso limitado a la educación.

En cuanto al estado civil se tiene que el 70% de ellas viven con su pareja, bien sea casadas o

viviendo en unión libre, lo cual es una característica que va a influir en la estimación de los

índices de empoderamiento.

Gráfico 4. Distribución por estado civil

En cuanto al nivel de ingresos el 67% de las mujeres tienen ingresos inferiores a un salario

mínimo, es decir, estamos hablando de una población con bajos recursos y cuya principal fuente

de ingresos son sus propios negocios.

Gráfico 5. Distribución por ingresos

Unión libre43%

Casada27%

Soltera17%

Separada o divorciada

8%

Viuda5%

67%

17%

10%6%

Ingresos

Menos de un salario mínimo Entre 1 y 2 salarios mínimos

Más de 2 salarios mínimos Sin ingresos

Page 25: Análisis de componentes principales en la estimación de ...

25

2. Estimación del índice de poder de decisión

Con ayuda de este índice se pretende conocer el comportamiento en la toma de decisiones en

el hogar y de la pareja a través de preguntas que permiten identificar quién es la persona que

toma las decisiones en la mayoría de las veces en cuanto a:

1. Si la mujer puede trabajar o estudiar

2. Si la mujer puede salir su casa

3. Qué hacer con el dinero que ella gana

4. Si puede comprar cosas para ella

5. Si puede participar en eventos de la comunidad

6. Cómo gasta el dinero en casa

7. Sobre los permisos de los hijos

8. Cambiarse de casa o ciudad

9. Tener relaciones sexuales

10. Si se usan anticonceptivos

11. Quién usa los anticonceptivos

Para cada una de las decisiones expuestas anteriormente se evaluaron 5 respuestas posibles:

Sólo la entrevistada

Sólo el esposo o pareja

Ambos

Otras personas

No aplica

Debido a una amplia tradición machista las mujeres han estado supeditadas a seguir las

decisiones de su compañero debido a su cultura o a la fuerza que él pueda infringir sobre ella,

por esto con estas sencillas preguntas se puede determinar cuál es la participación de ellas en

las decisiones del hogar y qué tanto control tienen en su vida.

Page 26: Análisis de componentes principales en la estimación de ...

26

Lo primero que se hizo para crear este índice fue categorizar las respuestas posibles en puntajes

en orden ascendente que indiquen la incidencia de la mujer en la toma de decisiones así: Sólo

el esposo o pareja: 1 punto, ambos: 2 puntos y sólo la mujer entrevistada: 3 puntos. Los casos

en los que la respuesta fue otra persona o no aplica, fueron excluidos del análisis, dado que no

proporciona información alguna acerca de poder de decisión de la mujer. Por lo tanto de 7.267

mujeres, para la construcción de este índice sólo se tomaron las respuestas de 4158.

Una vez recodificadas las respuestas, se tienen los resultados en la tabla1.

Sólo él Ambos Sólo ella

Si usted puede trabajar o estudiar 1,4% 39,5% 59,1%

Si usted puede salir de la casa 1,1% 28,4% 70,5%

Qué hacer con el dinero que usted gana 0,6% 30,6% 68,8%

Si puede comprar cosas para usted 0,8% 18,4% 80,8%

Si usted puede participar en los eventos de la comunidad 1,2% 33,5% 65,3%

Como se gasta el dinero en casa 1,4% 63,8% 34,8%

Sobre los permisos de los hijos(as) 2,2% 69,5% 28,3%

Cambiarse de casa o ciudad 2,6% 71,4% 26,1%

Cuando tener relaciones sexuales 2,2% 69,6% 28,2%

Sobre el uso de anticonceptivos 1,5% 60,3% 38,2%

Sobre quién debe usar los anticonceptivos 3,3% 56,6% 40,0%

Tabla 1. ¿Quién decide la mayor parte de las veces en el hogar o en su relación de pareja.

Aquí se puede observar que en 6 de las 11 decisiones, más del 50% de las veces éstas son

tomadas por ambos y están relacionadas con las decisiones del hogar: Como se gasta el dinero

en casa(63,8%), Sobre los permisos de los hijos(as) (69,5%), Cambiarse de casa o ciudad (71,4%),

Cuando tener relaciones sexuales (69,6%), Sobre el uso de anticonceptivos (60,3%), Sobre quién

debe usar los anticonceptivos (56,6%); mientras que las decisiones que afectan directa y

únicamente a la mujer las toma solamente ella la gran mayoría de los casos: Si usted puede

trabajar o estudiar (59,1%), Si usted puede salir de la casa (70,5%), Qué hacer con el dinero que

usted gana(68,8%), Si puede comprar cosas para usted (80,8%), Si usted puede participar en los

eventos de la comunidad (65,3%).

Page 27: Análisis de componentes principales en la estimación de ...

27

De aquí se puede concluir que las decisiones en el hogar se toman de forma equitativa entre

hombres y mujeres; sin embargo, para llegar a una deducción más acertada es necesario

considerar la correlación que existe entre las variables evaluadas para así generar indicadores

multivariados que permitan valorar el poder de decisión.

Los estadísticos de las variables estudiadas (Tabla2) muestran que las primeras 5 variables

tienen en promedio resultados más cercanos a 3, es decir hacia decisiones tomadas por la mujer,

mientras que las últimas se acercan en promedio más hacia 2, es decir puntajes inclinados hacia

la toma de decisión de ambos. Los coeficientes de variación se encuentran casi todos alrededor

del 20% indicando una variabilidad baja en las respuestas de las mujeres.

Variable Promedio Desviación estándar

Coeficiente de variación

Si usted puede trabajar o estudiar 2,58 0,52 20,2%

Si usted puede salir de la casa 2,69 0,48 17,9%

Qué hacer con el dinero que usted gana 2,68 0,48 17,9%

Si puede comprar cosas para usted 2,80 0,42 14,9%

Si usted puede participar en los eventos de la comunidad 2,64 0,50 19,1%

Como se gasta el dinero en casa 2,33 0,50 21,5%

Sobre los permisos de los hijos(as) 2,26 0,49 21,5%

Cambiarse de casa o ciudad 2,23 0,48 21,5%

Cuando tener relaciones sexuales 2,26 0,49 21,5%

Sobre el uso de anticonceptivos 2,37 0,51 21,6%

Sobre quien debe usar los anticonceptivos 2,37 0,55 23,1%

Tabla 2. Estadísticos descriptivos variables empoderamiento

Al observar la matriz de correlaciones en la tabla 3, se ve que las correlaciones más altas se

encuentran entre las 5 últimas variables, las cuales son concernientes a las decisiones del hogar.

Page 28: Análisis de componentes principales en la estimación de ...

28

Tabla 3. Matriz de correlaciones

Para integrar las 11 variables estudiadas anteriormente se realiza un análisis de componentes

principales obteniendo los resultados que aparecen en la tabla 4, en donde se observa que el

primer factor explica el 51.34% del total de la varianza, el segundo el 15.69% y los demás menos

del 7% del total de la inercia cada uno. De allí se tiene que con los dos primeros ejes se está

explicando el 67% del total de la inercia.

Al observar los resultados de la tabla 4, se ve que solamente los dos primeros autovalores son

mayores que 1, por lo tanto tomando el criterio de Kaiser se tomarán estos componentes para

el análisis subsiguiente. El gráfico 6 de sedimentación ayuda a confirmar que se deben tomar las

dos primeras componentes.

Si usted

puede

trabajar o

estudiar

Si usted

puede

salir de la

casa

Qué hacer

con el

dinero

que usted

gana

Si puede

comprar

cosas para

usted

Si usted

puede

participar

en los

eventos

de la

comunida

d

Como se

gasta el

dinero en

casa

Sobre los

permisos

de los

hijos(as)

Cambiars

e de casa

o ciudad

Cuando

tener

relaciones

sexuales

Sobre el

uso de

anticonce

ptivos

Sobre

quien

debe usar

los

anticonce

ptivos

Si usted puede trabajar o estudiar 1,0

Si usted puede salir de la casa 0,6 1,0

Qué hacer con el dinero que

usted gana0,5 0,5 1,0

Si puede comprar cosas para

usted0,5 0,6 0,6 1,0

Si usted puede participar en los

eventos de la comunidad0,5 0,5 0,5 0,5 1,0

Como se gasta el dinero en casa 0,5 0,4 0,4 0,3 0,5 1,0

Sobre los permisos de los

hijos(as)0,4 0,4 0,4 0,3 0,4 0,7 1,0

Cambiarse de casa o ciudad 0,5 0,4 0,4 0,3 0,4 0,7 0,8 1,0

Cuando tener relaciones sexuales 0,4 0,3 0,4 0,3 0,4 0,6 0,7 0,7 1,0

Sobre el uso de anticonceptivos 0,4 0,3 0,3 0,2 0,3 0,5 0,6 0,6 0,7 1,0

Sobre quien debe usar los

anticonceptivos0,3 0,3 0,3 0,2 0,3 0,5 0,5 0,5 0,6 0,8 1,0

Page 29: Análisis de componentes principales en la estimación de ...

29

Tabla 4.Componentes extraídas Gráfico 6. Gráfico de Sedimentación

Al graficar las componentes principales de las columnas (gráfico 7), se observan claramente dos

grupos de variables en donde en la parte superior se tienen aquellas relacionadas directamente

con decisiones del hogar, mientras que en contraposición se tienen las que tienen que ver con

las decisiones propias que debe tomar una persona en su individualidad como por ejemplo: si

puede trabajar o estudiar, salir de la casa, qué hacer con su dinero, entre otros.

Gráfico 7. Componentes principales de las columnas

Factor Inercia PorcentajePorcentaje

acumulado

1 5,65 51,34 51,34

2 1,73 15,69 67,03

3 0,76 6,87 73,90

4 0,56 5,07 78,97

5 0,53 4,80 83,76

6 0,41 3,69 87,46

7 0,38 3,48 90,93

8 0,34 3,07 94,00

9 0,27 2,46 96,46

10 0,20 1,85 98,31

11 0,19 1,69 100,00

01

23

45

d = 0.2

Dec.trabajar.estudiar

Dec.puedesalirdelacasa Dec.quehacerconeldineroquegana

Dec.sipuedecomprarcosasparausted

Dec.puedeparticipareventoscomunidad

Dec.comogastaeldineroencasa

Dec.sobrepermisosdeloshijos Dec.cambiarsedecasaociudad

Dec.tenerrelacionessexuales Dec.usodeanticonceptivos

Dec.quienusaanticonceptivos

Page 30: Análisis de componentes principales en la estimación de ...

30

Al ver el comportamiento de cada variable en las dos componentes (tabla 5), se advierte que las

5 primeras se comportan de manera muy similar frente a la primera componente, tomando

valores similares, aun cuando la variable Si puede comprar cosas para usted tiene un

coeficiente más bajo (0.57). En la segunda componentes se tiene que el primer grupo de

variables, aquellas relacionadas con el desarrollo personal del individuo, se contrapone al

segundo grupo que corresponde a las decisiones del hogar.

Tabla 5. Cargas de las componentes

El gráfico de correlaciones de las variables (gráfico 8) ratifica los dos grupos de variables

mencionados anteriormente. Allí se ve una clara contraposición de estos, evidenciando que las

decisiones en estos grupos de variables son tomadas de forma diferente por los miembros del

hogar. De igual manera se puede ver que las características evaluadas en los grupos se

encuentran fuertemente correlacionados dentro de ellos.

Variable Componente 1 Componente 2

Si usted puede trabajar o estudiar 0,69 -0,32

Si usted puede salir de la casa 0,64 -0,50

Qué hacer con el dinero que usted gana 0,63 -0,48

Si puede comprar cosas para usted 0,57 -0,60

Si usted puede participar en los eventos de la comunidad 0,65 -0,39

Como se gasta el dinero en casa 0,78 0,15

Sobre los permisos de los hijos(as) 0,80 0,31

Cambiarse de casa o ciudad 0,82 0,31

Cuando tener relaciones sexuales 0,81 0,35

Sobre el uso de anticonceptivos 0,74 0,38

Sobre quien debe usar los anticonceptivos 0,70 0,37

Page 31: Análisis de componentes principales en la estimación de ...

31

Gráfico 8. Gráfico de correlaciones

Con base en los resultados obtenidos con la metodología de componentes principales, se

consigue caracterizar las dos componentes de la siguiente forma:

Componente 1: Explica el 51.34% del total de la varianza y allí sobresalen por su aporte

las siguientes variables: cuándo tener relaciones sexuales, cambiarse de casa o ciudad

sobre el permiso de los hijos y cómo se gasta el dinero en la casa; por lo tanto, este

factor puede ser considerado como aquel que indica el control sobre las decisiones del

hogar y los hijos.

Componente 2: Explica el 15.7% de la varianza y está relacionado con aquellas variables

que tienen que ver con decisiones acerca del desarrollo del individuo como: estudiar,

cómo gastar su dinero, salir de la casa, comprar cosas para ella y participar en eventos

de la comunidad. A esta componente se le puede llamar desarrollo de la individualidad.

Una vez obtenidos los ítems que más influyen sobre cada componente, se procede a crear dos

subíndices para poder fusionarlos y generar un único índice, de la siguiente forma:

Page 32: Análisis de componentes principales en la estimación de ...

32

El primer subíndice estará compuesto por los ítems:

o Como se gasta el dinero en casa

o Sobre los permisos de los hijos(as)

o Cambiarse de casa o ciudad

o Cuando tener relaciones sexuales

o Sobre el uso de anticonceptivos

o Sobre quién debe usar los anticonceptivos

Y se calcula sumando los valores de las variables mencionadas anteriormente (ya recodificadas),

y se estandariza dividiendo el resultado de la suma que se obtiene para cada individuo, en el

mayor valor que podría tomar la sumatoria.

De igual forma se calcula el segundo subíndice, tomando los valores de las siguientes variables.

Estos se estandarizan de la misma forma que se realizó para la primera componente:

o Si usted puede trabajar o estudiar

o Si usted puede salir de la casa

o Qué hacer con el dinero que usted gana

o Si puede comprar cosas para usted

o Si usted puede participar en los eventos de la comunidad

Así, se obtienen dos resultados que se combinan por medio de una suma ponderada, cuyo

ponderador está dado por el porcentaje de varianza que aporta cada componente a la varianza

total explicada de la siguiente manera:

Total de la varianza explicada: 67.03

Peso del subíndice 1: 51.34/67.03=76.6%

Peso del subíndice 2: 15.69/67.03=23.4%

Índice de poder de decisión = 0.766*(Subíndice de control sobre las decisiones del hogar y los hijos

+0.234*(Subíndice de desarrollo de la individualidad)

Page 33: Análisis de componentes principales en la estimación de ...

33

El resultado del índice de poder de decisión toma valores entre 0 y 1, en donde valores cercanos

a 0 representan los casos de mujeres sin poder de decisión, es decir, que la mayoría de las

decisiones son tomadas por su esposo, mientras que 1 involucra a las mujeres que toman sus

decisiones de manera autónoma, sin involucrar a sus parejas.

Al calcular el índice sobre la base de datos analizada se tiene que el valor promedio del índice es

de 0.8, y la mediana es de 0.74, lo que indica que la mayoría de las mujeres se encuentran en

valores altos del índice, evidenciando una tendencia hacia la autonomía en las decisiones

(gráfico 9).

Gráfico 9. Histograma índice de poder de decisión.

También se calculó el índice de Cronbach con los 11 ítems incluidos en el análisis de

componentes principales y se obtuvo un valor de 0.9, mostrando consistencia en el índice

calculado.

Page 34: Análisis de componentes principales en la estimación de ...

34

3. Estimación del índice de autonomía

En el cuestionario se establecen preguntas que ayudan a determinar la autonomía de la mujer

con respecto a su pareja en el momento de realizar las siguientes actividades:

Para trabajar por una remuneración

Para ir a comprar cosas para el hogar

Para visitar parientes o amistades

Si puede comprar cosas para usted

Para participar en actividades comunales

Para hacer amigos(as) que su familia no conoce

Para votar por algún candidato en especial

Como alternativas de respuesta se tienen: Le debe pedir permiso, le avisa, va acompañada, no

tiene que hacer nada y otro. La recodificación para estas respuestas es la siguiente: le debe pedir

permiso 1 punto, le avisa 2 puntos, va acompañada 0 puntos y no tiene que hacer nada son 3

puntos.

Los casos en donde la respuesta fue “No aplica”, se excluyeron del análisis ya que no

proporcionan información relevante para estimar la autonomía de las mujeres. Por lo tanto de

7.267 mujeres, para la construcción de este índice sólo se tomaron las respuestas de 5.989.

Una vez codificadas las respuestas se tienen los siguientes resultados:

Ir

acompañada

Pedir

permiso

Avisar Nada

Para trabajar por una remuneración 1,6% 5,7% 49,9% 42,8%

Para ir a comprar cosas para el hogar 11,6% 2,0% 42,0% 44,4%

Para visitar parientes o amistades 8,7% 3,2% 47,9% 40,2%

Page 35: Análisis de componentes principales en la estimación de ...

35

Si puede comprar cosas para usted 4,4% 1,0% 29,1% 65,5%

Para participar en actividades comunales 4,9% 4,1% 42,9% 48,1%

Para hacer amigos(as) que su familia no conoce 3,1% 2,6% 33,0% 61,4%

Para votar por algún candidato en especial 2,7% 1,7% 23,0% 72,6%

Tabla 6. Para las siguientes actividades que le voy a nombrar usted tiene que…

Dentro de las variables que se usan para este este índice, no se observan posiciones claras para

la mayoría de las participantes en ítems como: Para ir a comprar cosas para el hogar o para

visitar parientes o amistades, ya que el porcentaje está dividido entre avisar o no hacer nada.

En la característica Trabajar por una remuneración se da el mayor porcentaje de mujeres que

tiene que pedir permiso, y por el contrario Si puede comprar cosas para usted es una variable

en la que el porcentaje de permisos solicitados es el menor.

Los estadísticos de las variables estudiadas muestran que todos los promedios están sobre 2,

manifestando una tendencia hacia avisar o no hacer nada para realizar estas actividades. Las

que más puntúan en promedio hacia no tener que hacer nada son: si puede comprar cosas para

usted, para hacer amigos que su familia no conoce y para votar por algún candidato en especial.

Los coeficientes de variación más altos se presentan en: Para visitar parientes o amistades y Para

participar en actividades comunales.

Promedio Desviación

estándar

Coeficiente de

variación

Para trabajar por una remuneración 2,339 0,659 28%

Para ir a comprar cosas para el hogar 2,191 0,945 43%

Para visitar parientes o amistades 2,196 0,862 39%

Si puede comprar cosas para usted 2,557 0,729 29%

Para participar en actividades comunales 2,343 0,774 33%

Para hacer amigos(as) que su familia no

conoce

2,526 0,697 28%

Para votar por algún candidato en especial 2,656 0,649 24%

Tabla 7. Estadísticos descriptivos

Page 36: Análisis de componentes principales en la estimación de ...

36

La matriz de correlación (tabla 8) muestra que las asociaciones entre las variables analizadas no

son muy altas, teniendo como máximo el valor 0.53 entre comprar cosas para el hogar y para

visitar parientes o amistades; y el 0.50 entre para hacer amigos que su familia no conoce y

participar en actividades comunales.

Tabla 8. Matriz de correlaciones

Para integrar las 7 actividades se realiza un análisis de componentes principales obteniendo los

resultados que aparecen en la tabla 9, en donde se tiene que el primer factor explica el 49.27%

del total de la varianza, el segundo el 12.36% y los demás menos del 10% del total de la inercia

cada uno. De esta forma se tiene que con los dos primeros ejes se está explicando el 61.6% del

total de la inercia.

En este caso, solo el primer autovalor es mayor que 1, por lo que aplicando el criterio de Kaiser

se debería tomar solamente este; de igual forma el gráfico de sedimentación muestra que de

ahí en adelante no se gana un porcentaje de inercia importante.

Para trabajar

por una

remuneración

Para ir a

comprar

cosas para

el hogar

Para visitar

parientes o

amistades

Si puede

comprar

cosas para

usted

Para

participar

en

actividades

comunales

Para hacer

amigos(as)

que su

familia no

conoce

Para votar

por algún

candidato

en especial

Para trabajar por una

remuneración1,00

Para ir a comprar cosas para el

hogar0,39 1,00

Para visitar parientes o amistades 0,42 0,53 1,00

Si puede comprar cosas para

usted0,38 0,40 0,42 1,00

Para participar en actividades

comunales0,49 0,43 0,47 0,46 1,00

Para hacer amigos(as) que su

familia no conoce0,39 0,32 0,38 0,44 0,50 1,00

Para votar por algún candidato en

especial0,36 0,28 0,28 0,39 0,36 0,43 1,00

Page 37: Análisis de componentes principales en la estimación de ...

37

Tabla 9. Componentes principales Gráfico 10. Gráfico de sedimentación

Al graficar las componentes principales de las columnas (gráfico 11) se diferencian tres grupos

de variables, en donde en la parte superior se tienen aquellas en las que las mujeres tienen

mayor autonomía: hacer amigos que su familia no conoce, votar por algún candidato en especial

y comprar cosas para usted; en el segundo grupo están trabajar por un pago remunerado, y

participar en actividades comunales, las cuales son las que mayor porcentaje de mujeres deben

pedir permiso; mientras que en el tercero están comprar cosas para el hogar y visitar parientes

o amistades, en donde los porcentajes se dividen entre avisar y nada.

Gráfico 11. Gráfico de columnas de las componentes principales

Factor Autovalor PorcentajePorcentaje

acumulado

1 3,45 49,3 49,3

2 0,87 12,4 61,6

3 0,63 9,1 70,7

4 0,60 8,6 79,3

5 0,54 7,7 87,0

6 0,46 6,6 93,6

7 0,45 6,4 100,0

Page 38: Análisis de componentes principales en la estimación de ...

38

Al ver el comportamiento de cada variable en la primera componente (tabla 9), se tiene que

todas se relacionan de forma positiva, en especial para participar en actividades comunales

(0.77) y la que menos se relaciona es para votar por algún candidato en especial (0.62).

Tabla 9. Cargas de las componentes

El gráfico de correlaciones de las variables (gráfico 11), ratifica los tres grupos de variables

mencionados anteriormente. Allí se ve una clara contraposición de dos grupos en donde en la

parte superior están aquellos en los que la autonomía de la mujer es muy clara, mientras que

en el grupo 3, de la parte inferior de la gráfica, están las actividades en las que el mayor

porcentaje de las mujeres se divide entre avisar y no hacer nada. Muy cerca al eje están las

actividades en las que se encuentra el mayor porcentaje de mujeres que deben pedir permiso.

Variable Componente 1

Para trabajar por una remuneración 0,70

Para ir a comprar cosas para el hogar 0,68

Para visitar parientes o amistades 0,72

Si puede comprar cosas para usted 0,72

Para participar en actividades comunales 0,77

Para hacer amigos(as) que su familia no

conoce0,71

Para votar por algún candidato en

especial0,62

Page 39: Análisis de componentes principales en la estimación de ...

39

Gráfico 12. Gráfico de correlaciones

En este caso, como sólo se trabajó con una componente, el índice está compuesto por todos los

ítems evaluados anteriormente, por lo que se procede a calcularlo y estandarizarlo de la misma

forma en la que se hizo para calcular el índice de poder de decisión, y así obtener valores entre

0 y 1.

Índice de autonomía =∑ 𝒙𝒊

𝒏𝒊=𝟏

𝟐𝟏

Al aplicar el índice obtenido en la base de datos se tiene la distribución presentada en el

histograma del gráfico 13, en donde se ve una clara tendencia hacia valores altos de este; su

media es de 0.8 mostrando una tendencia hacia la autonomía de la mujer en la mayoría de las

actividades analizadas.

Page 40: Análisis de componentes principales en la estimación de ...

40

Gráfico 13. Histograma índice de autonomía

En este indicador el alfa de Cronbach es de 0.82, indicando que las variables utilizadas son

adecuadas para el cálculo del índice

Page 41: Análisis de componentes principales en la estimación de ...

41

4. Estimación del índice de Roles de género

Durante muchos años el rol de la mujer en el hogar ha sido asignado como subordinado al

hombre, lo cual la ha llevado a tener limitantes en cuanto a sus opciones y capacidades, por lo

tanto toma relevancia el analizar cuál es la postura de la mujer ante este hecho, es decir, si lo

acepta o lo rechaza y por ende su concepción como individuos iguales con los mismos derechos.

Para analizar este hecho se realizaron 11 preguntas en las que ellas deberían decidir si están de

acuerdo o en desacuerdo con los siguientes ítems:

Una buena esposa debe obedecer a su esposo en todo lo que ordene

Una mujer puede escoger a sus amistades aunque a su esposo no le guste

El hombre debe responsabilizarse de todos los gastos de la familia

Una mujer tiene la misma capacidad que un hombre para ganar dinero

Es obligación de la mujer tener relaciones sexuales con su esposo aunque ella no

quiera

Cuando la mujer no cumple con sus obligaciones el marido tiene derecho a pegarle

Las mujeres y los hombres tienen los mismos derechos para tomar sus decisiones

Las mujeres y los hombres tienen la misma libertad

Las mujeres tienen el derecho a defenderse y a denunciar cualquier maltrato y

agresión

Las mujeres tienen la posibilidad de decidir sobre su propia vida

Las mujeres tienen el derecho a vivir una vida libre de violencia

Como alternativas de respuesta se tienen: de acuerdo y en desacuerdo, pero en este caso la

valoración depende de la pregunta que se está realizando, allí la codificación 0 indica que se

mantienen los roles tradicionales, mientras que el 1 indica un cambio de pensamiento. De esta

forma la codificación se establece según la tabla 10:

Page 42: Análisis de componentes principales en la estimación de ...

42

Tabla 10. Codificación de las variables

En este caso se tomaron 7245 casos para el análisis y una vez codificadas las respuestas se tienen

los siguientes resultados:

Variable De acuerdo En desacuerdo

Una buena esposa debe obedecer a su esposo en todo lo que ordene 18% 82%

Una mujer puede escoger a sus amistades aunque a su esposo no le guste 65% 35%

El hombre debe responsabilizarse de todos los gastos de la familia 29% 71%

Una mujer tiene la misma capacidad que un hombre para ganar dinero 88% 12%

Es obligación de la mujer tener relaciones sexuales con su esposo aunque ella

no quiera

3% 97%

Cuando la mujer no cumple con sus obligaciones el marido tiene derecho a

pegarle

3% 97%

Las mujeres y los hombres tienen los mismos derechos para tomar sus

decisiones

95% 5%

Las mujeres y los hombres tienen la misma libertad 83% 17%

Las mujeres tienen el derecho a defenderse y a denunciar cualquier maltrato

y agresión

99% 1%

Las mujeres tienen la posibilidad de decidir sobre su propia vida 98% 2%

Las mujeres tienen el derecho a vivir una vida libre de violencia 99% 1%

Tabla 11. Resultados variables recodificadas

Con base en las respuestas observadas en las tabla 11, se tiene que la gran mayoría de las

mujeres se encuentran concentradas en un cambio de pensamiento en el rol de la mujer,

especialmente en cuanto al derecho a defenderse y denunciar cualquier maltrato o agresión y

tener la posibilidad de decidir sobre su propia vida.

Variable De acuerdoEn

desacuerdo

Una buena esposa debe obedecer a su esposo en todo lo que ordene 0 1

Una mujer puede escoger a sus amistades aunque a su esposo no le guste 1 0

El hombre debe responsabilizarse de todos los gastos de la familia 0 1

Una mujer tiene la misma capacidad que un hombre para ganar dinero 1 0

Es obligación de la mujer tener relaciones sexuales con su esposo aunque ella no quiera 0 1

Cuando la mujer no cumple con sus obligaciones el marido tiene derecho a pegarle 0 1

Las mujeres y los hombres tienen los mismos derechos para tomar sus decisiones 1 0

Las mujeres y los hombres tienen la misma libertad 1 0

Las mujeres tienen el derecho a defenderse y a denunciar cualquier maltrato y agresión 1 0

Las mujeres tienen la posibilidad de decidir sobre su propia vida 1 0

Las mujeres tienen el derecho a vivir una vida libre de violencia 1 0

Page 43: Análisis de componentes principales en la estimación de ...

43

En la matriz de correlaciones se puede ver que las asociaciones entre las variables son en su

mayoría bajas, a excepción de aquellas que tratan acerca de los derechos de las mujeres, la

posibilidad de decidir y tener una vida libre de violencia, en donde se tienen valores superiores

al 40% (Tabla 12) .

Tabla 12. Matriz de correlaciones

Para integrar las 11 posiciones frente a los roles de género se realiza un análisis de componentes

principales obteniendo los resultados que aparecen en la tabla 13, en donde se observa que el

primer factor explica el 21.6% del total de la varianza, y con el segundo se tiene un porcentaje

de varianza acumulado de tan solo el 35%. De esta forma, para lograr obtener un mayor

porcentaje de varianza explicada, y basados en el criterio de Kaiser se toman 4 factores para

tener un porcentaje acumulado de varianza del 54%.

Una buena

esposa

debe

obedecer a

su esposo

en todo lo

que ordene

Una mujer

puede

escoger a

sus

amistades

aunque a su

esposo no

le guste

El hombre

debe

responsabili

zarse de

todos los

gastos de la

familia

Una mujer

tiene la

misma

capacidad

que un

hombre

para ganar

dinero

Es

obligación

de la mujer

tener

relaciones

sexuales

con su

esposo

aunque ella

no quiera

Cuando la

mujer no

cumple con

sus

obligacione

s el marido

tiene

derecho a

pegarle

Las mujeres

y los

hombres

tienen los

mismos

derechos

para tomar

sus

decisiones

Las mujeres

y los

hombres

tienen la

misma

libertad

Las mujeres

tienen el

derecho a

defenderse

y a

denunciar

cualquier

maltrato y

agresión

Las mujeres

tienen la

posibilidad

de decidir

sobre su

propia vida

Las mujeres

tienen el

derecho a

vivir una

vida libre de

violencia

Una buena esposa debe obedecer a su esposo en

todo lo que ordene1,00

Una mujer puede escoger a sus amistades aunque

a su esposo no le guste0,15 1,00

El hombre debe responsabilizarse de todos los

gastos de la familia0,24 0,06 1,00

Una mujer tiene la misma capacidad que un

hombre para ganar dinero0,15 0,11 0,10 1,00

Es obligación de la mujer tener relaciones

sexuales con su esposo aunque ella no quiera0,13 0,05 0,08 0,12 1,00

Cuando la mujer no cumple con sus obligaciones el

marido tiene derecho a pegarle0,05 0,01 0,07 0,10 0,17 1,00

Las mujeres y los hombres tienen los mismos

derechos para tomar sus decisiones0,09 0,10 0,08 0,22 0,12 0,06 1,00

Las mujeres y los hombres tienen la misma

libertad0,20 0,15 0,11 0,21 0,09 0,02 0,22 1,00

Las mujeres tienen el derecho a defenderse y a

denunciar cualquier maltrato y agresión0,04 0,06 0,03 0,06 0,08 0,05 0,19 0,11 1,00

Las mujeres tienen la posibilidad de decidir sobre

su propia vida0,07 0,08 0,03 0,12 0,07 0,03 0,26 0,17 0,41 1,00

Las mujeres tienen el derecho a vivir una vida

libre de violencia0,03 0,05 0,02 0,07 0,07 0,06 0,17 0,10 0,50 0,45 1,00

Page 44: Análisis de componentes principales en la estimación de ...

44

Tabla 13. Matriz de correlaciones Gráfico Gráfico 14. Gráfico de sedimentación

Al graficar las componentes principales de las columnas (gráfico 15), se generan dos grupos de

variables en donde en la parte superior están aquellas que se refieren a los derechos de las

mujeres a decidir y a vivir una vida libre de agresiones, estas variables son: Las mujeres tienen

el derecho a defenderse y a denunciar cualquier maltrato y agresión, las mujeres tienen la

posibilidad de decidir sobre su propia vida, las mujeres tienen el derecho a vivir una vida libre

de violencia. En estas características la mayoría de las mujeres se oponen al rol tradicional.

En contraposición se encuentra en la parte inferior del gráfico 15, aquellas en las que la posición

de acuerdo o desacuerdo no es tan unánime como en el grupo anterior.

Gráfico 15. Gráfico de columnas de las componentes principales

Factor Autovalor PorcentajePorcentaje

acumulado

1 2,3278 21,16 21,16

2 1,5063 13,69 34,86

3 1,1003 10,00 44,86

4 0,9980 9,07 53,93

5 0,9111 8,28 62,21

6 0,8385 7,62 69,84

7 0,7785 7,08 76,91

8 0,7613 6,92 83,84

9 0,7073 6,43 90,27

10 0,5774 5,25 95,51

11 0,4935 4,49 100,00

0.0

0.5

1.0

1.5

2.0

d = 0.2

PUNTAJEAF1

PUNTAJEAF2

PUNTAJEAF3

PUNTAJEAF4

PUNTAJEAF5

PUNTAJEAF6

PUNTAJEAF7

PUNTAJEAF8

PUNTAJEAF9

PUNTAJEAF10

PUNTAJEAF11

Page 45: Análisis de componentes principales en la estimación de ...

45

Al ver el comportamiento de cada variable en las componentes (tabla 14) se tiene que en la

primera de ellas las variables que más aportan son aquellas que tratan acerca del rol de la mujer

cuando a exige sus derechos, su libertad y tener una vida libre de agresiones. El segundo factor

está determinado por la variable obediencia, la tercera se refiere a las obligaciones con su

cónyuge y sus relaciones con otras personas, mientras que el cuarto está determinado por las

responsabilidades de gastos en el hogar y la capacidad de la mujer para aportar dinero en el

hogar.

Tabla 14. Matriz de correlaciones Gráfico

De acuerdo con los resultados obtenidos, los factores quedan determinados de la siguiente

manera:

Componente 1: Está determinado por las siguientes variables, las cuales son las que más le

aportan: las mujeres y los hombres tienen los mismos derechos para tomar sus decisiones, las

mujeres y los hombres tienen la misma libertad, las mujeres tienen el derecho a defenderse y a

denunciar cualquier maltrato y agresión, las mujeres tienen la posibilidad de decidir sobre su

propia vida y las mujeres tienen el derecho a vivir una vida libre de violencia. Por lo tanto este

será el factor de derechos de las mujeres y la no violencia.

Variable Factor 1 Factor 2 Factor 3 Factor 4

Una buena esposa debe obedecer a su esposo en

todo lo que ordene0,34 0,52 0,12 -0,42

Una mujer puede escoger a sus amistades aunque a

su esposo no le guste0,28 0,28 0,37 0,08

El hombre debe responsabilizarse de todos los gastos

de la familia0,25 0,45 -0,05 -0,62

Una mujer tiene la misma capacidad que un hombre

para ganar dinero0,41 0,38 0,03 0,43

Es obligación de la mujer tener relaciones sexuales

con su esposo aunque ella no quiera0,31 0,27 -0,54 0,11

Cuando la mujer no cumple con sus obligaciones el

marido tiene derecho a pegarle0,19 0,19 -0,74 0,09

Las mujeres y los hombres tienen los mismos

derechos para tomar sus decisiones0,54 0,10 0,07 0,37

Las mujeres y los hombres tienen la misma libertad 0,46 0,33 0,31 0,18

Las mujeres tienen el derecho a defenderse y a

denunciar cualquier maltrato y agresión0,64 -0,46 -0,04 -0,17

Las mujeres tienen la posibilidad de decidir sobre su

propia vida0,67 -0,37 0,06 -0,04

Las mujeres tienen el derecho a vivir una vida libre

de violencia0,64 -0,48 -0,05 -0,16

Page 46: Análisis de componentes principales en la estimación de ...

46

Componente 2: Está conformado por la variable una buena esposa debe obedecer a su esposo

en todo lo que ordene, por lo tanto será el factor de obediencia.

Componente 3: Tiene como eje las variables: una mujer puede escoger a sus amistades aunque

a su esposo no le guste, es obligación de la mujer tener relaciones sexuales con su esposo

aunque ella no quiera, cuando la mujer no cumple con sus obligaciones el marido tiene derecho

a pegarle. Por lo tanto será el factor de relaciones con su cónyuge y con otras personas.

Componente 4: Está conformado por: el hombre debe responsabilizarse de todos los gastos de

la familia y una mujer tiene la misma capacidad que un hombre para ganar dinero, en

consecuencia será el de aporte económico de la mujer al hogar.

El gráfico de correlaciones de las variables (gráfico 16), ratifica los dos grupos de variables

determinados con el gráfico 15. Allí se ve una clara contraposición de dos grupos en donde en

la parte superior están aquellos en los las mujeres no están totalmente en desacuerdo con el rol

tradicional de la mujer, mientras que en la parte de abajo están aquellas en las que el cambio

de pensamiento acerca de los roles tradicionales de género se da casi en el 100% de las mujeres.

Gráfico 16. Gráfico de correlaciones

Page 47: Análisis de componentes principales en la estimación de ...

47

El índice de roles de género se calcula estandarizando los subíndices compuestos por las

variables que más aportan a cada factor y multiplicándolos por su factor de ponderación, tal

como se hizo en el índice de poder de decisión, teniendo como resultado la siguiente ecuación:

Í𝒏𝒅𝒊𝒄𝒆 𝒅𝒆 𝒓𝒐𝒍𝒆𝒔 𝒅𝒆 𝒈é𝒏𝒆𝒓𝒐 = 𝟎. 𝟑𝟗𝟐 ∗ 𝑺𝒖𝒃í𝒏𝒅𝒊𝒄𝒆 𝒇𝒂𝒄𝒕𝒐𝒓𝟏 + 𝟎. 𝟐𝟓𝟒 ∗ 𝑺𝒖𝒃í𝒏𝒅𝒊𝒄𝒆 𝒇𝒂𝒄𝒕𝒐𝒓𝟐 +

𝟎. 𝟏𝟖𝟓 ∗ 𝑺𝒖𝒃í𝒏𝒅𝒊𝒄𝒆 𝒇𝒂𝒄𝒕𝒐𝒓 𝟑 + 𝟎. 𝟏𝟔𝟖 ∗ 𝑺𝒖𝒃í𝒏𝒅𝒊𝒄𝒆 𝒇𝒂𝒄𝒕𝒐𝒓 𝟒

Al calcular el índice para las mujeres de la base de datos, se tiene la distribución dada en el

gráfico 17, que muestra una distribución asimétrica negativa, lo que indica que hay una postura

de género igualitaria en cuanto a roles de género, entre hombres y mujeres. El alfa de Cronbach

para este índice es de 0.53, muy inferior al valor esperado 0.8, lo que podría ser un indicador de

que es necesario realizar un cambio de preguntas hacia aquellas que permitan medir de mejor

forma los roles de género.

Gráfico 17. Histograma roles de género

Page 48: Análisis de componentes principales en la estimación de ...

48

Conclusiones

El análisis de componentes principales es una metodología muy poderosa que permite además

de reducir dimensiones, generar índices que aplicados en áreas como las ciencias sociales son

muy útiles.

Los resultados obtenidos en este trabajo, aun cuando siguen la misma metodología aplicada en

México, revelan hallazgos muy diferentes a los encontrados allí, debido principalmente al tipo

de mujeres seleccionadas para el análisis. Como se mencionó en los estadísticos descriptivos de

la base, la mayoría de las mujeres seleccionadas tienen su propio negocio, lo que las hace de

alguna manera personas más empoderadas, con mayor autonomía e inclinación hacia unos roles

de género mucho más equitativos.

Esto mismo no sucede en México debido a que la muestra es totalmente aleatoria y no tiene en

cuenta que las mujeres estén inscritas a un programa como el que existe en Colombia de

Mujeres Ahorradoras en Acción.

Uno de los puntos a mejorar en este análisis es el grupo de preguntas con el que se calcula el

índice de roles de género, debido a que el índice de Cronbach es bajo (0.53) y brinda una alerta

acerca de la utilidad de las preguntas analizadas para calcularlo. Se podría plantear un cambio

bien sea en el contenido de estas o en la forma en la que se pregunta ya que este tipo de

cuestionamientos, realizados de la manera en la que se hicieron, generan confusión en el

entrevistado, lo que puede llevar a encontrar resultados erróneos.

Page 49: Análisis de componentes principales en la estimación de ...

49

Bibliografía

1. http://www.dps.gov.co

2. Castro, Roberto y Casique Irene (2008). Violencia de género en las parejas mexicanas.

Análisis de resultados de la Encuesta Nacional sobre la dinámica de las relaciones en los

hogares 2006. Instituto Nacional de las mujeres. México.

3. Pardo, Campo Elías (2003). Lebart et al Statisquique exploratoire multimensionnelle

Traducción provisional. Universidad Nacional de Colombia.

4. Díaz, Luis G. Estadística multivariada: inferencia y métodos (2002). Universidad Nacional

de Colombia.

5. Anderson, T.W. (1984). An introduction to Multivariate Statistical Analysis. John Wiley

& Sons.

6. Gutiérrez, R. y González, A. (1991). Estadística Multivariable. Introducción al análisis

multivariante. Servicio de Reprografía de la Facultad de Ciencias. Universidad de

Granada.

7. Hair, J.; Anderson, R.; Tatham, R. y Black, W. (2000). Análisis Multivariante. 5ª Edición

(en español). Prentice Hall.

8. Johnson, R.A. y Wichern, D.W. (1988). Applied Multivariate Analysis. Prentice Hall

International,Inc.

9. Martínez Arias, R. (1999). El análisis multivariante en la investigación científica.

Colección Cuadernos de Estadística, 1. Hespérides.

10. Timm, N. H. (1975). Multivariate Analysis with applications in education and psychology.

Brooks/Cole Publishing.