ESTRATEGIAS Y DISEÑOS AVANZADOS DE INVESTIGACIÓN
SOCIAL
Titular: Agustín Salvia
MÓDULO 4 B
ANÁLISIS FACTORIAL
SEMINARIO DE POSGRADO
ANÁLISIS FACTORIAL
Identificación de estructuras subyacentes
Reducción de información
EN LA INVESTIGACIÓN SOCIAL SE TRABAJA CON MUCHOS CONCEPTOS COMPLEJOSCONCEPTOS COMPLEJOS QUE
NO SON DIRECTAMENTE OBSERVABLES
Creación de variables resumen
USOS MÁS FRECUENTES
El Análisis Factorial es una técnica que consiste en resumir la información contenida en una matriz de datos con V variables. Para ello se identifican un reducido número de factores F, siendo el número de factores menor que el número de variables. Los factores representan a la variables originales, con una pérdida mínima de información.
El modelo del Análisis Factorial se expresa como una combinación lineal de factores no directamente observables: Xij = F1i ai1 + F2i ai2+....+Fki aik + Vi
ANÁLISIS FACTORIAL
El Análisis Factorial (método factor principal) supone que existe un factor común subyacente a las variables.
Este método busca factores que expliquen la mayor parte de la varianza común. La varianza común es la parte de la variación de la variable que es compartida con las otras variables. La varianza única es la parte de la variación de la variable que es propia de esa variable.
ANÁLISIS FACTORIALFACTOR PRINCIPAL
El Análisis Factorial (método componentes principales) no supone que existe un factor común subyacente a las variables.
El Análisis de Componentes Principales busca hallar combinaciones lineales de las variables originales que expliquen la mayor parte de la variación total. El primer factor o componente sería aquel que explica una mayor parte de la varianza total, el segundo factor sería aquel que explica la mayor parte de la varianza restante, y así sucesivamente.
ANÁLISIS FACTORIALCOMPONENTES PRINCIPALES
Para que el Análisis Factorial tenga sentido deberían cumplirse dos condiciones básicas:
Parsimonia e Interpretabilidad
Según el principio de parsimonia el número de factores debe ser lo más reducido posible y estos deben ser susceptibles de interpretación sustantiva. Una buena solución factorial es aquella que es sencilla e interpretable.
ANÁLISIS FACTORIAL
ANÁLISIS FACTORIAL
Se asume que los factores únicos no están correlacionados entre sí ni con los factores comunes.
Se puede distinguir entre Análisis Factorial Exploratorio, donde no se conocen los factores "a priori“ sino que se identifican por el análisis factorial y, por otro lado estaría el Análisis Confirmatorio donde se propone "a priori" un modelo, según el cual hay unos factores que representan mejor a las variables originales.
1- Calcular la matriz de correlaciones entre todas las variables (conocida habitualmente
como matriz R).
2- Extracción de los factores necesarios para representar los datos. Análisis de la matriz de cargas.
3- Rotación de los factores con objeto de facilitar la interpretación. Representación gráfica.
4- Calcular las puntuaciones factoriales de cada individuo.
ANÁLISIS FACTORIALPASOS EN EL ANALISIS FACTORIAL
REQUISITOS PARA SU UTILIZACIÓN
Selección de variables que formen conjuntos correlacionados. Variables deben estar en escala métrica. Un mínimo de 100 casos
ANÁLISIS FACTORIAL
ANÁLISIS FACTORIALEJEMPLO
Se intentan conocer los determinantes de los ingresos de la ocupación principal de los asalariados. Dado que se supone que estos están asociados a un conjunto de características de la persona y del puesto. Dado que el conjunto de variables es grande y se sospecha que algunas de ellas están muy relacionadas, por lo que parece conveniente antes del análisis intentar determinar si existen subconjuntos diferenciados de ellas.
EXAMEN DE LA MATRIZ DE CORRELACIONES
1- El primer paso en el Análisis Factorial será calcular la matriz de correlaciones entre todas las variables que entran en el análisis.
2- Una vez que se dispone de esta matriz cabe examinarla para comprobar si sus características son adecuadas para realizar un Análisis Factorial.
3- Uno de los requisitos que deben cumplirse para que el Análisis Factorial tenga sentido es que las variables estén altamente correlacionadas.
ANÁLISIS FACTORIAL
EXAMEN DE LA MATRIZ DE CORRELACIONES
ANÁLISIS FACTORIALEJEMPLO
Correlation Matrix
1,000 ,281 ,136 ,379
,281 1,000 -,101 ,554,136 -,101 1,000 ,164,379 ,554 ,164 1,000
,000 ,000 ,000
,000 ,000 ,000,000 ,000 ,000,000 ,000 ,000
Tamaño delestablecimientoNivel de InstrucciónEdadCalificación laboralTamaño delestablecimientoNivel de InstrucciónEdadCalificación laboral
Correlation
Sig. (1-tailed)
Tamañodel
establecimiento
Nivel deInstrucción Edad
Calificación laboral
El Análisis Factorial extrae una matriz factorial:F 1 F 2
1 P11 P212 P12 P22
• Cada columna es un factor y cada fila una variable. Los elementos Pij pueden interpretarse como índices de correlación entre el factor i y la variable j.
• Estos coeficientes reciben el nombre de pesos o cargas factoriales. Las cargas indican el peso de cada variable en cada factor. Lo ideal es que cada variable cargue alto en un factor y bajo en los demás.
ANÁLISIS FACTORIALMATRIZ DE CARGA
FACTORIAL
ANÁLISIS FACTORIALEJEMPLO
Component Matrixa
,680 ,202
,775 -,412,185 ,931,859 1,103E-02
Tamaño delestablecimientoNivel de InstrucciónEdadCalificación laboral
1 2Component
Extraction Method: Principal Component Analysis.2 components extracted.a.
• El cuadrado de una carga factorial indica la proporción de la varianza explicada por un factor en una variable particular.
• La suma de los cuadrados de los pesos de cualquier columna de la matriz factorial es lo que denominamos eigenvalues, indica la cantidad total de varianza que explica ese factor.
• Las cargas factoriales pueden tener como valor máximo 1, por tanto el valor máximo que puede alcanzar el valor propio es igual al número de variables.
ANÁLISIS FACTORIALEIGENVALUES (VALORES
PROPIOS)
EXTRACCIÓN DE MATRIZ FACTORIAL
ANÁLISIS FACTORIALEJEMPLO
Communalities
1,000 ,504
1,000 ,7711,000 ,9001,000 ,738
Tamaño delestablecimientoNivel de InstrucciónEdadCalificación laboral
Initial Extraction
Extraction Method: Principal Component Analysis.
Total Variance Explained
1,836 45,910 45,910 1,836 45,910 45,910 1,821 45,531 45,5311,077 26,913 72,823 1,077 26,913 72,823 1,092 27,292 72,823,702 17,544 90,367,385 9,633 100,000
Component1234
Total% of
VarianceCumulativ
e % Total% of
VarianceCumulativ
e % Total% of
VarianceCumulativ
e %
Initial EigenvaluesExtraction Sums of Squared
Loadings Rotation Sums of Squared Loadings
Extraction Method: Principal Component Analysis.
• Se denomina "comunalidad" a la proporción de la varianza explicada por los factores comunes en una variable. La comunalidad es la suma de los pesos factoriales al cuadrado en cada una de las filas.
• El Análisis Factorial comienza sus cálculos a partir de lo que se conoce como matriz reducida compuesta por los coeficientes de correlación entre las variables y con las comunalidades en la diagonal.
• Como la comunalidad no se puede saber hasta que se conocen los factores, este resulta ser uno de los problemas del Análisis Factorial.
ANÁLISIS FACTORIALCOMUNALIDADES
La matriz factorial presenta un número de factores superior al necesario para explicar la estructura de los datos. Generalmente hay un conjunto reducido de factores, los primeros, que son los que explican la mayor parte de la variabilidad total. Los otros factores suelen contribuir relativamente poco.
Existen diversos criterios para determinar el número de factores a conservar. Uno de los más utilizados es la regla de Kaiser: "conservar aquellos factores cuyos valores propios (eigenvalues) son mayores a la unidad". Este criterio tiende a sobreestimar el número de factores.
ANÁLISIS FACTORIALNUMERO DE FACTORES A
CONSERVAR
La matriz factorial resulta difícil de interpretar pues no queda claro en que factor satura cada variable. Para facilitar la interpretación se realizan lo que se denominan rotaciones factoriales, la cual consiste en hacer girar los ejes de coordenadas, que representan a los factores, hasta conseguir que se aproxime al máximo a las variables en que están saturados. La saturación de factores transforma la matriz factorial inicial en otra denominada matriz factorial rotada, de más fácil interpretación. La matriz factorial rotada es una combinación lineal de la primera y explica la misma cantidad de varianza inicial.
ANÁLISIS FACTORIALROTACIONES
FACTORIALES
La matriz factorial debe reunir las siguientes características: 1- Cada factor debe tener unos pocos pesos altos y los otros próximos a 0. 2- Cada variable no debe estar saturada más que en un factor. 3- Los factores distintos deben presentar distribuciones de cargas altas y bajas distintas.
Con la rotación factorial aunque cambie la matriz factorial las comunalidades no se alteran, sin embargo, cambia la varianza explicada por cada factor. Existen varios métodos de rotación: ortogonales para factores independientes (Varimax) y oblicuos para factores correlacionados (Oblimin).
ANÁLISIS FACTORIALEVALUACIÓN DE LA MATRIZ
ROTADA
MATRIZ ROTADA
ANÁLISIS FACTORIALEJEMPLO
Rotated Component Matrixa
,645 ,296
,826 -,2985,196E-02 ,947
,849 ,132
Tamaño delestablecimientoNivel de InstrucciónEdadCalificación laboral
1 2Component
Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization.
Rotation converged in 3 iterations.a.
Component Transformation Matrix
,990 ,141-,141 ,990
Component12
1 2
Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization.
ANÁLISIS FACTORIALEJEMPLO
Component Plot in Rotated Space
Component 1
1,0,50,0-,5-1,0
Com
pone
nt 2
1,0
,5
0,0
-,5
-1,0
calificación laboral
edad
nivel de instrucción
tamaño del estableci
Dos cuestiones pueden ayudar a la interpretación y reconocimiento de los factores: 1) Ordenar la matriz rotada de forma que las variables con saturaciones altas en un factor aparezcan juntas. 2) Eliminar las variables con cargas factoriales bajas (aquellas por debajo de 0,25).
Llamaremos variable compleja a aquella que satura altamente en más de un factor y que no debe ser utilizada para identificar los factores. Factores bipolares, son aquellos en los que unas variables cargan positivamente y otras tienen carga negativa.
ANÁLISIS FACTORIALINTERPRETACIÓN DE RESULTADOS
Top Related