ANÁLISIS FACTORIAL.docx

ANLISIS FACTORIAL

En la siguientes seccin se estudia la tcnica del Anlisis Factorial. El contenido de esta seccin se divide en tres apartados: Presentacin del problema y de las situaciones donde este tipo de anlisis es relevante. Una breve introduccin a los fundamentos tericos del anlisis y a la nomenclatura utilizada habitualmente. Es recomendable que el lector revise esta seccin para comprender correctamente la utilizacin de esta tcnica, as como la interpretacin de los resultados obtenidos. Anlisis de un caso prctico mediante Anlisis Factorial. En este apartado se distinguen dos finalidades: a) exponer detalladamente cmo analizar datos mediante la tcnica del Anlisis Factorial mediante SPSS; y b) exponer el proceso del anlisis y la interpretacin de los resultados en un caso realista. Aspectos TericosAnlisis Factorial versus Anlisis en Componentes Principales

Estas dos tcnicas de anlisis tienen ciertos aspectos en comn, razn por la cual se utilizan de forma indistinta en muchos casos prcticos (aunque no siempre es correcto este uso indiscriminado). Ambas tcnicas tienen como finalidad ltima el obtener un conjunto de variables nuevas a partir de las variables originales. Lo interesante de estas tcnicas de anlisis es que el nmero de variables nuevo es mucho menor que el nmero inicial de variables.

De todos modos, no se debe olvidar que son dos tcnicas diferentes. El Anlisis Factorial (FA) distingue dos tipos de variabilidad en la matriz de correlaciones: una variabilidad que es comn a todas las variables (conocida como comunalidad) y otra variabilidad que es propia de cada variable (conocida como unicidad). La finalidad del AF es encontrar un nmero de variables reducido que permita explicar la variabilidad comn en la matriz de correlaciones. Por otra parte, el Anlisis de Componentes Principales (ACP) no realiza ninguna distincin, por lo que la variabilidad comn y la variabilidad especfica quedan confundidas. La finalidad del APC es encontrar un nmero de variables reducido que permita explicar la variabilidad total en la matriz de correlaciones.

El AF no es propiamente un mtodo de reduccin de informacin, ya que supone que las nuevas variables realmente existen aunque no sean directamente observables. Las puntuaciones de los sujetos en las variables no directamente observables (las que se estiman mediante el anlisis) determinan la puntuacin en las variables que s son observables (de las que parte el anlisis).

El ACP es propiamente un mtodo de reduccin de informacin, donde las variables obtenidas se ordenan de forma decreciente en funcin la cantidad de variabilidad total que explican. Este mtodo es de espacial inters cuando se busca reducir el nmero de variables, explicando cada variable nueva el mximo de varianza posible.

Desde un punto de vista aplicado, hay una relacin bastante clara entre los resultados del AF y del ACP: tendern a resultados similares cuando se analice un gran nmero de variables con poco error de medida o con una dispersin de errores similar en todas ellas. Es decir, cuando la unicidad sea baja o inexistente, ambos mtodos llevan a soluciones factoriales proporcionales.

En ambos casos el anlisis se realiza en tres pasos principales: (a) determinar si la matriz de correlaciones es adecuada para el anlisis; (b) determinar el nmero ptimo de variables nuevas (factores); y (c) determinar la relacin entre cada variable observada y las variables nuevas.

Antes de afrontar estos tres pasos, es preciso conocer cmo se presenta la informacin en este tipo de tcnicas de anlisis. Por otra parte, existe una nomenclatura muy particular sin la cul es difcil adentrase en el mundo del AF y el ACP.

Informacin y nomenclatura

Informacin en la rotacin ortogonal

Informacin en la rotacin oblicua

El anlisis parte de una matriz (conjunto de datos ordenados por filas y columnas) de datos directos. En esta matriz, las columnas se refieren a las variables observadas, mientras que las filas corresponden a las puntuaciones de los sujetos en cada una de las variables observadas. A partir de la matriz de datos directos, se obtiene la matriz de correlaciones desde donde se inicia el anlisis. Alternativamente, el anlisis se puede iniciar desde la matriz de covarianzas, aunque esta posibilidad no se va a considerar en este manual.

La finalidad del anlisis es obtener un conjunto de variables nuevas, cuyo nmero es inferior al que se tena originalmente. Cada una de estas variables nuevas se denomina factor o componente (dependiendo de si se realiza un AF o un ACP). Cada uno de los factores es una variable abstracta o latente (no directamente observable), as que ser preciso determinar qu mide en realidad cada factor. Dado que cada factor es en realidad una aglutinacin de variables (con las que el factor mantiene una relacin ms o menos directa), la mejor gua para interpretar el significado de cada factor es el conjunto de variables resumidas por dicho factor.

Una vez se ha realizado el anlisis se obtiene la conocida solucin factorial. La solucin consiste en una serie de matrices que resumen las relaciones entre las variables observadas y los factores. La solucin inicial resume en una nica matriz las relaciones entre las variables y los factores. Sin embargo, es una matriz compleja de interpretar por lo que no ayuda a determinar el significado de los factores.

Para solucionar el problema de determinar el significado de los factores, es preciso realizar una rotacin factorial. La rotacin factorial consiste en una transformacin de la solucin inicial, cuya finalidad es la de identificar el grado de relacin entre las variables observadas y los factores. Existen dos tipos de rotacin factorial: la rotacin ortogonal y la rotacin oblicua. En el primer tipo de rotacin la correlacin entre factores es siempre cero (es decir, las puntuaciones de los sujetos en las variables nuevas no correlacionan entre s). Esta rotacin es la ms simple ya que la informacin se resume en menos matrices. En el segundo tipo de rotacin se permite que, si es preciso, exista correlacin entre factores (es decir, las puntuaciones de los sujetos en las variables nuevas pueden hallarse correlacionados). Es importante indicar que la magnitud de la correlacin entre los factores depender de la complejidad de los propios datos: si existe una transformacin de la solucin inicial que para ser simple no requiere que los factores estn correlacionados, los factores no estarn correlacionados. Esta rotacin es ms compleja, ya que requiere interpretar ms matrices.

A continuacin se enumeran y se describen brevemente las matrices obtenidas despus de cada tipo de rotacin. Algunas de las matrices reciben nombres diferentes en la literatura factorial especializada. Por otra parte, SPSS nombra las matrices siguiendo una nomenclatura propia que no siempre coincide con la utilizada en la literatura. En las siguientes tablas se recogen las diferentes denominaciones posibles.

Informacin en la rotacin ortogonal Nombre de la matriz Denominacin en SPSS Descripcin de la matriz

Patrn factorial

Matriz de saturaciones Matriz de factores rotados Los elementos de esta matriz se denominan saturaciones, pesos o loadings. Indican la correlacin entre cada variable observada y cada factor.

Matriz de rotacin

Matriz de Transformacin Matriz de transformacin de los factores Consiste en una matriz de transformacin de la solucin original a la solucin rotada que carece de interpretacin terica.

Para interpretar la solucin factorial es preciso interpretar la Matriz de factores rotados. Las saturaciones se pueden interpretar en trminos de coeficientes de correlacin entre las variables observadas y los factores. Habitualmente, las saturaciones inferiores a 0,20 (aunque se pueden utilizar hasta valores de 0,40) en valores absolutos se toman como una correlacin despreciable. As pues, cada factor se define por las variables con saturaciones (positivas o negativas) ms altas (superiores a 0,20 en valores absolutos). Despus de la rotacin cada variable observada debera correlacionar (en trminos de saturaciones altas) con un nico factor, mientras que cada factor se debera definir por un mnimo de tres variables observadas (sin que existan grandes diferencias entre el nmero de variables que definen cada factor). Esta matriz es la ms importante de todas las obtenidas y ha de ser incluida en los resultados del anlisis.

Informacin en la rotacin oblicua Nombre de la matriz Denominacin en SPSS Descripcin de la matriz

Patrn factorial

Matriz de saturaciones Matriz de configuracin Los elementos de esta matriz se denominan saturaciones, pesos o loadings. Indican el peso entre cada variable observada y cada factor. Se deben interpretar como pendientes estandarizadas (betas) en un anlisis de regresin mltiple.

Matriz estructura Matriz estructura Los elementos esta matriz indican la correlacin entre cada variable observada y cada factor.

Matriz Phi

Matriz correlacin factorial Matriz de correlacin entre los factores Los elementos de esta matriz indican las correlaciones entre los factores.

Para interpretar la solucin factorial es preciso interpretar la Matriz de configuracin. El modo de interpretacin es similar al de la matriz de factores rotados en el caso ortogonal. En el caso oblicuo, las matrices ms importantes de todas las obtenidas son la Matriz de configuracin y la Matriz de correlacin entre los factores. As pues, han de ser necesariamente incluidas en los resultados del anlisis.

Evaluacin de la matriz de correlacin: ndices de adecuacin muestral

Los ndices de adecuacin hacen referencia a los ndices que indican si la matriz de correlacin se adecua a los supuestos de las tcnicas AF y ACP. Una matriz de correlacin apropiada debe presentar una variabilidad sistemtica entre las variables. Los dos ndices ms populares para evaluar la adecuacin de la matriz de correlaciones son el ndice de Esferidad de Bartlett (TEB) y el test de Kaiser-Meyer-Olkin (KMO).

Test de Esferidad de Bartlett

El TEB se utiliza como una prueba convencional de Ji-cuadrado y evala la hiptesis nula de que la matriz R muestral proviene de una poblacin en la que las variables no estn correlacionadas. Si no puede rechazarse la hiptesis, la solucin factorial reflejar relaciones debidas al azar y realmente inexistentes, por lo que la matriz de correlaciones no debe analizarse.

Test de Kaiser-Meyer-Olkin

El KMO indica hasta qu punto las asociaciones entre las variables pueden ser explicadas por un nmero de componentes o factores ms reducido que el de variables. Tiene un rango de valores entre 0 y 1 y se aconseja un valor mnimo de 0,5 para poder llevar a cabo el anlisis.

Determinacin del nmero ptimo de variables nuevas (factores) Mtodos de extraccin Nmero ptimo de factores Autovalor mayor de uno Grfico de Sedimentacin (Scree Test) Nmero de factores esperado Prueba de inferencia estadstica

En el AF y el ACP es preciso determinar el nmero de factores que componen la solucin factorial final. Por una parte, se debe determinar un mtodo de extraer factores y un mtodo para determinar cundo se han extrado suficientes factores. De otro modo, se podra a llegar a extraer un nmero de factores igual al nmero de variables. En este caso, el AF no tendra ninguna utilidad como tcnica para reduccin de la informacin.

Mtodos de extraccin

Existe una gran cantidad de mtodos de extraccin, por lo que se presenta un breve resumen de los ms habituales, as como su denominacin en SPSS. Mtodo de extraccin Denominacin en SPSS Descripcin del mtodo

Componentes Principales

ACP

PCA Componentes Principales Es el nico mtodo de extraccin relacionado con ACP. Los componentes se hallan estandarizados, por lo que se podra obtener una solucin rotada (esto no sucede en todos los programas estadsticos, as que se debe actuar con precaucin).

Anlisis factorial de ejes principales Ejes Principales Desde un punto de vista computacional es similar a los Componentes Principales, si bien la varianza total se divide en comunalidad mas unicidad.

Anlisis factorial de mnimos cuadrados residuales

MINRES

ULS Mn. cuadrados no ponderados Cada factor se obtiene con la finalidad de minimizar un criterio de suma de cuadrados. Es un mtodo recomendable cuando los datos definen una solucin factorial compleja.

Anlisis factorial por mxima verosimilitud

ML Mxima verosimilitud Cada factor se obtiene con la finalidad de maximizar un criterio de verosimilitud. Es un mtodo estadstico que permite evaluar la adecuacin del nmero de factores extrados mediante una prueba de Ji-cuadrado. Cuando los datos definen una solucin factorial compleja, podra no llegar a converger. Por otra parte, para interpretar el test de Ji-cuadrado requiere que las variables observadas presenten una distribucin normal multivariada.

Nmero ptimo de factores

La mejor solucin factorial posible representa un compromiso entre un nmero bajo de factores y una proporcin de varianza explicada alta. En un caso extremo, la solucin factorial presenta tantos factores como variables observadas se disponen. En este caso, el anlisis no tendra sentido ya que no se habra conseguido resumir la informacin (en el caso del ACP), o se asumira que cada factor se identifica perfectamente con una variable observada (en el caso del FA). Existen diferentes mtodos para determinar el nmero adecuado de factores.

Autovalor mayor de uno

La cantidad de varianza explicada mediante el nmero de factores extrados est directamente relacionada con los autovalores asociados a los factores: la suma de los autovalores es igual al total de la varianza explicada. Cuanto mayor sean los autovalores asociados a los factores extrados, mayor ser la cantidad de varianza explicada. Este mtodo establece que cada factor extrado debe tener un autovalor asociado igual o superior a 1 (aunque este valor se puede alterar). Considerando que los factores se extraen de forma consecutiva y que cada factor extrado presenta cada vez un autovalor asociado menor, la extraccin finaliza cuando el autovalor asociado al ltimo factor extrado es inferior a 1. En la prctica el criterio resulta muy arbitrario: la importancia (en trminos de proporcin de varianza explicada) de un factor cuyo autovalor asociado se halle alrededor de 1 depende directamente de la magnitud de los autovalores asociados a los factores ya extrados (e indirectamente a la cantidad de varianza comn existente en los datos). En situaciones con un nmero alto de variables, los primeros factores pueden obtener autovalores muy superiores a 1. En este caso, factores con autovalores asociados cuyo valor sea cercano a 1 pueden ser considerados no relevantes (ya que explicaran una proporcin de varianza pequea). Resumiendo, este criterio no es recomendable ya que en general lleva a extraer ms factores de los que en general se requieren.

Grfico de Sedimentacin (Scree Test)

El grfico de Sedimentacin se basa en el mismo principio que en el mtodo anterior (es decir, la suma de los autovalores es igual al total de la varianza explicada). Si bien en este caso se pretenden identificar los factores cuyo autovalor asociado sea lo suficientemente grande como para ser considerados. La decisin se toma representando los autovalores asociados a cada factor en un grfico. Los autovalores asociados a los factores iniciales son habitualmente altos, mientras que el valor de los autovalores decrece progresivamente a mediada que se extraen factores (presentando el grfico una pendiente pronunciada). Llega un punto en que los autovalores son bajos y similares entre ellos (presentando el grfico un pendiente mnima). El punto de inflexin donde cambia la tendencia del grfico pasando de una pendiente pronunciada a una pendiente mnima se toma como indicador del nmero de factores a extraer.

Este procedimiento es recomendable cuando el anlisis tenga un claro carcter exploratorio y se pretenda encontrar la mejor solucin posible. Se utiliza en el denominado Anlisis Factorial Exploratorio (AFE).

Nmero de factores esperado

Existen situaciones en las que se espera un nmero determinado de factores. Ya sea por las caractersticas propias de las variables observadas o por los resultados obtenidos en anlisis anteriores, existe una hiptesis previa sobre el nmero que se espera obtener. En este caso el criterio consiste en extraer ese nmero exacto de factores. Es recomendable acompaar este criterio de extraccin con alguno otro que nos permita determinar si el nmero de factores retenido ha sido apropiado. El grfico de sedimentacin o una prueba de inferencia estadstica seran adecuados.

Este procedimiento es recomendable cuando el anlisis tenga un carcter confirmatorio: se pretende confirmar la solucin que se suponan en los datos. Se utiliza en el denominado Anlisis Factorial Confirmatorio (AFC).

Prueba de inferencia estadstica

Al explicar el procedimiento de extraccin ML se ha apuntado que este mtodo de extraccin permite evaluar estadsticamente el ajuste del modelo propuesto. El test de bondad de ajuste del modelo (nmero de factores que se ha propuesto como el adecuado) se basa en un estadstico referido a la distribucin Ji-cuadrado. La hiptesis nula del test es que la matriz de correlacin entre variables observadas puede ser reproducida exactamente por el modelo en la poblacin. El rechazo de dicha hiptesis debera interpretarse como que el modelo propuesto no se cumple exactamente en la poblacin. En la prctica el modelo se espera que se cumpla aproximadamente.

Determinacin de la relacin entre variables observadas y factores Mtodos de rotacin ortogonal Mtodos de rotacin oblicua Como ya se ha indicado en un apartado previo (ver apartado), la finalidad ltima del AF no es tan slo determinar un nmero de factores, sino tambin el establecer la relacin entre las variables observadas y los factores. Esta identificacin se consigue mediante la rotacin factorial. Existen muchos mtodos de rotacin factorial, as que nos limitaremos a clasificar y comentar los disponibles en SPSS.

Mtodos de rotacin ortogonal Mtodo de rotacin Comentarios

Quartimax Este mtodo tiende a obtener un factor definido por muchas variables.

Varimax Es el mtodo ms popular y quizs el que determina soluciones ms simples.

Equamax Es muy eficiente pero muy poco utilizado en investigacin aplicada.

Mtodos de rotacin oblicua Mtodo de rotacin Comentarios

Oblimin Es el mtodo de rotacin oblicua ms popular y probablemente uno de los ms efectivos. Requiere definir el valor de un parmetro, siendo el valor cero el ms recomendable.

Promax Requiere definir el valor de un parmetro, siendo el valor cuatro el ms recomendable.

DESCRIPCIN DEL PROBLEMA

Supongamos que pretendemos medir la percepcin que las mujeres tienen de su propio cuerpo y de cmo esta percepcin afecta a su relacin con los dems, a su propia aceptacin y a sus hbitos alimentarios. En particular estamos interesados en medir cuatro variables: (a) la percepcin negativa que una mujer pueda tener de s misma; (b) su percepcin de hasta qu punto los dems la aceptan en funcin de su aspecto fsico; (c) hasta qu punto su aspecto fsico determina su propia aceptacin; y, finalmente, (d) su actitud hacia la ingesta de alimentos como medio de controlar su aspecto fsico. Obtener una puntuacin de una mujer particular en cada una de estas cuatro variables no es fcil, ya que ninguna de esas variables se puede observar directamente. Son variables denominadas latentes.

Una manera de abordar el problema consiste en medir variables que sean indicadores indirectos de cada una de las variables latentes, que son las que realmente nos interesan medir. Las variables que mediremos han de ser directamente observables. Cuanto mejores indicadores sean las variables observables (ms relacionadas estn con la variable latente), ms acertada ser nuestra apreciacin de la puntuacin de una mujer particular en cada una de las variables latentes. Dado que la relacin entre las variables que realmente medimos y las que nos interesan medir es indirecta, probablemente sea necesario medir ms de una variable observable para llegar a estimar con ms precisin la medida en la variable latente.

Un tipo de variables observables que se utilizan con frecuencia son los tems de un test. Cada tem de un test forma parte de un grupo de tems que se suponen relacionados con una variable latente. Si se pretende medir una nica variable latente, se dice que el test es unidimensional. Por el contrario, si se pretenden medir ms de una variable latente, se dice que el test es multidimensional. Para medir las cuatro variables que proponemos ms arriba, ser preciso un test con cuatro dimensiones: cada dimensin se debe identificar con un grupo de tems (o subescala del test total).

Con esta finalidad, los autores Cooper, Cohen-Tove, Todd, Wells y Tove (1997) propusieron el test: The Eating Disorder Belief Questionnaire (TEDBQ). Cada tem fue redactado para ser un indicador de una nica variable latente, si bien es de esperar que las puntuaciones en las variables latentes estn relacionadas (es decir, se observe correlacin entre las variables latentes). Los tems del test fueron los siguientes: Primera variable latente Nmero de tem Contenido del tem 1 I'm stupid 2 I'm no good 3 I'm a failure 4 I'm useless 5 I'm dull 6 I'm not a likeable person 7 I'm all alone 8 I don't like myself very much 9 I'm unloveable 10 I'm ugly Segunda variable latente Nmero de tem Contenido del tem 11 If my thighs are firm it means I'm a better person 12 If my hips are narrow it means I'm successful 13 If my bottom is small people will take me seriously 14 If I gain weight it means I'm a bad person 15 If I gain weight I'm nothing 16 If my body shape is in proportion people will love me 17 If my hips are thin people will approve of me 18 If I lose weight people will be friendly and want to get to know me 19 If I lose weight people will care about me 20 If I lose weight I'll count more in the world Tercera variable latente Nmero de tem Contenido del tem 21 If my stomach is flat I'll be more desirable 22 If my flesh is firm I'm more attractive 23 If my body is lean I can feel good about myself 24 If I eat desserts or puddings I'll get fat 25 Body fat/flabbiness is disgusting 26 If I eat bad foods such as fats, sweets, bread and cereals they will turn into fat Cuarta variable latente Nmero de tem Contenido del tem 27 If I've eaten something I have to get rid of it as soon as possible 28 If I binge and vomit I can stay in control 29 If I eat three meals a day like other people I'll gain weight 30 If I eat normally I'll gain weight 31 If I stay hungry I can guard against losing control and getting fat 32 If I eat a forbidden food I won't be able to stop

Cada mujer a la que se administra el test (es decir, el sujeto que responde al test) debe indicar en una escala de 1 a 100 cul es su postura respecto a cada uno de los tems. Un valor extremo de 1 se refiere a: "I do not usually believe this at all". Mientras que un valor extremo de 100 se refiere a: "I am usually completely convinced that this is true". Valores intermedios indican posturas ms o menos relacionadas con cada extremo. A los sujetos se les pidi responder basndose "on what you emotionally believe or feel, not on what rationally believe to be true and try to choose the rating that best describes what you usually believe or what you believe most of the time". La estimacin de la puntuacin del sujeto en una variable latente se obtiene mediante la suma de las respuestas en cada uno de los tems que son indicadores de dicha variable latente.

Por el momento hemos supuesto que cada tem es realmente un indicador correcto de una de las cuatro variables latentes. Sin embargo, esta suposicin podra no ser correcta. De hecho, se plantean muchos interrogantes a esta suposicin. Hasta qu punto podemos afirmar que realmente subyacen cuatro variables latentes en el test? Podra ser que en realidad haya ms variables latentes? O por el contrario, podra ser que en realidad haya menos variables latentes? Si finalmente podemos afirmar que subyacen cuatro variables latentes, hasta qu punto los tems son buenos indicadores de estas dimensiones? Cada tem es un indicador de la variable latente que se le supone? Las variables latentes se hallan correlacionadas?

Para responder a estas preguntas, Cooper y colaboradores (1997) administraron el test a 249 mujeres y analizaron las respuestas a los tems mediante la tcnica del Anlisis Factorial. Para entender porqu optaron por esta tcnica de anlisis y las respuestas a las preguntas anteriores es imprescindible hacer un inciso en los aspectos tericos de la tcnica. A continuacin, replicaremos los anlisis realizados por los autores mediante el programa SPSS. El fichero de datos para ser analizado es eating.sav. Finalmente, responderemos a las preguntas planteadas. Anlisis de un caso prcticoDisposicin de los datos

Cmo se puede apreciar en el fichero de datos, cada columna se refiere a un tem del cuestionario, mientras que cada fila se refiere a las respuestas de cada sujeto a cada uno de los tems. En la figura se puede observar que se ha incluido una primera columna para incluir un identificador numrico para cada sujeto. Tambin se puede apreciar que la etiqueta de los tems corresponde al enunciado de cada tem. De este modo, las tablas de resultados ya incluyen el contenido de los tems, por lo que ser ms fcil elaborar el informe de resultados.

Configuracin del anlisis por mensDescriptivos

Pulsando el botn Descriptivos se activa la ventana Anlisis Factorial: Descriptivos. En esta ventana se deben seleccionar la opcin Solucin inicial y la opcin KMO y prueba de esfericidad de Bartlett. La primera permite obtener un listado detallado de las comunalidades estimadas antes y despus del anlisis, as como de la proporcin de varianza explicada por cada factor, incluso de los factores que no se llegan a extraer. La segunda opcin muestra los ndices de adecuacin de la matriz de correlacin a los supuestos del modelo. Configuracin del anlisis por sintaxis

El anlisis factorial configurado mediante mens se poda haber realizado mediante la sintaxis habitual del SPSS. En la siguiente figura se muestra el programa que hubiese sido necesario.

Extraccin

Pulsando el botn Extraccin se activa la ventana Anlisis Factorial: Extraccin. En esta ventana se deben seleccionar el mtodo de extraccin que se considera adecuado. En este anlisis se ha seleccionado el mtodo Mn. cuadrados no ponderados (MINRES), por lo que el anlisis es realmente un Anlisis Factorial. Por otra parte, se ha seleccionado la opcin Solucin factorial sin rotar y la opcin Grfico de sedimentacin. La primera muestra la matriz factorial (solucin factorial inicial). Aunque es una matriz difcil de interpretar, resulta conveniente inspeccionarla. La segunda opcin permite determinar el nmero adecuado de factores a retener segn la prueba Scree Test.

En la figura tambin se puede observar que se ha seleccionado un nmero exacto de factores (cuatro en este caso), mediante la opcin Nmero de factores. As pues, la finalidad de este primer anlisis es la de confirmar la estructura factorial propuesta por Cooper y colaboradores (1997). La opcin Autovalores mayores que: permite aplicar el criterio de Autovalor mayor que uno explicado previamente (ntese que el valor por defecto es 1 ya que es el valor ms habitual). Finalmente, si la convergencia del mtodo de extraccin requiere ms de 25 iteraciones, se finalizar el anlisis con un mensaje de aviso de que ha sido imposible converger la solucin. A la prctica, si una solucin no converge con 25 iteraciones, dada la eficiencia de clculo actual de los ordenadores, este valor se puede aumentar. Si el mtodo no converge, por ejemplo, en 100 iteraciones entonces se puede concluir que los datos son demasiado complejos para ser analizados mediante el mtodo de extraccin seleccionado. Habitualmente, el mtodo MINRES converge rpidamente en pocas iteraciones incluso con datos complejos.Rotacin

Pulsando el botn Rotacin se activa la ventana Anlisis Factorial: Rotacin. Dado que es posible que los cuatro factores extrados se hallen correlacionados, se va a realizar una rotacin oblicua de los factores. Para ello, se ha seleccionado el mtodo de rotacin Oblimin directo con el valor del parmetro delta igual a cero (que de hecho es el valor por defecto). Por otra parte, se ha seleccionado la opcin mostrar la Solucin rotada. esta opcin muestra las matrices Matriz de configuracin, Matriz de estructura y Matriz de correlaciones entre factores. Son de especial inters la primera y la tercera. La opcin Grficos de saturaciones no ha sido seleccionada en este caso. Sin embargo, en los dos anlisis siguientes s que ser seleccionada. Esta opcin representa de forma grfica la solucin factorial.

Finalmente, si la convergencia del mtodo de rotacin requiere ms de 25 iteraciones, se finalizar el anlisis con un mensaje de aviso de que ha sido imposible converger la rotacin. Una vez ms, si una solucin no converge con 25 iteraciones este valor se puede aumentar. Si el mtodo no converge, por ejemplo, en 100 iteraciones se puede concluir que la solucin factorial es demasiado compleja para ser rotada mediante el mtodo seleccionado.Puntuaciones

Pulsando el botn Puntuaciones se activa la ventana Anlisis Factorial: Puntuaciones factoriales. La finalidad de esta ventana es determinar qu procedimiento se debe utilizar para estimar las puntuaciones de los sujetos en los factores (en las variables latentes). Despus del anlisis las puntuaciones en las variables latentes se incluirn como columnas en la ventana de datos del SPSS.

En la figura se puede observar que se ha seleccionado el mtodo Regresin. En la practica, es recomendable no activar ningn mtodo (desactivar la opcin Guardar como variables) hasta que no se determine con seguridad el nmero de factores ms adecuado.Opciones

Pulsando el botn Opciones se activa la ventana Anlisis Factorial: Opciones. La finalidad de esta ventana es configurar el tratamiento de las respuestas faltantes y la presentacin de los datos en las matrices factoriales. Para interpretar la solucin rotada, resulta de ayuda el no imprimir las saturaciones que presenten valores cercanos a cero (ya que son saturaciones que se consideran residuales). En este caso se eliminan de las matrices las saturaciones que sean menores de 0.30 en valores absolutos.

No obstante, es importante indicar que en el informe final de resultados se deben incluir necesariamente todas las saturaciones (incluso las que se consideren residuales). En todo caso, se puede formatear la tabla para que las saturaciones salientes se impriman, por ejemplo, en negrita con la finalidad de facilitar su comprensin visual.Extraccin de cuatro factores ndices de adecuacin muestral Comunalidades Decisin del nmero de factores Solucin factorial rotada Conclusion del estudio

ndices de adecuacin muestral La matriz de correlacin cumple perfectamente los requisitos para ser analizada mediante AF. La prueba de esfericidad indica que la matriz difiere significativamente de una matriz donde las variables no correlacionan. Por otra parte, la prueba de KMO es muy alta, indicando que existe una variabilidad sistemtica en la matriz.

Comunalidades

El mtodo estima las comunalidades de las variables antes y despus del anlisis. Se puede observar que las comunalidades finales son, en general, altas. De hecho, esta es una propiedad muy apreciada de un cuestionario, ya que si las comunalidades son altas el cuestionario puede ser validado incluso con muestras de sujetos relativamente pequeas (en la literatura especializada se propone un mnimo de 60 sujetos cuando las comunalidades son muy altas, y un mnimo de 500 cuando las comunalidades son muy bajas).

Decisin del nmero de factores

En la configuracin inicial hemos propuesto extraer cuatro factores con la intencin de comprobar si realmente es el nmero ms adecuado de factores. Para evaluar la dimensionalidad (nmero de factores), disponemos de dos informaciones: la magnitud de los autovalores (indicadores de la cantidad de varianza explicada por los factores) y la proporcin de varianza explicada por cada factor (as como la proporcin varianza explicada total). Esta informacin se muestra en la siguiente tabla:

Como se puede apreciar, el primer factor explica un total de varianza de 17.28 (que representa el 53.145% de la varianza), mientras que el segundo explica un total de 3.46 (que representa el 9.789% de la varianza), siendo la proporcin total del 62.934%. Los otros dos factores explican una proporcin de varianza mucho ms baja. Ntese que si se hubiese extrado un quinto factor hubiese explicado una varianza total de 0.53 (este dato aparece en la segunda columna de la tabla).

Por otra parte, la prueba del Scree Test parece indicar igualmente una diferencia importante entre el segundo y el tercer factor (a partir del cual todos los factores explican cantidades de varianza similares). Esta prueba se presenta en la siguiente figura.

La conclusin es que el cuestionario es casi unidimensional (ya que el primer factor explica una cantidad de varianza muy alta respecto a los dems), si bien es posible aceptar la existencia de un segundo factor. En este punto, no sera preciso estudiar la solucin rotada, sino ms bien volver a iniciar el anlisis con dos factores. No obstante, en este manual se estudia la solucin rotada con una finalidad didctica.

Finalmente, apuntar que el criterio de extraccin de un autovalor mayor de uno hubiese reforzado nuestra hiptesis inicial de que existen cuatro factores (ya que el cuarto factor es el ltimo que ha presentado un auto valor mayor de uno). Sin embargo, los otros cirterios apuntan a una solucin bifactorial en el mejor de los casos.

Solucin factorial rotada

Previa a la inspeccin de la solucin factorial rotada, se obtiene la solucin factorial inicial. Como se puede apreciar en la siguiente tabla, es una solucin difcil de interpretar.

A continuacin se obtiene el patn factorial rotado (donde las saturaciones menores de 0.30 en valores absolutos no se muestran). Como se puede observar, los diez tems que se suponan relacionados con la variable latente percepcin negativa que una mujer pueda tener de s misma, presentan saturaciones altas slo en el segundo factor. Esto implica que todos estos tems se comportan correctamente, y que hemos podido determinar una variable latente (el segundo factor en este caso) que explica las respuestas de los sujetos en estos diez primeros tems. Lo mismo sucede en los dos grupos de diez y seis tems siguientes, por lo que las variables latentes la percepcin de hasta qu punto los dems la aceptan en funcin de su aspecto fsico (el primer factor en este caso) y hasta qu punto su aspecto fsico determina su propia aceptacin (el tercer factor en este caso) tambin pueden considerarse identificadas. Finalmente, los seis tems finales deberan relacionarse con un nico factor (el cuarto en este caso), si bien las saturaciones son ms bajas y dos tems (los dos ltimos) presentan saturaciones significativas en otras dimensiones. Por lo tanto, la variable latente actitud hacia la ingesta de alimentos como medio de controlar su aspecto fsico no ha sido tan bien identificada como hubiese sido de esperar.

A continuacin se muestra la matriz estructura que indica la correlacin entre los tems y los factores. La mayora de los tems muestra correlaciones altas con los cuatro factores, mientras en la solucin pareca mucho ms simple cuando se ha inspeccionado el patrn factorial. Cuando se observa esta situacin es debido, como veremos a continuacin, a que existe una correlacin alta entre las puntuaciones en los factores.

Finalmente, la solucin factorial rotada requiere estudiar la correlacin entre las puntuaciones de los factores. Al aplicar un mtodo de rotacin oblicuo, se ha dado libertad para que los factores correlacionen (si es que era preciso para obtener un patrn factorial simple). La matriz de correlaciones entre factores se presenta a continuacin.

Las correlaciones ms altas se observan entre los factores 1, 3 y 4, que son los relacionados con la autopercepcin del aspecto fsico.

Conclusin del estudio

La matriz de correlaciones es vlida para ser analizada, si bien la estructura factorial de cuatro factores no se ha visto completamente reforzada. La solucin parece ser bifactorial. No obstante, al extraer cuatro factores, slo dos tems no se comportan como era de esperar (parecen mejores indicadores de otros factores diferentes de los que inicialmente cabra esperar). Por otra parte, las puntuaciones en los cuatro factores muestran una correlacin alta, especialmente entre los tres factores relacionados con la autopercepcin del aspecto fsico. Extraccin de dos factores Solucin factorial rotada Presentacin grfica bidimensional Conclusin del estudio Como consecuencia de los resultados obtenidos en el estudio anterior, se pasa a reanalizar la matriz de correlaciones, pero extrayendo dos factores en esta ocasin. La nica diferencia es que en esta ocasin en la ventana Anlisis Factorial: Extraccin se ha seleccionado el nmero exacto de dos factores, mediante la opcin Nmero de factores. Otra diferencia es que la ventana Anlisis Factorial: rotacin se ha seleccionado la opcin Grficos de saturaciones. Esta opcin representa de forma grfica la solucin factorial (que es una representacin muy informativa cuando la solucin es bidimensional).

Dado que las variables que se estudian son las mismas que en el caso anterior (los mismos tems), no hace falta volver a comentar los ndices de adecuacin, ni volver a revisar cuantos factores seran adecuados (ya que esta informacin es idntica a la obtenida en el anlisis de con cuatro factores). Las comunalidades s que han de variar (siendo ms bajas en este caso). Dado que la diferencia es mnima, tampoco van a ser comentadas.

Respecto a la solucin factorial rotada slo se comentan el patrn factorial y la matriz de correlaciones entre factores (si bien el lector puede consultar la matriz estructura en su propio ordenador).


El patrn factorial muestra una clara solucin bifactorial. Los tems relacionados con la autoestima definen el segundo factor (con saturaciones muy altas, excepto en un tem que presenta una saturacin algo inferior). Este factor es pues un factor de autoestima. El resto de tems definen el primer factor, siendo todas las saturaciones muy altas (excepto en un tem que muestra una saturacin algo inferior). Este primer factor es un factor de autopercepcin del aspecto fsico. El primer factor es un factor muy bien definido, que explica una proporcin de varianza muy alta, mientras que el segundo factor explica un proporcin menor de varianza (probablemente porque est definido por menos variables).

La matriz de correlaciones entre factores muestra una correlacin alta entre las puntuaciones en los factores. Esta correlacin indica que la autoestima y la autopercepcin del aspecto fsico estn muy relacionadas.

Presentacin grfica bidimensional

La representacin grfica de la solucin es muy informativa. Se puede apreciar que los tems (representados como los puntos del grfico) se agrupan muy bien entorno a los factores (representados como los ejes del grfico).

Cabe apuntar que la representacin generada por el SPSS en el caso de la rotacin oblicua no es muy realista. Si los factores estn relacionados, el ngulo entre los ejes del grfico debera ser mostrado como un ngulo obtuso, y no como un ngulo recto de 90 grados (que ms bien indica ausencia de correlacin).


La conclusin del estudio es que la solucin bifactorial responde muy bien a los datos obtenidos. Un factor muy bien definido por un nmero alto de tems se puede interpretar como un factor de autopercepcin del aspecto fsico, mientras que un segundo grupo de tems definen un segundo factor de autoestima (que explica menos varianza por estar definido por un nmero muy inferior de tems). Por otra parte, ambos factores muestran una correlacin muy alta.

La siguiente cuestin que surge es: si se analizan nicamente los tems que definen el primer factor (autopercepcin del aspecto fsico), que es un grupo muy alto de tems, se agruparn los tems entorno a las tres variables latentes que se pretendan medir? Dado que eran tres variables relacionadas con la autopercepcin del aspecto fsico, ya era de esperar que pudiesen llegar a formar un nico factor (especialmente cuando se las analiza junto con tems que miden otra variable latente). Pero si se analizan por separado, obtendramos las tres variables latentes (factores) que se esperaban? Para responder a esta pregunta es preciso reanalizar los tems que hacen referencia a la autopercepcin del aspecto fsico por separado y extraer tres factores. Extraccin de tres factores ndices de adecuacin muestral Decisin del nmero de factores Solucin factorial rotada Presentacin grfica tridimensional Conclusin del estudio

En el siguiente ejemplo se analizan 22 tems del cuestionario (del tem 11 al tem 32), los tems relacionados con la autopercepcin del aspecto fsico, mediante AF. La finalidad del anlisis es la siguiente. En los dos anlisis anteriores se ha constatado que estos tems son unidimensionales (es decir, se agrupan en torno a un nico factor). Ahora bien, si se analizan estos tems por separado mediante AF y se extraen tres factores, cada uno de los factores corresponder con una de las variables latentes que se pretendan medir? Dicho de otro modo, el factor general puede ser divido en tres subfactores segn el contenido de los tems que los definen? En la literatura especializada, algunos autores defienden que la unidimensionalidad es la suma de varias dimensiones menores y muy correlacionadas. Si esto es cierto, en nuestro caso deberamos obtener tres factores perfectamente identificados por los contenidos de los tems y altamente correlacionados.

En la ventana Anlisis Factorial se han seleccionado slo los tems que se pretenden analizar. Por otra parte, en la ventana Anlisis Factorial: Extraccin se ha seleccionado el nmero exacto de tres factores, mediante la opcin Nmero de factores. Finalmente, la ventana Anlisis Factorial: rotacin se ha seleccionado la opcin Grficos de saturaciones. Esta opcin representa de forma grfica la solucin factorial (que permitir una representacin tridimensional de la solucin factorial).

En este ejemplo no se revisan todas las matrices obtenidas, sino que se comentan nicamente las ms interesantes.

ndices de adecuacin muestral

La matriz de correlacin cumple perfectamente los requisitos para ser analizada mediante AF. La prueba de esfericidad indica que la matriz difiere significativamente de una matriz donde las variables no correlacionan. Por otra parte, la prueba de KMO es muy alta, indicando que existe una variabilidad sistemtica en la matriz.

Decisin del nmero de factores

En la configuracin hemos propuesto extraer tres factores con la intencin de comprobar si realmente es el nmero ms adecuado de factores. Para tomar esta decisin consideraremos el total de varianza explicada y la proporcin de varianza explicada por cada factor. Esta informacin se muestra en la siguiente tabla:

Como se puede apreciar, el primer factor explica un total de varianza de 13.984 (que representa el 62.389% de la varianza). El segundo factor explica un total de varianza de 1.559 (que representa el 5.739% de la varianza). Finalmente, el tercero explica un total de 1.156 (que representa el 3.922% de la varianza) siendo la proporcin total del 72.05%. Es interesante destacar que el siguiente factor habra explicado una varianza total de 0.536.

La prueba del Scree Test indica igualmente una diferencia importante entre el primer y el segundo factor. Esta prueba se presenta en la siguiente figura.

Observando estos datos, se llega a la conclusin que ya hemos obtenido previamente: este conjunto de tems es prcticamente unidimensional (ya que el primer factor explica una cantidad de varianza muy alta respecto a los dems). De todos modos, recordemos que la finalidad de este anlisis es extraer tres factores para comprobar si el factor general se divide en tres subfactores bien delimitados por los contenidos de los tems que los definen. Por el momento podemos observar que se pueden considerar los tres factores (aunque dos de ellos explican poca varianza). A continuacin es importante estudiar la solucin rotada.


El patrn factorial rotado (donde las saturaciones menores de 0.30 en valores absolutos no se imprimen) se muestra a continuacin.

Como se puede observar, los diez primeros tems muestran saturaciones altas en el primer factor, mientras que los seis tems siguientes muestran saturaciones altas en el segundo factor. As pues, cada uno de estos factores corresponde a las variables latentes la percepcin de hasta qu punto los dems la aceptan en funcin de su aspecto fsico (el primer factor) y hasta qu punto su aspecto fsico determina su propia aceptacin (el segundo factor). Finalmente, los seis tems finales se relacionan con el tercer factor, si bien las saturaciones son ms bajas y un tem (el ltimo) presenta una saturacin significativa en otra dimensin. Pese a estas limitaciones, la variable latente actitud hacia la ingesta de alimentos como medio de controlar su aspecto fsico ha sido tambin identificada.

Finalmente, la solucin factorial rotada requiere estudiar la correlacin entre las puntuaciones de los factores. Como se ha apuntado previamente, es de esperar que los factores se encuentren muy correlacionados. La matriz de correlaciones entre factores se presenta a continuacin.

Como era de esperar las correlaciones son de hecho altas.

Presentacin grfica tridimensional

La representacin grfica tridimensional requiere encontrar el punto de vista que mejor clarifique cmo los tems (representados como los puntos del grfico) se agrupan entorno a los factores (representados como los ejes del grfico). Prcticamente siempre es necesario cambiar el punto de vista del grfico (e incluso es recomendable probar puntos de vista alternativos). Para ello se debe pulsar dos veces consecutivas el botn del ratn a la vez que se sita el puntero sobre el grfico. De este modo el grfico se activa en modo edicin, apareciendo una barra de herramientas en la parte superior de la pantalla:

En esta barra de herramientas, se debe pulsar el botn Activar/desactivar modo de giro (en la figura corresponde al ltimo botn). A continuacin se activa una nueva barra de herramientas:

Pulsando sobre los diferentes botones de la barra, el punto de vista cambia. Se invita al lector a probar diferentes puntos de vista, e incluso cambiar el punto de vista de forma sistemtica para obtener una impresin de tridimensionalidad ms real. En nuestro caso nos parece adecuado el siguiente punto de vista:

Desde este punto de vista se puede observar que el primer factor es el mejor definido (un nmero mayor de tems se agrupa alrededor de este primer factor, formando un ncleo relativamente compacto). Entre los factores dos y tres se puede observar que hay un par de tems (segn el patrn factorial podran ser los tems 26 y 32). Estos son los tems ms complejos del anlisis, ya que parecen estar relacionados con dos factores.

Una vez finalizada la edicin del grfico, el aspecto final es el mostrado en la siguiente figura.


La conclusin de este estudio es que el factor general de autopercepcin del aspecto fsico puede ser divido en tres subfactores que muestran entre ellos una alta correlacin. Conclusin final despus de los tres anlisis

Los 32 tems del cuestionario estudiado han sido analizados mediante AF. Esta tcnica ha sido utilizada por el hecho de que los tems se han tomado como indicadores indirectos de cuatro variables latentes (factores). Han sido necesarios tres anlisis antes de comprender exactamente la estructura factorial de estos tems. Las conclusiones generales a las que se ha llegado son las siguientes: Los 32 tems del cuestionario definen dos factores (o variables latentes). Los diez primeros tems definen un factor de autoestima, mientras que los 22 restantes tems definen un factor de autopercepcin del aspecto fsico. El factor de autopercepcin del aspecto fsico puede ser dividido en tres subfactores altamente correlacionados. Estos factores son (1) la percepcin de hasta qu punto los dems la aceptan en funcin de su aspecto fsico, (2) hasta qu punto su aspecto fsico determina su propia aceptacin y (3) actitud hacia la ingesta de alimentos como medio de controlar su aspecto fsico.

Los autores originales del cuestionario ya consideraron en su artculo los aspectos positivos y negativos de incluir en su cuestionario (inicialmente desarrollado para detectar alteraciones en la ingesta de alimentos debidos a la autopercepcin del aspecto fsico) tems relacionados con una variable latente de autoestima. Uno de los inconvenientes es que la presencia de un grupo de tems tan diferenciado (tems de autoestima) respecto al grupo central de tems (tems de autopercepcin del aspecto fsico) puede provocar que la estructura factorial del cuestionario sea bifactorial: un factor para cada tipo de tems. La estructura interna de los tems relacionados con la autopercepcin del aspecto fsico aparece con mayor claridad cuando estos tems se analizan por separado. Sin embargo, los autores consideraron positivo el hecho de facilitar una escala de autoestima en su propio cuestionario con la finalidad de reducir el trabajo del psiclogo: con la administracin de un nico cuestionario se obtienen estimaciones de las puntuaciones del sujeto en las cuatro variables latentes que parecen ser relevantes.

ANÁLISIS FACTORIAL.docx

Documents

Transcript of ANÁLISIS FACTORIAL.docx