7/26/2019 Diapositivas Tema3 ACP Color
1/19
Anlisis de Componentes
Principales
Mtodos Estadsticos en OrdenadorGrado en Relaciones Laborales y Recursos Humano s
7/26/2019 Diapositivas Tema3 ACP Color
2/19
Introduccin: ACP y AF
Sintetizar grandes cantidades de datos
Eliminar informacin redundante
Conservar mxima informacin
Descubrir factores subyacentes en los datos
ANLISIS MULTIVARIANTE
REDUCCIN DE DATOS
Representar un conjunto devariables observadas mediante
un nmero pequeo de nuevasvariablesconstruidas como
combinaciones lineales de las
originales, denominadas
componentes principales.
Descubrir las relacionesexistentes entre diversas
variablesy expresarlas entrminos de unas pocas variables
aleatorias subyacentes y no
observables, llamadas factores.
Anlisis de ComponentesPrincipales (ACP) Anlisis FACTORIAL (AF)
Pearson (1901)Hottelling (1933)
Pearson (1901)
Spearman (1904)
7/26/2019 Diapositivas Tema3 ACP Color
3/19
ACP como caso particular de AFObjetivo:
En trminos generales el anlisis de componentes principales buscaunas pocas combinaciones lineales de las variables, a las que se
denominan componentes principales, que permitan resumir los datos,procurando que en el proceso se pierda la menos informacin posible.
Caractersticas deseables:
REDUCCIN DE LA DIMENSIONALIDAD. Se pretende que elnmero de componentes principales sea menor que el de variablesoriginales.
ORTOGONALIDAD. Es decir, que sean estadsticamenteindependientes.
SIGNIFICATIVIDAD. Las nuevas variables, a pesar de estar en unnmero ms reducido, deben explicar la mayor proporcin posible de la
variabilidad total.
INTERPRETABILIDAD. Las nuevas variables pueden tener unainterpretacin clara (objetivo del AF ms que del ACP)
7/26/2019 Diapositivas Tema3 ACP Color
4/19
ACP y AF en la prcticaCampos de aplicacin:
El ACP es una herramienta muy til como un paso previo que permitela reduccin de la dimensin, y por consiguiente puede simplificarposteriores anlisis estadsticos al aplicarlos sobre las componentes
principales (por ejemplo para un anlisis de regresin).
Economa, educacin, empresa, poltica, agricultura, antropologa,
arqueologa, biometra, ecologa, geografa, geologa, industria,
lingustica, medicina, metereologa, psicologa, sociologa, veterinaria,etc..
Tipo de datos:
Variables cuantitativas con medidas de tipo escala.
Ejemplos:
1. Qu actitudes subyacentes hacen que las personas respondan a
preguntas de una encuesta poltica de la manera que lo hacen? El AF
puede poner al descubierto dichas relaciones y expresarlas en trminos de
unas nuevas cantidades que no eran observables directamente.
2. Qu factores influyen a la hora de comprar un vehculo? El AF permite
extraer unos pocos factores que representan la relacin observada entre
las respuestas a las distintas preguntas.
7/26/2019 Diapositivas Tema3 ACP Color
5/19
Un ejemplo ilustrativoQu factores influyen en el individuo a la hora de comprar un vehculo? Se dise un cuestionario con 10 items (precio, financiacin, consumo,
combustible, prestaciones, modernidad, aerodinmica, seguridad,confort, capacidad). Se pas el cuestionario a una muestra de clientes.
Se observ que existan relacionesentre las puntuaciones que daban a
los distintos items. Se intent expresar esas relaciones en trminos de nuevos
factores.
Se descubrieron dos factores:
Factor 1: representando los items precio, financiacin, consumo,
combustible, prestaciones, modernidad, aerodinmica.
Factor 2:representando los items seguridad, confort, capacidad.
Resultado: se gan en interpretabilidad y adems se consigui unareduccin de la dimensionalidad.
7/26/2019 Diapositivas Tema3 ACP Color
6/19
Un ejemplo ilustrativoQu factores influyen en el individuo a la hora de comprar un vehculo?
Factor 1
1.0.50.0-.5-1.0
Factor2
1.0
.5
0.0
-.5
-1.0
aerodinmica
modernidadprestaciones
capacidad
confort
seguridad
combustibleconsumo
financiacin
precio
7/26/2019 Diapositivas Tema3 ACP Color
7/19
Qu resultados vamos a obtener desde SPSS?
Contrastes y medidas para valorar la existencia de interrelaciones entre
las variables (KMOy prueba de esfericidad de Bartlett)
Mtodos para decidir cuntos factores/componentesextraemos:
Regla de Kaiser (mtodo automtico)
Porcentaje de varianza total explicada
Grfico de sedimentacin oscree plot
Una medida del poder explicativo de cada factor/componente:comunalidad
Una medida de asociacin entre los factores/componentes y cadauna de las variables originales: matriz de factores/componentes
Grfico de las variables en el espacio de factores/componentes
Valores de los factores/componentes en cada individuo:puntuaciones
7/26/2019 Diapositivas Tema3 ACP Color
8/19
Ejemplo paso a pasoEl problema y los datos:Una empresa especializada en el diseo de
automviles de turismo desea estudiar cules son los deseos delpblico que compra automviles. Para ello disea una encuesta con 10
preguntas donde se le pide a cada uno de los 20 encuestados que
valores de 1 a 5 si una caracterstica es o no muy importante. Los
encuestados debern contestar con un 5 si la caracterstica es muy
importante, un 4 si es importante, un 3 si tiene regular importancia, un
2 si es poco importante y un 1 si no es nada importante. Las 10caractersticas a valorar (V1 a V10) son: precio, financiacin, consumo,
combustible, seguridad, confort, capacidad, prestaciones, modernidad
y aerodinmica.
El fichero coches_AF.sav recoge los datos. Realizar un anlisis
factorial (mtodo de componentes principales) que permita extraer un
nmero reducido de factores que resuman correctamente la
informacin que contienen los datos. Interpretar en la medida de lo
posible dichos factores.
OBJETIVO: Descubrir las relaciones existentes entre las 10
variables y expresarlas en trminos de un reducido nmero de
factores (componentes principales).
7/26/2019 Diapositivas Tema3 ACP Color
9/19
Realizamos un estudio de anlisis factorial con las diezvariables por el mtodo de la componentes principales
Anal izar / Reduccin de d imensio nes / Factor
En este caso, dado que
todas las variablesestn medidas en lasmismas unidades, noes necesario tipificar las
variables previamente
7/26/2019 Diapositivas Tema3 ACP Color
10/19
Analizamos la medida KMO y el test de esfericidad de Bartlettpara comprobar la utilidad y adecuacin del AF (ACP)
La medida KMO evala si las correlaciones entre las variables son altas.Vara entre 0 y 1 y cuanto ms cerca est de 1 ms adecuado ser el AF.
-Si KMO es mayor o igual que 0.9 las correlaciones son muy altas
-Si KMO est entre 0.8 y 0.9 son notables
-Si KMO est entre 0.7 y 0.8 son medianas
El test de Bartlett contrasta la hiptesis nula no tiene sentido aplicar elAF. Un p-valor (sig.) inferior al 5% conducira a rechazar dicha hiptesis
nula al 5%.
Tanto KMO como Bartlett nos llevan a la conclusin de que el AF (ACP)
tiene sentido y que las correlaciones entre las variables son medianas
7/26/2019 Diapositivas Tema3 ACP Color
11/19
Decidimos cuntas componentes principales es adecuadoextraer (varianza total explicada)
Por defecto se han considerado 2 componentes principales (factores)
El programa ha considerado como criterio la regla de Kaiser (de forma
automtica elige las componentes con autovalor mayor que 1).
Interpretacin: concluimos el porcentaje de la varianza total que quedaexplicado por cada componente y el porcentaje de la varianza total que
queda explicado por las 2 componentes extradas.
7/26/2019 Diapositivas Tema3 ACP Color
12/19
Interpretacin de los resultados (porcentaje de varianza explicadapor cada posible componente principal y por las 2 componentes extradas)
% de varianza explicada por cada componente (poder explicativo de las componentes)
Componente 1: 57.011%
Componente 2: 20.692%
Componente 3: 7.205%
Etc.
Porcentaje de la variabilidad total que queda explicada por las dos componentes
extradas: 77.703%
7/26/2019 Diapositivas Tema3 ACP Color
13/19
Permite valorar qu nmero de componente principales es adecuado extraer.
Se localiza el nmero de componentes donde la curva empieza a descender
ms lentamente. En este caso estara localizado entre 2 y 3 componentes.
Grfico de sedimentacin o scree plot: complemento grficoa la tabla de la varianza total explicada
7/26/2019 Diapositivas Tema3 ACP Color
14/19
Comprobamos si las variables originales quedan bienrepresentadas considerando las dos componentes
principales: tabla de comunalidades
La columna Extraccin muestra la proporcin en que cada variable
queda representada por las dos componentes extradas. Sera deseableque todas la variables quedaran bien representadas.
Podemos observar que Precio queda representada en un 78.1%,
Financiacin en un 85.7% y as sucesivamente. La que menos
representada est es Capacidad,solo en un 52.8% (se podra considerar
extraer 3 componentes en lugar de 2).
7/26/2019 Diapositivas Tema3 ACP Color
15/19
Asociamos las variables originales a cada una de lascomponentes extradas: matriz y grfico de componentes
En la matriz de componentes cada variable original se asocia con lascomponentes extradas (valores correspondientes en la matriz). Por ejemplo
podemos leer que Precioestara altamente asociada a la componente1 (enun (0.878)^2*100 % = 77.08%) y levemente con la componente 2 (en un(0.099)^2*100 % = 0.98%) y as sucesivamente.
La asociacin est menos clara para variables como Seguridad que presenta
niveles de asociacin muy altos en ambas componentes. Algo similar (aunque menos
notable) ocurre con Aerodinmicay Capacidad. Esto tambin se puede observar
en el grfico (estas variables estn cerca de las diagonales).
7/26/2019 Diapositivas Tema3 ACP Color
16/19
Rotamos los factores para ver si se simplifica laestructura (rotacin Varimax)
Probamos con varios tipos de rotacin y vemos si alguno permite corregir el
problema con las variables Seguridad,Aerodinmicay Capacidad.
7/26/2019 Diapositivas Tema3 ACP Color
17/19
Analizamos la solucin final y nos preguntamos si lascomponentes extradas tienen alguna interpretacin
Se ha extrado dos componentes principales (o factores):
Componente 1 (Economicidad)que englobaba los items precio,financiacin, consumo, combustible, prestaciones, modernidad,
aerodinmica.
Componente 2 (Utilidad)que englobaba seguridad, confort y capacidad.
7/26/2019 Diapositivas Tema3 ACP Color
18/19
Calculamos las puntuaciones factoriales (valores de losindividuos en cada componente)
7/26/2019 Diapositivas Tema3 ACP Color
19/19
Ejercicio propuesto
Utilizando el fichero de datos mundo2.sav,realizar un anlisisde componentes principales con las variables znac_def,
zmortinf, zfertil, zinc_pob, ztasa_na, zurbana, zalfabet, zcaloria,
zlog_pib, zpib_cap, zpoblac y zdensida.
En el anlisis se pueden seguir los pasos realizados en el
ejemplo anterior. Y a partir de los resultados que proporcionaSPSS se pide responder a las siguientes cuestiones:
1. Cuntas componentes es adecuado extraer? Cul es el
poder explicativo de cada componente extrada?Qu
porcentaje de la varianza total queda explicado por todas
las componentes que se han extrado?2. Asociar las variables originales con las componentes
extradas.