Diapositivas Tema3 ACP Color

download Diapositivas Tema3 ACP Color

of 19

Transcript of Diapositivas Tema3 ACP Color

  • 7/26/2019 Diapositivas Tema3 ACP Color

    1/19

    Anlisis de Componentes

    Principales

    Mtodos Estadsticos en OrdenadorGrado en Relaciones Laborales y Recursos Humano s

  • 7/26/2019 Diapositivas Tema3 ACP Color

    2/19

    Introduccin: ACP y AF

    Sintetizar grandes cantidades de datos

    Eliminar informacin redundante

    Conservar mxima informacin

    Descubrir factores subyacentes en los datos

    ANLISIS MULTIVARIANTE

    REDUCCIN DE DATOS

    Representar un conjunto devariables observadas mediante

    un nmero pequeo de nuevasvariablesconstruidas como

    combinaciones lineales de las

    originales, denominadas

    componentes principales.

    Descubrir las relacionesexistentes entre diversas

    variablesy expresarlas entrminos de unas pocas variables

    aleatorias subyacentes y no

    observables, llamadas factores.

    Anlisis de ComponentesPrincipales (ACP) Anlisis FACTORIAL (AF)

    Pearson (1901)Hottelling (1933)

    Pearson (1901)

    Spearman (1904)

  • 7/26/2019 Diapositivas Tema3 ACP Color

    3/19

    ACP como caso particular de AFObjetivo:

    En trminos generales el anlisis de componentes principales buscaunas pocas combinaciones lineales de las variables, a las que se

    denominan componentes principales, que permitan resumir los datos,procurando que en el proceso se pierda la menos informacin posible.

    Caractersticas deseables:

    REDUCCIN DE LA DIMENSIONALIDAD. Se pretende que elnmero de componentes principales sea menor que el de variablesoriginales.

    ORTOGONALIDAD. Es decir, que sean estadsticamenteindependientes.

    SIGNIFICATIVIDAD. Las nuevas variables, a pesar de estar en unnmero ms reducido, deben explicar la mayor proporcin posible de la

    variabilidad total.

    INTERPRETABILIDAD. Las nuevas variables pueden tener unainterpretacin clara (objetivo del AF ms que del ACP)

  • 7/26/2019 Diapositivas Tema3 ACP Color

    4/19

    ACP y AF en la prcticaCampos de aplicacin:

    El ACP es una herramienta muy til como un paso previo que permitela reduccin de la dimensin, y por consiguiente puede simplificarposteriores anlisis estadsticos al aplicarlos sobre las componentes

    principales (por ejemplo para un anlisis de regresin).

    Economa, educacin, empresa, poltica, agricultura, antropologa,

    arqueologa, biometra, ecologa, geografa, geologa, industria,

    lingustica, medicina, metereologa, psicologa, sociologa, veterinaria,etc..

    Tipo de datos:

    Variables cuantitativas con medidas de tipo escala.

    Ejemplos:

    1. Qu actitudes subyacentes hacen que las personas respondan a

    preguntas de una encuesta poltica de la manera que lo hacen? El AF

    puede poner al descubierto dichas relaciones y expresarlas en trminos de

    unas nuevas cantidades que no eran observables directamente.

    2. Qu factores influyen a la hora de comprar un vehculo? El AF permite

    extraer unos pocos factores que representan la relacin observada entre

    las respuestas a las distintas preguntas.

  • 7/26/2019 Diapositivas Tema3 ACP Color

    5/19

    Un ejemplo ilustrativoQu factores influyen en el individuo a la hora de comprar un vehculo? Se dise un cuestionario con 10 items (precio, financiacin, consumo,

    combustible, prestaciones, modernidad, aerodinmica, seguridad,confort, capacidad). Se pas el cuestionario a una muestra de clientes.

    Se observ que existan relacionesentre las puntuaciones que daban a

    los distintos items. Se intent expresar esas relaciones en trminos de nuevos

    factores.

    Se descubrieron dos factores:

    Factor 1: representando los items precio, financiacin, consumo,

    combustible, prestaciones, modernidad, aerodinmica.

    Factor 2:representando los items seguridad, confort, capacidad.

    Resultado: se gan en interpretabilidad y adems se consigui unareduccin de la dimensionalidad.

  • 7/26/2019 Diapositivas Tema3 ACP Color

    6/19

    Un ejemplo ilustrativoQu factores influyen en el individuo a la hora de comprar un vehculo?

    Factor 1

    1.0.50.0-.5-1.0

    Factor2

    1.0

    .5

    0.0

    -.5

    -1.0

    aerodinmica

    modernidadprestaciones

    capacidad

    confort

    seguridad

    combustibleconsumo

    financiacin

    precio

  • 7/26/2019 Diapositivas Tema3 ACP Color

    7/19

    Qu resultados vamos a obtener desde SPSS?

    Contrastes y medidas para valorar la existencia de interrelaciones entre

    las variables (KMOy prueba de esfericidad de Bartlett)

    Mtodos para decidir cuntos factores/componentesextraemos:

    Regla de Kaiser (mtodo automtico)

    Porcentaje de varianza total explicada

    Grfico de sedimentacin oscree plot

    Una medida del poder explicativo de cada factor/componente:comunalidad

    Una medida de asociacin entre los factores/componentes y cadauna de las variables originales: matriz de factores/componentes

    Grfico de las variables en el espacio de factores/componentes

    Valores de los factores/componentes en cada individuo:puntuaciones

  • 7/26/2019 Diapositivas Tema3 ACP Color

    8/19

    Ejemplo paso a pasoEl problema y los datos:Una empresa especializada en el diseo de

    automviles de turismo desea estudiar cules son los deseos delpblico que compra automviles. Para ello disea una encuesta con 10

    preguntas donde se le pide a cada uno de los 20 encuestados que

    valores de 1 a 5 si una caracterstica es o no muy importante. Los

    encuestados debern contestar con un 5 si la caracterstica es muy

    importante, un 4 si es importante, un 3 si tiene regular importancia, un

    2 si es poco importante y un 1 si no es nada importante. Las 10caractersticas a valorar (V1 a V10) son: precio, financiacin, consumo,

    combustible, seguridad, confort, capacidad, prestaciones, modernidad

    y aerodinmica.

    El fichero coches_AF.sav recoge los datos. Realizar un anlisis

    factorial (mtodo de componentes principales) que permita extraer un

    nmero reducido de factores que resuman correctamente la

    informacin que contienen los datos. Interpretar en la medida de lo

    posible dichos factores.

    OBJETIVO: Descubrir las relaciones existentes entre las 10

    variables y expresarlas en trminos de un reducido nmero de

    factores (componentes principales).

  • 7/26/2019 Diapositivas Tema3 ACP Color

    9/19

    Realizamos un estudio de anlisis factorial con las diezvariables por el mtodo de la componentes principales

    Anal izar / Reduccin de d imensio nes / Factor

    En este caso, dado que

    todas las variablesestn medidas en lasmismas unidades, noes necesario tipificar las

    variables previamente

  • 7/26/2019 Diapositivas Tema3 ACP Color

    10/19

    Analizamos la medida KMO y el test de esfericidad de Bartlettpara comprobar la utilidad y adecuacin del AF (ACP)

    La medida KMO evala si las correlaciones entre las variables son altas.Vara entre 0 y 1 y cuanto ms cerca est de 1 ms adecuado ser el AF.

    -Si KMO es mayor o igual que 0.9 las correlaciones son muy altas

    -Si KMO est entre 0.8 y 0.9 son notables

    -Si KMO est entre 0.7 y 0.8 son medianas

    El test de Bartlett contrasta la hiptesis nula no tiene sentido aplicar elAF. Un p-valor (sig.) inferior al 5% conducira a rechazar dicha hiptesis

    nula al 5%.

    Tanto KMO como Bartlett nos llevan a la conclusin de que el AF (ACP)

    tiene sentido y que las correlaciones entre las variables son medianas

  • 7/26/2019 Diapositivas Tema3 ACP Color

    11/19

    Decidimos cuntas componentes principales es adecuadoextraer (varianza total explicada)

    Por defecto se han considerado 2 componentes principales (factores)

    El programa ha considerado como criterio la regla de Kaiser (de forma

    automtica elige las componentes con autovalor mayor que 1).

    Interpretacin: concluimos el porcentaje de la varianza total que quedaexplicado por cada componente y el porcentaje de la varianza total que

    queda explicado por las 2 componentes extradas.

  • 7/26/2019 Diapositivas Tema3 ACP Color

    12/19

    Interpretacin de los resultados (porcentaje de varianza explicadapor cada posible componente principal y por las 2 componentes extradas)

    % de varianza explicada por cada componente (poder explicativo de las componentes)

    Componente 1: 57.011%

    Componente 2: 20.692%

    Componente 3: 7.205%

    Etc.

    Porcentaje de la variabilidad total que queda explicada por las dos componentes

    extradas: 77.703%

  • 7/26/2019 Diapositivas Tema3 ACP Color

    13/19

    Permite valorar qu nmero de componente principales es adecuado extraer.

    Se localiza el nmero de componentes donde la curva empieza a descender

    ms lentamente. En este caso estara localizado entre 2 y 3 componentes.

    Grfico de sedimentacin o scree plot: complemento grficoa la tabla de la varianza total explicada

  • 7/26/2019 Diapositivas Tema3 ACP Color

    14/19

    Comprobamos si las variables originales quedan bienrepresentadas considerando las dos componentes

    principales: tabla de comunalidades

    La columna Extraccin muestra la proporcin en que cada variable

    queda representada por las dos componentes extradas. Sera deseableque todas la variables quedaran bien representadas.

    Podemos observar que Precio queda representada en un 78.1%,

    Financiacin en un 85.7% y as sucesivamente. La que menos

    representada est es Capacidad,solo en un 52.8% (se podra considerar

    extraer 3 componentes en lugar de 2).

  • 7/26/2019 Diapositivas Tema3 ACP Color

    15/19

    Asociamos las variables originales a cada una de lascomponentes extradas: matriz y grfico de componentes

    En la matriz de componentes cada variable original se asocia con lascomponentes extradas (valores correspondientes en la matriz). Por ejemplo

    podemos leer que Precioestara altamente asociada a la componente1 (enun (0.878)^2*100 % = 77.08%) y levemente con la componente 2 (en un(0.099)^2*100 % = 0.98%) y as sucesivamente.

    La asociacin est menos clara para variables como Seguridad que presenta

    niveles de asociacin muy altos en ambas componentes. Algo similar (aunque menos

    notable) ocurre con Aerodinmicay Capacidad. Esto tambin se puede observar

    en el grfico (estas variables estn cerca de las diagonales).

  • 7/26/2019 Diapositivas Tema3 ACP Color

    16/19

    Rotamos los factores para ver si se simplifica laestructura (rotacin Varimax)

    Probamos con varios tipos de rotacin y vemos si alguno permite corregir el

    problema con las variables Seguridad,Aerodinmicay Capacidad.

  • 7/26/2019 Diapositivas Tema3 ACP Color

    17/19

    Analizamos la solucin final y nos preguntamos si lascomponentes extradas tienen alguna interpretacin

    Se ha extrado dos componentes principales (o factores):

    Componente 1 (Economicidad)que englobaba los items precio,financiacin, consumo, combustible, prestaciones, modernidad,

    aerodinmica.

    Componente 2 (Utilidad)que englobaba seguridad, confort y capacidad.

  • 7/26/2019 Diapositivas Tema3 ACP Color

    18/19

    Calculamos las puntuaciones factoriales (valores de losindividuos en cada componente)

  • 7/26/2019 Diapositivas Tema3 ACP Color

    19/19

    Ejercicio propuesto

    Utilizando el fichero de datos mundo2.sav,realizar un anlisisde componentes principales con las variables znac_def,

    zmortinf, zfertil, zinc_pob, ztasa_na, zurbana, zalfabet, zcaloria,

    zlog_pib, zpib_cap, zpoblac y zdensida.

    En el anlisis se pueden seguir los pasos realizados en el

    ejemplo anterior. Y a partir de los resultados que proporcionaSPSS se pide responder a las siguientes cuestiones:

    1. Cuntas componentes es adecuado extraer? Cul es el

    poder explicativo de cada componente extrada?Qu

    porcentaje de la varianza total queda explicado por todas

    las componentes que se han extrado?2. Asociar las variables originales con las componentes

    extradas.