Econometria Vanessa Santiago

36
Presentación #1: Manual de Análisis Factorial (páginas 215 – 262) Vanessa Santiago Olivares Universidad Interamericana MATE 6600 Econometría

Transcript of Econometria Vanessa Santiago

Presentación #1:Manual de Análisis Factorial(páginas 215 – 262)

Vanessa Santiago OlivaresUniversidad InteramericanaMATE 6600 Econometría

Introducción

El Capítulo 7 se toca el tema del análisis factorial usando la técnica RLa técnica R busca identificar relaciones entre factores y variables cuando se usan los mismos instrumentos de medida en muchos sujetos Antes de la sección 7.5 (página 215) se describe el método Varimax para realizar el análisis

Método de Criterios en Tandem

El método pretende usar rotaciones de los factores para poder identificar relaciones fuertes y únicas entre dichos factores y las variables

Este método hace uso de dos criterios para realizar la separación y rotación de los datos

Método de Criterios en Tandem

Criterio I - Se basa en el siguiente principio

Si dos variables están correlacionadas, deben aparecer en el mismo factor

Método de Criterios en Tandem

Matemáticamente se expresa así:

∑∑∑= = =

=m

k

n

i

n

jjkikij aarF

1 1 1

222'

∑=

=n

kjkikij aar

1

donde

es la correlación entre la variable i y la variable j

aik es el peso de la variable i en el factor k

a jk es el peso de la variable j en el factor k

Método de Criterios en Tandem

Luego de la rotación, los factores cuyo peso es demasiado pequeño (<0.3) se descartan

Los criterios marginales (entre 0.3 y 0.45) y fuertes (>0.45) pasan a una segunda rotación, conocida como el Criterio II

Método de Criterios en Tandem

Criterio II - Se basa en el siguiente principio

Si dos variables no están correlacionadas, no deben aparecer en el mismo factor

Método de Criterios en Tandem

Matemáticamente se expresa así:

( )∑∑∑= = =

−=m

k

n

i

n

jjkikij aarF

1 1 1

222'1 donde

rij es la correlación entre la variable i y la variable j

aik es el peso de la variable i en el factor k

a jk es el peso de la variable j en el factor k

Método de Criterios en Tandem

El método de los Criterios en Tandemproduce resultados similares al método Varimax cuando se aplican siguiendo los mismos controles

Estrategia de Trabajo para el Análisis Factorial

1. Extraer factores con el método de residuo mínimo hasta alcanzar convergencia

2. Inspeccionar los factores y eliminar los que tengan un peso de 0.2 o menos

3. Rotar bajo el Criterio I y desechar los factores con peso de 0.3 o menos

Estrategia de Trabajo para el Análisis Factorial

4. Rotar bajo el Criterio II y eliminar los factores que no se aumenten o pierdan su carácter básico

5. Continuar proceso de eliminación con el Criterio I

6. La solución final puede ser rotada para satisfacer otros criterios del investigador

Principios de Diseño

El investigador debe ser libre para definir el área que desea estudiar

Definir el dominioEstablecer estructura factorial hipotéticaFormular el modelo factorial con los factores esperados y las hipótesis alternativas

Principios de Diseño

Escoger las variables con las que se quiere trabajar

Frecuentemente, el investigador se encuentra con que debe generar nuevas variables con las características deseadas que sirvan de variables indicadoras de los factores que se conjetura aparecerán.Cada factor debe tener cinco o más variables como buenos indicadoresMientras más variables, más seguro que se encuentre una relación en las rotaciones

Principios de Diseño

Obtener datos de una muestra adecuada de individuos

Realizar en análisis

Jerarquía Factorial

Se refiere a la importancia de los factores en el modelo finalLa presencia de factores de bajo nivel jerárquico que resultan de la introducción de variables con varianza solapada, a menudo, no es prevista por el investigadorAnte esto, es prudente repasar el análisis luego de eliminar o combinar variables para suprimir factores de baja jerarquía

Jerarquía Factorial

Otra forma de impulsar factores de interés es mediante la extracción de factores de bajo nivel y realizando rotacionesLa dificultad de este método estriba en la capacidad de identificar correctamente el número de factores que se deben eliminar

Jerarquía Factorial

Aunque los factores de alto nivel son útiles para algunos fines, generalmente se desea tener un modelos con factores de jerarquía intermedia ya que se ha encontrado que son más útiles para fines cinetíficos.

Variables

Las variables deben generar datos continuos y distribuidos normalmenteLas regresiones de pares de variables deben ser linealesEsto permite que el coeficiente de correlación Pearson produzca resultados confiables

Variables

Las escalas de medida afectan los resultados del análisis factorial y las correlaciones encontradasPara variables que no son continuas, sino categóricas, es deseable tener 12 o más grados en vez de dos o tresLas variables incluidas en la misma matriz no deberían ser dependientes unas de otras

Variables

Muestras de tamaño 50 ofrecen fiabilidad muy ineficiente de los coeficientes de correlaciónMuestras de tamaño 1000 son más adecuadas para la mayoría de los fines del análisis factorial

Variables

Para el trabajo exploratorio es importante garantizar que haya mucha varianza, por tanto, el tamaño de la muestra pasa a un segundo planoPara refinar el modelo hipotetisado, la muestra debe ser grande (representativa de la población) para asegurar correlaciones precisas

Coeficientes de Correlación

El coeficiente de correlación de Pearson es apropiado para las diversas situaciones que ocupan al análisis factorialEl inconveniente que tiene es que es intensivo en cómputos matemáticos, lo que dificulta su aplicación por el método manual

Coeficientes de Correlación

Otros coeficientes disponibles:ϕ - Se emplea cuando las variables representas dicotomías absolutas

Punto Biserial – Se emplea cuando una de las variables es una dicotomía absoluta, y la otra es continua y aproximadamente normal

Coeficiente de Correlación

Otros coeficientes disponibles:Biserial – Se emplea cuando una de las variables se distribuye normalmente pero ha sido artificialmente dicotomizada, y la otra es continua y aproximadamente normal

Tetracórico – Se emplea cuando ambas variables estén distribuidas normalmente pero artificialmente dicotomizadas

Coeficientes de Correlación

Se debe evitar variables dicotómicas siempre que sea posibleSe debe intentar tener variables continuas o con, al menos, 12 categoríasCalcular la correlación Pearson, que ofrece buena resolución

Errores Comunes

1. Recoger datos antes de planificar2. Usar variables con malas

distribuciones y regresiones inapropiadas

3. Usar variables que no son independientes entre si

4. Sobre-determinar factores5. Utilizar demasiadas variables

complejas

Errores Comunes

6. Incluir variables muy similares7. No proporcionar buenas variables

indicadores de un factor8. Procedimientos deficientes de

muestreo9. No incluir suficientes factores en el

análisis10.Utilización de coeficientes de

correlación inadecuados

Errores Comunes

11.Utilización de estimaciones inapropiados

12.Extraer demasiado pocos factores13.Procedimientos de rotación

deficientes14.Interpretar el primer factor extraído

como un factor general15.Sacar conclusiones con evidencia

insuficiente

Técnica Q

Esta técnica es similar a la técnica R, pero hace comparaciones entre las columnas de la matriz en vez de las filas

Establece correlaciones entre los sujetos en vez de las pruebasPuesto que las pruebas utilizadas no son iguales, requiere normalización de los datos

Técnica Q

Al tipificar o normalizar los datos, el promedio se vuelve cero y la desviación estándar 1

Este proceso causa que los efectos importantes se aumenten y los no importantes se supriman

Técnica Q

La estabilidad del coeficiente de correlación depende de que se tome una muestra grande y representativa de casos de la población

Con la técnica R, esto significa usar muchos sujetos con un número limitado de variablesCon la técnica Q, esto significa medir muchas variables para un número limitado de sujetos

Problema de la Rotación en el Análisis Mediante la Técnica Q

Los sujetos deben ser cuidadosamente seleccionados para obtener resultados factoriales significativos

No hacerlo causaría que no se pueda discriminar entre los sujetos y parezca que todos pertenecen al mismo grupo

Técnica P

Utilizado para el análisis clínicoLa matriz está compuesta por observaciones (columnas) de las mismas variables (filas) para el mismo sujetoLos factores derivados de la técnica P representan grupos de variables sustancialmente correlacionadas

Técnica P

Este análisis es apropiado para variables con variaciones medibles a través del tiempo pero que sean inmunes al efecto de práctica, aprendizaje o errorTiene poco potencial para características que son estables en el individuo

Otras Técnicas

Técnica O – Similar a la técnica P, pero comparando columnas en vez de filas de la matriz de datosTécnica T – Correlaciones entre las ocasiones en que grupos de individuos se comportan de forma similarTécnica S – Correlaciona dos individuos sobre una serie de acontecimientos en los que se miden las variables de interés

¿Preguntas?

Vanessa Santiago OlivaresUniversidad InteramericanaMATE 6600 Econometría