Representación de los modelos - prof.usb.veprof.usb.ve/jjramirez/POSTGRADO/AFC/03...

26
2 Representación de los modelos Representación de los modelos (preliminares) Una práctica frecuente, es representar nuestro modelo mediante lo que se denomina un diagrama de senderos (en inglés, “path diagram”), como el de la Figura 2.1. Figura 2.1. Diagrama de senderos de un modelo de análisis factorial confirmatorio con dos factores spatial visperc cubes lozenges wordmean paragrap sentence err_v err_c err_l err_p err_s err_w verbal 1 1 1 1 1 1 1 1 También se denominan diagramas causales o diagramas estructurales. En este caso se re- presenta un modelo de Análisis Factorial Confirmatorio (Holzinger y Swineford, 1939).

Transcript of Representación de los modelos - prof.usb.veprof.usb.ve/jjramirez/POSTGRADO/AFC/03...

2 Representación de los modelos

Representación de los modelos (preliminares) Una práctica frecuente, es representar nuestro modelo mediante lo que se denomina un diagrama de senderos (en inglés, “path diagram”), como el de la Figura 2.1. Figura 2.1. Diagrama de senderos de un modelo de análisis factorial confirmatorio con dos factores

spatial

visperc

cubes

lozenges

wordmean

paragrap

sentence

err_v

err_c

err_l

err_p

err_s

err_w

verbal

1

1

1

1

1

1

1

1

También se denominan diagramas causales o diagramas estructurales. En este caso se re-presenta un modelo de Análisis Factorial Confirmatorio (Holzinger y Swineford, 1939).

14 Apuntes Modelos de Ecuaciones estructurales (Universidad Autónoma de Madrid)

En el modelo se representa que las relaciones entre las puntuaciones en una serie de tests psicológicos (Visperc -percepción visual, cubes –cubos, Lozenges –test de banderas de Lozenges, Paragraph -Comprensión de párrafos, Sentence -Comprensión de frases- y Wordmean –Significado de Palabras-) dependen de dos factores latentes (spatial –aptitud espacial- y verbal –aptitud verbal).

Observe que se siguen una serie de convenciones en la representación:

Las variables se representan mediante cuadrados o rectángulos si son observables (en este caso, los tests: Visperc, Cubes, Lozenges, Paragrap,…) o mediante círcu-los si son variables latentes: como los factores (Spatial, Verbal) o los errores (Err_v, Err_c , Err_l,…, Err_w).

Las relaciones entre variables se representan mediante líneas. Una línea curva bidi-reccional conectando dos variables latentes indica que ambas covarían (en la figu-ra los factores están correlacionados). Las flechas rectas indican que hay una re-lación direccional entre las 2 variables conectadas (por ejemplo, Visperc recibe líneas de spatial y del error, Err_v, para representar que está influenciada por am-bas variables).

En ocasiones, se hace una distinción entre variables endógenas (variables que reciben fle-cha direccional de alguna otra variable del modelo) y variables exógenas (variables que no reciben ninguna flecha direccional dentro del modelo). Esta distinción es muy impor-tante. Las variables exógenas son aquellas para las que el modelo no proporciona explica-ción. Pueden existir relaciones entre las variables exógenas. Cada flecha bidireccional se utiliza siempre para representar la covariación entre dos variables exógenas.

En los modelos de Análisis Factorial Confirmatorio, las variables latentes son siempre exógenas y las variables observables, endógenas. Observe que no se contemplan efectos de Verbal a Visperc o Cubes, ni tampoco de Spatial a Paragap o Sentence. Tampoco hay flechas bidireccionales entre err_v y err_c, lo que quiere decir que los errores en las va-riables observadas no están correlacionados. Las variables endógenas son aquellas que se predicen a partir de otras variables en el modelo. Por tanto, cualquier variable endógena recibe una flecha de un término de error.

Capítulo 2. Representación de los modelos 15

Representación de algunos modelos simples Podemos representar algunos de los modelos estadísticos más usuales mediante diagramas causales. Modelo de regresión simple Figura 2.2. Diagrama de senderos de un modelo de regresión simple

performance

satisfaction

error1

En el modelo de regresión simple una variable observable (performance) es predicha a partir de otra variable observable (satisfaction). El valor de la relación se etiqueta, en este caso, con la letra b. Traducido a una ecuación, el modelo sería1:

erroronsatisfactibeperformanc *

Observe que la predicción se hace con error, por lo que se incluye tal término (error). El error no es observable por lo que se representa con un círculo. Satisfaction y error serían variables exógenas. Performance sería una variable endógena. Modelo de regresión múltiple Figura 2.3. Diagrama de senderos de un modelo de regresión múltiple

value

knowledge

performance

satisfaction

error1

El modelo de regresión simple es un modelo de predicción sencillo pero poco realista. Generalmente, las relaciones son multivariadas. En el modelo de regresión múltiple una variable observable (performance) es predicha a partir de dos o más variables predictoras observables (en este caso, knowledge, value y satisfaction). Observe, de nuevo, que la

1 Puesto que se trabaja con las variables en puntuaciones diferenciales no se incluye el intercepto.

b

a d e b f c

16 Apuntes Modelos de Ecuaciones estructurales (Universidad Autónoma de Madrid)

value

knowledge

performance

satisfaction

error11

error21

predicción se hace con error, por lo que se incluye tal término (error). Knowledge, value, Satisfaction y error serían variables exógenas. Performance sería una variable endógena. Observe que, en la regresión múltiple, se contempla que las variables predictoras covarian entre sí. Traducido a ecuaciones, el modelo sería:

erroronsatisfacticvaluebknowledgeaeperformanc ***

Un problema conocido de estos modelos es que las relaciones entre dos variables pueden verse atenuadas por el error de medida. Por ejemplo, supongamos que performance es el rendimiento en una prueba de comprensión de textos y que knowledge es la nota media en asignaturas de lengua y literatura. Supongamos que la correlación teórica entre el nivel de comprensión de textos y el nivel de conocimientos en lengua y literatura es alta. Pues bien, a pesar de esto, la correlación empírica puede ser baja si el rendimiento en la prueba de comprensión de textos se ha medido de forma poco fiable. Modelo de “path analysis" Figura 2.4. Diagrama de senderos de un modelo de “análisis de senderos”

Los modelos de path analysis son modelos más flexibles que los de regresión múltiple. En ellos se pueden especificar, mediante un diagrama, las relaciones de un conjunto de varia-bles observables. En el ejemplo una variable observable (performance) es predicha a par-tir de dos predictoras (knowledge y value). A su vez, la variable satisfaction es predicha por performance y value. En este caso, el investigador ha especificado que las variables predictoras (knowledge y value) correlacionan entre sí. En estos modelos pueden plantear-se distintos tipos de relaciones. Las relaciones entre las variables pueden deberse a efec-tos directos, indirectos, espúreos o conjuntos.

Efectos directos de A sobre B. Cuando una variable B recibe el efecto de otra va-riable A directamente. Por ejemplo, knowledge tiene un efecto directo en perfor-mance (sendero “a”). Value tiene un efecto directo en performance (sendero “b”) y otro efecto directo en satisfaction (sendero “c”). Performance tiene un efecto di-recto en satisfaction (sendero “d”).

Efectos indirectos de A sobre B. Cuando la variable A tiene efectos sobre una va-riable que tiene efectos directos (o indirectos) en la variable B. Por ejemplo,

a e b c d

Capítulo 2. Representación de los modelos 17

knowledge y value tienen efectos indirectos en satisfaction (a través de perfor-mance) (senderos “ad” y “bd”).

Efectos espúreos entre A y B. Cuando las variables A y B comparten una causa común. Por ejemplo, parte de la relación entre performance y satisfaction es espú-rea porque ambas variables comparten una causa (value) (sendero “bc”).

Efectos conjuntos o de covariación entre A y B. Cuando la relación entre las varia-bles A y B no está completamente explicada por un mecanismo causal. Por ejem-plo, parte de la relación entre knowledge y satisfaction se deberá a que knowledge correlaciona con value que, a su vez, tiene efecto directo en satisfaction (sendero “ce”). Este tipo de efectos también se dan entre knowledge y performance (sende-ro “eb”) y entre value y performance (sendero “ea”). Observe que en estas rela-ciones siempre aparece un sendero bidireccional, que implica una covariación en-tre variables exogénas para la que no se ofrece explicación causal (en el ejemplo, la relación entre knowledge y value).

Traducido a ecuaciones, el modelo sería:

2**

1**

erroreperformancdvalueconsatisfacti

errorvaluebknowledgeaeperformanc

Modelo de análisis factorial confirmatorio Figura 2.5. Diagrama de senderos de un modelo de análisis factorial confirmatorio

spatial

visperc

cubes

lozenges

wordmean

paragrap

sentence

err_v

err_c

err_l

err_p

err_s

err_w

verbal

1

1

1

1

1

1

1

1

Un problema de trabajar con variables observables es que casi todas las variables psicoló-gicas (inteligencia, satisfacción, rendimiento, etc.) se miden con error de medida. Por ejemplo, considere una prueba de aptitud espacial (cubos). La puntuación en el test es una variable observable. Esta puntuación refleja en parte lo que queremos medir (p.e., aptitud espacial general) pero también otras aptitudes específicas de esa tarea o incluso error de

a b c d

e

18 Apuntes Modelos de Ecuaciones estructurales (Universidad Autónoma de Madrid)

medida. La aptitud espacial general y la especificidad (i.e., aptitudes específicas de la ta-rea y error de medida) son variables latentes o no observables.

Cuando se dispone de varias tareas para medir un constructo (e.g., varias pruebas para medir la aptitud espacial) puede postularse que las puntuaciones en esas tareas covarían debido a que son indicadores del mismo constructo. Se está planteando entonces un mode-lo de análisis factorial, en el que las relaciones entre un conjunto de variables observables se predicen a partir de un conjunto menor de variables latentes o factores

En el modelo de análisis factorial confirmatorio (figura 2.1) las variables observables (Visperc, Cubes, Lozenges, Paragrap,…) son predichas por las variables latentes (Spatial, Verbal). Como ya se ha mencionado, las variables latentes son exógenas y las observa-bles, endógenas. Nótese que cada variable observable incluye un término de error (Err_v, Err_c , Err_l,…, Err_w), que indica que esa variable es un indicador imperfecto del factor latente; además, en el modelo, los factores pueden covariar. Los errores en un AFC tam-bién pueden covariar.

Traducido a ecuaciones, el modelo sería:

werrorverbaldwordmean

serrorverbalcsentence

perrorverbalparagap

lerrorspatialblozenges

cerrorspatialacubes

verrorspatialvisperc

_*

_*

_

_*

_*

_

Modelos generales de ecuaciones estructurales Figura 2.6. Diagrama de senderos de un modelo estructural completo

1knowledge

2knowledge

1value

2value

1satisfaction

2satisfaction

1performance

2performance

knowledge

value

satisfaction

performance

error1

error2

error8

error7

error6

error5

error4

error31

1

1

1

1

1

1

1

1

1 1

1

error9

1

Capítulo 2. Representación de los modelos 19

Los modelos más generales de ecuaciones estructurales aúnan las ventajas de los modelos de path analysis y de los modelos de análisis factorial confirmatorio. En la figura 2.6 se representa un modelo que define que knowledge, value y satisfaction predicen performan-ce, como en un modelo de regresión múltiple. La diferencia entre este modelo y el de re-gresión múltiple es que cada una de esas variables (p.e., satisfaction) aparece ahora como una variable latente, que subyace a dos indicadores observables (p.e., 1satisfaction y 2satisfaction). Esto es, la flecha que va de satisfaction a performance representa una rela-ción entre constructos. En los modelos más complejos se suele distinguir entre:

Modelo de medida: El modelo de medida especifica las relaciones entre las varia-bles latentes y los indicadores. En la figura 2.6 el modelo de medida es la parte del modelo que especifica las relaciones entre las variables observables (1knowledge, 2knowledge, 1value, 2value, 1satisfaction, 2satisfaction, 1performance y 2performance) y las variables latentes (knowledge, value, satisfaction y perfor-mance).

Modelo estructural: es la parte del modelo en la que se especifican las relaciones causales o de covariación entre las variables latentes. En la figura 2.6, el modelo estructural es la parte que especifica las relaciones entre las variables latentes (knowledge, value, satisfaction y performance).

Reglas del path analysis En un modelo de ecuaciones estructurales las relaciones (covarianzas) entre las variables se derivan de los parámetros del modelo. En este apartado se ilustran algunas reglas heurísticas que facilitan deducir de qué parámetros dependen las varianzas y covarianzas de las variables. Reglas para derivar las covarianzas Para deducir la covarianza entre dos variables A y B, basta fijarse en todos los senderos que conectan esas variables y sumar los efectos asociados a cada sendero, siempre que esos senderos cumplan ciertas reglas. Esto es:

1. Nunca pasar dos veces por el mismo sitio (esto es, la misma variable). 2. Nunca ir hacia delante y luego hacia atrás. 3. No pasar por más de un camino curvo en el sendero. 4. Cada sendero que no incluya una covarianza debe incluir la varianza de la va-

riable exógena (la variable exógena que esté más “atrás” en la cadena de cau-salidad).

Veamos algunos ejemplos para ilustrar estas reglas.

20 Apuntes Modelos de Ecuaciones estructurales (Universidad Autónoma de Madrid)

Ejemplo 1:

Las covarianzas en este modelo serían:

aceAbeVarFACov

acdAbdVarEACov

acAbVarCACov

aBACov

)(),(

)(),(

)(),(

),(

abeBceVarFBCov

abdBcdVarEBCov

abBcVarCBCov

)(),(

)(),(

)(),(

)(),(

)(),(

CeVarFCCov

CdVarECCov

)(),( CdeVarFECov

Por ejemplo, la relación entre A y B se sigue únicamente del sendero “a” porque el sende-ro “bc” implica ir hacia delante y luego hacia atrás (se incumple la regla 2). La covarianza entre A y C es la suma de dos efectos (uno directo y otro “conjunto”).

En efecto:

caAbVarABcCovAAbCovAcBCovAbACov

AcBbACov

ACerrorCovAcBbACov

CACov

CerrorcBbAC

)(),(),(),(),(

),(

)),((),(

),(

)(

Otro ejemplo, la relación entre E y F se sigue únicamente del sendero “de”. Mientras que el sendero “dbace” no es válido porque se pasa dos veces por la variable C (se incumple la regla 1). En efecto:

Capítulo 2. Representación de los modelos 21

)(),(),(

))(),(())(,())(,(),(

),(

)(

)(

CdeVarCCdeCoveCdCCov

FerrorEerrorCovEerroreCCovFerrordCCoveCdCCov

FECov

FerroreCF

EerrordCE

Ejemplo 2:

Las covarianzas serían:

)()(),(

)(),(

)(),(

AbdVarAacVarEACov

AbVarCACov

AaVarBACov

)()(),(

)(),(

AabdVarBcVarEBCov

AabVarCBCov

)()(),( AabcVarCdVarECCov

Por ejemplo, la relación entre B y C se sigue únicamente del sendero “ab”. El sendero “dc” no es válido porque d implica ir hacia delante y c hacia atrás (se incumple la regla 2). Sin embargo, para la relación entre B y E, el sendero “abd” es válido porque sólo implica ir atrás y luego hacía delante. En efecto:

22 Apuntes Modelos de Ecuaciones estructurales (Universidad Autónoma de Madrid)

)(()()())(()((

))((),(),(

))(),((

))(),(()),(())(),(()),((

))(,())(,(),())(,(),(

),(

)())(())(()(

)(

)(

2

2

AVaradbBcVarAadbVarBerrVarAVarac

BerrcVarAAadbCovAAcCova

EerrorBerrorCov

CderrorBerrorCovdbABerrorCovBcerrorBerrorCovcaABerrCov

EerroraACovCderroraACovdbAaACovBcerroraACovcaAaACov

EBCov

EerrorCerrorbAdBerroraAcEerrordCcBE

CerrorbAC

BerroraAB

Ejemplo 3: Las covarianzas serían:

afFACov

beEACov

AdVarDACov

aCACov

bBACov

),(

),(

)(),(

),(

),(

cfFBCov

BeVarEBCov

bdDBCov

cCBCov

),(

)(),(

),(

),(

)(),(

),(

),(

CfVarFCCov

ceECCov

adDCCov

dafFDCov

dbeEDCov

),(

),( ecfFECov ),(

Capítulo 2. Representación de los modelos 23

Por ejemplo, la relación entre D y F se sigue únicamente del sendero “daf”. El sendero “dbcf” no es válido porque pasa por dos líneas curvas. En efecto,

dfaCAdfCovfCdCCov

FerrorDerrorCovDerrorfCCovFerrordACovfCdACov

FDCov

FerrorfCF

DerrordAD

),(),(

))(),(())(,())(,(),(

),(

)(

)(

Reglas para derivar las varianzas La varianza de una variable endógena puede derivarse a partir de las variables exógenas que tienen un efecto directo en esa variable y de las covarianzas entre ellas. En el ejemplo 1, las varianzas de las variables endógenas serían:

))(())((2)()(

))(()()))((()(

))(())((2)()(

))(()()))((()(

))((2)()(

))((),(2)()())(()(

222222

2

222222

2

22

22

FerrorVarCerrorVarebcaeBVarceAVarbe

FerrorVarCVareFerrorVareCVarFVar

EerrorVarCerrorVardbcadBVarcdAVarbd

EerrorVarCVardEerrorVardCVarEVar

CerrorVarbcaBVarcAVarb

CerrorVarBAbcCovBVarcAVarbCerrorcBbAVarCVar

En el ejemplo 2, las varianzas de las variables endógenas serían:

))(()(2))(()())(()(

))((),(2)()())(()(

))(()()(

))(()()(

222222

22

2

2

EErrorVarAcdabVarCErrorVardAVarbdBerrorVarcAVarac

EErrorVarCBcdCovBVardBVarcEerrordCcBVarEVar

CErrorVarAVarbCVar

BErrorVarAVaraBVar

En el ejemplo 3, las varianzas de las variables endógenas serían:

24 Apuntes Modelos de Ecuaciones estructurales (Universidad Autónoma de Madrid)

))(()()(

))(()()(

))(()()(

2

2

2

FerrorVarCVarfFVar

EErrorVarBVareEVar

DErrorVarAVardDVar

Representación de los modelos (conceptos avanzados) En este apartado vamos a mostrar la notación más usual para referirse a los parámetros de un modelo de ecuaciones estructurales. Observe el siguiente modelo estructural (Wheaton, 1977):

anomia67 powles67 anomia71 powles71

educatio SEI

67alienation

71alienation

eps1 eps2 eps3 eps4

ses

delta2delta1

1 1 1 1

11

1

1

zeta2zeta11 1

1

Pues bien, lo más usual es referirse a las variables utilizando letras. Lo más usual sería ex-presar el modelo como:

Capítulo 2. Representación de los modelos 25

1 1 1 1

1

1 1

1

Hemos introducido algunas modificaciones:

Se utilizan letras latinas para referirse a las variables observables (X, Y) Se utilizan letras griegas para referirse a las variables latentes (, η, δ, ).2 También se utilizan letras griegas para los parámetros que representan los efectos o

covarianzas entre las variables (λ, γ, ). En cada símbolo se representan con subíndices dos números. Si es unidireccional,

el primer número indica la variable predictora y el segundo la variable predicha. Si la flecha fuera bidireccional los números indicarían las variables implicadas y el orden de los subíndices es arbitrario.

En concreto:

• ξ (Ksi) son las variables latentes exógenas. • X son las variables observables que constituyen indicadores de las variables la-

tentes exógenas.

2 La siguiente tabla muestra la pronunciación de algunas de las letras griegas más utilizadas en este contexto: αΑ Alfa ζΖ Zeta μΜ Mi νΥ Upsilon βΒ Beta ηΗ Eta νN Ni τΤ Tau γΓ Gamma θΘ Theta ξΞ Ksi φ Φ Phi δ Δ Delta κΚ Kappa πΠ Pi ψΨ Psi εΕ Epsilon λΛ Lambda σΣ Sigma ωΩ Omega

1 2 3 4

Y1 Y2 Y3 Y4

X1 X2

y11 y21 y32 y42

1 1 2 2

1

1 2

x11 x21

11 21

21

26 Apuntes Modelos de Ecuaciones estructurales (Universidad Autónoma de Madrid)

• (delta) representa el término error al predecir X a partir de ξ.

• η (eta) son las variables latentes endógenas. • Y son las variables observables que constituyen indicadores de las variables la-

tentes endógenas. • (épsilon) representa el término error al predecir Y a partir de η.

• ζ(zeta) representa el término error al predecir η a partir de ξ.

El modelo se traduce en una serie de ecuaciones. El modelo de medida para las variables exógenas (asumiendo que las puntuaciones están en diferenciales):

21212

11111

x

x

X

X

Donde xjk es el peso de la variable Xj en la variable k . j es la varianza del error de me-

dida de la variable Xj. Matricialmente:

2

11

21

11

2

1

x

x

X

X

Las ecuaciones anteriores se pueden expresar de forma compacta:

δξΛx x donde Λx

representa la matriz q x n de coeficientes de regresión de las variables X sobre las variables ξ. A la matriz Λx se le denomina usualmente matriz de pesos factoriales. x es un vector de dimensiones q x 1 que contiene las q variables X. ξ es un vector de dimensio-nes n x 1 que contiene las variables latentes exógenas. δ es una vector de dimensiones q x 1 que contiene los errores de medida de las q variables X. El modelo de medida para las variables endógenas es (asumiendo que las puntuaciones están en diferenciales):

42424

32323

21212

11111

y

y

y

y

Y

Y

Y

Y

Capítulo 2. Representación de los modelos 27

Donde yjk es el peso de la variable Yj en la variable k . j es la varianza del error de me-

dida de la variable Yj. Matricialmente:

4

3

2

1

2

1

42

32

21

11

4

3

2

1

0

0

0

0

y

y

y

y

Y

Y

Y

Y

Las ecuaciones anteriores se pueden expresar de forma compacta:

εηΛy y donde Λy

representa la matriz p x m de coeficientes de regresión de las p variables Y sobre las m variables η. A la matriz Λy se le denomina usualmente matriz de pesos factoriales. Y es un vector de dimensiones m x 1 que contiene las m variables Y. η es un vector de di-mensiones m x 1 que contiene las variables latentes η. es una vector de dimensiones m x 1 que contiene los errores de medida de las m variables Y. El modelo estructural es:

11111

11211212

Donde jk es el peso de la variable j en la variable k. Donde jk es el peso de la variable

j en la variable k . j es la varianza del error de regresión al predecir la variable j a

partir del resto de las variables. Matricialmente:

2

11

21

11

2

1

212

1

0

00

Las ecuaciones anteriores se pueden expresar de forma compacta:

ζΓξΒηη donde

representa la matriz m x n de coeficientes de regresión de las m variables so-

bre las n variables . η es un vector de dimensiones m x 1 que contiene las variables la-

tentes η. ξ es un vector de dimensiones n x 1 que contiene las n variables ξ. es una vec-tor de dimensiones m x 1 que contiene los errores de predicción de las m variables η.

28 Apuntes Modelos de Ecuaciones estructurales (Universidad Autónoma de Madrid)

Un problema de la ecuación anterior es que η aparece a ambos lados de la ecuación. Para que esto no sea así puede despejarse η. Matricialmente:

)()( 1 ζΓξBIη

Entonces, podemos definir:

1)(* BIB Por tanto:

)(* ζΓξBη Ecuaciones para la matriz de varianzas-covarianzas Modelo para las variables X, indicadores de las variables exógenas Las varianzas y covarianzas de las variables X pueden derivarse de los parámetros del modelo:

)(),(

)()()(

)()()(

1211121

212

212

112111

VarXXCov

VarVarXVar

VarVarXVar

xx

x

x

Matricialmente, esto puede expresarse como:

)(0

0)()(

)(),(

),()(

2

121111

21

11

221

211

Var

VarVar

XVarXXCov

XXCovXVar

Ahora establezcamos una serie de definiciones para hacer la notación más compacta:

)(),(

),()(

221

211

2212

2111

XVarXXCov

XXCovXVar

θΣθΣ

θΣθΣθΣ

xx

xxx

21

11

x

x

)( 111 VarΦ

Capítulo 2. Representación de los modelos 29

)(0

0)(

2

1

2212

2111

Var

VarδΘ

θΣx (sigma-equis) representa la matriz de varianzas-covarianzas entre las variables X

según el modelo. Cada elemento jkθΣx representa un elemento de esa matriz. θ se refie-

re genéricamente a todos los parámetros del modelo (i.e., Λx

(lambda-equis) representa la matriz de coeficientes de regresión de las variables X so-bre las variables ξ. Φ (phi) es una matriz simétrica que contiene la matriz de varianzas-covarianzas de los factores (ξ). Cada elemento jk se refiere a un elemento de esa matriz. En el ejemplo la

matriz solo contiene un elemento porque sólo hay una variable latente exógena. Θ

(theta-delta) es una matriz simétrica que contiene la matriz de varianzas-covarianzas de los términos de error de las variables X (). En el ejemplo, es una matriz diagonal pues-to que los errores no correlacionan entre sí. Cada elemento jk se refiere a un elemento

de esa matriz. De forma compacta puede escribirse:

δ'xxx ΘΦΛΛθΣ

Observe que a la izquierda de la ecuación aparece la matriz que contiene las varianzas y cova-rianzas entre las variables, mientras que a la derecha aparecen las matrices que contienen los parámetros del modelo ( Demostración:

)δδ'Λδξ'ξδ'ΛΛξξ'(Λ

)δδ'ξ)'δ(Λξ)δ'(Λξ)'ξ)(Λ((Λ

)'δξΛδξΛ()(XX'θΣ

'xx

'xx

xxxx

xxx

E

E

EE

δ'xx

'xx

'xx

ΘΦΛΛ

)δδ'Λδξ'ξδ'ΛΛξξ'Λ

()()()( EEEE

Nótese que se asume que las variables exógenas no correlacionan con sus términos de error:

)(ξδ'E = 0

30 Apuntes Modelos de Ecuaciones estructurales (Universidad Autónoma de Madrid)

Modelo para las variables latentes endógenas Las varianzas y covarianzas de las variables pueden derivarse de los parámetros del modelo:

))()(()()()(),(

)()()()()()()()(

)()()(

1121121121111211211121

2122111

211

22121

2211

2212

112111

VarVarVarVarVarCov

VarVarVarVarVarVarVarVar

VarVarVar

Matricialmente, esto puede expresarse como:

10

1

)(0

0)()(

1

01

)(),(

),()( 21

2

121111

21

11

21221

211

Var

VarVar

VarCov

CovVar

Si definimos:

)(),(

),()(

221

211

2221

1211

VarCov

CovVar

θΣθΣ

θΣθΣθΣ

ηη

ηηη

1

01

10

01

21

1

2221

12111*

BIB

21

11

Γ

)(0

0)(

2

1

2221

1211

Var

VarΨ

θΣη (sigma-eta) representa la matriz de varianzas-covarianzas entre las variables

según el modelo. Cada elemento jkθΣη representa un elemento de esa matriz.

B* es la inversa de una matriz que depende de dos matrices: I : matriz identidad.

B (beta) es una matriz que contiene los coeficientes de regresión de η sobre η. En el ejemplo, sólo hay un efecto (21)

Capítulo 2. Representación de los modelos 31

Г (gamma) es una matriz que contiene los coeficientes de regresión de η sobre ξ. Ψ (psi) es la matriz de varianzas-covarianzas entre las ζ (errores al predecir η a partir de ξ). En el ejemplo, es una matriz diagonal puesto que los errores no correlacionan entre sí. Cada elemento jk se refiere a un elemento de esa matriz. De forma compacta:

*'* )'( BΨΓΦΓBθΣη

En efecto:

*'*

*'**'*

*'**'**'**'*

*'**'**'**'*

****

)'(

'

')'()'()'(')'(

)''''''

))')(()(

BΨΓΦΓB

ΨBBBΓΦΓB

BΓζξBBξζΓBBζζBBΓξξΓB

BΓζξBBΓξζBBζζBBΓΓξξ(B

ζBΓξBζBΓξB(ηη'θΣη

EEEE

E

EE

)(000

0)(00

00)(0

000)(

00

00

10

1

)(0

0)()(

1

01

0

0

0

0

4

3

2

1

4232

2111

21

2

121111

21

11

21

42

32

21

11

Var

Var

Var

Var

Var

VarVar

yy

yy

y

y

y

y

32 Apuntes Modelos de Ecuaciones estructurales (Universidad Autónoma de Madrid)

Modelo para las varianzas y covarianzas de las variables Y Las varianzas y covarianzas de las variables Y pueden derivarse de los parámetros del mo-delo:

)(),(

),(),(

),(),(

),(),(

),(),(

)(),(

)()()(

)()()(

)()()(

)()()(

2423243

21422142

21322132

21421141

21321131

1211121

422

424

322

323

212

212

112

111

VarYYCov

CovYYCov

CovYYCov

CovYYCov

CovYYCov

VarYYCov

VarVarYVar

VarVarYVar

VarVarYVar

VarVarYVar

yy

yy

yy

yy

yy

yy

y

y

y

y

Matricialmente, esto puede expresarse como:

)(),(),(),(

),()(),(),(

),(),()(),(

),(),(),()(

4342414

4332313

4232212

4131211

YVarYYCovYYCovYYCov

YYCovYVarYYCovYYCov

YYCovYYCovYVarYYCov

YYCovYYCovYYCovYVar

)(000

0)(00

00)(0

000)(

00

00

)(),(

),()(

0

0

0

0

4

3

2

1

4232

2111

221

211

42

32

21

11

Var

Var

Var

Var

VarCov

CovVar

yy

yy

y

y

y

y

Ahora establezcamos una serie de definiciones para hacer la notación más compacta:

Capítulo 2. Representación de los modelos 33

)(),(),(),(

),()(),(),(

),(),()(),(

),(),(),()(

4342414

4332313

4232212

4131211

44434241

34333231

24232221

14131211

YVarYYCovYYCovYYCov

YYCovYVarYYCovYYCov

YYCovYYCovYVarYYCov

YYCovYYCovYYCovYVar

θΣθΣθΣθΣ

θΣθΣθΣθΣ

θΣθΣθΣθΣ

θΣθΣθΣθΣ

θΣ

yyyy

yyyy

yyyy

yyyy

y

42

32

21

11

0

0

0

0

y

y

y

y

)(000

0)(00

00)(0

000)(

4

3

2

1

44434241

34333231

24232221

14131211

Var

Var

Var

Var

εΘ

yΣ (sigma-equis) representa la matriz de varianzas-covarianzas entre las variables Y

según el modelo. Cada elemento jkθΣy representa un elemento de esa matriz.

Λy

(lambda-y griega) representa la matriz de coeficientes de regresión de las variables Y sobre las variables . Θ

(theta-epsilon) es una matriz simétrica que contiene la matriz de varianzas-covarianzas de los términos de error de las variables Y (). En el ejemplo, es una matriz diagonal pues-to que los errores no correlacionan entre sí. Cada elemento jk se refiere a un elemento

de esa matriz. De forma compacta:

ε'yy

εyηyy

ΘΛBΨΓΦΓBΛ

ΘΛθΣΛθΣ

*'*

'

)'(

En efecto:

34 Apuntes Modelos de Ecuaciones estructurales (Universidad Autónoma de Madrid)

)εε'Λεη'ηε'ΛΛηη'(Λ

)εε'η)'ε(Λη)ε'(Λη)'η)(ΛΛ(

)'εηΛεηΛ()(YY'θΣ

'yy

'yy

yyyy

yyy

E

E

EE

(

ε'yy

'yy

'yy

ΘΛBΨΓΦΓBΛ

)εε'Λεη'ηε'ΛΛηη'Λ

*'* )'(

()()()( EEEE

Modelo para las covarianzas entre las variables y las variables Las covarianzas entre las variables y las variables pueden derivarse de los parámetros del modelo:

)()(),(

)(),(

1211112121

11111

VarVarCov

VarCov

Matricialmente, esto puede expresarse como:

10

1)(),(),( 21

211112111

VarCovCov

Definamos:

),(),( 21111211 CovCov θΣθΣθΣ ξηξηξη

θΣξη (sigma-epsilon-delta) representa la matriz de covarianzas entre las variables y las

variables . Cada elemento jkθΣξη representa un elemento de esa matriz.

De forma compacta:

*'')( BΦΓξη'EθΣξη En efecto:

*'

*'*'

*'*'

**

'

)'(')'(

)'''(

))'()(

BΦΓ

BξζEBΓξξE

BξζBΓξξ

ζBΓξB(ξξη'

E

EE

Capítulo 2. Representación de los modelos 35

Modelo para las covarianzas entre las variables X y las variables Y Las covarianzas entre las variables X y las variables Y pueden derivarse de los parámetros del modelo:

)()(),(),(

)()(),(),(

)(),(),(

)(),(),(

121114211121421121421141

121113211121321121321131

111211111211121

111111111111111

VarVarCovYXCov

VarVarCovYXCov

VarCovYXCov

VarCovYXCov

yxyxyx

yxyxyx

yxyx

yxyx

Matricialmente, esto puede expresarse como:

),(),(),(),(

),(),(),(),(

42322212

41312111

yxCovyxCovyxCovyxCov

yxCovyxCovyxCovyxCov

),(),(),(),(

),(),(),(),(

00

00),(),(

42322212

42312111

4232

21112111

21

11

CovCovCovCov

CovCovCovCov

CovCovyy

yy

Definamos:

),(),(),(),(

),(),(),(),(

42322212

41312111

24232221

14131211

yxCovyxCovyxCovyxCov

yxCovyxCovyxCovyxCov

θΣθΣθΣθΣ

θΣθΣθΣθΣθΣ

xyxyxyxy

xyxyxyxyxy

),(),(),(),(

),(),(),(),(

42322212

42312111

24232221

14131211

CovCovCovCov

CovCovCovCov

δεΘ

donde:

θΣxy (sigma-xy) representa la matriz de covarianzas entre las variables X y las variables

Y. Cada elemento jkxyΣ representa un elemento de esa matriz.

36 Apuntes Modelos de Ecuaciones estructurales (Universidad Autónoma de Madrid)

Θ

(theta-delta-epsilon) es una matriz que contiene las covarianzas entre los términos de error de las variables X () y los términos de error de las variables Y (). Cada elemento

jk indica la covarianza entre j y k.. En el ejemplo, todas las covarianzas son cero.

De forma compacta:

εyx

εyξηxxy

ΘΛ'BΦΓ'Λ

ΘΛ'θΣΛθΣ

*'

En efecto:

εy'

x

yxyx

yxyx

yxyx

yxxy

ΘΛ'BΦΓΛ

δε'EΛ'δη'Eξε'EΛΛ'ξη'EΛ

)δε'Λ'δη'ξε'ΛΛ'ξη'E(Λ

)δε'η)'δ(Λε'ξ(Λη)'(ΛξΛE(

)'εηΛδξΛE()E(XY'θΣ

*'

)()()()(

))(

Capítulo 2. Representación de los modelos 37

Resumen:

ε'yyε

'xy

ε'yxδ

'xx

yyx

xyx

ΘΛBΨΓΦΓBΛΘΓΦΛBΛ

ΘΛBΦΓΛΘΦΛΛ

θΣθΣ

θΣθΣ*'**

*'

)'(

'

donde los elementos de las matrices de varianzas-covarianzas predichas por el modelo se en-cuentran en las siguientes matrices:

θΣx (sigma-equis) representa la matriz de varianzas-covarianzas entre las variables X

según el modelo. Cada elemento jkθΣx representa un elemento de esa matriz.

θΣy (sigma-equis) representa la matriz de varianzas-covarianzas entre las variables Y

según el modelo. Cada elemento jkθΣy representa un elemento de esa matriz.

θΣxy (sigma-xy) representa la matriz de covarianzas entre las variables X y las variables

Y. Cada elemento jkθΣxy representa un elemento de esa matriz. 'θΣθΣ xyyx

En lo sucesivo nos referimos a la matriz completa como Σ :

θΣθΣ

θΣθΣθΣ

yyx

xyx

Y los parámetros del modelo se contienen en las siguientes matrices: Λx

(lambda-equis) representa la matriz de coeficientes de regresión de las variables X so-bre las variables ξ. Φ (phi) es una matriz simétrica que contiene la matriz de varianzas-covarianzas de los factores (ξ). Cada elemento jk se refiere a un elemento de esa matriz. En el ejemplo, la

matriz solo contiene un elemento porque sólo hay una variable latente exógena. Θ

(theta-delta) es una matriz simétrica que contiene la matriz de varianzas-covarianzas de los términos de error de las variables X (). En el ejemplo, es una matriz diagonal pues-to que los errores no correlacionan entre sí. Cada elemento jk se refiere a un elemento

de esa matriz. B* es la inversa de una matriz que depende de dos matrices: I : matriz identidad.

B (beta) es una matriz que contiene los coeficientes de regresión de η sobre η. En el ejemplo, sólo hay un efecto (21)

38 Apuntes Modelos de Ecuaciones estructurales (Universidad Autónoma de Madrid)

Г (gamma) es una matriz que contiene los coeficientes de regresión de η sobre ξ. Ψ (psi) es la matriz de varianzas-covarianzas entre las ζ. En el ejemplo, es una matriz di-agonal puesto que los errores no correlacionan entre sí. Cada elemento jk se refiere a un

elemento de esa matriz. Λy

(lambda-y griega) representa la matriz de coeficientes de regresión de las variables Y sobre las variables . Θ

(theta-epsilon) es una matriz simétrica que contiene la matriz de varianzas-covarianzas de los términos de error de las variables Y (). En el ejemplo, es una matriz diagonal pues-to que los errores no correlacionan entre sí. Cada elemento jk se refiere a un elemento

de esa matriz. Θ

(theta-delta-epsilon) es una matriz que contiene las covarianzas entre los términos de error de las variables latentes exógenas () y los términos de error de las variables latentes endógenas (). Cada elemento jk indica la covarianza entre j y k. ΘΘ

'