Handout - Sesion 11 - No Notes

12
14/10/2014 1 Andres Molano – CIFE - 2014 EDUC - 4026 Métodos Cuantitativos de Investigación Andres Molano Centro de Investigación y Formación en Educación & Facultad de Ciencias Sociales Universidad de los Andes Andres Molano – CIFE - 2014 EDUC - 4026 Mapa del Curso Cimientos de Inferencia Estadística Fundamentos de Regresión Linear Interpretación y comunicación Generalización de principios 1. Teoría, diseños y Causalidad 2. Inferencia Estadística Básica 3. Análisis bi- variados 4. Análisis de Varianza 5. Regresión lineal (predictor continuo) 6. Regresión lineal (predictor categórico) 7. Regresión Múltiple 8. Moderación en Modelos de Regresión 9. Taxonomía de Modelos 10. Evaluación de Supuestos de la Regresión 11. Post- Estimación (eff. Marginales) 12. Post- Estimación (Rep. Grafica) 13. Mediación completa (2SLS) 14. Regresión Logística 15. Probabilidades Marginales Andres Molano – CIFE - 2014 EDUC - 4026 Mapa del Curso (beta) Cortesía de John B. Willett Análisis de Regresión Múltiple 2 2 1 1 0 X X Y 1. Teoría, diseños y Causalidad Características de los Predictores y su interpretación Binarios y Categóricos Continuos Interacciones (a.k.a Moderación) Taxonomía de Modelos Evaluación de Supuestos de la Regresión Análisis Multinivel Análisis longitudinal Post- Estimación Efectos marginales y representación grafica Continua Binaria Mediación completa (2SLS) Inferencia Causal Ecuaciones Estructurales

description

Notas STATA

Transcript of Handout - Sesion 11 - No Notes

Page 1: Handout - Sesion 11 - No Notes

14/10/2014

1

Andres Molano – CIFE - 2014

EDUC - 4026

Métodos Cuantitativos de Investigación

Andres Molano

Centro de Investigación y Formación en Educación&

Facultad de Ciencias Sociales

Universidad de los Andes

Andres Molano – CIFE - 2014

EDUC - 4026

Mapa del CursoCimientos de

InferenciaEstadística

Fundamentos deRegresión Linear

Interpretación ycomunicación

Generalizaciónde principios

1. Teoría, diseñosy Causalidad

2. InferenciaEstadística Básica

3. Análisis bi-variados

4. Análisis deVarianza

5. Regresiónlineal (predictor

continuo)

6. Regresiónlineal (predictor

categórico)

7. RegresiónMúltiple

8. Moderación enModelos deRegresión

9. Taxonomía deModelos

10. Evaluación deSupuestos de la

Regresión

11. Post-Estimación (eff.

Marginales)

12. Post-Estimación (Rep.

Grafica)

13. Mediacióncompleta (2SLS) 14. Regresión Logística 15. Probabilidades

Marginales

Andres Molano – CIFE - 2014

EDUC - 4026

Mapa del Curso (beta)Cortesía de John B. Willett

Análisis de RegresiónMúltiple

Análisis de RegresiónMúltiple

22110 XXY

1. Teoría, diseñosy Causalidad

Características de losPredictores y su interpretación

Binarios y Categóricos Continuos

Interacciones (a.k.a Moderación)

Taxonomía de Modelos

Evaluación deSupuestos de la

Regresión

AnálisisMultinivel

Análisislongitudinal

Post- Estimación

Efectosmarginales y

representacióngrafica

Continua Binaria

Mediacióncompleta(2SLS)

InferenciaCausal

EcuacionesEstructurales

Page 2: Handout - Sesion 11 - No Notes

14/10/2014

2

Andres Molano – CIFE - 2014

EDUC - 4026

Tabla 1. EDUC-4026: Parámetros estimados, valores p aproximados, y estadísticas de ajuste del modelo para una taxonomía demodelos de regresión evaluando la relación entre Ansiedad frente a las Matemáticas (ANXMAT1) y familiaridad reportada con elcontenido (FAMCON1) con el desempeño alcanzado en la prueba de PISA 2012 – componente de Matemáticas – por una poblaciónde adolescentes en 9 diferentes países de las Américas. n=2972

Modelos de regresiónM1 M2 M3 M4 M5 M6 M7 M8

Intercepto 501.86*** 239.89*** 335.22*** 272.14*** 275.66*** 256.54*** 273.70*** 218.48***ANXMAT1 -33.20*** -24.49*** -0.70 0.07 1.52 -4.09 -3.11FAMCON1 37.72*** 31.43*** 44.57*** 44.80*** 44.74*** 40.84*** 37.51***ANXMAT1byFAMCON1 -5.05*** -4.93*** -4.94*** -3.79** -3.92**FEMALE 15.27*** 23.41 15.34*** 13.14***ANXMAT1byFEMALE -3.07FAMCON1byFEMALE 0.04

WEALTH1 14.55***

BRAZIL -9.01 -4.30CHILE 20.57** 14.57*COLOMBIA -23.08*** -15.00*COSTA RICA 7.48 14.50*MEXICO 10.62* 18.64***PERU -44.34*** -27.87***URUGUAY 10.19 9.54USA 47.07*** 27.09***

R2 0.134 0.1873 0.2552 0.2588 0.2676 0.2679 0.3252 0.3697

Andres Molano – CIFE - 2014

EDUC - 4026

Interpretación de resultados estimados

• Algunas consideraciones– Trabajar con una taxonomía de modelos no quiere decir que

debemos interpretar, todos y cada uno de los modelos estimados.– Generalmente interpretamos exclusivamente el ultimo modelo

estimado. El énfasis debe estar en responder la pregunta deinvestigación, considerando posibles “explicaciones alternativas”

– En las próximas dos clases (miércoles y jueves) interpretaremosvarios modelos estimados como un recurso pedagógico.

Andres Molano – CIFE - 2014

EDUC - 4026

Modelo 1:= + +

_cons 501.8676 4.431719 113.24 0.000 493.1781 510.5572ANXMAT1 -33.20729 1.546681 -21.47 0.000 -36.23997 -30.17462

MATH Coef. Std. Err. t P>|t| [95% Conf. Interval]

Total 19048651.2 2971 6411.52852 Root MSE = 74.512Adj R-squared = 0.1341

Residual 16489395.3 2970 5551.98495 R-squared = 0.1344Model 2559255.93 1 2559255.93 Prob > F = 0.0000

F( 1, 2970) = 460.96Source SS df MS Number of obs = 2972

. regress MATH ANXMAT1 if filter1==1

Page 3: Handout - Sesion 11 - No Notes

14/10/2014

3

Andres Molano – CIFE - 2014

EDUC - 4026

Intercepto estimado ( ) of 501.87:

El promedio estimado de MATH que corresponde a un valor de ANXMAT=0.

Pendiente Estimada ( ) of (-33.21):

La “diferencia” estimada en promedio de MATH por 1 punto (unidad) de “diferencia”en ANXMAT.

En promedio, cada 1 punto de diferencia en MATH esta asociado negativamente conuna diferencia estimada de 33.21 puntos en ANXMAT

En promedio, cada 1 punto de diferencia en MATH corresponde a una diferenciaestimada de -33.21 puntos en ANXMAT

_cons 501.8676 4.431719 113.24 0.000 493.1781 510.5572ANXMAT1 -33.20729 1.546681 -21.47 0.000 -36.23997 -30.17462

MATH Coef. Std. Err. t P>|t| [95% Conf. Interval]

= 501.87 + (−33.21 × )

Andres Molano – CIFE - 2014

EDUC - 4026

Una de interpretar resultados es pensar en diferentes“personas prototípicas” en la población.

• Por ejemplo, cual seria el promedio estimado para una “persona”con niveles de ansiedad = 0, en la población?

• Si los mejores “estimados” del comportamiento de la población esnuestro modelo… podemos usar nuestro modelo estimado pararesponder esta pregunta.= + += 501.87 + (−33.21 × 1)= 501.87 + (−33.21 × 0)= 501.87

Andres Molano – CIFE - 2014

EDUC - 4026

Una de interpretar resultados es pensar en diferentes“personas prototípicas” en la población.

• De igual manera, cual seria el promedio estimado para una“persona” con niveles de ansiedad = 1.5, en la población?= + += 501.87 + (−33.21 × 1)= 501.87 + (−33.21 × 1.5)= 501.87 + (−49.815)= 452.055

Page 4: Handout - Sesion 11 - No Notes

14/10/2014

4

Andres Molano – CIFE - 2014

EDUC - 4026

Qué tal para “personas” con niveles deansiedad = 3 y 4.5, en la población?

== 501.87 + (−33.21 × 3)= 501.87 + −99.63= 402.24[ | = . ]= 501.87 + (−33.21 × 4.5)= 501.87 + −149.445= 352.425

= + += 501.87 + (−33.21 × 1)

Andres Molano – CIFE - 2014

EDUC - 4026

0 1 2 3 4.5ANXMAT1

501.87

468.66

452.05

Cuál es la diferencia entre 501.87 y 468.66?

402.24

352.42

Andres Molano – CIFE - 2014

EDUC - 4026

ANXMAT1MATH0 501.87

0.5 485.2651 468.66

1.5 452.0552 435.45

2.5 418.8453 402.24

3.5 385.6354 369.03

4.5 352.4255 335.82

501.87

468.66

435.45

402.24

369.03

335.82

300

350

400

450

500

550

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5

Est

imad

o de

MA

TH

ANXMAT1

Page 5: Handout - Sesion 11 - No Notes

14/10/2014

5

Andres Molano – CIFE - 2014

EDUC - 4026

Intercepto estimado ( ) of 501.87:

El promedio estimado de MATH que corresponde a un valor de ANXMAT=0.

Pendiente Estimada ( ) of (-33.21):

La “diferencia” estimada en promedio de MATH por 1 punto (unidad) de “diferencia”en ANXMAT.

En promedio, cada 1 punto de diferencia en MATH esta asociado negativamente conuna diferencia estimada de 33.21 puntos en ANXMAT

En promedio, cada 1 punto de diferencia en MATH corresponde a una diferenciaestimada de -33.21 puntos en ANXMAT

_cons 501.8676 4.431719 113.24 0.000 493.1781 510.5572ANXMAT1 -33.20729 1.546681 -21.47 0.000 -36.23997 -30.17462

MATH Coef. Std. Err. t P>|t| [95% Conf. Interval]

= 501.87 + (−33.21 × )

Andres Molano – CIFE - 2014

EDUC - 4026

Modelo 2:= + +

_cons 239.8906 6.68729 35.87 0.000 226.7784 253.0028FAMCON1 37.72102 1.442007 26.16 0.000 34.89359 40.54846

MATH Coef. Std. Err. t P>|t| [95% Conf. Interval]

Total 19048651.2 2971 6411.52852 Root MSE = 72.199Adj R-squared = 0.1870

Residual 15481718.3 2970 5212.69977 R-squared = 0.1873Model 3566932.91 1 3566932.91 Prob > F = 0.0000

F( 1, 2970) = 684.28Source SS df MS Number of obs = 2972

Andres Molano – CIFE - 2014

EDUC - 4026

Un ejercicio para usted:• Estime y grafique a partir de los parámetros del

modelo = + += 239.89 + (37.72 × )… los siguientes “valores predichos”[ | = 0][ | = 3]= 6[ | = 9]

Page 6: Handout - Sesion 11 - No Notes

14/10/2014

6

Andres Molano – CIFE - 2014

EDUC - 4026

0 3 6 9FAMCON1

Andres Molano – CIFE - 2014

EDUC - 4026

Andres Molano – CIFE - 2014

EDUC - 4026

Modelo 3:= + + ( ) +

_cons 335.224 8.635619 38.82 0.000 318.2916 352.1564FAMCON1 31.43616 1.432557 21.94 0.000 28.62725 34.24506ANXMAT1 -24.4951 1.488855 -16.45 0.000 -27.41439 -21.5758

MATH Coef. Std. Err. t P>|t| [95% Conf. Interval]

Total 19048651.2 2971 6411.52852 Root MSE = 69.129Adj R-squared = 0.2547

Residual 14188206 2969 4778.78277 R-squared = 0.2552Model 4860445.2 2 2430222.6 Prob > F = 0.0000

F( 2, 2969) = 508.54Source SS df MS Number of obs = 2972

Page 7: Handout - Sesion 11 - No Notes

14/10/2014

7

Andres Molano – CIFE - 2014

EDUC - 4026

Modelo 3:= + + += 335.22 + −24.49 × + (31.43 × )• Enfoquémonos por un momento en ANXMAT1, es

decir, fijemos a FAMCON1 en una constante….• Por ejemplo, en un valor de 0.[ = 0 = 0][ = 1 = 0][ = 2 = 0][ = 3 = 0][ = 5 = 0]

Andres Molano – CIFE - 2014

EDUC - 4026

335.22310.73

286.24261.75

237.26212.77

150

200

250

300

350

400

450

500

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5

Est

imad

o de

MA

TH

ANXMAT1

Cuál es la diferencia, estimada entre 335.22 y 310.73???

entre 310.73 y 286.24???

Andres Molano – CIFE - 2014

EDUC - 4026

Cuál es la diferencia, estimada entre 335.22 y 310.73???

entre 310.73 y 286.24???

_cons 335.224 8.635619 38.82 0.000 318.2916 352.1564FAMCON1 31.43616 1.432557 21.94 0.000 28.62725 34.24506ANXMAT1 -24.4951 1.488855 -16.45 0.000 -27.41439 -21.5758

MATH Coef. Std. Err. t P>|t| [95% Conf. Interval]

Total 19048651.2 2971 6411.52852 Root MSE = 69.129Adj R-squared = 0.2547

Residual 14188206 2969 4778.78277 R-squared = 0.2552Model 4860445.2 2 2430222.6 Prob > F = 0.0000

F( 2, 2969) = 508.54Source SS df MS Number of obs = 2972

Page 8: Handout - Sesion 11 - No Notes

14/10/2014

8

Andres Molano – CIFE - 2014

EDUC - 4026

Modelo 3:= + + += 335.22 + −24.49 × + (31.43 × )• Ahora pongamos el énfasis en FAMCON1, fijando

ANXMAT en un valor de 0….[ = 0 = 0][ = 0 = 1][ = 0 = 3][ = 0 = 6][ = 0 = 9]

Andres Molano – CIFE - 2014

EDUC - 4026

335.22366.65

429.51

523.8

618.09

150

250

350

450

550

650

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6 6.5 7 7.5 8 8.5 9

Est

imad

o de

MA

TH

FAMCON1

Cuál es la diferencia, estimada entre 335.22y 366.65???

(366.65 – 335.22) = 31.43

Andres Molano – CIFE - 2014

EDUC - 4026

_cons 335.224 8.635619 38.82 0.000 318.2916 352.1564FAMCON1 31.43616 1.432557 21.94 0.000 28.62725 34.24506ANXMAT1 -24.4951 1.488855 -16.45 0.000 -27.41439 -21.5758

MATH Coef. Std. Err. t P>|t| [95% Conf. Interval]

De acuerdo a nuestro modelo, estimamos que la media de MATH es 335.22, cuando todos lospredictores en el modelo son igual a cero. Este promedio, es estadísticamente diferente de 0, en la

población (p <.001)Nuestros resultados sugieren que, en promedio en la población, una unidad de diferencia en

ANXMAT1 esta asociada con -24.49 puntos de diferencia en los puntajes de MATH, controlandopor el efecto de FAMCON1. Esta asociación, es estadísticamente significativa, a un nivel de

α=0.05.

De igual manera, controlando por los efectos de ANXMAT, nuestros resultados sugieren que, enpromedio en la población, una unidad de diferencia en FAMCON1 esta asociada con 31.43 puntosde diferencia en MATH. Esta asociación, es estadísticamente diferente a cero ( t = -21.94, p <.001)

Page 9: Handout - Sesion 11 - No Notes

14/10/2014

9

Andres Molano – CIFE - 2014

EDUC - 4026

Para contar la historia tengo que fijar el otropredictor en 0?

• No!. Pero el modelo lo hace.• Qué pasa si quiero fijarlo en el promedio del

predictor por el cual estoy controlando?= 0 = 4.54 = 477.91= 1 = 4.54 = 453.66= 2 = 4.54 = 428.93= 3 = 4.54 = 404.44= 5 = 4.54 = 355.46Y la diferencia estimada entre 477.91 y 453.66?

24.49

Andres Molano – CIFE - 2014

EDUC - 4026

• Fijar el otro predictor en cualquiervalor, mientras sea constante, esigual a la noción de “control”estadístico.Eso es lo que el modelo hace!

Andres Molano – CIFE - 2014

EDUC - 4026

Page 10: Handout - Sesion 11 - No Notes

14/10/2014

10

Andres Molano – CIFE - 2014

EDUC - 4026

Modelo 4:= + + +( × ) +

_cons 272.1423 18.6749 14.57 0.000 235.5253 308.7594ANXbyFAM -5.051464 1.326776 -3.81 0.000 -7.652959 -2.44997

FAMCON1 44.57486 3.735194 11.93 0.000 37.25103 51.89869ANXMAT1 -.7021004 6.4234 -0.11 0.913 -13.29687 11.89267

MATH Coef. Std. Err. t P>|t| [95% Conf. Interval]

Total 19048651.2 2971 6411.52852 Root MSE = 68.972Adj R-squared = 0.2580

Residual 14119247.7 2968 4757.15892 R-squared = 0.2588Model 4929403.56 3 1643134.52 Prob > F = 0.0000

F( 3, 2968) = 345.40Source SS df MS Number of obs = 2972

. regress MATH ANXMAT1 FAMCON1 ANXbyFAM if filter1==1

Andres Molano – CIFE - 2014

EDUC - 4026

Modelo Estimado:= 272.14 + −0.70 × +44.57 × +(−5.05 ×y…. Entonces… como reportamos estosresultados?

Modelo con Interacción= + + +( × ) +

Andres Molano – CIFE - 2014

EDUC - 4026

• : Intercepto =272.14 El desempeño estimado en MATH, enpromedio en esta población, cuando FAMCON1 = ANXMAT1 = 0

• : Pendiente de ANXMAT =-0.70 “diferencia” promedio estimadaen MATH correspondiente a una unidad de diferencia en ANXMAT,controlando por FAMCON1

• : Pendiente de FAMCON1 =44.57 “diferencia” promedio estimadaen MATH correspondiente a una unidad de diferencia en FAMCON1,controlado por ANXMAT1

• : Efecto de interacción (ANXMAT × FAMCON1) =(-5.05)“diferencia” promedio estimada en el efecto de FAMCON1 enMATH correspondiente a una unidad de diferencia en ANXMAT1.

• “diferencia” promedio estimada en el efecto de ANXMAT1 enMATH correspondiente a una unidad de diferencia en FAMCON1.

Page 11: Handout - Sesion 11 - No Notes

14/10/2014

11

Andres Molano – CIFE - 2014

EDUC - 4026= 0 = 4.54 = 474.49= 1 = 4.54 = 450.86= 2 = 4.54 = 427.23= 3 = 4.54 = 403.60= 5 = 4.54 = 356.34= 0 = 3 = 405.85= 1 = 3 = 390.00= 2 = 3 = 374.15= 3 = 3 = 358.29= 5 = 3 = 326.59= 0 = 6 = 539.56= 1 = 6 = 508.56= 2 = 6 = 477.56= 3 = 6 = 446.55= 5 = 6 = 384.55

(474.49 – 450.86) = 23.63

(405.85 – 390.00) = 15.85

(539.56 – 508.56) = 31.00

Andres Molano – CIFE - 2014

EDUC - 4026

474.49

450.86

427.23

403.60

379.97

356.34

405.85390.00

374.15358.29

342.44326.59

539.56

508.56

477.56

446.55

415.55

384.55

300

350

400

450

500

550

600

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5ANXMAT1

FAMCON==4.54 FAMCON==3 FAMCON==6

15.85

23.63

31.00

Andres Molano – CIFE - 2014

EDUC - 4026

FINALMENTE…..

MUCHOS MASPREDICTORES EN ELMODELO

Page 12: Handout - Sesion 11 - No Notes

14/10/2014

12

Andres Molano – CIFE - 2014

EDUC - 4026

Modelo 8: = + ( ) + ( )+ ( × ) + ( ) +∝ ( ) +∝ ( ) +

_cons 218.4822 18.25928 11.97 0.000 182.68 254.2844CTR_9 27.09224 7.251793 3.74 0.000 12.87316 41.31131CTR_8 9.540111 6.997849 1.36 0.173 -4.181036 23.26126CTR_7 -27.87285 6.834641 -4.08 0.000 -41.27399 -14.47172CTR_6 18.64355 5.165947 3.61 0.000 8.514334 28.77276CTR_5 14.50431 7.133226 2.03 0.042 .5177233 28.4909CTR_4 -15.00301 6.143896 -2.44 0.015 -27.04975 -2.956264CTR_3 14.57559 6.451781 2.26 0.024 1.92516 27.22603CTR_2 -4.307751 5.450417 -0.79 0.429 -14.99475 6.379242

WEALTH1 14.5561 1.006792 14.46 0.000 12.58202 16.53018FEMALE 13.14229 2.378894 5.52 0.000 8.477831 17.80674

ANXbyFAM -3.926172 1.230877 -3.19 0.001 -6.339635 -1.512709FAMCON1 37.51754 3.478024 10.79 0.000 30.69795 44.33713ANXMAT1 -3.112262 5.956074 -0.52 0.601 -14.79073 8.566208

MATH Coef. Std. Err. t P>|t| [95% Conf. Interval]

Total 19048651.2 2971 6411.52852 Root MSE = 63.709Adj R-squared = 0.3670

Residual 12005938.8 2958 4058.80283 R-squared = 0.3697Model 7042712.46 13 541747.112 Prob > F = 0.0000

F( 13, 2958) = 133.47Source SS df MS Number of obs = 2972

. regress MATH ANXMAT1 FAMCON1 ANXbyFAM FEMALE WEALTH1 CTR_2 CTR_3 CTR_4 CTR_5 CTR_6 CTR_7 CTR_8 CTR_9 if filter1==1

Andres Molano – CIFE - 2014

EDUC - 4026

200

250

300

350

400

450

500

550

600

650

700

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5

Val

ores

Pre

dich

os e

n Y

Variable Independiente

Grafico de Ejemplo para valores estimados a partir demodelo de regresion multiple

FAMCON|0 FAMCON|3 FAMCON|6 FAMCON|9