Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las...

33
1 Inferencia causal Francisco Gallego PUC Chile y J-PAL Santiago, 9 de abril de 2013

Transcript of Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las...

Page 1: Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

1

Inferencia causal Francisco Gallego PUC Chile y J-PAL Santiago, 9 de abril de 2013

Page 2: Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

Mapa

I. Motivación II. Evaluación de Impacto y Contrafactual III. Análisis causal IV. Análisis causal y Efectos Tratamiento

2

Page 3: Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

1. Motivación

• Las preguntas empíricas más difíciles en ciencias sociales y en políticas públicas involucran relaciones causa-efecto del tipo:

– ¿Mejora la descentralización de las escuelas la calidad de la

educación? – ¿Un año de capacitación causa mayores ingresos? Y, más

importante quizás, ¿qué tipo de capacitación causa mayores aumentos de ingresos?

– ¿Mejoran las transferencias condicionadas los resultados de salud y educación de los niños? O, ¿lo hacen porque condicionan o porque entregan dinero adicional?

3

Page 4: Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

• Responder estas preguntas es importante porque:

– Ayudan a responder preocupaciones de política • ¿Logran los programas reducir la pobreza? ¿Podrían

reducirla más rápido con los mismos recursos?

– Problemas que enfrentan los tomadores de decisiones

– Consideraciones teóricas de estudio en ciencias sociales

4

1. Motivación

Page 5: Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

Mapa

I. Motivación II. Evaluación de Impacto y Contrafactual

5

Page 6: Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

2. ¿Cómo responder las preguntas?: Evaluación de Impacto

El impacto de un programa es la diferencia entre:

1. Los resultados que los participantes del programa obtienen un tiempo después de participar en el programa y

2. Los resultados que esos mismos participantes hubieran obtenido en ese mismo momento si no hubiesen participado en el programa.

Page 7: Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

• Tomamos la diferencia entre Qué ocurrió (con el programa) y

- Qué habría ocurrido (sin el programa) = IMPACTO del programa

• Este último escenario se denomina el contrafactual

7

2.1. Evaluación de impacto

Page 8: Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

2.1.2. Impacto: ¿Qué es?

Tiempo

Resu

ltado

prim

ario

Impacto

Intervención

Page 9: Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

Tiempo

Intervención

2.1.3. ¿Cómo Evaluar Impacto?

Impacto

Resu

ltado

prim

ario

Page 10: Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

Tiempo

Intervención

Impacto

Resu

ltado

prim

ario

2.1.3. ¿Cómo Evaluar Impacto?

Page 11: Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

• El contrafactual representa el estado del mundo que participantes del programa habrían experimentado en la ausencia del programa

• Problema: No se puede observar el contrafactual • Solución: Tenemos que “replicar” o “construir” el

contrafactual

2.2. Contrafactual

Page 12: Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

Mapa

I. Motivación II. Evaluación de Impacto y Contrafactual III. Análisis causal

12

Page 13: Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

3.1. Análisis estadístico estándar

• Herramientas: probabilidad y otras técnicas de estimación

• Objetivo: inferir parámetros de una distribución a partir de muestras de esta distribución

• Uso: Con la ayuda de los parámetros, uno puede: – Inferir asociación entre variables, – Estimar probabilidad de ocurrencia de eventos pasados o

futuros – Actualizar pro;

• Condición: las condiciones experimentales no pueden cambiarse

13

Page 14: Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

3.2. Análisis causal

• Va un paso más allá que el análisis estadístico estándar

• Objetivo: inferir aspectos del proceso de generación de datos

• Uso: Con la ayuda de tales aspectos, se puede: – Deducir la probabilidad de ocurrencia si el contexto no

cambia (análisis “estático”) – Predecir como cambian las variables si cambia el contexto

(análisis “dinámico”)

14

Page 15: Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

• La idea de dinámica de los eventos cuando cambian las condiciones incluye: – Predecir los efectos de intervenciones – Predecir los efectos de cambios espontáneos – Identificar las causas de los eventos

• Distinción entre causalidad y correlación – Nuevo lenguaje – Causalidad es la clave para decisiones de políticas

• ¿Si hacemos XXX, lograremos YYYY? No basta con saber que XXX está asociado con YYY…

15

3.2. Análisis causal

Page 16: Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

3.2.1. Modelo Causal de Neyman (1923), Rubin (1974)

• Modelo de resultados potenciales • Definamos a la población por la letra U.

– Cada unidad en U se denota u.

• Para cada u ϵ U: – Y(u): variable de respuesta – A: atributo de las unidades en U.

• Idea: exponer a cada unidad a la acción de una causa • Rubin asume que las causas son acciones que,

hipotéticamente, podrían ser tratamientos

16

Page 17: Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

3.2.2. Modelo Causal y tratamientos

• Supongamos, por simplicidad que hay sólo 2 causas o niveles de tratamiento.

• Sea D una variable que indica la causa a la que cada unidad en U es expuesta:

• En un estudio controlado, D es construido por el experimentador/evaluador

• En un estudio no controlado, D es determinado por factores que van más allá del experimentador/evaluador

17

= control al expuesta es unidad la si0

to tratamienal expuesta es unidad la si1uu

D

Page 18: Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

Mapa

I. Motivación II. Evaluación de Impacto y Contrafactual III. Análisis causal IV. Análisis causal y Efectos Tratamiento

18

Page 19: Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

4.1. Modelo Causal y tratamientos

• Y son afectados potencialmente por t o c. • O sea puede haber 2 variables de respuesta para el

mismo u: – Y1(u): valor de la respuesta si la unidad u fuera expuesta al

tratamiento. – Y0(u) : valor de la respuesta si la unidad u fuera expuesta al

control.

• Entonces, el resultado de cada individuo puede ser escrito como (si es que no hay externalidades):

19

( ) )(1)()( 01 uYDuDYuY −+=

Page 20: Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

• Tomamos la diferencia entre Qué ocurrió (con el programa) y

- Qué habría ocurrido (sin el programa) = IMPACTO del programa

• Este último escenario se denomina el contrafactual

• ¿Cómo se traduce esto al lenguaje del modelo causal de Rubin?

20

4.2. Evaluación de Impacto y modelo causal

Page 21: Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

4.3. Modelo Causal y evaluación de impacto

• Para cada unidad u, el tratamiento causa: • Problema Fundamental de Inferencia Causal:

– Para el mismo u, no se puede observar Y1(u) y Y0(u)

• O sea no tenemos el contrafactual para cada u – Un individuo no puede estar al mismo tiempo recibiendo y

no recibiendo el tratamiento…

• ¿Qué hacemos?

21

)()( 01 uYuYu −=δ

Page 22: Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

• ¿Y el efecto causal en promedio? • El efecto tratamiento promedio (ATE) sobre U (o una sub-

población de U es):

• O sea la solución estadística reemplaza el efecto causal a nivel de cada unidad por el efecto causal promedio en una población de U unidades.

22

[ ][ ] [ ]

δ=

−=

−=−=

01

01

01

)()()()(

YY

uYEuYEuYuYEATE

UU

UU

4.3. Modelo Causal y evaluación de impacto

Page 23: Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

• Obviamente las esperanzas de Y1(u) y Y0(u) no pueden ser calculadas pero sí estimadas…

• Los métodos econométricos de evaluación de impacto intentan construir (bajo diferentes supuestos) estimaciones con consistentes de:

• La “bondad” de estos estimadores se define justamente por la razonabilidad/plausibilidad de los supuestos utilizados.

23

[ ] [ ] 0011 )(y )( YuYEYuYE UU ==

4.3. Modelo Causal y evaluación de impacto

Page 24: Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

• Obviamente las esperanzas de Y1(u) y Y0(u) no pueden ser calculadas pero sí estimadas…

• Los métodos econométricos de evaluación de impacto intentan construir (bajo diferentes supuestos) estimaciones con consistentes de:

• La “bondad” de estos estimadores se define justamente por la razonabilidad/plausibilidad de los supuestos utilizados.

24

[ ] [ ] 0011 )(y )( YuYEYuYE UU ==

4.3. Modelo Causal y evaluación de impacto

Page 25: Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

• Entonces consideremos estimar:

• Usando el siguiente estimador: • (1) está definida para la población • (2) se estima usando una muestra de la población

25

[ ](1)

)()(

01

01

YY

uYuYEATE UU

−=

−=

[ ] [ ] (2) 0|ˆ1|ˆˆ01 =−== DYDYδ

δ̂

4.3. Modelo Causal y evaluación de impacto

Page 26: Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

• Sea π la proporción de la población asignada al grupo tratamiento

• Entonces ATE se puede descomponer como:

26

{ } ( ) { }

[ ] ( )[ ][ ] ( )[ ]{ }

[ ] ( )[ ]{ }0|11|

0|11|

0|11|

1

00

11

0101

01

=−+=

−=−+==

=−−+=−=

−+= ==

DYDY

DYDY

DYYDYYDD

ππ

ππ

ππ

δπδπδ

4.3. Modelo Causal y evaluación de impacto

Page 27: Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

• Supongamos que:

• Entonces:

• Lo que se puede estimar de modo consistente por:

27

[ ] [ ][ ] [ ]0|1|

y 0|1|

00

11

===

===

DYDY

DYDY

[ ] ( )[ ]{ }[ ] ( )[ ]{ }

[ ] [ ]0|1|

0|11|

0|11|

01

00

11

=−==

=−+=

−=−+==

DYDY

DYDY

DYDY

ππ

ππδ

[ ] [ ] (2) 1|ˆ1|ˆˆ01 =−== DYDYδ

4.3. Modelo Causal y evaluación de impacto

Page 28: Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

• ¿Tienen sentido

• O sea: – El resultado promedio:

• Bajo el tratamiento no difiere en entre los grupos de tratamiento y control • Bajo el control no difiere en entre los grupos de tratamiento y control

• Para satisfacer estas condiciones es suficiente que la asignación del tratamiento D no esté correlacionada con los resultados potenciales de Y1(u) y Y0(u)

• La forma principal de lograr esta no-correlación es a través de la asignación aleatoria del tratamiento. – En la siguiente clase hablaremos de esto con más detalle.

28

[ ] [ ][ ] [ ]0|1|

y 0|1|

00

11

===

===

DYDY

DYDY

4.3. Modelo Causal y evaluación de impacto

Page 29: Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

• En muchos casos simplemente no hay información disponible sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento – …y viceversa, como los del grupo tratamiento hubieran reaccionado si

hubiesen recibido el control…

• Ésta es la base para comprender los sesgos del estimador (2). • De hecho usando un poco de álgebra, se puede demostrar

que:

29

[ ] [ ]{ }( ) { } { }[ ]

to tratamienefecto de idadHeterogene

01

ientosin tratam Diferencia

00

1

0|1|ˆ

== −−+

=−=+=

DD

DYDY

δδπ

δδ

4.3. Modelo Causal y evaluación de impacto

Page 30: Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

• Dos grandes fuentes de sesgo de selección: 1. Sesgo de selección 2. Heterogeneidad en los efectos del tratamiento

• La mayoría de los métodos disponibles se enfocan en 1.,

asumiendo que los efectos tratamiento son homogéneos en la población (o redefiniendo los parámetros de interés en la población)

[ ] [ ]{ } ( ) { } { }[ ]

nto tratamieefecto de idadHeterogene

01

mientosin trata Diferencia

00 10|1|ˆ== −−+=−=+= DDDYDY δδπδδ

4.3. Modelo Causal y evaluación de impacto

Page 31: Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

4.4. Otros parámetros de interés

• ATE no siempre es el parámetro de interés de política pública. • En ocasiones, por ejemplo, interesa más el efecto tratamiento

promedio para la persona bajo intervención, o sea:

• Notar que la diferencia entre ATE y TOT sólo tiene sentido si hay heterogeneidad en los efectos tratamiento en la población U (si no, todos son iguales…)

31

[ ][ ] [ ]1|)(1|)(

1|)()(

01

01

=−===−=

DuYEDuYEDuYuYETOT

Page 32: Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

• ¿Cuándo nuestro estimador (2) estima consistentemente TOT?

• Como es evidente, este estimador lo hace bien si:

32

[ ] [ ] (2) 0|ˆ1|ˆˆ01 =−== DYDYδ

[ ] [ ] 0|1| 00 === DYDY

4.4. Otros parámetros de interés

Page 33: Inferencia causal - World Bankpubdocs.worldbank.org/pubdocs/publicdoc/2016/5/...sobre como las unidades del grupo control hubieran reaccionado si hubiesen recibido el tratamiento –

• En algunas situaciones de políticas pública interesa conocer el efecto promedio de ofrecer el programa (ITT)

– ¿“Qué le ocurrió al niño promedio que está en una escuela tratada en

esta población?” – “¿Qué le ocurrió a la persona promedio que recibió una oferta del

tratamiento?”

• Suponga que la intención de tratar ¿Es este el número adecuado a buscar?, ¿Es el efecto del tratamiento?

• La lógica es exactamente la misma que en los estimadores

previos pero en este caso D=1 refleja la oferta del tratamiento y no que las personas hayan sido efectivamente tratadas.

33

4.4. Otros parámetros de interés