class: title-slide .title[ # Clase 10. LATE y variables instrumentales ] .subtitle[ ## Evaluación de Programas ] .author[ ### Irvin Rojas <br> [rojasirvin.com](https://www.rojasirvin.com/) <br> [<i class="fab fa-github"></i>](https://github.com/rojasirvin) [<i class="fab fa-twitter"></i>](https://twitter.com/RojasIrvin) [<i class="ai ai-google-scholar"></i>](https://scholar.google.com/citations?user=FUwdSTMAAAAJ&hl=en) ] .affiliation[ ### Centro de Investigación y Docencia Económicas <br> División de Economía ] --- # Agenda 1. Introduciremos problemas de evaluación cuando hay cumplimiento imperfecto 1. Derivaremos e interpretaremos el estimador de efecto local promedio de tratamiento (LATE) --- class: inverse, middle, center # Cumplimiento no perfecto --- # ¿Fracasó el experimento? - Frecuentemente nos encontraremos con intervenciones donde la aleatorización ocurre de manera íntegra, pero no todos aquellos asignados a cierto tratamiento efectivamente lo reciben - Nos tomaremos en serio la diferencia entre **ser asignado** al tratamiento y **recibir el tratamiento** - Al evaluar un programa que asigna aleatoriamente a niños a escuelas de prestigio, nos interesa el efecto de efectivamente asistir a dichas escuelas y, quizás no tanto, el efecto de haber sido sorteado para asistir a dichas escuelas --- # ¿Fracasó el experimento? - Usaremos un estimador de variables instrumentales (VI) para relacionar los efectos de la **asignación** con los efectos de la **adopción** - Llegaremos al siguiente resultado: `$$\text{Efecto de la asignación en } Y=(\text{Efecto de la asignación en la adopción})\times (\text{Efecto de la adopción en }Y)$$` - Por tanto: `$$\text{Efecto de la adopción en }Y=\frac{\text{Efecto de la asignación en }Y}{\text{Efecto de las asignación en la adopción}}$$` - Ahora derivaremos formalmente este resultado, pero la intución es importante: el efecto causal de la adopción es el efecto de la asignación, *escalado* por el efecto de la asignación en la adopción --- class: inverse, middle, center # Efectos causales con cumplimiento imperfecto --- # Identificación de efectos causales usando VI - Angrist, Imbens & Rubin (1996) - Asignación: `\(Z_i=\begin{cases} 1 \\0 \\ \end{cases}\)` - Cumplimiento: `\(D_i=\begin{cases} 1 \\0 \\ \end{cases}\)` - `\(Y_i\)` variable de resultados - Nos importa el efecto de `\(D_i\)` sobre `\(Y_i\)` --- # Efectos causales y VI - `\(D_i(Z)\)` es el indicador de cumplir, dada la asignación `\(Z\)` - Con cumplimiento perfecto tendríamos `\(D_i(Z)=Z_i\)` - En general, hay asignados que no cumplen y no asignados que cumplen - `\(Y_i(Z,D)\)` es la variable de interés de `\(i\)` - `\(Y_i(Z,D)\)` y `\(D_i(Z)\)` son resultados potenciales --- # Supuestos **Supuesto 1**: *Stable Unit Treatment Value Assumption (SUTVA)* - Este supuesto indica que los resultados potenciales de `\(i\)` no están correlacionados con los de los otros individuos - Por tanto podemos escribir `\(Y_i(Z,D)=Y_i(Z_i,D_i)\)` y `\(D_i(Z)=D_i(Z_i)\)` **Supuesto 2**: asignación aleatoria - La asignación de `\(Z_i\)` es aleatoria, es decir, `\(P(Z=C)=P(Z=C')\)` para todo `\(C\)` y `\(C'\)` -- - Los supuestos 1 y 2 nos permiten identificar los efectos causales de `\(Z\)` en `\(Y\)` y de `\(Z\)` en `\(D\)` calculando diferencias de medias por grupos de `\(Z\)`: - `\(ITT_Y\)` comparar las medias de `\(y\)` entre quienes `\(Z=1\)` y quienes `\(Z=0\)` - `\(ITT_D\)` comparar las medias de `\(D\)` entre quienes `\(Z=1\)` y quienes `\(Z=0\)` - `\(ITT\)` se conoce como **intención a tratar** o **intention to treat** --- # Parada para reflexionar - Hasta ahora el supuesto crítico es la asignación aleatoria de `\(Z\)` - `\(D_i\)` puede no serlo y, en general, no lo es - Por tanto, una comparación de `\(y\)` entre grupos de `\(D\)` es inapropiada - Necesitamos algunos supuestos para decir algo del efecto causal de `\(D\)` sobre `\(Y\)` --- # Más supuestos **Supuesto 3**: restricción de exclusión `$$Y(Z,D)=Y(Z',D)\quad \forall \quad Z,Z',D$$` - Este supuesto implica que podemos escribir: `$$Y_i(1,d)=Y_i(0,d) \quad d=\{0,1\}$$` - Es decir, resuleve el problema contrafactual -- - Con el supuesto 3 podemos escribir: `$$Y(D)=Y(Z,D)=Y(Z',D)\quad \forall \quad Z,Z',D$$` -- - Y por el supuesto 1: `$$Y_i(D_i)=Y_i(Z,D)$$` --- # Más supuestos **Supuesto 4**: el efecto causal promedio de `\(Z\)` sobre `\(D\)` es distinto de cero - Esto es, `\(E(D_i(1)-D_i(0))\neq0\)` - En otras palabras, la asignación tiene efecto sobre el cumplimiento -- **Supuesto 5**: monotonicidad `$$D_i(1)\geq D_i(0) \quad \forall\quad i=1,\ldots N$$` - Este supuesto simplemente dice que no hay un individuo que: - Cuando se le asigna, no cumple - Cuando no se le asigna, cumple - Noten que este supuesto se debe pensar en términos contrafactuales - A un individuo que no cumple cuando se le asigna y cumple cuando no se le asigna se le conoce como **retador** o *defier* --- # Variable instrumental - `\(Z\)` es una **variable instrumental** para el efecto causal de `\(D\)` sobre `\(Y\)` si se cumplen los supuestos 1 al 5 --- # Interpretación del estimador de VI - Comencemos escribiendo el efecto causal de `\(Z\)` en `\(Y\)`, que por el supuesto de exclusión de `\(Z\)` es: $$ `\begin{aligned} Y_i(1,D_i(1))-Y_i(0,D_i(0))=\underbrace{Y_i(D_i(1))-Y_i(D_i(0))}_{A} \\ \end{aligned}` $$ -- - Notemos que el lado derecho, `\(A\)`, puede calcularse siguiendo la notación de resultados potenciales: $$ `\begin{aligned} Y(D)&=Y(0)+D(Z)(Y(1)-Y(0)) \\ D(Z)&=D(0)+Z(D(1)-D(0))\\ \end{aligned}` $$ -- - Sustituyendo `\(D\)` en `\(Y\)`: $$ `\begin{aligned} Y(D(Z))&=Y(0)+(D(0)+Z(D(1)-D(0)))(Y(1)-Y(0)) \\ &=Y(0)D(0)(Y(1)-Y(0))+Z(D(1)-D(0))(Y(1)-Y(0)) \end{aligned}` $$ --- # Interpretación del estimador de VI - Podemos evaluar entonces los dos valores de `\(Z\)` y obtener: $$ `\begin{aligned} Y(D(1))&=Y(0)+D(1)(Y(1)-Y(0)) \\ Y(D(0))&=Y(0)+D(0)(Y(1))-Y(0) \\ \end{aligned}` $$ -- - Y entonces: $$ `\begin{aligned} A&=Y_i(D_i(1))-Y_i(D_i(0)) \\ &=(Y_i(1)-Y_i(0))(D_i(1)-D_i(0))\\ \end{aligned}` $$ -- - Es decir, el efecto causal de `\(Z\)` sobre `\(Y\)` para `\(i\)` es el producto del efecto causal de `\(D\)` sobre `\(Y\)` y del efecto causal de `\(Z\)` sobre `\(D\)`: $$ \underbrace{Y_i(1,D_i(1))-Y_i(0,D_i(0))}_B=(Y_i(1)-Y_i(0))(D_i(1)-D_i(0)) $$ --- # Interpretación causal del estimador de VI - Consideremos ahora `\(B\)` y obtengamos el valor esperado: $$ `\begin{aligned} E(Y_i(1,D_i(1))-Y_i(0,D_i(0)))&=E(Y_i(1)-Y_i(0))(D_i(1)-D_i(0))\\ &=E(Y_i(1)-Y_i(0)|D_i(1)-D_i(0)=1)P(D_i(1)-D_i(0)=1)\\ &+E(Y_i(1)-Y_i(0)|D_i(1)-D_i(0)=0)P(D_i(1)-D_i(0)=0)\\ &+E(Y_i(1)-Y_i(0)|D_i(1)-D_i(0)=-1)P(D_i(1)-D_i(0)=-1)\\ \end{aligned}` $$ -- - La intuición de este valor esperado es obtener el efecto en la variable de interés bajo los distintos posibles efectos de `\(Z\)` sobre `\(D\)` - El segundo término de la suma es cero y corresponde a aquellos para quienes la asignación no modificó el cumplimento, por lo que `\(E(Y_i(1)-Y_i(0)|D_i(1)-D_i(0)=0)=0\)` - Usando el supueto 5 de monotonicidad, sabemos `\(D_i(1)-D_i(0)\)` es igual a uno o cero, es decir, `\(P(D_i(1)-D_i(0)=-1)=0\)` --- # Interpretación causal del estimador de VI - Por tanto: $$ `\begin{aligned} E(Y_i(1,D_i(1))-Y_i(0,D_i(0)))=E(Y_i(1)-Y_i(0)|D_i(1)-D_i(0)=1)P(D_i(1)-D_i(0)=1) \end{aligned}` $$ -- - Es decir, el efecto causal promedio de `\(Z\)` sobre `\(Y\)` es igual al producto del efecto causal promedio de `\(D\)` sobre `\(Y\)` en aquellos individuos que cuando se les asigna cumplen y cuando no se les asigna no cumplen, `\(D_i(0)=0\)` y `\(D_i(1)=1\)`, y la proporción de estos individuos en la población --- # Interpretación causal del estimador de VI **Proposición 1 en Angrist, Imbens & Rubin (1996)**: interpretación causal del estimador de VI - Si los supuestos 1 a 5 se cumplen, el estimador de VI es: `$$E(Y_i(1)-Y_i(0)|D_i(1)-D_i(0)=1)=\frac{E(Y_i(D_i(1),1))-Y_i(D_i(0),0)}{E(D_i(1)-D_i(0)}=\lambda_{LATE}$$` - Angrist y coautores llaman a este parámetro el **efecto local promedio del tratamiento** o *LATE* - El LATE es el efecto causal promedio del tratamiento en un conjunto de individuos cuyo estatus de tratamiento puede ser modificado por la asignación aleatoria - A estos individuos se les conoce como **cumplidores** o *compliers* --- # Tipos de individuos - Hay cuatro tipos de individuos: <div style="border: 1px solid #ddd; padding: 0px; overflow-y: scroll; height:60%; "><table class=" lightable-paper lightable-hover" style='font-family: "Arial Narrow", arial, helvetica, sans-serif; margin-left: auto; margin-right: auto;border-bottom: 0;'> <thead> <tr><th style="padding-bottom:0; padding-left:3px;padding-right:3px;text-align: center; font-weight: bold; padding-right: 4px; padding-left: 4px; background-color: white !important;position: sticky; top:0; background-color: #FFFFFF;" colspan="3"><div style="TRUE">Tipos de individuos</div></th></tr> <tr> <th style="text-align:left;position: sticky; top:0; background-color: #FFFFFF;"> </th> <th style="text-align:center;position: sticky; top:0; background-color: #FFFFFF;"> </th> <th style="text-align:center;position: sticky; top:0; background-color: #FFFFFF;"> </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> </td> <td style="text-align:center;"> `D_i(0)=0` </td> <td style="text-align:center;"> `D_i(0)=1` </td> </tr> <tr> <td style="text-align:left;"> `D_i(1)=0` </td> <td style="text-align:center;"> `Y_i(1,0)-Y_i(0,0)=0` </td> <td style="text-align:center;"> `Y_i(1,0)-Y_i(0,1)=-(Y_i(1)-Y_i(0))` </td> </tr> <tr> <td style="text-align:left;"> </td> <td style="text-align:center;"> Nunca cumplidor </td> <td style="text-align:center;"> Retador </td> </tr> <tr> <td style="text-align:left;"> </td> <td style="text-align:center;"> </td> <td style="text-align:center;"> </td> </tr> <tr> <td style="text-align:left;"> </td> <td style="text-align:center;"> </td> <td style="text-align:center;"> </td> </tr> <tr> <td style="text-align:left;"> `D_i(1)=1` </td> <td style="text-align:center;"> `Y_i(1,1)-Y_i(0,0)=Y_i(1)-Y_i(0)` </td> <td style="text-align:center;"> `Y_i(1,1)-Y_i(0,1)=0` </td> </tr> <tr> <td style="text-align:left;"> </td> <td style="text-align:center;"> Cumplidor </td> <td style="text-align:center;"> Siempre adoptador </td> </tr> </tbody> <tfoot><tr><td style="padding: 0; " colspan="100%"> <span style="font-style: italic;">Nota:</span> <sup></sup> Adaptado de la tabla 1 en Angrist, Imbens & Rubin (1996).</td></tr></tfoot> </table></div> --- # Tipos de individuos - Los cumplidores cumplen con el tratamiento si se les asigna y no lo cumplen si no se les asigna - `\(Z\)` es independiente de `\(D\)` para los nunca cumplidores y los siempre adoptadores y el efecto causal es 0 para ambos - Los retadores hacen lo contrario a lo que les es asignado - El supuesto de monotonicidad descarta la existencia de retadores para la identificación del LATE - En la práctica, esperamos que sean pocos tal que podamos ignorarlos - A la suma de nunca cumplidores, siempre adoptadores y retadores se le conoce como **no cumplidores** --- # LATE y TT - En general el LATE y el TT (TOT o ATET) difieren - Pero recordemos que `\(TT=E(y_{1i}-y_{0i}|D_i=1)\)` - Noten que en el conjunto con `\(D_i=1\)` se encuentran los cumplidores y los siempre adoptadores - Si podemos asegurar que no hay siempre adoptadores, el LATE y el TT son iguales --- # Resumiendo - Hemos mostrado que el efecto promedio de `\(Z\)` sobre `\(Y\)` es proporcional al efecto de `\(D\)` sobre `\(Y\)` para los cumplidores - Por el supuesto 4, sabemos que la proporción de cumplidores es igual al efecto de `\(Z\)` sobre `\(D\)` - Dado que `\(Z\)` se asigna aleatoriamente, podemos estimar los dos ITT por separado para obtener `\(\lambda=\frac{ITT_Y}{ITT_D}\)` -- - En la práctica de evaluación recurrimos a la econometría con variables instrumentales --- class: inverse, middle, center # Variables instrumentales y LATE --- # Terminología - **Primera etapa**: es el efecto causal de la asignación sobre el cumplimento `$$\phi=E(D_i|Z_i=1)-E(D_i|Z_i=0)$$` - **Forma reducida**: es la diferencia en `\(y\)` entre grupos de asignación `$$\rho=E(y_i|Z_i=1)-E(y_i|Z_i=0)$$` - **LATE**: es la diferencia en `\(y\)` entre a quienes se les asigna el tratamiento y quienes no, dividida por la diferencia en cumplimiento entre a quienes se les asigna el tratamiento y quienes no `$$\lambda_{LATE}=\frac{\rho}{\phi}$$` --- # Variables instrumentales en investigación criminológica - Angrist (2006) estudia un experimento bastante particular: aleatorizar la respuesta policíaca - ¿En qué consistió la intervención? -- - `\(y_i\)`: tasa de reincidencia en conductas de violencia doméstica - `\(Z_i=\begin{cases} 1\quad \text{si apercibido} \\ 0\quad \text{otro caso}\ \end{cases}\)` -- - Se muestra como el ITT puede no reflejar la efectividad de la intervención debido al efecto de *dilusión* provocado, en este caso, por desviaciones con respecto a la forma de enfrentar un episodio policíaco --- # Diferencias en las respuestas efectivas <div style="border: 1px solid #ddd; padding: 0px; overflow-y: scroll; height:60%; "><table class=" lightable-paper lightable-hover" style='font-family: "Arial Narrow", arial, helvetica, sans-serif; margin-left: auto; margin-right: auto;border-bottom: 0;'> <thead> <tr><th style="padding-bottom:0; padding-left:3px;padding-right:3px;text-align: center; font-weight: bold; padding-right: 4px; padding-left: 4px; background-color: white !important;position: sticky; top:0; background-color: #FFFFFF;" colspan="4"><div style="TRUE">Tratamiento asignado y recibido en casos de violencia doméstica</div></th></tr> <tr> <th style="empty-cells: hide;position: sticky; top:0; background-color: #FFFFFF;" colspan="1"></th> <th style="padding-bottom:0; padding-left:3px;padding-right:3px;text-align: center; font-weight: bold; padding-right: 4px; padding-left: 4px; background-color: white !important;position: sticky; top:0; background-color: #FFFFFF;" colspan="2"><div style="TRUE">Tramiento recibido:</div></th> <th style="empty-cells: hide;position: sticky; top:0; background-color: #FFFFFF;" colspan="1"></th> </tr> <tr> <th style="text-align:left;position: sticky; top:0; background-color: #FFFFFF;"> </th> <th style="text-align:center;position: sticky; top:0; background-color: #FFFFFF;"> </th> <th style="text-align:center;position: sticky; top:0; background-color: #FFFFFF;"> </th> <th style="text-align:center;position: sticky; top:0; background-color: #FFFFFF;"> </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> </td> <td style="text-align:center;"> Arrestado </td> <td style="text-align:center;"> Apercibido </td> <td style="text-align:center;"> </td> </tr> <tr> <td style="text-align:left;"> Tratamiento asignado: </td> <td style="text-align:center;"> </td> <td style="text-align:center;"> </td> <td style="text-align:center;"> Total </td> </tr> <tr> <td style="text-align:left;"> Arrestar </td> <td style="text-align:center;"> 98.91 (91) </td> <td style="text-align:center;"> 1.09 (1) </td> <td style="text-align:center;"> 29.3 (92) </td> </tr> <tr> <td style="text-align:left;"> Apercibir </td> <td style="text-align:center;"> 20.27 (45) </td> <td style="text-align:center;"> 79.73 (177) </td> <td style="text-align:center;"> 70.7 (222) </td> </tr> <tr> <td style="text-align:left;"> Total </td> <td style="text-align:center;"> 43.1 (136) </td> <td style="text-align:center;"> 56.69 (178) </td> <td style="text-align:center;"> 100 (314) </td> </tr> </tbody> <tfoot><tr><td style="padding: 0; " colspan="100%"> <span style="font-style: italic;">Nota:</span> <sup></sup> Adaptado de la tabla 1 en Angrist (2006).</td></tr></tfoot> </table></div> - En el estudio original, lo que llamamos *apercibir* tuvo en realidad dos componentes: *aconsejar* y *separar*, pero para facilitar el análisis usaremos solo *arrestar* por un lado y *apercibir* por el otro - ¿Qué observamos sobre a las desviaciones con respecto al tratamiento asignado? --- # Diferencias en las respuestas efectivas - Noten que cuando el tratamiento asignado era arrestar, efectivamente se arrestó al 98.91% de los individuos - En cambio, noten que 20.27 % de los 222 asignados a ser apercibidos fueron en efecto arrestados - ¿Cómo ocurre el sesgo de selección en este caso? --- # Sesgo de selección - Algunos individuos se comportaron violentos, por lo que fueron arrestados a pesar de ser asignados a apercibimiento - Por tanto, si comparamos `\(y\)` entre aquellos individuos apercibidos y no apercibidos, no tomamos en cuenta que aquellos no apercibidos (por tanto, arrestados) pudieran ser más violentos, sobrestimando el efecto de la política de apercibimiento --- # LATE - La primera etapa es el efecto causal en la probabilidad de recibir el tratamiento de apercibimiento por el hecho de haber sido asignado a ese tratamiento: `\(E(D_i|Z_i=1)-E(D_i|Z_i=0)=0.797-0.011=0.786\)` - La forma reducida es el efecto causal de la asignación al tratamiento sobre la tasa de reincidencia: `\(E(y_i|Z_i=1)-E(y_i|Z_i=0)=0.211-0.097=0.114\)` -- - El ITT ignora el hecho de que algunos asignados a apercibimiento fueron arrestados - Sabemos que el LATE está dado por `\(\lambda_{LATE}=\frac{ITT_y}{ITT_D}=\frac{0.114}{0.786}=0.145\)` - Los datos de los autores reportan que si nos fijáramos solo en las diferencias por tipo de tratamiento obtendríamos, `\(E(y_i|D_i=1)-E(y_i|D_i=0)=0.216-0.129=0.087\)`, es decir, casi la mitad del LATE - Pero como `\(D\)` no es aleatoria, dicha comparación no es correcta --- class: inverse, middle, center # La econometría del LATE --- # Motivación con un estadístico de Wald - Pensemos en un modelo con efectos constantes de tratamiento: `\(y_{1i}-y_{0i}=\lambda\)` - La variable de resultados está determinada por `\(y_{0i}=\alpha+\varepsilon_i\)`, donde `\(\alpha=E(y_{0i})\)` - Entonces, el modelo de resultados potenciales es: `$$y_i=\alpha+\lambda D_i+\varepsilon_i$$` - Si `\(D_i\)` no es independiente de `\(y_{0i}\)`, es decir, `\(y_{0i}\)` no es independiente del error, entonces una diferencia de medias entre grupos de `\(D\)` no produce un estimador consistente de `\(\lambda\)` --- # Motivación con un estadístico de Wald - Ahora supongamos que tenemos un **instrumento** `\(z_i\)` tal que `\(z_i\perp y_i\)`, es decir, `\(E(\varepsilon_i|z_i)=0\)` -- - Evaluemos la esperanza de `\(y_i\)` cuando `\(z_i=1\)` y cuando `\(z_i=0\)`: $$ `\begin{aligned} E(y_i|z_i=1)&=\alpha+\lambda E(D_i| z_i=1) \\ E(y_i|z_i=0)&=\alpha+\lambda E(D_i| z_i=0) \\ \end{aligned}` $$ - Restando: `$$E(y_i|z_i=1)-E(y_i|z_i=0)=\lambda(E(D_i| z_i=1)-E(D_i| z_i=0))$$` - Y despejando obtenemos `$$\lambda=\frac{E(y_i|z_i=1)-E(y_i|z_i=0)}{E(D_i| z_i=1)-E(D_i| z_i=0)}$$` que es conocido como un *estadístico de Wald* --- # Mínimos cuadrados en dos etapas (MC2E) - En la práctica, podemos plantear un modelo econométrico en dos etapas: - **Modelo estructural** `$$y_i=X_i'\beta+\lambda D_i+\varepsilon_i$$` -- - **Primera etapa** `$$D_i=X_i'\phi_0+\phi_1z_i+\eta_i$$` donde `\(\phi_i\)` es el efecto causal de la asignación sobre el cumplimiento - Cuado `\(D_i\)` y `\(z_i\)` son ambas dicotómicas, `\(\phi_1\)` da la proporción de la población que son cumplidores --- # Mínimos cuadrados en dos etapas (MC2E) - Podemos concebir el problema como uno en el que primero se estima la primera etapa y se sustituyen los valores ajustados de `\(D_i\)` en el modelo estructural - Sustituyendo la primera etapa en el modelo estructural `$$y_i=X_i'\beta+\lambda \hat{D}_i+\varepsilon_i$$` -- - Esta es la forma de pensar el procedimiento, pero en la práctica nunca hacemos esto manualmente - Noten que `\(\hat{D}_i\)` es estimada, por lo cual se ignora la variabilidad muestral de la primera etapa y los errores estándar serían inconsistentes -- - Nota: el estimador de Wald es igual al estimador de MC2E cuando no hay `\(X\)` y cuando `\(Z\)` y `\(D\)` son binarias --- # Mínimos cuadrados en dos etapas (MC2E) - **Forma reducida** $$ `\begin{aligned} y_i&=X_i'\beta+\lambda(X_i'\phi_0+\phi_1z_1+\eta_i)+\varepsilon_i \\ &=X_i'\rho_0+\rho_1z_i+\nu_i \end{aligned}` $$ donde `\(\rho_1=\lambda\phi_1\)` es el coeficiente de forma reducida sobre la variable de asignación -- - Noten que esto implica que `\(\lambda=\rho_1/\phi_1\)` - Es decir, `\(\lambda_{MC2E}\)` puede interpretarse como la versión reescalada del coeficiente de forma reducida usando el efecto causal de la primera etapa para reescalar --- # Efectos estimados - Regresando a los resultados del experimento, ahora con econometría **Primera etapa** - Versión corta: `$$apercibido_i=\phi_0+\phi_1T_i+\eta_i$$` - Con controles: `$$apercibido_i=\phi_0+\phi_1T_i+X_i'\Phi +\eta_i$$` - Noten que el 0.786 es exactamente lo que se encontraba al hacer las diferencias de medias **Forma reducida** - También conocido como ITT `$$reincidencia_i=\rho_0+\rho_1T_i+\nu_i$$` --- # Efectos estimados <div style="border: 1px solid #ddd; padding: 0px; overflow-y: scroll; height:60%; "><table class=" lightable-paper lightable-hover" style='font-family: "Arial Narrow", arial, helvetica, sans-serif; margin-left: auto; margin-right: auto;border-bottom: 0;'> <thead> <tr><th style="padding-bottom:0; padding-left:3px;padding-right:3px;text-align: center; font-weight: bold; padding-right: 4px; padding-left: 4px; background-color: white !important;position: sticky; top:0; background-color: #FFFFFF;" colspan="5"><div style="TRUE">Primera etapa y forma reducida</div></th></tr> <tr> <th style="empty-cells: hide;position: sticky; top:0; background-color: #FFFFFF;" colspan="1"></th> <th style="padding-bottom:0; padding-left:3px;padding-right:3px;text-align: center; font-weight: bold; padding-right: 4px; padding-left: 4px; background-color: white !important;position: sticky; top:0; background-color: #FFFFFF;" colspan="2"><div style="TRUE">Primera etapa</div></th> <th style="padding-bottom:0; padding-left:3px;padding-right:3px;text-align: center; font-weight: bold; padding-right: 4px; padding-left: 4px; background-color: white !important;position: sticky; top:0; background-color: #FFFFFF;" colspan="2"><div style="TRUE">Forma reducida</div></th> </tr> <tr> <th style="empty-cells: hide;position: sticky; top:0; background-color: #FFFFFF;" colspan="1"></th> <th style="padding-bottom:0; padding-left:3px;padding-right:3px;text-align: center; font-weight: bold; padding-right: 4px; padding-left: 4px; background-color: white !important;position: sticky; top:0; background-color: #FFFFFF;" colspan="2"><div style="TRUE">Variable dep.: fue apercibido</div></th> <th style="padding-bottom:0; padding-left:3px;padding-right:3px;text-align: center; font-weight: bold; padding-right: 4px; padding-left: 4px; background-color: white !important;position: sticky; top:0; background-color: #FFFFFF;" colspan="2"><div style="TRUE">Variable dep.: reincidencia</div></th> </tr> <tr> <th style="text-align:left;position: sticky; top:0; background-color: #FFFFFF;"> </th> <th style="text-align:center;position: sticky; top:0; background-color: #FFFFFF;"> (1) </th> <th style="text-align:center;position: sticky; top:0; background-color: #FFFFFF;"> (2)* </th> <th style="text-align:center;position: sticky; top:0; background-color: #FFFFFF;"> (3) </th> <th style="text-align:center;position: sticky; top:0; background-color: #FFFFFF;"> (4)* </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> Asignado a ser apercibido (`T`) </td> <td style="text-align:center;"> 0.786 (0.043) </td> <td style="text-align:center;"> 0.733 (0.043) </td> <td style="text-align:center;"> 0.114 (0.047) </td> <td style="text-align:center;"> 0.108 (0.041) </td> </tr> <tr> <td style="text-align:left;"> Arma </td> <td style="text-align:center;"> </td> <td style="text-align:center;"> -0.064 (0.045) </td> <td style="text-align:center;"> </td> <td style="text-align:center;"> -0.004 (0.042) </td> </tr> <tr> <td style="text-align:left;"> Influencia químicos </td> <td style="text-align:center;"> </td> <td style="text-align:center;"> -0.088 (0.040) </td> <td style="text-align:center;"> </td> <td style="text-align:center;"> 0.052 (0.038) </td> </tr> <tr> <td style="text-align:left;"> Media variable dep. </td> <td style="text-align:center;"> 0.567 </td> <td style="text-align:center;"> 0.567 </td> <td style="text-align:center;"> 0.178 </td> <td style="text-align:center;"> 0.178 </td> </tr> </tbody> <tfoot><tr><td style="padding: 0; " colspan="100%"> <span style="font-style: italic;">Nota:</span> <sup></sup> Tabla 2 en Angrist (2006). * Indica que se incluyen como variables de control indicadoras para año, trimestre, raza no blanca y raza mixta.</td></tr></tfoot> </table></div> - Habíamos obtenido antes la columna (1), pero como una diferencia de medias: `\(E(D_i|Z_i=1)-E(D_i|Z_i=0)=0.797-0.011=0.786\)` - Mientras que también habíamos encontrado (3): `\(E(y_i|Z_i=1)-E(y_i|Z_i=0)=0.211-0.097=0.0.114\)` --- #Efectos estimados **Efecto del tratamiento** - Noten que con nuestro estimador de MC2E obtenemos exactamente lo que antes habíamos calculado como `\(\lambda_{LATE}=\frac{ITT_y}{ITT_D}=\frac{E(y_i|Z_i=1)-E(y_i|Z_i=0)}{E(D_i|Z_i=1)-E(D_i|Z_i=0)}=0.145\)` - Vean que al estimar la ecuación estructural por MCO obtenemos un coeficiente cercano a 0.070 - Más aún, sabemos que el coeficiente de MCO es inconsistente --- #Efectos estimados <div style="border: 1px solid #ddd; padding: 0px; overflow-y: scroll; height:50%; "><table class=" lightable-paper lightable-hover" style='font-family: "Arial Narrow", arial, helvetica, sans-serif; margin-left: auto; margin-right: auto;border-bottom: 0;'> <thead> <tr><th style="padding-bottom:0; padding-left:3px;padding-right:3px;text-align: center; font-weight: bold; padding-right: 4px; padding-left: 4px; background-color: white !important;position: sticky; top:0; background-color: #FFFFFF;" colspan="5"><div style="TRUE">Impactos de ser apercibido en la reincidencia (MCO y LATE)</div></th></tr> <tr> <th style="empty-cells: hide;position: sticky; top:0; background-color: #FFFFFF;" colspan="1"></th> <th style="padding-bottom:0; padding-left:3px;padding-right:3px;text-align: center; font-weight: bold; padding-right: 4px; padding-left: 4px; background-color: white !important;position: sticky; top:0; background-color: #FFFFFF;" colspan="2"><div style="TRUE">MCO</div></th> <th style="padding-bottom:0; padding-left:3px;padding-right:3px;text-align: center; font-weight: bold; padding-right: 4px; padding-left: 4px; background-color: white !important;position: sticky; top:0; background-color: #FFFFFF;" colspan="2"><div style="TRUE">VI/MC2E</div></th> </tr> <tr> <th style="empty-cells: hide;position: sticky; top:0; background-color: #FFFFFF;" colspan="1"></th> <th style="padding-bottom:0; padding-left:3px;padding-right:3px;text-align: center; font-weight: bold; padding-right: 4px; padding-left: 4px; background-color: white !important;position: sticky; top:0; background-color: #FFFFFF;" colspan="4"><div style="TRUE">Variable dep.: reincidencia</div></th> </tr> <tr> <th style="text-align:left;position: sticky; top:0; background-color: #FFFFFF;"> </th> <th style="text-align:center;position: sticky; top:0; background-color: #FFFFFF;"> (1) </th> <th style="text-align:center;position: sticky; top:0; background-color: #FFFFFF;"> (2)* </th> <th style="text-align:center;position: sticky; top:0; background-color: #FFFFFF;"> (3) </th> <th style="text-align:center;position: sticky; top:0; background-color: #FFFFFF;"> (4)* </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> Apercibido </td> <td style="text-align:center;"> 0.087 (0.044) </td> <td style="text-align:center;"> 0.070 (0.038) </td> <td style="text-align:center;"> 0.145 (0.060) </td> <td style="text-align:center;"> 0.140 (0.053) </td> </tr> <tr> <td style="text-align:left;"> Arma </td> <td style="text-align:center;"> </td> <td style="text-align:center;"> 0.010 (0.043) </td> <td style="text-align:center;"> </td> <td style="text-align:center;"> 0.005 (0.043) </td> </tr> <tr> <td style="text-align:left;"> Influencia químicos </td> <td style="text-align:center;"> </td> <td style="text-align:center;"> 0.057 (0.039) </td> <td style="text-align:center;"> </td> <td style="text-align:center;"> 0.064 (0.039) </td> </tr> </tbody> <tfoot><tr><td style="padding: 0; " colspan="100%"> <span style="font-style: italic;">Nota:</span> <sup></sup> Tabla 3 en Angrist (2006). * Indica que se incluyen como variables de control indicadoras para año, trimestre, raza no blanca y raza mixta.</td></tr></tfoot> </table></div> - Usando el estimador de MC2E obtenemos exactamente lo que antes habíamos calculado como `\(\lambda_{LATE}=\frac{ITT_y}{ITT_D}=\frac{E(y_i|Z_i=1)-E(y_i|Z_i=0)}{E(D_i|Z_i=1)-E(D_i|Z_i=0)}=0.145\)` - Al estimar la ecuación estructural por MCO obtenemos un coeficiente cercano a 0.070 - Pero sabemos que el coeficiente de MCO es inconsistente --- # LATE es igual ATET en este caso - Noten que este estudio tiene lo que se conoce como *no cumplidores de un solo lado* <div style="border: 1px solid #ddd; padding: 0px; overflow-y: scroll; height:50%; "><table class=" lightable-paper lightable-hover" style='font-family: "Arial Narrow", arial, helvetica, sans-serif; margin-left: auto; margin-right: auto;border-bottom: 0;'> <thead> <tr><th style="padding-bottom:0; padding-left:3px;padding-right:3px;text-align: center; font-weight: bold; padding-right: 4px; padding-left: 4px; background-color: white !important;position: sticky; top:0; background-color: #FFFFFF;" colspan="3"><div style="TRUE">Tipos de individuos</div></th></tr> <tr> <th style="text-align:left;position: sticky; top:0; background-color: #FFFFFF;"> </th> <th style="text-align:center;position: sticky; top:0; background-color: #FFFFFF;"> </th> <th style="text-align:center;position: sticky; top:0; background-color: #FFFFFF;"> </th> </tr> </thead> <tbody> <tr> <td style="text-align:left;"> </td> <td style="text-align:center;"> `D_i(0)=0` </td> <td style="text-align:center;"> `D_i(0)=1` </td> </tr> <tr> <td style="text-align:left;"> `D_i(1)=0` </td> <td style="text-align:center;"> `Y_i(1,0)-Y_i(0,0)=0` </td> <td style="text-align:center;"> `Y_i(1,0)-Y_i(0,1)=-(Y_i(1)-Y_i(0))` </td> </tr> <tr> <td style="text-align:left;"> </td> <td style="text-align:center;"> Nunca cumplidor </td> <td style="text-align:center;"> Retador </td> </tr> <tr> <td style="text-align:left;"> </td> <td style="text-align:center;"> </td> <td style="text-align:center;"> </td> </tr> <tr> <td style="text-align:left;"> </td> <td style="text-align:center;"> </td> <td style="text-align:center;"> </td> </tr> <tr> <td style="text-align:left;"> `D_i(1)=1` </td> <td style="text-align:center;"> `Y_i(1,1)-Y_i(0,0)=Y_i(1)-Y_i(0)` </td> <td style="text-align:center;"> `Y_i(1,1)-Y_i(0,1)=0` </td> </tr> <tr> <td style="text-align:left;"> </td> <td style="text-align:center;"> Cumplidor </td> <td style="text-align:center;"> Siempre adoptador </td> </tr> </tbody> <tfoot><tr><td style="padding: 0; " colspan="100%"> <span style="font-style: italic;">Nota:</span> <sup></sup> Adaptado de la tabla 1 en Angrist, Imbens & Rubin (1996).</td></tr></tfoot> </table></div> - Cuando la asignación es **apercibir**, en el 20.27% de los casos la acción fue arrestar y en el 79.73% efectivamente fue apercibir - En cambio, cuando se indica **no apercibir**, es decir, arrestar, la adopción es casi perfecto (salvo un caso) -- - En otras palabras, en este caso no hay **siempre cumplidores** - No hay individuos que hayan sido *apercibidos* independientemente de la asignación --- # LATE es igual ATET en este caso - Recordemos que el grupo de quienes reciben el tratamiento está compuesto de los cumplidores y los siempre adoptadores - En este caso en particular: `$$\lambda_{LATE}=E(y_{1i}-y_{0i}|C_i=1)=E(y_{1i}-y_{0i}|D_i=1)=ATET$$` -- - Esto ocurre en los casos en que: - Algunos de los asignados al tratmiento, `\(z_i=1\)` lo reciben mientras otros no - Nadie de los asignados al control, `\(z_i=0\)` tiene acceso al tratamiento --- # Próxima sesión - El jueves hablaremos sobre detalles respecto a errores estándar - MHE, Capítulo 8 --- class: center, middle Presentación creada usando el paquete [**xaringan**](https://github.com/yihui/xaringan) en R. El *chakra* viene de [remark.js](https://remarkjs.com), [**knitr**](http://yihui.org/knitr), y [R Markdown](https://rmarkdown.rstudio.com). Material de clase en versión preliminar. **No reproducir, no distribuir, no citar.**