Examen parcial

Instrucciones

El examen debe realizarse de manera individual y debe entregarse a más tardar las 9:35 am. en Teams. Solo en la pregunta 3 es necesario usar R o el software de su elección. Puede compactar su notación para ahorrar tiempo. Por ejemplo, puede escribir \(y_i\) simplemente como \(y\) y en vez de \(\beta_1\) puede escribir simplemente \(b1\). Por favor, no comprima los archivos en carpetas comprimidas. Al igual que las tareas, el examen debe contener:

Un primer documento de respuestas donde se incluyan las respuestas a las preguntas teóricas y conceptuales. Este documento puede ser redactado en Word o cualquier otro software, o si lo prefiere, a mano, pero deberá estar impreso en .pdf. En este documento también se deben incluir las respuestas a preguntas sobre conclusiones que se desprenden de las secciones prácticas. Por ejemplo, si una pregunta pide obtener la media de la variable x en cierta base de datos, entonces el documento de respuestas debe incluir la pregunta y respuesta correspondiente: “la media de la variable x es 32.6”.

Un segundo archivo deberá contener el código replicable usado para generar los resultados de la sección práctica. Los archivos de código se verificarán para comprobar su replicabilidad.

Recuerde que en Teams debe asegurarse de que los archivos se han subido correctamente.

Al realizar este examen usted se compromete a no recibir ayuda de ninguna otra persona, por ningún medio. Ante la situación especial en que vivimos, entiendo que debemos ser flexibles en la forma en que esperamos que los alumnos aprendan y cómo tratamos de monitorear dicho aprendizaje. Al mismo tiempo, apelo a su madurez y honestidad intelectual. Recuerde que se aplicarán estrictamente los lineamientos generales del CIDE en términos de plagio y fraude.

Pregunta 1

Se diseñó una intervención que consistió en entregar zapatos a niños en cuatro áreas con altos niveles de pobreza de cierto país. Se sabe que los niños caminan bastante para ir a la escuela y realizan una serie de tareas domésticas después de la escuela. Por tanto, se tiene la hipótesis de que la entrega de zapatos tendrá impactos en el desarrollo de los niños. Se seleccionaron aleatoriamente localidades de control y localidades de tratamiento. Dentro de las localidades asignadas al tratamiento, todos los niños de entre 7 y 12 años de edad recibieron zapatos. Los investigadores deciden usar un \(\alpha=0.10\) durante el estudio.

La tabla 1 presenta información sobre una serie de características de los niños que participaron en el estudio en la línea base.

Tabla 1. Covariables entre grupos de tratamiento y control (datos en la línea base)
\((1)\)\((2)\)\((3)\)
VariablesMedia controlMedia tratamientop
Edad9.4869.3320.114
Sexo (masculino=1)0.5450.4970.073*
Jefe trabaja en agricultura0.4620.5220.435
Grado máximo de estudios en el hogar5.8365.3460.406
Índice calidad de vivienda0.4920.5930.447
Índice de consumo de durables0.4410.4670.829
Número de pares de zapatos que posee2.061.8250.213
Horas que pasa sin zapatos2.091.9630.917
Días que no fue a la escuela0.7010.8860.465
Horas para dormir10.689.980.388
Horas para comer1.9311.9340.986
Horas para lavar0.7320.8350.228
Horas en escuela4.6134.1540.168
Horas para trabajar0.4090.5720.082*
N6669121,578
Nota: Los valores p son de una prueba t simple.

La tabla 2 muestra los resultados de estimar una regresión del tipo \[y_i=\alpha+X_i'\beta+\theta T_i+\varepsilon_i\]

donde \(T_i\) indica la pertenencia al grupo de tratamiento, \(X_i\) es un vector de características observables usadas como controles y \(y_i\) es cada una de las siguientes variables sobre las que se estima el impacto del programa: 1) número de zapatos que posee; 2) días que no fue a la escuela; y 3) horas para trabajar.

Tabla 2. Efectos del tratamiento en variables seleccionadas
\((1)\)\((2)\)\((3)\)
Número de pares de zapatos que poseeDías que no fue a la escuelaHoras para trabajar
\(\hat{\theta}\)0.075-0.165**0.348
(e.e)(0.061)(0.057)(0.243)
N1,302664556
Nota: * p <0.10, ** p <0.05, *** p <0.01. Todas las regresiones controlan por edad, sexo, ocupación del jefe del hogar y calidad de la vivienda. Errores estándar agrupados a nivel localidad entre paréntesis.
  1. [5 puntos] ¿Qué representan los valores \(p\) reportados en la columna (3) en la tabla 1?

  2. [10 puntos] Un donante está preocupado por los resultados de la intervención porque considera que los niños que tenían más zapatos antes de que iniciara el programa tuvieron una menor probabilidad de estar en el grupo que recibió zapatos por parte del programa. ¿Considera esto una preocupación válida sobre la integridad del experimento?

  3. [5 puntos] ¿Cómo se interpreta el asterisco al lado del valor \(p\) de 0.082 asociado a las horas para trabajar?

  4. [10 puntos] ¿Cuál es el impacto del programa en el número de pares zapatos que los niños en promedio poseen? Mencione la magnitud y significancia estadística de dicho impacto.

  5. [5 puntos] En columna (2) de la tabla 2, ¿qué interpretación tienen los dos asteriscos al lado de -0.165?

  6. [10 puntos] ¿Cuántos días sin ir a la escuela esperaríamos observar después de la intervención en los niños que recibieron zapatos?

  7. [5 puntos] La nota al pie de la tabla 2 indica que se reportan errores estándar agrupados? ¿Por qué los investigadores realizan la estimación de los errores estándar de esta manera?

Pregunta 2

Un gobierno tiene recursos para analizar el impacto de un programa de transferencia de tecnología en las localidades rurales de un país. El programa consiste en enseñar talleres de buenas prácticas agrícolas a productores de maíz (desde el tratamiento de semillas, pasando por la preparación del suelo, hasta la cosecha). Se espera que este programa mejore los rendimientos (toneladas de maíz cosechado por hectárea). Se tiene la hipótesis de que el programa puede tener efectos de derramamiento o spillover, es decir, que los productores que no reciben el programa directamente se benefician de quienes sí lo hacen (por ejemplo, si los vecinos que sí recibieron el tratamiento le enseñan a quienes no las cosas que aprendieron en los talleres).

  1. [10 puntos] Describa cómo diseñaría un experimento para probar la hipótesis de spillovers.

  2. [10 puntos] Escriba la regresión que emplearía para probar dicha la hipótesis. Indique qué coeficiente identifica el efecto de los spillovers.

Pregunta 3

En la pregunta 1 de la tarea 2 estimamos el LATE de ser cliente de microfinanzas sobre el gasto total para un grupo de hogares incluidos en un experimento en Marruecos. En esta pregunta usará la misma base de datos, crepon_morocco_analysis.csv. Al igual que en dicha tarea, use un indicador de ser cliente, client y un indicador de asignación aleatoria, treatment. Use también los mismos controles: members_resid_bl, nadults_resid_bl, head_age_bl, act_livestock_bl, act_business_bl, borrowed_total_bl, members_resid_d_bl, nadults_resid_d_bl, head_age_d_bl, act_livestock_d_bl, act_business_d_bl, borrowed_total_d_bl, ccm_resp_activ, other_resp_activ, ccm_resp_activ_d y other_resp_activ_d. Además, incluya efectos fijos por pareja introduciendo la variable paire como factor. Es decir, todo es exactamente igual a lo realizado en la tarea 2, salvo la variable dependiente, pues ahora nos ocuparemos del efecto sobre la probabilidad de estar autoempleado, self_empl.

  1. [10 puntos] Estime el LATE de ser cliente sobre la probabilidad de estar autoempleado, usando la misma especificación que en la tarea 2 y usando errores estándar agrupados a nivel de la variable demi_paire. ¿Es este efecto estadísticamente significaivo.

  2. [10 puntos] Interprete el coeficiente asociado a la variable client en la regresión estimada en la parte a.

  3. [10 puntos] Ahora estime los errores estándar robustos, pero sin agrupar. En particular, calcule los errores estándar robustos del tipo HC1. Compare sus conclusiones con lo que encontró en la parte a.

Next