Diseño de regresión discontinua

En estadística, econometría, ciencia política, epidemiología y otras disciplinas relacionadas, un diseño de regresión discontinua (DRD o RDD en inglés) es un diseño cuasi-experimental pretest-postest que investiga efectos causales de las intervenciones mediante la asignación de un valor de corte o umbral por encima o por debajo de los cuales una intervención es asignada. Mediante la comparación de las observaciones que se extienden estrechamente a ambos lados del umbral, es posible estimar el efecto promedio del tratamiento en entornos en los que la aleatorización era inviable. En primer lugar aplicada por Donald Thistlewaite y Donald T. Campbell a la evaluación de los programas de becas,^[1] la RDD se ha vuelto cada vez más popular en los últimos años.^[2]

Ejemplo[editar]

La intuición detrás del diseño de regresión discontinua se ilustra muy bien con la evaluación de las becas basadas en el mérito. El principal problema de estimar el efecto causal de este tipo de programa es la endogeneidad de la asignación del tratamiento (por ejemplo, la beca): Dado que los estudiantes de alto rendimiento tienen más probabilidades de obtener la beca de mérito y continuar obteniendo buenos grados, al mismo tiempo, la comparación de los resultados de los que obtuvieron la beca y los no beneficiarios conducirían a una estimación altamente sesgada. Incluso si la beca no mejoró las calificaciones en absoluto, los beneficiarios habrían obtenido mejores resultados que los no beneficiarios, simplemente porque las becas se otorgan a estudiantes que estaban funcionando bien ex ante.

A pesar de la ausencia de un diseño experimental, un DRD puede explotar características exógenas de la intervención para provocar efectos causales. Si todos los estudiantes por encima de un determinado grado-por ejemplo, el 80% se les da la beca, es posible obtener el efecto del tratamiento local mediante la comparación de los estudiantes alrededor del 80%: La intuición nos dice que un estudiante con calificación de 79% es probablemente muy parecido a un estudiante con calificación de 81%, dado el umbral predeterminado de 80%. Sin embargo, el segundo estudiante recibirá la beca mientras que el primero no. Al comparar los resultados del adjudicatario de la beca (grupo de tratamiento) con el resultado contrafactual del no-adjudicatario (grupo control), por tanto, veremos el efecto local del tratamiento.

Metodología[editar]

Los dos enfoques más comunes para la estimación utilizando un DRD son el paramétrico y el no-paramétrico (normalmente regresión polinómica).

Estimación no paramétrica[editar]

El método no paramétrico más común utilizado en el contexto DRD es una regresión lineal local. Esto es de la forma:

$Y=\alpha +\tau D+\beta _{1}(X-c)+\beta _{2}D(X-c)+\epsilon$

donde $c-h\leq X\leq c+h$ Donde $c$ es el punto de corte del tratamiento, $D$ es una variable binaria igual a uno si $X\geq c$ , y $h$ es el ancho de banda de datos utilizados. Se ajustan diferentes pendientes e intersecciones a cada lado del punto de corte. Por lo general se utiliza un kernel rectangular (sin ponderación) o triangular, siendo el último más popular en investigación^[3] pero el kernel rectangular tiene una interpretación más directa.^[4]

La principal ventaja de utilizar métodos no paramétricos en un DRD es que proporcionan estimaciones basadas en los datos más cerca del punto de corte, lo que los hace intuitivamente atractivo. Esto reduce algunos sesgos que puedan resultar del uso de datos más lejos del punto de corte para estimar la discontinuidad en el punto de corte.^[4] De manera más formal, se prefieren las regresiones lineales locales, ya que tienen mejores propiedades de polarización^[3] y tienen una mejor convergencia.^[5] Sin embargo, el uso de ambos tipos de estimación, si es factible, es una forma útil para argumentar que los resultados estimados no dependen demasiado del enfoque particular adoptado.

Referencias[editar]

↑ Thistlewaite, D. & Campbell, D.: Regression-Discontinuity Analysis: An alternative to the ex post facto experiment, 1960, Journal of Educational Psychology 51: 309-317.
↑ Imbens, G. &nd Lemieux, T.: Regression Discontinuity Designs: A Guide to Practice, 2010, Journal of Economic Literature 48, 281-355
↑ ^a ^b Fan; Gijbels (1996). Local Polynomial Modelling and Its Applications. Londres: Chapman and Hall. ISBN 0-412-98321-4.
↑ ^a ^b Lee; Lemieux (2010). «Regression Discontinuity Designs in Economics». Journal of Economic Literature 48 (2): 281-355. doi:10.1257/jel.48.2.281.
↑ Porter (2003). «Estimation in the Regression Discontinuity Model». Unpublished Manuscript. Archivado desde el original el 20 de octubre de 2013. Consultado el 27 de noviembre de 2013.

Datos: Q2138712

[Thistlewaite_and_Cambpell-1] Thistlewaite, D. & Campbell, D.: Regression-Discontinuity Analysis: An alternative to the ex post facto experiment, 1960, Journal of Educational Psychology 51: 309-317.

[Imbens_and_Lemieux-2] Imbens, G. &nd Lemieux, T.: Regression Discontinuity Designs: A Guide to Practice, 2010, Journal of Economic Literature 48, 281-355

[Fan_and_Gijbels_1996-3] Fan; Gijbels (1996). Local Polynomial Modelling and Its Applications. Londres: Chapman and Hall. ISBN 0-412-98321-4.

[Lee_and_Lemieux_2010-4] Lee; Lemieux (2010). «Regression Discontinuity Designs in Economics». Journal of Economic Literature 48 (2): 281-355. doi:10.1257/jel.48.2.281.

[Porter_2003-5] Porter (2003). «Estimation in the Regression Discontinuity Model». Unpublished Manuscript. Archivado desde el original el 20 de octubre de 2013. Consultado el 27 de noviembre de 2013.

[1]

[2]

[3]

[4]

[5]