Sie sind auf Seite 1von 88

Regresin con Variables Instrumentales (VI) (SW Captulo 10)

Tres problemas a considerar: Sesgo por omisin de variables (OV) no observadas (y, por tanto, no incluidas en la regresin) que estn correlacionadas con X; Sesgo por causalidad simultnea (CS); es decir, X causa a Y e Y causa a X; Sesgo por errores en las variables (EV); es decir, medimos X con error. La regresin VI puede eliminar los anteriores sesgos.
10-1

El estimador VI con un nico regresor y un nico instrumento (SW Seccin 10.1) Yi = 0 + 1Xi + ui La regresin VI divide X en dos partes: una que puede estar correlacionada con u, y la otra que no. Aislando esta ltima, podremos estimar 1. Para ello, utilizaremos una variable instrumental, Zi, no correlacionada con ui. Para estimar 1, la VI detecta aquellos movimientos en Xi que no estn correlacionados con ui.
10-2

Terminologa: endogeneidad y exogeneidad Una variable es endgena si est correlacionada con u. Una variable es exgena si no lo est. Nota histrica: Endgeno significa literalmente determinado dentro del sistema, es decir, una variable que se determina conjuntamente con Y, o bien que est sujeta a CS. Sin embargo, nuestra definicin es ms general y la regresin IV puede utilizarse tambin en los casos OV y EV.

10-3

Dos condiciones para que un instrumento sea vlido Yi = 0 + 1Xi + ui Para que un instrumento Z sea vlido, debe satisfacer las dos siguientes condiciones: 1. 2. relevante: corr(Zi,Xi) 0 exgeno: corr(Zi,ui) = 0

Supongamos que disponemos de un Zi (discutiremos posteriormente la forma de obtenerlo). Cmo lo podemos utilizar para estimar 1?
10-4

El estimador VI: una X y una Z Explicacin #1: Mnimos Cuadrados en Dos Etapas Como suena: MC2E tiene dos etapas dos regresiones: (1) Primero se asla la parte de X que no est correlacionada con u: regresin de X sobre Z por MCO Xi = 0 + 1Zi + vi Como Zi no est correlacionada con ui, 0 + 1Zi tampoco lo estar con ui. No conocemos 0 or 1 pero sabemos estimarlos.
, donde X = 0 + Hallar las estimaciones de Xi, X i i
1 Zi, i = 1,,n.
10-5

(1)

en la regresin de inters: (2) Reemplazar Xi por X i por MCO: regresin de Y sobre X i + ui Yi = 0 + 1 X i no est correlacionada con ui en muestras Como X i

(2)

grandes, el primero de los supuestos MCO se cumple. Por tanto, 1 puede estimarse por MCO en (2) ste es un argumento de muestras grandes (es decir 0 y

1 estarn bien estimadas en (1)) MC 2 E . El estimador resultante es el MC2E, 1

10-6

MC2E (Continuacin) Si disponemos de un instrumento vlido, Zi, Etapa 1: Regresin de Xi sobre Zi, para obtener X i Etapa 2: ; el coeficiente de X es el Regresin de Yi sobre X i i
MC 2 E . MC2E, 1 MC 2 E es consistente de 1. Entonces, 1
10-7

El estimador VI: una X y una Z, (continuacin). Explicacin #2: (slo) un poco de lgebra Yi = 0 + 1Xi + ui Entonces, cov(Yi,Zi) = cov(0 + 1Xi + ui,Zi) = cov(0,Zi) + cov(1Xi,Zi) + cov(ui,Zi) = 0 + cov(1Xi,Zi) + 0 = 1cov(Xi,Zi) donde cov(ui,Zi) = 0 (instrumento exgeno); por tanto
cov(Yi , Z i ) 1 = cov( X i , Z i )
10-8

El estimador VI: una X y una Z. (continuacin)


cov(Yi , Z i ) 1 = cov( X i , Z i )

El estimador VI reemplaza estas covarianzas poblacionales por las muestrales:


sYZ MC 2 E = , 1 s XZ

sYZ y sXZ son las covarianzas muestrales. ste es el estimador MC2E una derivacin diferente.
10-9

Consistencia del estimador MC2E


sYZ MC 2 E = 1 s XZ

Las covarianzas muestrales son consistentes: sYZ cov(Y,Z) y sXZ cov(X,Z). Por tanto,

MC 2 E 1 p

sYZ p cov(Y , Z ) = = 1 cov( X , Z ) s XZ

La condicin de relevancia del instrumento, cov(X,Z) 0, impide dividir por cero.


10-10

Ejemplo #2: Oferta y demanda de mantequilla La regresin IV tuvo su origen en la estimacin de elasticidades de demanda de bienes agrcolas, por ejemplo la de la mantequilla: ln(Qimant ) = 0 + 1ln( Pi mant ) + ui 1 = elasticidad precio de la mantequilla = cambio porcentual en la cantidad demandada debido a un cambio de un 1% en el precio. Datos: observaciones sobre precio y cantidad de mantequilla consumida en distintos aos La regresin MCO de ln(Qimant ) sobre ln( Pi mant ) adolece de sesgo CS (por qu?)
10-11

La CS en la regresin MCO de ln(Qimant ) sobre ln( Pi mant ) se debe a que el precio y la cantidad vienen determinados por la interaccin de la demanda y oferta

10-12

Esta interaccin de demanda y oferta produce

Podra una regresin utilizar estas observaciones para hallar la curva de demanda?
10-13

Qu es lo que se obtendra si slo la curva de oferta se desplazara?

10-14

MC2E estima la curva de demanda aislando los cambios en el precio y cantidad que son consecuencia de desplazamientos en la curva de oferta. Z es una variable que desplaza la oferta pero no la demanda. Sea Z = lluvia en regiones productoras de leche. Es Z un instrumento vlido? (1) Exgeno? corr(lluviai,ui) = 0? Posiblemente: el que llueva o no en dichas regiones no debera afectar a la demanda (2) Relevante? corr(lluviai,ln( Pi mant )) 0? Posiblemente: lluvia escasa significa menos pasto, y, por tanto, menos mantequilla
10-15

MC2E en el ejemplo de oferta y demanda ln(Qimant ) = 0 + 1ln( Pi mant ) + ui Zi = lluviai en regiones productoras de leche. Etapa 1: regresin de ln( Pi mant ) sobre lluvia; obtener
ln( Pi mant ) ln( Pi mant ) asla cambios del precio por el lado de la

oferta Etapa 2: regresin de ln(Qimant ) sobre ln( Pi mant )

10-16

Ejemplo #2: Nmero de alumnos y notas Los resultados de las regresiones en el ejemplo de California podran adolecer de sesgo OV (por ejemplo, ayuda de los padres en los estudios de sus hijos). Este sesgo podra eliminarse mediante VI (MC2E). La regresin requiere un instrumento vlido,: (1) relevante: corr(Zi,STRi) 0 (2) exgeno: corr(Zi,ui) = 0

10-17

Ejemplo #2: Nmero de alumnos y notas (cont.) El siguiente podra ser un (hipottico) instrumento: los distritos que han sido afectados por algn terremoto han tenido tambin un mayor nmero de alumnos: Zi = Terri = 1 si ha habido algn terremoto. Se cumpliran las dos condiciones de instrumentos vlidos? El comportamiento aleatorio de los terremotos implica que la variacin en STR como consecuencia de uno de ellos es exgena. Primera etapa: regresin de STR sobre Terr, aislando as la parte de STR que es exgena.
10-18

Inferencia con MC2E En muestras grandes, la distribucin muestral del estimador MC2E es normal Inferencia (tests de hiptesis, intervalos de confianza) de la misma forma, e.g. 1.96SE El estimador MC2E es como los dems tratados hasta ahora un promedio de variables i.i.d. con media cero, al que podemos aplicar el TCL.

10-19

sYZ MC 2 E = 1 s XZ

1 n (Yi Y )( Z i Z ) n 1 i =1 = 1 n ( X i X )( Z i Z ) n 1 i =1

Sustituir en Yi = 0 + 1Xi + ui y simplificar: Primero, Yi Y = 1(Xi X ) + (ui u ) luego


1 n 1 n (Yi Y )( Z i Z ) = [ 1 ( X i X ) + (u i u )]( Z i Z ) n 1 i =1 n 1 i =1

1 n 1 n ( X i X )( Z i Z ) + (ui u )( Z i Z ) . = 1 n 1 i =1 n 1 i =1
10-20

Por tanto
MC 2 E 1 1 n (Yi Y )( Z i Z ) n 1 i =1 = 1 n ( X i X )( Z i Z ) n 1 i =1

1 n 1 n ( X i X )( Z i Z ) + (ui u )( Z i Z ) 1 n 1 i =1 n 1 i =1 = 1 n ( X i X )( Z i Z ) n 1 i =1 1 n (ui u )( Z i Z ) n 1 i =1 = 1 + . n 1 ( X i X )( Z i Z ) n 1 i =1

Restando 1 de ambos lados obtenemos,


10-21

MC 2 E 1

1 n (ui u )( Z i Z ) n 1 i =1 1 = 1 n ( X i X )( Z i Z ) n 1 i =1

Multiplicando por n 1 y utilizando la aproximacin


n 1 n, 1 n (ui u )( Z i Z ) 1) nn i =1 1 ( X i X )( Z i Z ) n i =1

MC 2 E n ( 1

10-22

MC 2 E n ( 1

1 n (ui u )( Z i Z ) 1) nn i =1 1 ( X i X )( Z i Z ) n i =1

Numerador: en muestras grandes,


1 n (ui u )( Z i Z ) ~ N(0,var[(ZZ)u]) n i =1

Denominator:
p 1 n ( X i X )( Z i Z ) cov(X,Z) por LGN n i =1

donde cov(X,Z) 0 porque el instrumento es relevante

10-23

Consecuentemente:
MC 2 E n ( 1 1 n (ui u )( Z i Z ) 1) nn i =1 1 ( X i X )( Z i Z ) n i =1

p 1 n ( X i X )( Z i Z ) cov(X,Z) n i =1

1 n (ui u )( Z i Z ) ~ N(0,var[(ZZ)u]) n i =1 MC 2 E se distribuye aproximadamente Finalmente,


1
2 N(1,
TSLS 1

),

2 MC 2 E 1

donde

1 var[( Z i Z )ui ] = . 2 n [cov( Z i , X i )]


10-24

Inferencia con MC2E (cont.)


MC 2 E se distribuye aprox. N(1, 2 MC 2 E ), 1
1

Inferencia como siempre. Justificacin como siempre: muestras grandes. Instrumentos vlidos. Nota importante sobre errores estndar: o Los errores estndar MCO de la 2 etapa no son los correctos no consideran que la primera etapa ha ). sido estimada ( X i o En su lugar, usaremos MC2E y los SEs correctos. o Como siempre, usaremos los SEs robustos a la heteroscedasticidad.
10-25

Digresin: Breve historia de IV Cunto dinero se recaudara mediante una tarifa de importacin sobre aceites vegetales y animales (mantequilla, aceite de soja, linaza, etc.)? Para calcularlo, necesitamos conocer las elasticidades de oferta y demanda, interior y exterior. Este problema fue resuelto por primera vez en el apndice B de Wright (1928), The Tariff on Animal and Vegetable Oils.

10-26

Grfico 4, p. 296, Apndice B (1928):

10-27

Philip Wright (1861-1934) Sewall Wright (1889-1988) economista y poeta famoso estadstico en Gentica MA Harvard, Econ, 1887 ScD Harvard, Biology, 1915 Lect.r, Harvard, 1913-1917 Prof., U. Chicago, 1930-1954
10-28

Ejemplo: Demanda de Tabaco Cunto reducir un impuesto el consumo de tabaco? Para ello, necesitaremos conocer su elasticidad de demanda; es decir, 1, en la regresin, ln(Qitabaco ) = 0 + 1ln( Pi tabaco ) + ui Estar sesgado el MCO? Por qu o por qu no?

10-29

Ejemplo: Demanda de tabaco (cont.) ln(Qitabaco ) = 0 + 1ln( Pi tabaco ) + ui Datos de Panel: Consumo anual de tabaco y precio medio (impuestos incluidos) 48 estados de USA, 1985-1995 Propuesta VI: Zi = Impuesto = SalesTaxi Es vlido? (1) Relevante? corr(SalesTaxi, ln( Pi tabaco )) 0? (2) Exgeno? corr(SalesTaxi,ui) = 0?
10-30

Por ahora, slo utilizaremos observaciones de 1995. Primera etapa: regresin MCO
ln( Pi tabaco ) = 4.63 + .031SalesTaxi, n = 48

Segunda etapa: regresin MCO


ln(Qitabaco ) = 9.72 1.08 ln( Pi tabaco ) , n = 48

Regresin combinada con errores estndar robustos a la heteroscedasticidad:


ln(Qitabaco ) = 9.72 1.08 ln( Pi tabaco ) , n = 48

(1.53) (0.32)
10-31

STATA Ejemplo: Demanda de tabaco, Primera etapa Instrumento = Z = rtaxso = impuesto (real $/pack)
X Z . reg lravgprs rtaxso if year==1995, r; Regression with robust standard errors Number of obs = F( 1, 46) = Prob > F = R-squared = Root MSE = 48 40.39 0.0000 0.4710 .09394

-----------------------------------------------------------------------------| Robust lravgprs | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------rtaxso | .0307289 .0048354 6.35 0.000 .0209956 .0404621 _cons | 4.616546 .0289177 159.64 0.000 4.558338 4.674755 -----------------------------------------------------------------------------X-hat . predict lravphat; Now we have the predicted values from the 1st stage

10-32

Segunda etapa
Y X-hat . reg lpackpc lravphat if year==1995, r; Regression with robust standard errors Number of obs = F( 1, 46) = Prob > F = R-squared = Root MSE = 48 10.54 0.0022 0.1525 .22645

-----------------------------------------------------------------------------| Robust lpackpc | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------lravphat | -1.083586 .3336949 -3.25 0.002 -1.755279 -.4118932 _cons | 9.719875 1.597119 6.09 0.000 6.505042 12.93471 ------------------------------------------------------------------------------

stas son las estimaciones MC2E Los errores estndar no son los correctos porque ignoran el hecho de que la primera etapa fue estimada
10-33

Regresin combinada:
Y X Z . ivreg lpackpc (lravgprs = rtaxso) if year==1995, r; IV (2SLS) regression with robust standard errors Number of obs = F( 1, 46) = Prob > F = R-squared = Root MSE = 48 11.54 0.0014 0.4011 .19035

-----------------------------------------------------------------------------| Robust lpackpc | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------lravgprs | -1.083587 .3189183 -3.40 0.001 -1.725536 -.4416373 _cons | 9.719876 1.528322 6.36 0.000 6.643525 12.79623 -----------------------------------------------------------------------------Instrumented: lravgprs This is the endogenous regressor Instruments: rtaxso This is the instrumental varible -----------------------------------------------------------------------------OK, the change in the SEs was small this time...but not always!

ln(Qitabaco ) = 9.72 1.08 ln( Pi tabaco ) , n = 48

(1.53) (0.32)
10-34

Resumen de la regresin VI con nicos X y Z Un instrumento vlido Z debe satisfacer dos condiciones: (1) relevancia: corr(Zi,Xi) 0 (2) exogeneidad: corr(Zi,ui) = 0
, y luego MC2E: regresin de X sobre Z para obtener X . de Y sobre X

La idea ms importante es que en la primera regresin se asla la parte de la variacin de X que no est correlacionada con u Si el instrumento es vlido, la distribucin en muestras grandes del MC2E ser normal.
10-35

El modelo general de regresin VI (SW Seccin 10.2) Hasta ahora hemos considerado la regresin VI con un nico regresor endgeno (X) y un nco instrumento (Z). Ahora extenderemos el modelo a: o mltiples regresores endgenos (X1,,Xk) o mltiples variables exgenas (W1,,Wr) o mltiples instrumentos (Z1,,Zm) Ms instrumentos pueden producir menor varianza en MC2E: el R2 de la primera etapa aumenta, es . decir mayor variacin en X
10-36

Ejemplo: Demanda de tabaco Otro determinante de la demanda de tabaco es la renta; su omisin resultar en sesgo por OV. demanda con una X, una W, y 2 Zs: ln(Qitabaco ) = 0 + 1ln( Pi tabaco ) + 2ln(Rentai) + ui Z1i = impuestos generales Z2i = impuesto especfico sobre el tabaco Otras Ws podran ser los efectos del Estado y/o Ao (con datos de panel)
10-37

El modelo general de regresin VI: notacin Yi = 0 + 1X1i + + kXki + k+1W1i + + k+rWri + ui Yi es la variable dependiente X1i,, Xki son regresores endgenos (potencialmente correlacionados con ui) W1i,,Wri son regresores exgenos incluidos or (no correlacionados con ui) 0, 1,, k+r son los coeficientes desconocidos Z1i,,Zmi son m instrumentos (variables exgenas excluidas)
10-38

El modelo general de regression VI (cont.) Yi = 0 + 1X1i + + kXki + k+1W1i + + k+rWri + ui Terminologa: identificacin y sobreidentificacin MC2E con variables exgenas incluidas o un regresor endgeno o mltiples regresores endgenos Supuestos: o instrumentos vlidos (relevancia y exogeneidad) o supuestos generales de la regresin VI

10-39

Identificacin En general, un parmetro est identificado si diferentes valores del parmetro dan lugar a diferentes distribuciones de las observaciones. En la regresin VI, el que los coeficientes estn identificados depende del nmero de instrumentos (m) y el de regresores endgenos (k) Intuitivamente, si hay menos instrumentos que regresores endgenos, no podremos estimar 1,,k Por ejemplo, k = 1 y m = 0 (ningn instrumento)!

10-40

Identificacin (cont.) Los coeficientes 1,,k estn exactamente identificados si m = k. overidentified if m > k. Hay ms instrumentos de los necesarios para estimar

1,,k. Podremos, sin embargo, contrastar la validez de ellos mediante tests de sobreidentificacin no identificados si m < k. No hay un nmero suficiente de instrumentos para estimar 1,,k. Si es as, necesitaremos buscar ms instrumentos!

10-41

Regresin general VI: MC2E, 1 regresor endgeno Yi = 0 + 1X1i + 2W1i + + 1+rWri + ui Instrumentos: Z1i,,Zm Primera etapa o Regresin de X1 sobre todos los regresores exgenos: X1 sobre W1,,Wr,Z1,,Zm por MCO , i = 1,,n o Hallar X 1i Segunda etapa ,W1,,Wr por MCO o Regresin de Y sobre X 1 o Los coeficientes de esta segunda etapa son MC2E, pero SEs son incorrectos Para obtener los SEs correctos, hgalo en un solo paso
10-42

Ejemplo: Demanda de tabaco ln(Qitabaco ) = 0 + 1ln( Pi tabaco ) + 2ln(Rentai) + ui Z1i = impuesto generali Z2i = impuesto especficoi Regresor endgeno: ln( Pi tabaco ) (una X) Regresor exgeno incluido: ln(Rentai) (una W) Instrumentos (variables exgenas excluidas): impuestos general y especfico (dos Zs) Est la elasticidad de demanda 1 sobre-, exactamente o no identificada?
10-43

Ejemplo: Demanda de tabaco, un instrumento


Y W X Z . ivreg lpackpc lperinc (lravgprs = rtaxso) if year==1995, r; IV (2SLS) regression with robust standard errors Number of obs = F( 2, 45) = Prob > F = R-squared = Root MSE = 48 8.19 0.0009 0.4189 .18957

-----------------------------------------------------------------------------| Robust lpackpc | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------lravgprs | -1.143375 .3723025 -3.07 0.004 -1.893231 -.3935191 lperinc | .214515 .3117467 0.69 0.495 -.413375 .842405 _cons | 9.430658 1.259392 7.49 0.000 6.894112 11.9672 -----------------------------------------------------------------------------Instrumented: lravgprs Instruments: lperinc rtaxso STATA lists ALL the exogenous regressors as instruments slightly different terminology than we have been using ------------------------------------------------------------------------------

Un slo comando da los SEs correctos Usar , r para los SEs robustos a la heteroscedasticidad
10-44

Ejemplo: Demanda de tabaco, dos instrumentos


Y W X Z1 Z2 . ivreg lpackpc lperinc (lravgprs = rtaxso rtax) if year==1995, r; IV (2SLS) regression with robust standard errors Number of obs = F( 2, 45) = Prob > F = R-squared = Root MSE = 48 16.17 0.0000 0.4294 .18786

-----------------------------------------------------------------------------| Robust lpackpc | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------lravgprs | -1.277424 .2496099 -5.12 0.000 -1.780164 -.7746837 lperinc | .2804045 .2538894 1.10 0.275 -.230955 .7917641 _cons | 9.894955 .9592169 10.32 0.000 7.962993 11.82692 -----------------------------------------------------------------------------Instrumented: lravgprs Instruments: lperinc rtaxso rtax STATA lists ALL the exogenous regressors as instruments slightly different terminology than we have been using ------------------------------------------------------------------------------

10-45

MC2E, Z = impuesto (m = 1)
ln(Qitabaco ) = 9.43 1.14 ln( Pi tabaco ) + 0.21ln(Rentai)

(1.26) (0.37)

(0.31)

MC2E, Z = impuestos general y especfico (m = 2)


ln(Qitabaco ) = 9.89 1.28 ln( Pi tabaco ) + 0.28ln(Rentai)

(0.96) (0.25)

(0.25)

Menores SEs con m = 2. Utilizando 2 instrumentos es ms informativo mayor variacin aleatoria. Baja elasticidad renta (no es un bien de lujo); no es significativamente distinta de cero Sorprendentemente alta elasticidad precio
10-46

Regresin general VI: MC2E con mltiples regresores endgenos Yi = 0 + 1X1i + + kXki + k+1W1i + + k+rWri + ui Instrumentos: Z1i,,Zm Ahora hay k regresiones en primera etapa: o X1 sobre W1,, Wr, Z1,, Zm por MCO , i = 1,,n o Hallar X 1i o X2 sobre W1,, Wr, Z1,, Zm por MCO , i = 1,,n o Hallar X 2i
, X ,, X o Repetir con todas las Xs y obtener X 1i 2i ki
10-47

MC2E con mltiples regresores endgenos (cont.) Segunda etapa , X ,, X , W1,, Wr por MCO o Y sobre X 1i 2i ki o Los coeficientes de esta segunda etapa son MC2E, pero sus SEs son incorrectos Para obtener los SEs correctos, hgalo en un slo paso Qu sucedera en la segunda etapa si los coeficientes no estuviesen identificados ( #instrumentos < #variables endgenas);por ejemplo, k = 2, m = 1?

10-48

Distribucin muestral de MC2E en el modelo de regresin general VI Significado de instrumento vlido en el caso general Supuestos Implicaciones: si se cumplen los supuestos, entonces MC2E se distribuye normal, y la inferencia (contrastes e intervalos de confianza) se lleva a cabo como siempre

10-49

Conjunto de instrumentos vlidos en el caso general El conjunto debe ser relevante y exgeno: 1. Relevancia: Caso especial de una X Al menos uno de los instrumentos debe ser significativo en la primera etapa. 2. Exogeneidad Ninguno debe estar correlacionado con u: corr(Z1i,ui) = 0,, corr(Zm,ui) = 0

10-50

Instrumentos Vlidos en el caso general (cont.) (1) Condicin general de relevancia: Mltiples Xs Supongamos que la segunda etapa pudiera utilizar los valores de prediccin de la primera etapa poblacional. Entonces, no habra multicolinealidad. Caso especial de una X Al menos uno de los instrumentos debe ser significativo en la primera etapa.

10-51

Supuestos Yi = 0 + 1X1i + + kXki + k+1W1i + + k+rWri + ui 1. E(ui|W1i,,Wri) = 0 2. (Yi,X1i,,Xki,W1i,,Wri,Z1i,,Zmi) son i.i.d. 3. Las Xs, Ws, Zs, e Y poseen momentos finitos de cuarto orden no nulos. 4. Las Ws no son perfectamente multicolineales. 5. Los (Z1i,,Zmi) satisfacen las condiciones de validez. #1 dice los regresores exgenos son exgenos. #2 #4 no son nuevos; hemos discutido #5.
10-52

Implicaciones: Distribucin muestral de MC2E Si los supuestos se cumplen, entonces MC2E se distribuye normal en grandes muestras. Inferencia (contrastacin, intervalos de confianzas) se lleva a cabo como siempre. Dos notas sobre los errores estndar: o Los SEs de la segunda etapa son incorrectos porque no tienen en cuenta que la primera etapa ha sido estimada; para obtener los correctos, deber llevarse a cabo la regresin con un nico comando. o Utilizar SEs robustos.
10-53

Comprobacin de la validez (SW Seccin 10.3) Recurdese que los dos requisitos para que un instrumento sea vlido son: 1. Relevancia (caso especial de una X) Al menos uno de los instrumentos debe ser significativo en la primera etapa. 2. Exogeneidad Ningn instrumento debe estar correlacionado con el trmino de error: corr(Z1i,ui) = 0,, corr(Zmi,ui) = 0

10-54

Comprobar el Supuesto #1: Relevancia En el caso de un nico regresor endgeno incluido, Yi = 0 + 1Xi + 2W1i + + 1+rWri + ui Primera etapa: Xi = 0 + 1Z1i ++ miZmi + m+1iW1i ++ m+kiWki + ui Los instrumentos sern relevantes si al menos uno de los 1,,m es no nulo. Los instrumentos sern dbiles si todos los 1,,m son nulos o cercanos a cero. Instrumentos dbiles explican muy poco de la variacin en X, ms all de la ya explicada por Ws
10-55

Qu consecuencias tienen los instrumentos dbiles? Considerar el caso ms simple: Yi = 0 + 1Xi + ui Xi = 0 + 1Zi + ui
sYZ MC 2 E 1 = s XZ

Si cov(X,Z) es cero o cercana a cero, sXZ sera pequea.


MC 2 E (y su En este caso, la distribucin muestral de 1

estadstico t) no estar bien aproximado por una normal


10-56

Ejemplo: Distribucin de MC2E - t con instrumentos dbiles

Lnea oscura = instrumentos irrelevantes Lnea punteada = instrumentos fuertes


10-57

Por qu falla la aproximacin normal?


sYZ MC 2 E = 1 s XZ

Si cov(X,Z) es baja, pequeos cambios en sXZ (de una


MC 2 E muestra a otra) producirn grandes cambios en 1

Supongamos que en una muestra sXZ = .00001! Entonces, la normal no ser una buena aproximacin a
MC 2 E la distribucin muestral de 1 MC 2 E se distribuya Una aproximacin mejor es que 1

como un cociente de dos normales correlacionadas (vase SW Ap. 10.4) Si los instrumentos son dbiles, no deberemos confiar en los mtodos tradicionales de inferencia.
10-58

Cmo medir en la prctica la fortaleza de un instrumento: El estadstico F de la 1 etapa Primera etapa (una X): Regresin de X sobre Z1,..,Zm,W1,,Wk. Instrumentos totalmente irrelevantes todos los coeficientes de Z1,,Zm, son cero. El estadstico F de la 1 etapa contrasta la hiptesis de que Z1,,Zm no entre en la primera regresin. Instrumentos dbiles implican un valor pequeo de F.

10-59

Comprobar instrumentos dbiles con una nica X Hallar F de la primera etapa Consejo: Si F es menos de 10, considerar que el conjunto de instrumentos es dbil. En este caso, MC2E estar sesgado, y desconfiaremos de la inferencia (errores estndar, contrastes, intervalos de confianza). Ntese que no es suficiente rechazar simplemente que los coeficientes de Z sean cero necesitaremos adems un contenido predictivo sustancial para considerar a la normal una buena aproximacin.

10-60

Qu hacemos si nuestros instrumentos son dbiles? Buscarlos mejores (!) Si disponemos de muchos, algunos sern ms dbiles que otros y sera una Buena idea eliminar los ms dbiles (lo que aumentar el F de 1 etapa) Utilizar un estimador VI distinto de MC2E o Hay muchos estimadores VI cuando los coeficientes estn sobreidentificados. o Mxima Verosimilitud con Informacin Limitada (LIML) se ve menos afectada con instrumentos dbiles.
10-61

Comprobacin del Supuesto #2: Exogeneidad Exogeneidad: Ningn instrumento estar correlacionado con el trmino de error: corr(Z1i,ui) = 0,, corr(Zmi,ui) = 0 En otro caso, la 1 etapa de MC2E no aislar convenientemente el componente de X estar correlacionada con incorrelacionado con u, y X u y MC2E ser inconsistente. Si se dispone de ms instrumentos que regresores endgenos, ser posible contrastar parcialmente la exogeneidad de los instrumentos.
10-62

Contraste de sobreidentificacin Considerar el caso ms simple: Yi = 0 + 1Xi + ui, Disponemos de 2 instrumentos vlidos: Z1i, Z2i Llevar a cabo 2 regresiones separadas MC2E. Si las estimaciones MC2E son muy distintas, entonces algo debe estar mal: uno u otro (o los dos) deben ser invlidos. El contraste J de sobreidentificacin hace esta comparacin de forma precisa cuando #Zs > #Xs
10-63

Supongamos que #instruments = m > # Xs = k Yi = 0 + 1X1i + + kXki + k+1W1i + + k+rWri + ui Contraste J 1. Estimar la ecuacin mediante MC2E utilizando los m , utilizando el valor observado instrumentos; hallar Y i
s de la 2 etapa) de Xs (no las X i = Yi Y 2. Hallar los residuos u i
i sobre Z1i,,Zmi, W1i,,Wri 3. Regresin de u

4. Hallar F del contraste de la hiptesis de que todos los coeficientes de Z1i,,Zmi son cero; 5. Estadstico J es J = mF

10-64

J = mF, donde F es el del contraste de significacin conjunta de los coeficientes de Z1i,,Zmi en la regresin de los residuos MC2E sobre Z1i,,Zmi, W1i,,Wri. Distribucin del estadstico J Bajo la nula de que todos los instrumentos son exgenos, J se distribuye como una chi-cuadrado con mk grados de libertad If m = k, J = 0 (tiene sentido?) Si algunos instrumentos son exgenos y otros no, J ser grande, y la nula rechazada.
10-65

Aplicacin a la demanda de tabaco (SW Seccin 10.4) Por qu estamos interesados en conocer la elasticidad de la demanda de tabaco? Teora de la imposicin ptima: el impuesto ptimo est relacionado inversamente con dicha elasticidad. Externalidades: o Fumadores pasivos o Externalidades monetarias

10-66

Datos de Panel Consumo anual de tabaco, precio medio (impuestos incluidos), renta personal 48 estados USA, 1985-1995 Estrategia de estimacin Datos de panel nos permite controlar el efecto estado no observable que entra en la demanda de tabaco, en tanto en cuanto no vara con el tiempo. Pero todava necesitamos VI para eliminar el sesgo CS de la interaccin entre la oferta y demanda.

10-67

Modelo de Efectos Fijos (EF)


tabaco ln(Qit ) = i + 1ln( Pittabaco ) + 2ln(Rentait) + uit

i = 1,,48, t = 1985, 1986,,1995 i recoge factores omitidos no observables que varan con los estados pero no con el tiempo; e.g. actitud en relacin con fumar corr(ln( Pittabaco ),uit) puede ser no nula debido a las interacciones entre la oferta y demanda Estrategia de estimacin: o Eliminar i o MC2E contra el sesgo CS.
10-68

Regresin con datos de panel: dos enfoques (a) El mtodo de los n-1 indicadores binarios (b) El mtodo de los cambios (cuando T=2) (a) Mtodo de los n-1 indicadores binarios Escribir
tabaco ln(Qit ) = i + 1ln( Pittabaco ) + 2ln(Rentait) + uit

como
tabaco ln(Qit ) = 0 + 1ln( Pittabaco ) + 2ln(Rentait)

+ 2D2it + + 48D48it + uit Instrumentos: Z1it = impuesto generalit Z2it = impuesto especficoit
10-69

ste es el modelo general VI:


tabaco ) = 0 + 1ln( Pittabaco ) + 2ln(Rentait) ln(Qit

+ 2D2it + + 48D48it + uit X (regresor endgeno) = ln( Pittabaco ) 48 Ws (regresores exgenous incluidos) = ln(Rentait), D2it,, D48it Dos instrumentos = Z1it, Z2it Estimar el modelo complete por MC2E! Cmo introducir efectos retardados? (respuesta dinmica) se necesita tiempo para dejar de fumar

10-70

(b) Mtodo de los cambios (cuando T=2) Una forma de estudiar la dinmica es la consideracin de cambios en 10 aos, entre 1985 y 1995 Escribir la regression en la forma de cambios: tabaco ln(Qitabaco ) ln( Q 1995 i1985 )
tabaco tabaco = 1[ln( Pi1995 ) ln( Pi1985 )]

+2[ln(Rentai1995) ln(Rentai1985)] + (ui1995 ui1985) Variables de cambio a 10 aos, por ejemplo: Cambio a 10 aos en log-precio = ln(Pi1995) ln(Pi1985) Estimar la elasticidad de demanda por MC2E utilizando cambios a 10 aos en los instrumentos Seguiremos este enfoque
10-71

STATA: Demanda de tabaco Primero creamos variables a 10 aos Cambio a 10 aos en log-precio = ln(Pit) ln(Pit10) = ln(Pit/Pit10)
. . . . . . gen gen gen gen gen gen dlpackpc = log(packpc/packpc[_n-10]); dlavgprs = log(avgprs/avgprs[_n-10]); dlperinc = log(perinc/perinc[_n-10]); drtaxs = rtaxs-rtaxs[_n-10]; drtax = rtax-rtax[_n-10]; drtaxso = rtaxso-rtaxso[_n-10]; _n-10 is the 10-yr lagged value

10-72

Elasticidad de demanda por MC2E utilizando variables de cambios a 10 aos


Y W X Z . ivreg dlpackpc dlperinc (dlavgprs = drtaxso) , r; IV (2SLS) regression with robust standard errors Number of obs = F( 2, 45) = Prob > F = R-squared = Root MSE = 48 12.31 0.0001 0.5499 .09092

-----------------------------------------------------------------------------| Robust dlpackpc | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------dlavgprs | -.9380143 .2075022 -4.52 0.000 -1.355945 -.5200834 dlperinc | .5259693 .3394942 1.55 0.128 -.1578071 1.209746 _cons | .2085492 .1302294 1.60 0.116 -.0537463 .4708446 -----------------------------------------------------------------------------Instrumented: dlavgprs Instruments: dlperinc drtaxso -----------------------------------------------------------------------------NOTE: - All the variables Y, X, W, and Zs are in 10-year changes - Estimated elasticity = .94 (SE = .21) surprisingly elastic! - Income elasticity small, not statistically different from zero - Must check whether the instrument is relevant
10-73

Comprobacin de la relevancia: F de 1 etapa


. reg dlavgprs drtaxso dlperinc , r; Number of obs = F( 2, 45) = Prob > F = R-squared = Root MSE = 48 16.84 0.0000 0.5146 .06334 Regression with robust standard errors

-----------------------------------------------------------------------------| Robust dlavgprs | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------drtaxso | .0254611 .0043876 5.80 0.000 .016624 .0342982 dlperinc | -.2241037 .2188815 -1.02 0.311 -.6649536 .2167463 _cons | .5321948 .0295315 18.02 0.000 .4727153 .5916742 -----------------------------------------------------------------------------. test drtaxso; ( 1) drtaxso = 0 F( 1, We didnt need to run test here because with m=1 instrument, the F-statistic is the square of the t-statistic, that is, 5.80*5.80 = 33.67

45) = 33.67 Prob > F = 0.0000 First stage F = 33.7 > 10 so instrument is not weak

Podemos comprobar la exogeneidad? Nom = k


10-74

Dos instrumentos (impuestos general y especfico)


. ivreg dlpackpc dlperinc (dlavgprs = drtaxso drtax) , r; IV (2SLS) regression with robust standard errors Number of obs = F( 2, 45) = Prob > F = R-squared = Root MSE = 48 21.30 0.0000 0.5466 .09125

-----------------------------------------------------------------------------| Robust dlpackpc | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------dlavgprs | -1.202403 .1969433 -6.11 0.000 -1.599068 -.8057392 dlperinc | .4620299 .3093405 1.49 0.142 -.1610138 1.085074 _cons | .3665388 .1219126 3.01 0.004 .1209942 .6120834 -----------------------------------------------------------------------------Instrumented: dlavgprs Instruments: dlperinc drtaxso drtax -----------------------------------------------------------------------------drtaxso = general sales tax only drtax = cigarette-specific tax only Estimated elasticity is -1.2, even more elastic than using general sales tax only

Con m>k, podemos contrastar sobreidentificacin


10-75

Contraste de sobreidentificacin
. . predict e, resid; Computes predicted values for most recently estimated regression (the previous TSLS regression) reg e drtaxso drtax dlperinc; Regress e on Zs and Ws Number of obs F( 3, 44) Prob > F R-squared Adj R-squared Root MSE = = = = = = 48 1.64 0.1929 0.1008 0.0395 .08751

Source | SS df MS -------------+-----------------------------Model | .037769176 3 .012589725 Residual | .336952289 44 .007658007 -------------+-----------------------------Total | .374721465 47 .007972797

-----------------------------------------------------------------------------e | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------drtaxso | .0127669 .0061587 2.07 0.044 .000355 .0251789 drtax | -.0038077 .0021179 -1.80 0.079 -.008076 .0004607 dlperinc | -.0934062 .2978459 -0.31 0.755 -.6936752 .5068627 _cons | .002939 .0446131 0.07 0.948 -.0869728 .0928509 -----------------------------------------------------------------------------. test drtaxso drtax; ( 1) ( 2) drtaxso = 0 drtax = 0 F( 2, 44) = Prob > F = 2.47 0.0966 Compute J-statistic, which is m*F, where F tests whether coefficients on the instruments are zero so J = 2 2.47 = 4.93 ** WARNING this uses the wrong d.f. **
10-76

Los grados de libertad del estadstico J son mk: J = mF, donde F es el F del contraste de significacin conjunta de los coeficientes de Z1i,,Zmi en la regresin de los residuos MC2E sobre Z1i,,Zmi, W1i,,Wmi. Bajo la nula de que todos los instrumentos son exogenous,, J se distribuye chi-cuadrado con mk gradops de libertad Aqu, J = 4.93, distribuido chi-cuadrado con g.l. = 1; el valor crtico al 5% es 3.84; por tanto, rechazamos al 5% de nivel de significacin.
. dis "J-stat = " r(df)*r(F) " p-value = " J-stat = 4.9319853 p-value = .02636401 J = 2 2.47 = 4.93 chiprob(r(df)-1,r(df)*r(F));

p-value from chi-squared(1) distribution


10-77

Comprobar relevancia: F de 1 etapa


. X Z1 Z2 W reg dlavgprs drtaxso drtax dlperinc , r; Number of obs = F( 3, 44) = Prob > F = R-squared = Root MSE = 48 66.68 0.0000 0.7779 .04333 Regression with robust standard errors

-----------------------------------------------------------------------------| Robust dlavgprs | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------drtaxso | .013457 .0031405 4.28 0.000 .0071277 .0197863 drtax | .0075734 .0008859 8.55 0.000 .0057879 .0093588 dlperinc | -.0289943 .1242309 -0.23 0.817 -.2793654 .2213767 _cons | .4919733 .0183233 26.85 0.000 .4550451 .5289015 -----------------------------------------------------------------------------. test drtaxso drtax; ( 1) ( 2) drtaxso = 0 drtax = 0 F( 2, 44) = Prob > F = 88.62 0.0000 88.62 > 10 so instruments arent weak

10-78

Resumen de los resultados:

10-79

Cmo debe interpretarse el rechazo por J? J rechaza el que ambos instrumentos sean exgenos O bien rtaxso is endgena, o bien lo es rtax, o ambas J no nos dice cul! debemos pensar! Por qu rtax (especfico) debera ser endgena? o Por presin social, la imposicin sobre el tabaco ha sido tradicionalmente baja o En este caso, el impuesto especfico sobre el tabaco sera endgeno Este razonamiento no es aplicable a una imposicin general utilizar un nico instrumento: el impuesto general
10-80

La demanda de tabaco: Resumen de los resultados empricos Utilizar la elasticidad estimada por MC2E con el impuesto general como nico instrumento: Elasticity = -.94, SE = .21 Esta elasticidad es sorprendentemente elstica. un incremento del 1% en el precio reduce las ventas en cerca de un 1%. sta es una elasticidad de largo plazo (cambio a 10 aos). Como esperara Vd. que fuese la elasticidad de corto plazo (cambio a 1 ao)? ms o menos elstica?
10-81

Qu problemas quedan por resolver que afecten a la validez interna del modelo? Sesgo OV? o El estimador con datos de panel probablemente sea el correcto Especificacin inadecuada de la forma funcional del modelo? o Hmmmdeberamos comprobarlo o Una cuestin relacionada sera la distinta interpretacin de la elasticidad segn el cambio sea a 10 aos (largo plazo) o a 1 ao (corto plazo)

10-82

Sesgo CS o No si el impuesto general es un instrumento vlido: relevancia? exogeneidad? Sesgo EV? Estamos midiendo correctamente el precio? Qu hay del contrabando? Sesgo de seleccin? (no, disponemos de observaciones sobre todos los estados)

10-83

De dnde proceden los instrumentos vlidos? (SW Seccin 10.5) Instrumentos vlidos son (1) relevantes y (2) exgenos Una forma general de encontrar instrumentos vlidos es buscando variacin exgena que afecte a X variacin como si fuese generada aleatoriamente. o La lluvia desplaza la curva de oferta de mantequilla pero no la de demanda; lluvia como si fuese aleatoriamente asignada o Los impuestos desplazan la curva de oferta de tabaco pero no la de demanda; impuestos como si fuesen aleatoriamente asignados
10-84

Ejemplo: Cateterizacin cardiaca (CC) Mejora la longevidad de los pacientes que han sufrido algn ataque al corazn el haber recibido CC? Yi = tiempo de supervivencia (en das) Xi = 1 si el paciente recibe CC, = 0 si el paciente no la recibe Historiales clnicos han demostrado que CardCath afecta SurvivalDays. Pero es el tratamiento realmente efectivo? SurvivalDaysi = 0 + 1CardCathi + ui Es MCO insesgado? La decisin de utilizar CC es endgena slo se administra a aquellos pacientes que, por lo dems, se encuentran en buen estado de salud
10-85

Si slo aquellos pacientes con mejor estado de salud reciben CC, MCO adolecer de sesgo CS, y estimar al alza el efecto CC Instrumento propuesto: distancia al hospital CC ms cercano Z = distancia al hospital CC o Relevante? Si el hospital CC est muy alejado, el paciente no ser trasladado all y no recibir CC o Exgena? Si la distancia afecta a SurvivalDays slo a travs de CardCathi, entonces corr(distancia,ui) = 0 y, por tanto, ser exgena

10-86

o Si la localizacin del paciente es aleatoria, entonces la distancia estar asignada como si fuese aleatoriamente. o La 1 etapa es un modelo de probabilidad lineal: la distancia afecta a la probabilidad de recibir el tratamiento Resultados (McClellan, McNeil, Newhous, JAMA, 1994): o MCO significativo y gran efecto CC o MC2E no significativo y pequeo efecto CC

10-87

Resumen: Regresin VI (SW Seccin 10.6) Un instrumento vlido nos permite aislar la parte de X no correlacionada con u, y utilizarla para estimar el efecto de un cambio en X sobre Y La regresin VI est basada en instrumentos vlidos: (1) Relevancia: comprobar F de la 1 etapa (2) Exogeneidad: Contrastar sobreidentificacin via J Un instrumento vlido asla la variacin en X como si fuese aleatoriamente asignada. El requisito de al menos m instrumentos vlidos no puede ser contrastado Debe Vd. Utilizar su cabeza.
10-88

Das könnte Ihnen auch gefallen