Sie sind auf Seite 1von 29

Banco Central de Reserva del Per

Curso de Actualizacin para Economistas


Econometra
Prof. Juan F. Castro

Primera Sesin: Estimacin e inferencia en el


Modelo Lineal General
1. Introduccin
1.1. Qu es la econometra?
Aplicacin de tcnicas matemticas y estadsticas para
el anlisis (medicin emprica) de las relaciones
postuladas por la teora econmica (modelos).
Modelo: representacin simplificada de un fenmeno
real (un sistema o proceso).
Representamos este fenmeno a travs de un modelo
con el objetivo de: (i) explicarlo (entender qu est
detrs de su ocurrencia); (ii) predecirlo (aproximar
cmo ocurrir bajo determinadas circunstancias); y/o
(iii) controlarlo (saber qu se puede hacer para que
ocurra de manera consistente con algn objetivo de
poltica).
Trabajamos con modelos debido a que los sistemas o
procesos reales son, en general, demasiado complejos
(en especial aquellos asociados a las ciencias sociales).

BCRP - Curso de Actualizacin para Economistas

Econometra

Por lo mismo, buscamos representarlo de manera


realista y, a la vez, manejable.
o Realista: debe incorporar los principales elementos
del fenmeno (o sistema) representado,
especificando (de manera explcita) las relaciones
existentes entre las partes que lo conforman.
o Manejable: debe dejar de lado influencias (o
relaciones) de menor importancia > debemos
introducir supuestos y hacerlos explcitos.
1.2. Para qu la econometra?
Para qu introducimos supuestos y aprendemos
tcnicas de estimacin distintas?... es posible
distinguir algn objetivo primordial?
o Confrontar la teora con los datos.
o Escuchar lo que data nos quiere decir respecto a
las ideas que tenemos sobre la manera como
ocurren las cosas.
o Aislar los efectos de una variable de inters
sobre el fenmeno bajo anlisis.
Recordemos cmo hacamos esto en el colegio >
queremos medir el efecto que tiene sobre la temperatura
de la sustancia A, el hecho de mezclarla con la
sustancia B.

Prof. Juan F. Castro

BCRP - Curso de Actualizacin para Economistas

Econometra

Cmo hacamos este experimento?

Qu estamos suponiendo para que el experimento nos


permita recobrar el efecto de inters?
Un ejemplo msun experimento natural para medir
los efectos de la proteccin policial
o 18 de Julio de 1994 > ataque terrorista destruye el
principal Centro Judo de la ciudad de Buenos
Aires.
o 25 Julio de 1994 > Proteccin policial las 24 horas
a instituciones Judas y Musulmanas.
o Se cuenta con informacin sobre la locacin exacta
de robos de autos en tres distritos de BBAA antes y
despus del ataque.
La proteccin policial en las instituciones Judas y
Musulmanas es exgena respecto a la distribucin
del crimen

Prof. Juan F. Castro

BCRP - Curso de Actualizacin para Economistas

Econometra

Di Tella, Rafael, and Ernesto Schargrodsky. 2004. "Do


Police Reduce Crime? Estimates Using the Allocation
of Police Forces After a Terrorist Attack." American
Economic Review, 94(1): 115-133.
o Grupo de control: manzanas que se encuentran a
ms de 2 cuadras de distancia de un centro judo o
musulmn.
> Tienen una incidencia de crimen promedio antes
de la intervencin.
o Grupo de estudio (tratamiento): manzanas que se
encuentran a 2 o menos cuadras de distancia de un
centro judo o musulmn.
> Tienen una incidencia de crimen promedio antes
de la intervencin.
> Tienen mayor proteccin policial a raz del
ataque.
o Resultado: grupo de estudio exhibi 75% menos de
incidencia de robos de auto que el grupo de control.

Refinando un poco mejor nuestro objetivo:


> Aislar los efectos de una variable de inters sobre el
fenmeno bajo anlisistratado de aproximarnos, lo
mejor posible, a una situacin de experimento
controlado
En ciencias sociales, tenemos menos control sobre las
cosas que pasan en nuestro laboratorio.

Prof. Juan F. Castro

BCRP - Curso de Actualizacin para Economistas

Econometra

En nuestro laboratorio

Relacin entre el salario


y los aos de estudio

No creo que algo ms


afecte el cambio de
temperatura y, si fuera el
caso, no creo que est
correlacionado con el hecho
de que haga o no la mezcla

No creo que algo ms


afecte el salario de la
persona y, si fuera el caso,
no creo que est
correlacionado con el
nmero de aos de estudio

Vs.

La posibilidad de que determinada tcnica nos permita


recobrar el efecto de inters depende de un conjunto de
supuestos sobre la manera como han sido generados los
datos.
Tcnicas inadecuadas tienen detrs supuestos poco
plausibles.
Hacemos supuestos sobre:
o La forma funcional que relaciona al fenmeno con
sus determinantes.
o La existencia de otros determinantes del fenmeno.
o La relacin entre la variable de inters y aquellos
determinantes que no he podido observar.

Prof. Juan F. Castro

Quiero aislar el
efecto de una
variable sobre
otra
Quiero medir el
impacto de
cambios en una
variable sobre
otra, ceteris
paribus.

Depende el
fenmeno bajo
anlisis de
alguna(s) otra(s)
variable(s) adems
de la(s) de inters?

Puedo
observar
/medir estas
otras
variables?

Diferencia
simple

Regresin
multivariada
por MICO

Correcta especificacin del


modelo
E(/X) = 0
Estimador insesgado

Datos de panel /
DiD

Regresin por VI

Diseo
experimental
(aleatorizacin)

No

No

No

Est(n)
correlacionada(s)
con las variables
que s observo?

Regresin
multivariada
por MICO

Exogeneidad de los regresores


E(txt) = 0
Estimador consistente

1.3. La media condicional y el concepto de regresin


Cmo tornamos operativa la estimacin de la relacin
que existe entre un conjunto de variables de inters?
En general, podemos partir de la existencia de un vector
de resultados ( ) que contiene el valor registrado por
la(s) variable(s) cuyo comportamiento se busca explicar
/ modelar) y un vector de insumos ( ), que contiene el
valor registrado por las variables a partir de las cuales
se busca explicar el comportamiento de ).
La realidad puede ser representada por la funcin de
probabilidad conjunta que gobierna la ocurrencia de las
observaciones contenidas en y (el proceso que
).
genera estos datos): (
Esta funcin de probabilidad conjunta puede expresarse
como el producto de la funcin de probabilidad
condicional y marginal:
(

( | ) ( )

En el trabajo economtrico clsico nuestro inters se


centra en el primer momento de la funcin de
probabilidad condicional. Es decir, la esperanza de
condicionada a los valores (realizaciones) de :
( | ).
Suponemos que los insumos (o variables explicativas)
influyen sobre la esperanza condicional a travs de una
relacin lineal. Esto configura lo que se conoce como el
Modelo Lineal General (MLG).
( | )

BCRP - Curso de Actualizacin para Economistas

Econometra

Nuestro inters se centra en estimar esta esperanza


condicional. Por lo mismo, la pregunta que buscamos
responder es: cul es el valor ms probable para
dados los valores realizados de las ?
Esta esperanza es la que buscamos capture los
principales elementos del fenmeno bajo anlisis. Por
lo mismo, es cierto que nos equivocaremos, pero (y en
la medida en que logremos una adecuada
caracterizacin de esta media condicional) no nos
equivocaremos sistemticamente.
Para motivar lo anterior, partamos de la especificacin
ms sencilla (un modelo univariado) y veamos a qu
nos referimos con el concepto de regresin.

23

-
22
EY_DADO_X
Y_OBS

21

20
4.8

5.0

5.2
X

Prof. Juan F. Castro

5.4

5.6

BCRP - Curso de Actualizacin para Economistas

Econometra

Condicionado al valor de , la esperanza del error es


igual a cero: ( | )
. En promedio, el valor
observado de est encima de la recta de regresin
poblacional ( | ).
Veamos un programita para animar esta discusin.
1.4. Parmetros, estimadores y estimados
Modelo terico vs. modelo emprico.
Propiedades deseables para nuestros estimadores; la
importancia de los supuestos que haremos sobre la
manera como son generados los datos.
Representacin matricial del modelo terico.

Prof. Juan F. Castro

BCRP - Curso de Actualizacin para Economistas

Econometra

10

2. Los supuestos del Modelo Lineal General


Por qu nos interesa hacer supuestos sobre la manera
como han sido generados los datos? Cules son estos
supuestos?
S1. El modelo puede representarse:
( )
S2. Las variables explicativas no estn relacionadas o
son exgenas respecto al error.
{ }
S2F.
estocsticas.

no son

{ }
S2Ei.
estocsticas e independientes de

son
.

{ }
S2Eim.
son
estocsticas y
son independientes en media de
: ( | )
,
por el S1. Este supuesto es
suficiente para garantizar el insesgamiento de
.
{ }
S2Enc.
son
estocsticas y no presentan correlacin con (no
presentan correlacin con el error de la misma
)
(
)
observacin): (
por el S1. Este supuesto es suficiente para garantizar
la consistencia de
.

Prof. Juan F. Castro

BCRP - Curso de Actualizacin para Economistas

Econometra

11

S3. El error presenta una matriz de varianzas-covarianzas


condicional escalar: ( | )
. Este supuesto es
necesario para garantizar que el estimador MICO sea el de
mnima varianza dentro del conjunto de estimadores
insesgados.
S4N. El error se distribuye normal:
S0.

es una matriz (

).

) de rango completo.

dim Col(X) dimensin del espacio conformado por


todas las combinaciones lineales de los vectores en X
(X) dim Col(X)
(X) k

Prof. Juan F. Castro

BCRP - Curso de Actualizacin para Economistas

Econometra

3. El estimador de Mnimos Cuadrados


Ordinarios y sus propiedades
3.1. Cmo computar el estimador MICO?

{(

) (

)}

3.2. Propiedades para muestras pequeas


(i) Insesgamiento
(ii) Varianza mnima

3.3. Propiedades para muestras grandes


(i) Algunos elementos tiles de teora asinttica

Consideremos la secuencia de variables aleatorias YT T 1 .


Tipos de convergencia

Convergencia en ECM

ECM
YT
q si:

lim E YT q , lim Var YT 0

Convergencia en probabilidad

P
YT
q plim YT q si:

lim Pr YT q 0

Prof. Juan F. Castro

12

BCRP - Curso de Actualizacin para Economistas

Econometra

13

Convergencia en distribucin

d
YT
W si:

lim Pr YT x Pr W x x

Leyes de grandes nmeros

YT

1 T
xi
T i 1

ECM
Chebyshev: YT
; E(x) , Var(x) 2x
P
Khinchine: YT
; E(x)

Teorema del Lmite Central


Teorema de Lindeberg-Levy. Para una muestra i.i.d. x1, x 2 ,...x T
con media ( ) y varianza ( 2 ) finitas:

x d
W T

N(0,1)

Lo que implica que:

1 T xi d

N(0,1)

T i 1

Algunos teoremas ms

Teorema de Slutsky

Dados XT, YT: plim g XT ,YT g plimXT ,plimYT

Prof. Juan F. Castro

BCRP - Curso de Actualizacin para Economistas

Econometra

14

plim(X T YT ) plim X T plim YT


plim(X T YT ) plim X T .plim YT
plim(X T / YT ) plim X T / plim YT ; plim YT 0

Teorema de Cramer

d
P
X, YT
q :
Dados XT
d
X T YT
X q
d
X T YT
qX
d
X T / YT
X / q

(ii) Propiedades asintticas de MICO

Dados:
( )
(

]
)

podemos expresar la variable aleatoria de la forma:

)
(

De lo anterior, y en ausencia de correlacin entre el error y


el conjunto de regresores, es posible demostrar que:

Prof. Juan F. Castro

) ) sin importar

BCRP - Curso de Actualizacin para Economistas

Econometra

15

4. La geometra y el lgebra de Mnimos


Cuadrados Ordinarios
4.1. Nuestro setting
En adelante, cada vector representar todas las
observaciones para determinada variable. De modo que los
ejes correspondern a las observaciones en lugar de a las
variables mismas.
Grfico 1: Tres observaciones de la variable dependiente (y)

El siguiente grfico muestra la manera como


representaremos los datos contenidos en y como
vectores. Cada columna de es un vector. En el grfico,
la matriz tiene dos columnas representadas por los
vectores
y .
El plano que contiene todos los vectores en se denota
como
( ). Formalmente:
( ) subespacio

Prof. Juan F. Castro

BCRP - Curso de Actualizacin para Economistas

Econometra

conformado por todas las combinaciones lineales de los


vectores en .
Grfico 2: Representacin vectorial de los datos

4.2. De regreso a Mnimos Cuadrados Ordinarios


Todos sabemos que Mnimos Cuadrados Ordinarios
(MICO) resuelve:

)(

En palabras,
es el valor de que minimiza el
cuadrado de la distancia entre y los posibles .

Prof. Juan F. Castro

16

BCRP - Curso de Actualizacin para Economistas

Econometra

17

Es posible explicar la solucin al problema planteado


como un proceso en dos etapas.
(i)

En la primera etapa se halla el vector en


( )
ms cercano a . Denotamos a este vector como
. Formalmente:

( )

Este vector ( ) viene dado por la proyeccin


ortogonal de sobre
( ).
Grfico 3: Etapa 1. La proyeccin ortogonal

Si es la proyeccin ortogonal de y sobre


Col(X) y es cualquier otro vector en Col(X),
se cumple que ( )'(y ) 0 .

Prof. Juan F. Castro

BCRP - Curso de Actualizacin para Economistas

Econometra

18

Tarea: A partir de la relacin anterior y el


teorema de Pitgoras
es posible
z z z z z z

demostrar que y y . Es decir, que


es, por lo menos, tan cercano a y como
cualquier otro Col(X) .
(ii) En la segunda etapa se descompone como la
suma de los vectores obtenidos de multiplicar las
columnas de X por los coeficientes estimados
( ). Formalmente, encontramos como la
solucin a: X .
Grfico 4: Etapa 2. La descomposicin de

Prof. Juan F. Castro

BCRP - Curso de Actualizacin para Economistas

Econometra

19

Es importante tomar en cuenta que la solucin asociada a


la primera etapa es nica mientras que pueden existir
diversas soluciones para la segunda.
Tarea: Es posible probar la unicidad de a partir de las
relaciones de la primera tarea.
Con estas nociones en mente, es posible resumir la
naturaleza geomtrica de MICO de la siguiente manera:
(i)

El vector de valores predichos es la


proyeccin ortogonal (nica) de y sobre Col(X).

(ii)

El vector de errores (residuos) predichos y


es ortogonal a Col(X).

(iii)

Si dim[Col(X)] = k entonces

)(

tiene una solucin nica dada por:

Podemos partir de la condicin de ortogonalidad dada en


(ii) X'(y ) 0 (primera etapa) y hallar como la
solucin a X (segunda etapa).

Prof. Juan F. Castro

BCRP - Curso de Actualizacin para Economistas

Econometra

20

X '(y ) 0
X '(y X ) 0
X 'X X ' y
El sistema anterior tiene una solucin nica ( X es
una combinacin lineal nica de las columnas de X) si y
slo si los vectores en X son linealmente independientes.
La independencia lineal de los vectores en X implica que
el espacio que stos conforman tiene una dimensin igual
al nmero de vectores: dim[Col(X)] = k. Esto garantiza
que la matriz X'X sea invertible.
Por contradiccin > si X no tiene rango completo,
) tal que:
entonces existe un vector (k x 1) (
(

Un ejemplo:
N = 3, k = 2, X X1

Prof. Juan F. Castro

1 x12
X 2 1 x 22

1 x 32

BCRP - Curso de Actualizacin para Economistas

Econometra

21

Grfico 5: La proyeccin ortogonal en tres dimensiones

Pueden identificar al vector de residuos y ?


Cmo representaran la regresin de y sobre un conjunto
de variables que la contiene? y la regresin de una
identidad?
Ntese que en este caso dim[Col(X)] = k = 2. Qu pasara
si incluimos un tercer vector en X de tal forma que la
dimensin de Col(X) siga siendo igual a 2? Es decir,
dim[Col(X)] = 2 < k = 3.
- Es nica la proyeccin ortogonal?
- Es nica la descomposicin del vector ?

Prof. Juan F. Castro

BCRP - Curso de Actualizacin para Economistas

Econometra

22

Grfico 6: Una variable ms, pero el mismo Col(X)

gorro1

X3

gorro3

4.3. Las protagonistas: el hacedor de estimados y el


hacedor de residuos
Con todas estas nociones en mente, es ahora posible
presentar formalmente a dos matrices muy importantes.
(i)

El proyector ortogonal sobre el espacio de las X (el


hacedor de estimados) > si X tiene rango completo,
la transformacin lineal de y sobre Col(X) que genera
es:
PX X(X 'X) 1 X '
PX y

Prof. Juan F. Castro

BCRP - Curso de Actualizacin para Economistas

Econometra

23

> PX no modifica vectores Col(X) .


Para cada Z Col(X) existe un vector a tal que
Xa Z . Por lo mismo:
PX Z PX Xa X(X'X)1 X'Xa Xa Z
> PX transforma vectores Col(X) al vector nulo.
Para un vector:
Z Col(X) X'Z 0 X Col(X) PX Z 0

(ii)

El proyector ortogonal sobre el espacio de los errores


(el hacedor de residuos):

e y M X y
y X y PX y
(I PX )y
M X I PX
Estas matrices son ortogonales entre s, simtricas e
idempotentes.

Prof. Juan F. Castro

BCRP - Curso de Actualizacin para Economistas

Econometra

Grfico 7: El hacedor de estimados y el


hacedor de residuos

e = MXy

X2

= PX y

X1

Prof. Juan F. Castro

24

BCRP - Curso de Actualizacin para Economistas

Econometra

4.4. Qu nos dice la regresin particionada?


y X
X11 X 22

El sistema de ecuaciones normales:

X1 'X1 X1 'X 2 1 X1 ' y


X 'X X 'X X ' y
2
2
2 1
2 2

Qu nos dice esta expresin para ?

Si reemplazamos y agrupamos trminos, obtenemos:

Qu nos dice esta expresin para 2 ?


Qu ocurre cuando el modelo incluye intercepto?

Prof. Juan F. Castro

25

BCRP - Curso de Actualizacin para Economistas

Econometra

26

Ingreso

Educacin

Edad

MICO utiliza la informacin en el rea azul para


estimar el beta de Edad y la informacin en el rea
verde para estimar el beta de Educacin.
BetaEducacin: rea verde (variacin en Y que responde
nicamente a la variacin en educacin)
Blanco + verde = M Edad Ingreso
Celeste + verde = M Edad Educacin
Qu ocurrira si no controlamos por Edad? Tendramos
una estimacin sesgada del efecto de Educacin. Este
coeficiente recogera tambin el efecto de Edad.

Prof. Juan F. Castro

BCRP - Curso de Actualizacin para Economistas

Econometra

27

4.5. Multicolinelidad
Recordemos el diagrama de Venn > qu ocurre cuando el
rea (variaciones) que comparten Edad y Educacin crece?
Teorema de Gauss-Markov no nos asegura que MICO
tenga una varianza reducida en un sentido absoluto.
Problema que enfrentamos en el trabajo emprico > NO es
el problema de identificacin asociado a la
multicolinealidad exacta. Es la presencia de regresores
altamente (aunque no perfectamente) correlacionados > es
un problema de grado.
(i) Sntomas
- Pequeos cambios en la muestra generan cambios
pronunciados en los estimados (modelo poco
robusto).
- Coeficientes registran desviaciones estndar altas y,
por consiguiente, bajos niveles de significancia a
pesar de ser significativos en conjunto (ts bajos y un
R2 alto)
> no se afecta el ajuste global del modelo pero no es
posible identificar el aporte marginal de cada
regresor.
- Coeficientes pueden registrar signos distintos a los
esperados o magnitudes poco plausibles.
(ii) La varianza del k-simo regresor

Prof. Juan F. Castro

BCRP - Curso de Actualizacin para Economistas

Econometra

28

5. Breve repaso del concepto de inferencia


Se acuerdan de la prueba de diferencia de medias?
Cmo es que evaluamos la hiptesis nula?
Para poblaciones normales, varianzas desconocidas pero
iguales, nuestra estrategia es como sigue:

Ho : 1 2
Ha : 1 2
Dos muestras: n1,n 2 ,x1, x 2 ,S12 ,S22
S12 (n1 1) S22 (n 2 1)
S
n1 n 2 2
2

Recordemos que: x ~ N(,2 /n)


(x x 2 ) (1 2 )
Bajo la Ho: 1
~ t(n1 n 2 2)
S 1/ n1 1/ n 2
Dado lo anterior, necesitamos un criterio de decisin para
determinar cuando el estadstico en cuestin NO se
distribuye como sabemos lo hace bajo la Ho.
Por qu nos interesa buscar evidencia en contra de
que se distribuya como sabemos lo hace bajo la Ho.?
Cul es este criterio de decisin? Cmo se
relaciona con el concepto de significancia o tamao
de una prueba?... veamos un programita para
motivar la discusin!
Y la potencia de la prueba?

Prof. Juan F. Castro

BCRP - Curso de Actualizacin para Economistas

Econometra

Recordemos ahora la prueba ms general en el contexto


del MLG (la prueba F para un conjunto de j restricciones
lineales) partiendo de que MICO ~N , 2 (X'X) 1 y
recordando que

e'e
2
~

(N k) .
2

Qu hemos supuesto para llegar hasta la expresin que


todos conocemos?

Prof. Juan F. Castro

29

Das könnte Ihnen auch gefallen