01 Econometria Primera Sesion AE2015

Banco Central de Reserva del Per
Curso de Actualizacin para Economistas

Econometra
Prof. Juan F. Castro
Primera Sesin: Estimacin e inferencia en el

Modelo Lineal General
1. Introduccin
1.1. Qu es la econometra?
Aplicacin de tcnicas matemticas y estadsticas para
el anlisis (medicin emprica) de las relaciones
postuladas por la teora econmica (modelos).
Modelo: representacin simplificada de un fenmeno
real (un sistema o proceso).
Representamos este fenmeno a travs de un modelo
con el objetivo de: (i) explicarlo (entender qu est
detrs de su ocurrencia); (ii) predecirlo (aproximar
cmo ocurrir bajo determinadas circunstancias); y/o
(iii) controlarlo (saber qu se puede hacer para que
ocurra de manera consistente con algn objetivo de
poltica).
Trabajamos con modelos debido a que los sistemas o
procesos reales son, en general, demasiado complejos
(en especial aquellos asociados a las ciencias sociales).
BCRP - Curso de Actualizacin para Economistas
Econometra
Por lo mismo, buscamos representarlo de manera

realista y, a la vez, manejable.
o Realista: debe incorporar los principales elementos
del fenmeno (o sistema) representado,
especificando (de manera explcita) las relaciones
existentes entre las partes que lo conforman.
o Manejable: debe dejar de lado influencias (o
relaciones) de menor importancia > debemos
introducir supuestos y hacerlos explcitos.
1.2. Para qu la econometra?
Para qu introducimos supuestos y aprendemos
tcnicas de estimacin distintas?... es posible
distinguir algn objetivo primordial?
o Confrontar la teora con los datos.
o Escuchar lo que data nos quiere decir respecto a
las ideas que tenemos sobre la manera como
ocurren las cosas.
o Aislar los efectos de una variable de inters
sobre el fenmeno bajo anlisis.
Recordemos cmo hacamos esto en el colegio >
queremos medir el efecto que tiene sobre la temperatura
de la sustancia A, el hecho de mezclarla con la
sustancia B.
Econometra
Cmo hacamos este experimento?
Qu estamos suponiendo para que el experimento nos

permita recobrar el efecto de inters?
Un ejemplo msun experimento natural para medir
los efectos de la proteccin policial
o 18 de Julio de 1994 > ataque terrorista destruye el
principal Centro Judo de la ciudad de Buenos
Aires.
o 25 Julio de 1994 > Proteccin policial las 24 horas
a instituciones Judas y Musulmanas.
o Se cuenta con informacin sobre la locacin exacta
de robos de autos en tres distritos de BBAA antes y
despus del ataque.
La proteccin policial en las instituciones Judas y
Musulmanas es exgena respecto a la distribucin
del crimen
Econometra
Di Tella, Rafael, and Ernesto Schargrodsky. 2004. "Do

Police Reduce Crime? Estimates Using the Allocation
of Police Forces After a Terrorist Attack." American
Economic Review, 94(1): 115-133.
o Grupo de control: manzanas que se encuentran a
ms de 2 cuadras de distancia de un centro judo o
musulmn.
> Tienen una incidencia de crimen promedio antes
de la intervencin.
o Grupo de estudio (tratamiento): manzanas que se
encuentran a 2 o menos cuadras de distancia de un
centro judo o musulmn.
> Tienen una incidencia de crimen promedio antes
de la intervencin.
> Tienen mayor proteccin policial a raz del
ataque.
o Resultado: grupo de estudio exhibi 75% menos de
incidencia de robos de auto que el grupo de control.
Refinando un poco mejor nuestro objetivo:

> Aislar los efectos de una variable de inters sobre el
fenmeno bajo anlisistratado de aproximarnos, lo
mejor posible, a una situacin de experimento
controlado
En ciencias sociales, tenemos menos control sobre las
cosas que pasan en nuestro laboratorio.
Econometra
En nuestro laboratorio
Relacin entre el salario

y los aos de estudio
No creo que algo ms

afecte el cambio de
temperatura y, si fuera el
caso, no creo que est
correlacionado con el hecho
de que haga o no la mezcla
No creo que algo ms

afecte el salario de la
persona y, si fuera el caso,
no creo que est
correlacionado con el
nmero de aos de estudio
Vs.
La posibilidad de que determinada tcnica nos permita

recobrar el efecto de inters depende de un conjunto de
supuestos sobre la manera como han sido generados los
datos.
Tcnicas inadecuadas tienen detrs supuestos poco
plausibles.
Hacemos supuestos sobre:
o La forma funcional que relaciona al fenmeno con
sus determinantes.
o La existencia de otros determinantes del fenmeno.
o La relacin entre la variable de inters y aquellos
determinantes que no he podido observar.
Quiero aislar el
efecto de una
variable sobre
otra
Quiero medir el
impacto de
cambios en una
variable sobre
otra, ceteris
paribus.
Depende el
fenmeno bajo
anlisis de
alguna(s) otra(s)
variable(s) adems
de la(s) de inters?
Puedo
observar
/medir estas
otras
variables?
Diferencia
simple
Regresin
multivariada
por MICO
Correcta especificacin del

modelo
E(/X) = 0
Estimador insesgado
Datos de panel /
DiD
Regresin por VI
Diseo
experimental
(aleatorizacin)
No
No
No
Est(n)
correlacionada(s)
con las variables
que s observo?
Regresin
multivariada
por MICO
Exogeneidad de los regresores

E(txt) = 0
Estimador consistente
1.3. La media condicional y el concepto de regresin

Cmo tornamos operativa la estimacin de la relacin
que existe entre un conjunto de variables de inters?
En general, podemos partir de la existencia de un vector
de resultados ( ) que contiene el valor registrado por
la(s) variable(s) cuyo comportamiento se busca explicar
/ modelar) y un vector de insumos ( ), que contiene el
valor registrado por las variables a partir de las cuales
se busca explicar el comportamiento de ).
La realidad puede ser representada por la funcin de
probabilidad conjunta que gobierna la ocurrencia de las
observaciones contenidas en y (el proceso que
).
genera estos datos): (
Esta funcin de probabilidad conjunta puede expresarse
como el producto de la funcin de probabilidad
condicional y marginal:
(
( | ) ( )
En el trabajo economtrico clsico nuestro inters se

centra en el primer momento de la funcin de
probabilidad condicional. Es decir, la esperanza de
condicionada a los valores (realizaciones) de :
( | ).
Suponemos que los insumos (o variables explicativas)
influyen sobre la esperanza condicional a travs de una
relacin lineal. Esto configura lo que se conoce como el
Modelo Lineal General (MLG).
( | )
Econometra
Nuestro inters se centra en estimar esta esperanza

condicional. Por lo mismo, la pregunta que buscamos
responder es: cul es el valor ms probable para
dados los valores realizados de las ?
Esta esperanza es la que buscamos capture los
principales elementos del fenmeno bajo anlisis. Por
lo mismo, es cierto que nos equivocaremos, pero (y en
la medida en que logremos una adecuada
caracterizacin de esta media condicional) no nos
equivocaremos sistemticamente.
Para motivar lo anterior, partamos de la especificacin
ms sencilla (un modelo univariado) y veamos a qu
nos referimos con el concepto de regresin.
23
-
22
EY_DADO_X
Y_OBS
21
20
4.8
5.0
5.2
X
5.4
5.6
Econometra
Condicionado al valor de , la esperanza del error es

igual a cero: ( | )
. En promedio, el valor
observado de est encima de la recta de regresin
poblacional ( | ).
Veamos un programita para animar esta discusin.
1.4. Parmetros, estimadores y estimados
Modelo terico vs. modelo emprico.
Propiedades deseables para nuestros estimadores; la
importancia de los supuestos que haremos sobre la
manera como son generados los datos.
Representacin matricial del modelo terico.
Econometra
10
2. Los supuestos del Modelo Lineal General

Por qu nos interesa hacer supuestos sobre la manera
como han sido generados los datos? Cules son estos
supuestos?
S1. El modelo puede representarse:
( )
S2. Las variables explicativas no estn relacionadas o
son exgenas respecto al error.
{ }
S2F.
estocsticas.
no son
{ }
S2Ei.
estocsticas e independientes de
son
.
{ }
S2Eim.
son
estocsticas y
son independientes en media de
: ( | )
,
por el S1. Este supuesto es
suficiente para garantizar el insesgamiento de
.
{ }
S2Enc.
son
estocsticas y no presentan correlacin con (no
presentan correlacin con el error de la misma
)
(
)
observacin): (
por el S1. Este supuesto es suficiente para garantizar
la consistencia de
.
Econometra
11
S3. El error presenta una matriz de varianzas-covarianzas

condicional escalar: ( | )
. Este supuesto es
necesario para garantizar que el estimador MICO sea el de
mnima varianza dentro del conjunto de estimadores
insesgados.
S4N. El error se distribuye normal:
S0.
es una matriz (
).
) de rango completo.
dim Col(X) dimensin del espacio conformado por

todas las combinaciones lineales de los vectores en X
(X) dim Col(X)
(X) k
Econometra
3. El estimador de Mnimos Cuadrados

Ordinarios y sus propiedades
3.1. Cmo computar el estimador MICO?
{(
) (
)}
3.2. Propiedades para muestras pequeas

(i) Insesgamiento
(ii) Varianza mnima
3.3. Propiedades para muestras grandes

(i) Algunos elementos tiles de teora asinttica
Consideremos la secuencia de variables aleatorias YT T 1 .

Tipos de convergencia
Convergencia en ECM
ECM
YT
q si:
lim E YT q , lim Var YT 0
Convergencia en probabilidad
P
YT
q plim YT q si:
lim Pr YT q 0
12
Econometra
13
Convergencia en distribucin
d
YT
W si:
lim Pr YT x Pr W x x
Leyes de grandes nmeros
YT
1 T
xi
T i 1
ECM
Chebyshev: YT
; E(x) , Var(x) 2x
P
Khinchine: YT
; E(x)
Teorema del Lmite Central

Teorema de Lindeberg-Levy. Para una muestra i.i.d. x1, x 2 ,...x T
con media ( ) y varianza ( 2 ) finitas:
x d
W T
N(0,1)
Lo que implica que:
1 T xi d
N(0,1)
T i 1
Algunos teoremas ms
Teorema de Slutsky
Dados XT, YT: plim g XT ,YT g plimXT ,plimYT
Econometra
14
plim(X T YT ) plim X T plim YT

plim(X T YT ) plim X T .plim YT
plim(X T / YT ) plim X T / plim YT ; plim YT 0
Teorema de Cramer
d
P
X, YT
q :
Dados XT
d
X T YT
X q
d
X T YT
qX
d
X T / YT
X / q
(ii) Propiedades asintticas de MICO
Dados:
( )
(
]
)
podemos expresar la variable aleatoria de la forma:
)
(
De lo anterior, y en ausencia de correlacin entre el error y

el conjunto de regresores, es posible demostrar que:
) ) sin importar
Econometra
15
4. La geometra y el lgebra de Mnimos

Cuadrados Ordinarios
4.1. Nuestro setting
En adelante, cada vector representar todas las
observaciones para determinada variable. De modo que los
ejes correspondern a las observaciones en lugar de a las
variables mismas.
Grfico 1: Tres observaciones de la variable dependiente (y)
El siguiente grfico muestra la manera como

representaremos los datos contenidos en y como
vectores. Cada columna de es un vector. En el grfico,
la matriz tiene dos columnas representadas por los
vectores
y .
El plano que contiene todos los vectores en se denota
como
( ). Formalmente:
( ) subespacio
Econometra
conformado por todas las combinaciones lineales de los

vectores en .
Grfico 2: Representacin vectorial de los datos
4.2. De regreso a Mnimos Cuadrados Ordinarios

Todos sabemos que Mnimos Cuadrados Ordinarios
(MICO) resuelve:
)(
En palabras,
es el valor de que minimiza el
cuadrado de la distancia entre y los posibles .
16
Econometra
17
Es posible explicar la solucin al problema planteado

como un proceso en dos etapas.
(i)
En la primera etapa se halla el vector en

( )
ms cercano a . Denotamos a este vector como
. Formalmente:
( )
Este vector ( ) viene dado por la proyeccin

ortogonal de sobre
( ).
Grfico 3: Etapa 1. La proyeccin ortogonal
Si es la proyeccin ortogonal de y sobre

Col(X) y es cualquier otro vector en Col(X),
se cumple que ( )'(y ) 0 .
Econometra
18
Tarea: A partir de la relacin anterior y el

teorema de Pitgoras
es posible
z z z z z z
demostrar que y y . Es decir, que

es, por lo menos, tan cercano a y como
cualquier otro Col(X) .
(ii) En la segunda etapa se descompone como la
suma de los vectores obtenidos de multiplicar las
columnas de X por los coeficientes estimados
( ). Formalmente, encontramos como la
solucin a: X .
Grfico 4: Etapa 2. La descomposicin de
Econometra
19
Es importante tomar en cuenta que la solucin asociada a

la primera etapa es nica mientras que pueden existir
diversas soluciones para la segunda.
Tarea: Es posible probar la unicidad de a partir de las
relaciones de la primera tarea.
Con estas nociones en mente, es posible resumir la
naturaleza geomtrica de MICO de la siguiente manera:
(i)
El vector de valores predichos es la

proyeccin ortogonal (nica) de y sobre Col(X).
(ii)
El vector de errores (residuos) predichos y

es ortogonal a Col(X).
(iii)
Si dim[Col(X)] = k entonces
)(
tiene una solucin nica dada por:
Podemos partir de la condicin de ortogonalidad dada en

(ii) X'(y ) 0 (primera etapa) y hallar como la
solucin a X (segunda etapa).
Econometra
20
X '(y ) 0
X '(y X ) 0
X 'X X ' y
El sistema anterior tiene una solucin nica ( X es
una combinacin lineal nica de las columnas de X) si y
slo si los vectores en X son linealmente independientes.
La independencia lineal de los vectores en X implica que
el espacio que stos conforman tiene una dimensin igual
al nmero de vectores: dim[Col(X)] = k. Esto garantiza
que la matriz X'X sea invertible.
Por contradiccin > si X no tiene rango completo,
) tal que:
entonces existe un vector (k x 1) (
(
Un ejemplo:
N = 3, k = 2, X X1
1 x12
X 2 1 x 22
1 x 32
Econometra
21
Grfico 5: La proyeccin ortogonal en tres dimensiones
Pueden identificar al vector de residuos y ?

Cmo representaran la regresin de y sobre un conjunto
de variables que la contiene? y la regresin de una
identidad?
Ntese que en este caso dim[Col(X)] = k = 2. Qu pasara
si incluimos un tercer vector en X de tal forma que la
dimensin de Col(X) siga siendo igual a 2? Es decir,
dim[Col(X)] = 2 < k = 3.
- Es nica la proyeccin ortogonal?
- Es nica la descomposicin del vector ?
Econometra
22
Grfico 6: Una variable ms, pero el mismo Col(X)
gorro1
X3
gorro3
4.3. Las protagonistas: el hacedor de estimados y el

hacedor de residuos
Con todas estas nociones en mente, es ahora posible
presentar formalmente a dos matrices muy importantes.
(i)
El proyector ortogonal sobre el espacio de las X (el

hacedor de estimados) > si X tiene rango completo,
la transformacin lineal de y sobre Col(X) que genera
es:
PX X(X 'X) 1 X '
PX y
Econometra
23
> PX no modifica vectores Col(X) .

Para cada Z Col(X) existe un vector a tal que
Xa Z . Por lo mismo:
PX Z PX Xa X(X'X)1 X'Xa Xa Z
> PX transforma vectores Col(X) al vector nulo.
Para un vector:
Z Col(X) X'Z 0 X Col(X) PX Z 0
(ii)
El proyector ortogonal sobre el espacio de los errores

(el hacedor de residuos):
e y M X y
y X y PX y
(I PX )y
M X I PX
Estas matrices son ortogonales entre s, simtricas e
idempotentes.
Econometra
Grfico 7: El hacedor de estimados y el

hacedor de residuos
e = MXy
X2
= PX y
X1
24
Econometra
4.4. Qu nos dice la regresin particionada?

y X
X11 X 22
El sistema de ecuaciones normales:
X1 'X1 X1 'X 2 1 X1 ' y

X 'X X 'X X ' y
2
2
2 1
2 2
Qu nos dice esta expresin para ?
Si reemplazamos y agrupamos trminos, obtenemos:
Qu nos dice esta expresin para 2 ?

Qu ocurre cuando el modelo incluye intercepto?
25
Econometra
26
Ingreso
Educacin
Edad
MICO utiliza la informacin en el rea azul para

estimar el beta de Edad y la informacin en el rea
verde para estimar el beta de Educacin.
BetaEducacin: rea verde (variacin en Y que responde
nicamente a la variacin en educacin)
Blanco + verde = M Edad Ingreso
Celeste + verde = M Edad Educacin
Qu ocurrira si no controlamos por Edad? Tendramos
una estimacin sesgada del efecto de Educacin. Este
coeficiente recogera tambin el efecto de Edad.
Econometra
27
4.5. Multicolinelidad
Recordemos el diagrama de Venn > qu ocurre cuando el
rea (variaciones) que comparten Edad y Educacin crece?
Teorema de Gauss-Markov no nos asegura que MICO
tenga una varianza reducida en un sentido absoluto.
Problema que enfrentamos en el trabajo emprico > NO es
el problema de identificacin asociado a la
multicolinealidad exacta. Es la presencia de regresores
altamente (aunque no perfectamente) correlacionados > es
un problema de grado.
(i) Sntomas
- Pequeos cambios en la muestra generan cambios
pronunciados en los estimados (modelo poco
robusto).
- Coeficientes registran desviaciones estndar altas y,
por consiguiente, bajos niveles de significancia a
pesar de ser significativos en conjunto (ts bajos y un
R2 alto)
> no se afecta el ajuste global del modelo pero no es
posible identificar el aporte marginal de cada
regresor.
- Coeficientes pueden registrar signos distintos a los
esperados o magnitudes poco plausibles.
(ii) La varianza del k-simo regresor
Econometra
28
5. Breve repaso del concepto de inferencia

Se acuerdan de la prueba de diferencia de medias?
Cmo es que evaluamos la hiptesis nula?
Para poblaciones normales, varianzas desconocidas pero
iguales, nuestra estrategia es como sigue:
Ho : 1 2
Ha : 1 2
Dos muestras: n1,n 2 ,x1, x 2 ,S12 ,S22
S12 (n1 1) S22 (n 2 1)
S
n1 n 2 2
2
Recordemos que: x ~ N(,2 /n)

(x x 2 ) (1 2 )
Bajo la Ho: 1
~ t(n1 n 2 2)
S 1/ n1 1/ n 2
Dado lo anterior, necesitamos un criterio de decisin para
determinar cuando el estadstico en cuestin NO se
distribuye como sabemos lo hace bajo la Ho.
Por qu nos interesa buscar evidencia en contra de
que se distribuya como sabemos lo hace bajo la Ho.?
Cul es este criterio de decisin? Cmo se
relaciona con el concepto de significancia o tamao
de una prueba?... veamos un programita para
motivar la discusin!
Y la potencia de la prueba?
Econometra
Recordemos ahora la prueba ms general en el contexto

del MLG (la prueba F para un conjunto de j restricciones
lineales) partiendo de que MICO ~N , 2 (X'X) 1 y
recordando que
e'e
2
~
(N k) .
2
Qu hemos supuesto para llegar hasta la expresin que

todos conocemos?
29

01 Econometria Primera Sesion AE2015

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

01 Econometria Primera Sesion AE2015

Hochgeladen von

Copyright:

Verfügbare Formate

Banco Central de Reserva del Per

Curso de Actualizacin para Economistas

Primera Sesin: Estimacin e inferencia en el

BCRP - Curso de Actualizacin para Economistas

Por lo mismo, buscamos representarlo de manera

Prof. Juan F. Castro

BCRP - Curso de Actualizacin para Economistas

Cmo hacamos este experimento?

Qu estamos suponiendo para que el experimento nos

Prof. Juan F. Castro

BCRP - Curso de Actualizacin para Economistas

Di Tella, Rafael, and Ernesto Schargrodsky. 2004. "Do

Refinando un poco mejor nuestro objetivo:

Prof. Juan F. Castro

BCRP - Curso de Actualizacin para Economistas

Relacin entre el salario

No creo que algo ms

No creo que algo ms

La posibilidad de que determinada tcnica nos permita

Prof. Juan F. Castro

Correcta especificacin del

Exogeneidad de los regresores

1.3. La media condicional y el concepto de regresin

En el trabajo economtrico clsico nuestro inters se

BCRP - Curso de Actualizacin para Economistas

Nuestro inters se centra en estimar esta esperanza

Prof. Juan F. Castro

BCRP - Curso de Actualizacin para Economistas

Condicionado al valor de , la esperanza del error es

Prof. Juan F. Castro

BCRP - Curso de Actualizacin para Economistas

2. Los supuestos del Modelo Lineal General

Prof. Juan F. Castro

BCRP - Curso de Actualizacin para Economistas

S3. El error presenta una matriz de varianzas-covarianzas

dim Col(X) dimensin del espacio conformado por

Prof. Juan F. Castro

BCRP - Curso de Actualizacin para Economistas

3. El estimador de Mnimos Cuadrados

3.2. Propiedades para muestras pequeas

3.3. Propiedades para muestras grandes

Consideremos la secuencia de variables aleatorias YT T 1 .

lim E YT q , lim Var YT 0

Prof. Juan F. Castro

BCRP - Curso de Actualizacin para Economistas

Leyes de grandes nmeros

Teorema del Lmite Central

Lo que implica que:

Dados XT, YT: plim g XT ,YT g plimXT ,plimYT

Prof. Juan F. Castro

BCRP - Curso de Actualizacin para Economistas

plim(X T YT ) plim X T plim YT

(ii) Propiedades asintticas de MICO

podemos expresar la variable aleatoria de la forma:

De lo anterior, y en ausencia de correlacin entre el error y

Prof. Juan F. Castro

BCRP - Curso de Actualizacin para Economistas

4. La geometra y el lgebra de Mnimos

El siguiente grfico muestra la manera como

Prof. Juan F. Castro

BCRP - Curso de Actualizacin para Economistas

conformado por todas las combinaciones lineales de los

4.2. De regreso a Mnimos Cuadrados Ordinarios

Prof. Juan F. Castro