Sie sind auf Seite 1von 35

Econometra bsica

Lineal de dos variables

Modelo

CAPITULO 2
MODELO DE REGRESION DE DOS VARIABLES
1.1 Estimacin Puntual
1.1.1 Especificacin del modelo lineal
Supongamos que la teora econmica sostiene que:
Y f (X )

[2.1]

Donde:

Y
X

Es la variable dependiente (endgena)


Es la variable independiente (exgena)

Adems, si suponemos por simplicidad que ambas variables se


relacionan linealmente, se tiene la siguiente especificacin
matemtica
Y X

[2.2]

Consideremos que se dispone de n pares de observaciones para las


variables representados por
Yi , X i

i 1,2,3,..., n

Uno de los objetivos iniciales del anlisis economtrico es obtener


estimaciones de los parmetros desconocidos y con base a la
informacin disponible Yi , X i . Si la relacin postulada fuera cierto
slo se necesitara de dos pares de observaciones muestrales y con
ella determinar la ecuacin de la recta definida por [2.2]. Cualquier
otro punto muestral se encontrara en la misma lnea y no supondra
ninguna informacin adicional. Sin embargo, una relacional funcional
tal como la proporcionada por [2.2] es una descripcin inadecuada del
comportamiento econmico dado que no todos los puntos muestrales
estn sobre una misma lnea recta. De modo que, la especificacin de

Econometra bsica
Lineal de dos variables
la relacin lineal exacta
especificacin alternativa:

Modelo

se

debe

reemplazar

Yi X i i

por

esta

otra

[2.3]

Donde:
i

Representa a una variable aleatoria con una determinada


distribucin de probabilidad. El papel del trmino i es el de recoger
las discrepancias que surgen entre los valores observados de Yi y los
valores que dara una relacin funcional exacta. Cules son las
razones de esta discrepancia aludida? En realidad son varias, la
principal es que la variable endgena no solo depende de la variable
exgena, X i , explcitamente considerada en el modelo [2.3]. Es decir,
i , es un sustituto de todas aquellas variables que son omitidas del
modelo pero que, conjuntamente, afectan a la variable endgena.
En general, no podemos predecir el valor especfico de i que surge
para una observacin individual, pero si podemos hacer suposiciones
en torno a las caractersticas principales de su distribucin de
probabilidad. Estas caractersticas son las siguientes:
E ( i / X i ) 0
E(i j / X i , X j ) 0
E( / X i )
2
i

[2.4]
[2.5]
[2.6]

O en forma compacta
i ~ NID (0, 2 )

Donde, el smbolo ~ significa se distribuye y


distribuido normal e independiente.

NID

significa

Obsrvese que de [2.3], aplicando el operador de esperanza


matemtica, se tiene
E (Yi / X i ) X i E ( i / X i )

Considerando [2.4] resulta ser que


E (Yi / X i ) X i

[2.7]

A esta ltima relacin lineal obtenida se le denomina la funcin de


regresin poblacional (FRP). Estrictamente, el propsito del anlisis
economtrico es determinar, utilizando algn mtodo apropiado, esta
funcin de regresin poblacional. Es decir, estimar el valor promedio

Econometra bsica
Lineal de dos variables

Modelo

de la variable endgena, el cual queda determinado si se logra


estimar los parmetros y .
1.1.2 Mtodo de mnimos cuadrados ordinarios
Dado un conjunto de n pares de observaciones muestrales asociadas
a nuestras variables (endgena y exgena), se puede considerar
como una estimacin de la funcin de regresin poblacional, la
siguiente lnea recta
Yi X i

[2.8]

Donde:
Yi

Es la variable endgena estimada para un valor determinado de

Xi

Es el intercepto estimado
Es la pendiente estimada

Una vez determinado la variable endgena estimada, Yi , es evidente


que no todas sern iguales a la variable endgena observada, Yi , de
modo que por definicin se tiene por diferencia los denominados
errores muestrales siguientes
ei Yi Yi

El cual, reemplazando
alternativamente como

[2.9]
[2.8]

en

[2.9],

se

puede

escribir

ei Yi X i

[2.10]
Elevando al cuadrado cada error muestral y aplicando sumatorias se
tiene
n

e
i 1

2
i

(Yi X i ) 2
i 1

[2.11]
El criterio del mtodo de mnimos cuadrados ordinarios es seleccionar
y tal que se minimicen los errores muestrales al cuadrado.
Siguiendo este criterio, por la condicin de primer orden de
optimizacin, se tiene:

Econometra bsica
Lineal de dos variables

Modelo

[ ei2 ]

2 (Yi X i ) 0

i 1

i 1

[2.12]
n

[ ei2 ]

2 (Yi X i ) X i 0

i 1

i 1

[2.13]
De donde se obtiene las siguientes ecuaciones normales
n

i 1

i 1

Yi n X i
[2.14]
n

Y X
i 1

i 1

i 1

X i X i2

[2.15]
[2.14] y [2.15] definen dos ecuaciones simultneas, las cuales nos
permiten obtener las estimaciones de y , dado que el nmero de
observaciones muestrales y las respectivas sumatorias de las
variables correspondientes son conocidas.
1.1.3 Propiedades
ordinarios

del

mtodo

de

mnimos

cuadrados

La lnea de regresin muestral obtenida mediante el mtodo de


mnimos cuadrados ordinarios presenta las siguientes propiedades
importantes:
a) La sumatoria de los errores muestrales es igual a cero
Considerando [2.10] y reemplazando en [2.12] se obtiene
n

(Y X
i 1

) ei 0
i 1

[2.15]
La cual al dividirla por el nmero de observaciones es igual a
e 0

[2.16]
b) La covarianza entre los errores muestrales y la variable exgena es
igual a cero.

Econometra bsica
Lineal de dos variables

Modelo

Considerando [2.10] y reemplazando en [2.13] se obtiene


n

(Yi X i ) X i ei X i 0
i 1

i 1

[2.17]
Como por definicin
COV ( X i , ei )

1
( X i X )(ei e )
n

COV ( X i , ei )

1
( X i X )ei
n

1 n
1 n
X i e i X ei

n i 1
n i 1
n
1
COV ( X i , ei ) X i ei
n i 1

Dado que e 0

COV ( X i , ei )

Dado que

e
i 1

Entonces cualquiera sea el nmero de observaciones se obtiene


que
n

e X
i 1

c) La lnea de regresin pasa el punto definido por las medias


muestrales X y Y .
De la primera ecuacin normal, dividindola por el nmero de
observaciones, se obtiene
Y X

[2.18]
d) La media de la variable endgena estimada es igual a la media de
la variable endgena estimada
De la funcin de regresin muestral, definida por [2.8], aplicando
sumatorias y dividindola por el nmero de observaciones se tiene
Y X

[2.19]
Como los segundos miembros de las ecuaciones [2.18] y [2.19]
son iguales se deduce que

Econometra bsica
Lineal de dos variables

Modelo

Y Y

[2.20]

e) Nos permite obtener un estimador mnimo cuadrtico alternativo


Restando miembro a miembro [2.8] y [2.18],
Yi Y ( X i X )

Por [2.20] se puede escribir alternativamente, la funcin de regresin


muestral, en trminos de desviaciones de sus variables respecto de
su media
y i xi

[2.21]
Donde:
y i Yi Y Yi Y
xi X i X

Si ahora sumamos y restamos por Y el segundo miembro de la


relacin [2.9] se tiene, los errores muestrales pueden estar definidos
tambin por
ei Yi Y Yi Y
ei y i y i

De modo que
n

e
i 1

2
i

( y i y i ) 2 ( y i x i ) 2
i 1

Siguiendo el criterio del mtodo de mnimos cuadrados ordinarios se


tiene
n

ei2
i 1

2 ( y i xi ) xi 0

De donde finalmente se obtiene

Econometra bsica
Lineal de dos variables

Modelo

x y
i

i 1
n

x
i 1

2
i

[2.22]
El otro parmetro de la lnea de regresin muestral se puede calcular
a partir de [2.18]
Y X

[2.23]
1.1.4 Propiedades de los estimadores mnimo cuadrticos
Los estimadores mnimo cuadrticos tienen tres propiedades: Son
funciones lineales de las observaciones reales de la variable
endgena, son insesgados y tienen varianza mnima. Estas
propiedades a continuacin los mostraremos sucesivamente.
Reemplazando (2.22) en (2.23) se obtiene

xi y i

x (Y Y )
n
x
Y X x Y

n
x

2
i

2
i

2
i

1
X
n

c Y
i

xi
)Yi
xi2

[2.24]

Donde:
ci

1
X
n

xi
xi2

[2.25]
Siendo

c1Y1 c 2Y2 c3Y3 ... c n Yn

[2.26]
Se concluye que el estimador mnimo cuadrtico es una funcin
lineal de las observaciones reales de la variable endgena.

Econometra bsica
Lineal de dos variables

Modelo

Reemplazando (2.3) en (2.24) se tiene


ci ( X i i )

ci ci X i ci i

Como
1

c (n X
i

xi
)
xi2

Y adems

c X
i

c X
i

c X
i

1
( X
n
(

Xi
xX
X i i2 )
n
xi

X X

ci X i X X
c X
i

xi
)Xi
xi2

xi X i
xi2

x
x

2
i
2
i

Entonces
ci i

[2.27]

E ( ) E ( ) E ( ci i )
E ( ) ci E ( i )

Siendo
E ( i ) 0

Se deduce que
E ( )

[2.28]
Es decir, el estimador mnimo cuadrtico, , es insesgado

Econometra bsica
Lineal de dos variables

Modelo

Considerando la expresin [2.27} se obtiene


ci i
E ( ) 2 E ( ci i ) 2

Var ( ) E ( ci i ) 2

Var ( ) E (c1 1 c 2 2 c3 3 ... c n n ) 2


Var ( ) E (c12 12 c 22 22 c32 32 ... c n2 n2 2c1c 2 1 2 2c1c3 1 3 ... c n 1c n 1 n n )
Var ( ) c12 E ( 12 ) c22 E ( 22 ) c32 E ( 32 ) ... cn2 E ( n2 ) 2c1c2 E ( 1 2 ) ... cn 1cn 1E ( n n )

Siendo
E( i j ) 0

E ( i2 ) 0

Entonces
Var ( ) c12 2 c 22 2 c 32 2 ... c n2 2

Var ( )

2
i

[2.29]
El cual considerando [2.25] es
Xxi 2 2
1
Var ( ) (
)
n xi2

x nXx
Var ( ) (
n x
2
i

2
i

) 2 2

( xi2 ) 2 2n xi2 Xxi n 2 X 2 xi2

Var ( )

n ( x )
2

2 2
i

n( x ) 2n x X x i n X
2 2
i

Var ( )

2
i

n ( x )
2

x nX
n x

( X X ) nX
Var ( )
n x

Var ( )

2
i

2 2
i

2
i

Var ( )

Var ( )

2nX 2 nX 2 nX 2

2
i

X
n x

n xi2

2
i

2
i

2
i

2
i

Econometra bsica
Lineal de dos variables

Modelo

Cmo mostrar que esta varianza es mnima? Es decir, que esta


varianza es la ms pequea en consideracin a otros estimadores
lineales e insesgados. Al respecto supongamos que mediante un
mtodo alternativo se obtiene el siguiente estimador:

aY
i

[2.30]

Obsrvese que este estimador alternativo es lineal. Reemplazando


[2.3] en [2.30] se tiene
a i ( X i i )
a i ai X i ai i
E ( )

Es decir, es un estimador insesgado siempre y cuando se cumpla que

a 1
a X 0
i

Dado las restricciones impuestas


ai i

a i i
E ( ) 2 E (

a
i

2
Var ( ) E ( ai i )

Var ( ) E (a1 1 a 2 2 a 2 3 ... a n n ) 2


Var ( ) E (a12 12 a 22 22 a 32 32 ... a n2 n2 2a1a 2 1 2 2a1 a 3 1 3 ... a n 1 a n 1 n n )
Var ( ) a12 E ( 12 ) a 22 E ( 22 ) a 32 E ( 32 ) ... a n2 E ( n2 ) 2a1 a 2 E ( 1 2 ) ... a n 1 a n 1 E ( n n )

Siendo
E( i j ) 0

E ( i2 ) 0

Entonces
Var ( ) a12 2 a 22 2 a 32 2 ... a n2 2
Var ( )
a 2 2

[2.31]
Si este estimador tiene varianza mnima, dentro de todos los posibles
estimadores lineales e insesgados Cul es la expresin
correspondiente a las ponderaciones a i ? Para tal fin, utilizando los
multiplicadores de Lagrange, es posible plantear la siguiente funcin
de optimizacin:

Econometra bsica
Lineal de dos variables

Modelo

Z a i2 2 1 ( a i 1) 2 a i X i

[2.32]

Por la condicin de primer orden de optimizacin, se tiene


Z
2ai 2 1 2 X i 0
ai

[2.33]

Z
ai 1 0
1

[2.34]

Z
ai X i 0
2

[2.35]
De [2.33] despejando ai se obtiene
1
1 2 X i
2 2

ai

[2.36]
Aplicando el operador de sumatorias a [2.36] y tomando en
consideracin la expresin [2.34] se tiene

1
n1 2 X i 1
2 2

[2.37]
Multiplicando [2.36] por X i , aplicando el operador de sumatorias y
tomando en consideracin la expresin [2.35] se tiene

a X
i

1
1 X i 2 X i2 0
2
2

[2.38]
Despejando 1 en [2.37] y [2.38] e igualando ambas expresiones se
tiene
2 X i
1
2 2 2 X i
n
Xi

Despejando 2

Econometra bsica
Lineal de dos variables

2 X 2 2

2
i

X Xi

Modelo

2 X 2

2
i

( X i ) 2
n

2 X 2

2
i

[2.39]
Reemplazando [2.39] en [2.37] se tiene
1
2 2

n1

2 X 2

2
i

1
X2

2
n xi

1 2 2

[2.40]

Reemplazando [2.39] y [2.40] en [2.36] se tiene

2
1
X 2 2 X

Xi
2
2

n xi xi
[2.41]
XX i
1
X2
ai

2
n xi xi2

ai

1
2 2

ai

X X
1
X i 2
n
xi

ai

1
X
n

2
2

xi

xi2

[2.42]
Finalmente, como ci ai debido a [2.25] y [2.42], entonces el
estimador lineal, insesgado y de varianza mnima, solo puede ser el
estimador mnimo cuadrtico .
Mediante un procedimiento similar, a partir de [2.22] se puede
obtener que

Econometra bsica
Lineal de dos variables

Modelo

k i Yi

[2.43]

Donde:
ki

xi
xi2

[2.44]
Por lo cual
k1Y1 k 2Y2 k 3Y3 ... k nYn

[2.45]
Es tambin funcin lineal de las observaciones reales de la variable
endgena
Si reemplazamos [2.3] en [2.43] se obtiene
k i ( X i i )
k i k i X i k i i

[2.46]

Aplicando el operador de esperanza matemtica


E ( ) k i k i X i k i E ( i )

Dado que

k
k

[2.47]
i

Xi 1

[2.48]
Entonces
E ( )

[2.49]
Es decir, tambin resulta ser un estimador insesgado
Reemplazando [2.47] y [2.48] en [2.46] se tiene
k i i
k i i

[2.50]

E ( ) 2 E ( k i i ) 2

Econometra bsica
Lineal de dos variables

Modelo

VAR ( ) E ( k i i ) 2
Var ( ) E ( k1 1 k 2 2 k 3 3 ... k n n ) 2
Var ( ) E ( k12 12 k 22 22 k 32 32 ... k n2 n2 2k1 k 2 1 2 2k1 k 3 1 3 ... k n 1 k n 1 n n )
Var ( ) k12 E ( 12 ) k 22 E ( 22 ) k 32 E ( 32 ) ... k n2 E ( n2 ) 2k1 k 2 E ( 1 2 ) ... k n 1 k n 1 E ( n n )

Siendo
E( i j ) 0

E ( i2 ) 0

Entonces
Var ( ) k12 2 k 22 2 k 32 2 ... k n2 2
Var ( )
k 2 2

[2.51]
El cual considerando [2.44] es
2
Var ( )
xi2

[2.52]
Nuevamente, siguiendo un procedimiento similar, al adoptado para el
caso del estimador , se puede mostrar que posee una varianza
mnima. Es decir, el estimador , es lineal, insesgado y tiene una
varianza mnima.
1.1.5 Varianza de la regresin
Nuevamente considerando el modelo de regresin de dos variables
Yi X i i

Se supone que
E ( i ) 0
E( i j ) 0
E ( i2 ) 2

Aqu el propsito en general es determinar la funcin de regresin


poblacional
E (Yi ) X i

Es decir, estimar el valor promedio de la variable endgena, el cual


queda determinado si se logra estimar los parmetros y . Pero
adems, obsrvese que en el modelo de regresin planteado existe
2
otro parmetro adicional: . Esta es la varianza de las

Econometra bsica
Lineal de dos variables

Modelo

perturbaciones o la varianza de la regresin Cmo estimarlo? Al


respecto, comprese el modelo de regresin con su contraparte
muestral deducida de [2.8] y [2.9]l
Yi X i ei

Ntese que el estimador de la varianza de i debe ser


2
necesariamente E ( (ei e ) . Es decir, a travs de la varianza de los
errores muestrales se puede estimar la varianza de la regresin. Sin
2
embargo, como e 0 entonces concretamente E ( ei ) debe ser el
estimador de la varianza de la regresin.
Por definicin se ha establecido que
ei Yi Yi

Adems se ha mostrado que


ei y i y i

[2.53]
Ahora, aplicando sumatoria y
observaciones a [2.3] se obtiene

dividiendo

por

el

nmero

de

Y X

[2.54]
Restando [2.3] y [2.54] miembro a miembro el modelo de regresin
de dos variables queda planteado como
y i xi i

[2.55]
Dado [2.21] y [2.55], los errores muestrales definido en [2.53]
alternativamente corresponde a
ei x i i xi

Ordenando, elevando al cuadrado cada observacin muestral y


aplicando el operador de suma se tiene
ei i ( ) xi
ei2 ( i )) 2 ( ) 2 xi2 2( i )( ) xi
e 2 2 2 2 ( ) 2 x 2 2( ) x 2 ( ) x
i

ei2

i2 n 2 2 i ( ) 2 xi2 2( ) i xi 2 ( ) xi
ei2 i2 n 2 2 i ( ) 2 xi2 2( ) i xi

Econometra bsica
Lineal de dos variables

Modelo

En consideracin a lo anotado anteriormente, aplicando el operador


de la esperanza matemtica, se tiene
E[ ei2 ] E[ i2 ] nE ( 2 ) 2 E[ i ] xi2 E ( ) 2 2 E[( ) i xi ]

Como
2
2
2
2
2
a) E[ i ] E[ 1 2 3 ... n ]

E[ i2 ] E ( 12 ) E ( 22 ) E ( 32 ) ... E ( n2 )

E[ i2 ] 2 2 2 ... 2

E[ i2 ] n 2

2
2
Dado que E ( i )

[2.56]

b) nE ( 2 ) nE[ i ] 2
n
n
nE ( 2 ) 2 E[ i ] 2
n
1
E[ 1 2 3 ... n ] 2
n
1
nE ( 2 ) E[ 12 22 32 ... n2 2 1 2 2 1 2 ... 2 n 1 n ]
n
1
nE ( 2 ) [ E ( 12 ) E ( 22 ) E ( 32 ) ... E ( n2 ) 2 E ( 1 2 ) 2 E ( 1 2 ) ... 2 E ( n 1 n )]
n
1 2
2
2
2
nE ( ) [ 2 2 ... 2 ]
Dado que E ( i )
n
nE ( 2 ) 2
nE ( 2 )

[2.57]

c) 2 E[ i ] 2 E[ i
n

2
E[ i ] 2
n
2
2 E[ i ] [n 2 ]
n
2 E[ i ] 2 2

2 E[ i ]

Por [2.56]

[2.58]

d)

2
i

E ( ) 2

x Var ( )
2
i

2
2
2
)2
x
E
(

x
i
i x2
i

2
i

E ( ) 2 2

Por [2.52]

e) 2 E[( ) i xi 2 E[( )(( ) xi2 ] Por [2.50]

Econometra bsica
Lineal de dos variables

Modelo

2 E[( ) i xi 2 xi2 E ( ) 2
2 E[( ) i xi 2 xi2Var ( )

2 E[( ) i xi 2 xi2
2 E[( ) i xi 2 2

2
i

Reemplazando se tiene
E[ ei2 ] n 2 2 2 2 2 2 2
E[ ei2 ] ( n 2) 2

Despejando
2

E[ ei2 ]
n2

[2.59]
El cual para una muestra particular ser

2
i

n2

1.1.6 Coeficiente de determinacin


En todo anlisis de dependencia nos interesara conocer cual es la
variacin de la variable endgena debido a una variacin de la
variable exgena. Precisamente, sobre el particular existe un
estadstico denominado coeficiente de determinacin. Para obtener
este estadstico partimos de la nocin de la descomposicin de la
varianza de la variable endgena. Por definicin establecimos que
ei Yi Yi y i y i

De donde ordenando trminos tenemos


y i y i ei

Elevando al cuadrado y aplicando sumatorias obtenemos


y i y i ei

( y

2
i

ei ) 2
ei2 2 y i e

Econometra bsica
Lineal de dos variables

Modelo

Puesto que

y e x e
i

y e x e
i

y e 0

Dado que

x e
i

Entonces

2
i

2
i

ei2

[2.60]

Es decir, si dividimos por el nmero de observaciones en ambos


miembros, encontramos que la varianza muestral de la variable
endgena se puede descomponer en dos: la varianza debido a la
regresin y la varianza debido a los errores.
Estrictamente en [2.60], el trmino del primer miembro corresponde a
la suma total de cuadrado de la variable endgena, en desviaciones
con respecto a su media (STC); y los trminos del segundo miembro,
corresponden a la suma de cuadrados explicada por la variable
exgena (SCE) y la suma de cuadrados de los residuos (SCR).
Dividiendo [2.60] por la (STC) en ambos miembros se tiene

y
y

2
i
2
i

y
y

1 r2

e
y

2
i
2
i

e
y

2
i
2
i

2
i
2
i

Donde:
r

2
i
2
i

[2.61]

Es el denominado coeficiente de determinacin el cual


r2
corresponde a una proporcin de la suma de cuadrados explicada por
la variable exgena respecto de la suma total de cuadrados. de
cuadrados
Este coeficiente de determinacin puede expresar de formas distintas
y alternativas.

Econometra bsica
Lineal de dos variables

r 2 2

x
y

Modelo

2
i
2
i

[2.62]
Puesto que
y i xi

2
2 SX

r 2
SY
[2.63]
2

Donde:

SX

2
i

SY

2
i

xi y i
r 2
yi2
[2.64]

Puesto que

x y
x

r
2

2
i

x y
i

x y
x y

r
2
i

2
i

nS X S Y

Donde:
r

x y
i

nS X S Y

[2.65]

Es el coeficiente de correlacin. Este coeficiente nos mide el


grado de asociacin entre la variable endogena y la variable exgena.
1.2

Inferencia Estadstica

Econometra bsica
Lineal de dos variables

Modelo

La estadstica consta de dos partes: la estadstica descriptiva y la


inferencia estadstica. La estadstica descriptiva se ocupa de la
recoleccin, organizacin y presentacin de los datos, mientras que la
inferencia estadstica realiza generalizaciones, de una parte (muestra)
a un todo (poblacin).
En la econometra, bsicamente nos interesa la inferencia estadstica,
por cuanto constituye un instrumento bsico en el proceso de
investigacin cientfica. Lo que convierte la aplicacin de la inferencia
estadstica en un proceso cientfico es el hecho de que tomamos en
consideracin la forma de seleccionar la muestra, y de que
expresamos las generalizaciones en trminos de probabilidades.
En general, dada cierta poblacin, esta no podr observarse nunca
por completo, y por tanto, los juicios respecto a ella slo pueden
proceder de una muestra. Afortunadamente, no nos interesa conocer
todo respecto de una poblacin, sino que casi siempre estamos
interesados solamente en algunas de sus caractersticas que los
denominamos parmetros. El objetivo del muestreo, y de todo lo
relacionado con la inferencia estadstica, es efectuar juicios acerca de
los parmetros de la poblacin, basados en los estadsticos de la
muestra. En realidad, estos juicios son pronsticos dotados de un
cierto grado de confianza, y pueden ser de dos tipos segn se haga
referencia a la estimacin de un parmetro, o a la contrastacin de
alguna hiptesis respecto a un parmetro. La estimacin se realiza
mediante los estimadores que son frmulas que describen un
procedimiento para efectuar conjeturas acerca del valor de un
parmetro determinado de la poblacin; el valor especfico de un
estimador recibe el nombre de estimacin. Los juicios que toman la
forma de contrastacin de hiptesis implican un supuesto previo
respecto al valor de un parmetro. Si la informacin procedente de la
muestra proporciona evidencia contraria a la hiptesis, rechazamos
esta ltima; en caso contrario, la seguimos manteniendo. Para la
contrastacin de hiptesis, la evidencia proporcionada por las
observaciones que constituyen la muestra se resume en un
estadstico de prueba; a travs de este ltimo se llega a una decisin
relativa a la hiptesis.
Las muestras proporcionan informacin acerca de las poblaciones de
las que proceden. Cuando se trata de una estimacin, esta
informacin se resume en forma de un estimador, y si se trata de la
contrastacin de una hiptesis, la informacin se resume en un
estadstico de prueba. Si en estas frmulas utilizamos los valores
observados, el valor de un estimador o de un estadstico de prueba
representa un pronstico acerca del valor del correspondiente
parmetro de la poblacin. Ahora bien, es evidente que diferentes
muestras darn como resultado pronsticos diferentes, algunos de
ellos ms prximos a la verdad (al valor real del parmetro) que los

Econometra bsica
Lineal de dos variables

Modelo

otros. Naturalmente, en la prctica slo disponemos en general de


una muestra y, por tanto, de un solo pronstico, pero resulta muy
importante saber que otros pronsticos podramos haber obtenido si
hubisemos dispuesto de distintas muestras. Si todas las muestras
posibles conducen a pronsticos que en todo caso estn prximos a la
verdad, cualquiera de ellos resultar de fiar. Por otra parte, si todas
las
muestras
posibles
producen
pronsticos
que
difieren
ampliamente, slo alguno de ellos estar cerca de la verdad y no
podemos confiar mucho en ninguno por separado.
En que medida se puede confiar en un buen pronstico? Para confiar
en un pronstico lo primero que se debe conocer es la conducta de
todos los pronsticos que se pueden obtener a partir de todas las
muestras posibles ordenndolas en forma de una distribucin: La
distribucin muestral. Una distribucin muestral es una distribucin
de probabilidad de un estimador o de un estadstico de prueba.
Un procedimiento razonable, y generalmente til, para juzgar la
calidad de un pronstico consiste en valorar la calidad del
procedimiento empleado para obtenerlo. Lo que realmente es
importante es con que frecuencia un procedimiento determinado
produce malos resultados y con que frecuencia los produce buenos.
Es decir, debemos conocer los resultados de una gran cantidad de
pronsticos, todos ellos basados en el mismo procedimiento. Esta es
precisamente la informacin que proporciona las distribuciones
muestrales. Para comparar la calidad de los pronsticos, se comparan
los resultados de los procedimientos por medio de los cuales se
obtuvieron aquellos, lo cual quiere decir que se comparan sus
distribuciones muestrales.
Qu es un buen procedimiento para efectuar pronsticos? Cules
son los rasgos especficos de una distribucin muestral que nos
permite juzgar un determinado estimador? A decir en otros trminos
Qu es un buen estimador?
Un buen estimador es aquel que posee algunas propiedades que se
consideran deseables: Linealidad, insesgo y eficiencia (varianza
mnima).
Otra propiedad deseable es la consistencia. Esta propiedad hace
referencia a los cambios en la distribucin muestral a medida que
aumenta el tamao de muestra. Se dice que un estimador es
consistente si su distribucin muestral tiende a concentrarse
alrededor de su verdadero valor del parmetro cuando el tamao de
la muestra tiene a infinito
1.2.1

Estimacin por intervalos

Para repetir consideremos el siguiente modelo:

Econometra bsica
Lineal de dos variables

Modelo

Yi X i i

En general, nuestro propsito es estimar o predecir la funcin de


regresin poblacional,
E (Yi ) X i

Considerando, n pares de observaciones, P( X i , Yi ) , y adems,


aplicando el mtodo de mnimos cuadrados ordinarios es posible
obtener la funcin de regresin muestral siguiente,
Yi X i

Donde, y , constituyen la nica estimacin (puntual) de los


parmetros desconocidos y Qu tan confiable es esta
estimacin?. Es evidente que debido a las fluctuaciones muestrales,
lo ms probable es que una sola estimacin difiera del verdadero
valor del parmetro poblacional, aun cuando como lo hemos
demostrado, en muestreo repetido se espera que el valor de su media
sea igual al verdadero valor del parmetro poblacional.
En estadstica, la confiabilidad de un estimador puntual se mide por
su error estndar. Por tanto, en lugar de tener solo un estimador
puntual, se puede construir un intervalo alrededor del estimador
puntual, tal que el intervalo tenga una determinada probabilidad de
incluir el verdadero valor del parmetro.
Formalmente, el objetivo es construir un intervalo de confianza para
por lo cual definimos el intervalo aleatorio ( , ) cuya
probabilidad de contener es 1 . Es decir,
Pr( ) 1

[2.66]

Tomando en cuenta que, solo se pueden construir intervalos de


confianza si se conocen las distribuciones de probabilidad de los
estimadores, es conveniente precisarlas. Por ello, si considerando
que,
i ~ N (0, u2 )

Entonces por ser Yi una funcin lineal de i se tiene que


Yi ~ N ( X i , 2 )

[2.68]

[2.67]

Econometra bsica
Lineal de dos variables

Modelo

De modo similar, dado que los estimadores mnimo cuadrticos son


funciones lineales de las observaciones reales de la variable
endgena, Yi , entonces,

~ N ( ,

X i2 u2

2
i

[2.69]

u2

~ N ( ,
)
xi2
[2.70]

Y sus correspondientes variables estandarizadas,


X i2 u2
x

~ N (0,1)

2
i

[2.71]

u2
xi2

~ N (0,1)

[2.72]
Adicionalmente, es posible mostrar que

e
u2

u2
(n 2) 2 ~ n2 2
u
[2.73]

Ntese que en [2.71], [2.72] y [2.73] u2 es un parmetro


desconocido y por tanto no es posible construir intervalos de
confianza utilizando dichas distribuciones planeadas.
De otro lado, dado el siguiente teorema: S Z 1 es una variable
normal estndar Z ~ N (0,1) y otra variable Z 2 sigue una distribucin
ji-cuadrado con k grados de libertad y es independiente de Z 1 ,
entonces la variable definida como:
t

Z1
Z2

~ tk

[2.74]

Econometra bsica
Lineal de dos variables

Modelo

Considerando [2.71], [2.73] y reemplazando en [2.74] se obtiene

X
x
2
i


2
u

2
i

(n 2) 2

X
x
2
i

2
n2

2
u

2
i

2
2


2
2

X i2 u2

2
i

X i2 2


~ tn 2
S ( )

[275]

2
i

Considerando [2.72], [2.73] y reemplazando en [2.74] se obtiene

u2
xi2

u2
xi2

(n 2) 2

2
2

n2


2 u2
2 xi2


u2
xi2


~ tn 2
S ( )

[2.76]

Por consiguiente,
frente a la imposibilidad inicial de utilizar la
distribucin normal, podemos ahora utilizar la distribucin t de
student, para construir intervalos de confianza, de la forma,
Pr( t / 2


t / 2 ) 1
S ( )

[2.77]
Pr(t / 2


t / 2 ) 1
S ( )

[2.78]
El cual tambin se puede escribir como,
t / 2 S ( )

[2.79]
t / 2 S ( )

[2.80]
1.2.2 Prueba de Hiptesis
Para contrastar la hiptesis la hiptesis nula de que es igual a un
valor dado 0 . Es decir

Econometra bsica
Lineal de dos variables

Modelo

0
Contra la hiptesis alternativa de que es igual a un valor
cualquiera distinto de 0 . Es decir
Ha : 0
Introducimos 0 en [2.76] y llegamos a la siguiente afirmacin
condicional. Si la hiptesis es cierta
Ho :

0
~ tn 2
u2
xi2
[2.81]

Este estadstico de prueba nos proporciona la distribucin de bajo

la hiptesis nula propuesta. Si la hiptesis nula fuera cierta, el [1 ]%


2

de los valores muestrales de caera dentro del intervalo definido


por:
Pr[ t
2


t ] 1
2
2
2
xi

Donde:
t es el valor de crtico de t de tablas para un nivel de significancia
2

de / 2 con n 2 grados de libertad.


Si nuestro muestral cae fuera de los lmites de dicho intervalo
entonces:
a) La hiptesis nula es cierta, pero se ha elegido una muestra poco
verosmil
b) La hiptesis nula es falsa
En tal caso, elegiremos de forma deliberada la segunda interpretacin
y se procede de la siguiente forma. Se rechaza la H 0 al nivel de
significancia del % si
0
u2

xi2

t
2

[2.82]

Econometra bsica
Lineal de dos variables

Modelo

Se acepta la H 0 al nivel de significancia del % si

0
u2

t
2

2
i

[2.83]
La hiptesis nula que con mayor frecuencia se contrasta es
Ho :

Esto se conoce como la prueba de contrastacin de la variable


exgena. Si la hiptesis es cierta, la variable exgena X no juega
ningn papel en la determinacin de Y .
De forma similar se procede para contrastar alguna hiptesis sobre
. Esta prueba se basa en la siguiente distribucin

X i2 2
n xi2

~ tn 2

[2.84]

Para este propsito un intervalo de confianza del [1 ]% para


2

viene

dado por
Pr( t / 2


t / 2 ) 1
S ( )

Y la hiptesis
H0 :

Se rechazara al nivel de significancia del %



X i2 2

si

n xi2

[2.85]
1.2.3 Anlisis de Varianza
La prueba de significancia de la variable exgena tambin se puede
obtener mediante el anlisis de varianza.

Econometra bsica
Lineal de dos variables

Modelo

A partir de [2.72] se obtuvo


~ N (0,1)

u2
xi2

Tomando en cuenta el siguiente teorema: Si Z1 , Z 2 , Z 3 , , Z n son


variables independientes normalmente distribuidas tales que cada
Z i ~ N (0,1) , es decir, una variable normal estndar, entonces
Zi2 Z12 Z 22 ... Z n2 sigue una distribucin ji-cuadrado con n g de l.
2
2
Simblicamente, Z i ~ n , donde n denota los grados de libertad, g
de l. Se deduce que
Z1

[ ]2
~ 12
2
u
xi2

[2.86]

De acuerdo a [2.73]

Z2

2
i

2
u

~ n2 2

[2.87]

Por tanto, Con base al siguiente otro teorema: Si Z1 y Z 2 son


variables ji-cuadrado independientemente distribuidas con k1 y k 2 g
Z1 / k1
~ Fk1 , k 2 tiene una
de l, respectivamente, entonces la variable F
Z 2 / k2
distribucin F con k1 g de l en el numerador y k 2 g de l en el
denominador. Se obtiene

[ ]2
u2
xi2
[ ]2 xi2

~ F1, n 2
ei2 /(n 2)
ei2
u2
n2
[2.87]
Si consideramos que 0 entonces

Econometra bsica
Lineal de dos variables
F

Modelo

2 xi2
~ F1, n 2
ei2
n2
[2.88]

En relacin a la descomposicin de la suma de cuadrados realizada en


[2.62], el estadstico F se puede escribir como
F

SCE / 1
SCR / n 2

[2.89]

El procedimiento para realizar la prueba de hiptesis de que 0 ,


dado un nivel de significancia de es. Se la hiptesis de nulidad al
nivel del 100[ ]% si
F

SCE / 1
F[1 ][1, n 2]
SCR / n 2

[2.90]

Donde F[1 ][1,n 2 ] indica el valor de F tal que slo el 100 % de la


distribucin se encuentra a la derecha de F[1 ][1,n 2 ] .
1.3

Prediccin

Una de las utilidades del anlisis de regresin es la prediccin. Es


decir, usualmente nos interesa pronosticar cual es el valor de Y
correspondiente a un valor determinado de X . Supongamos que el
valor dado de la variable explicativa es X 0 , entonces nuestro
propsito es predecir el valor de Y0 .
Y0 X 0 0

[2.91]
Sin embargo, como Y0 es una variable aleatoria no podremos conocer
nunca su valor a priori aun en el caso de que se conocieran los
parmetros poblacionales. Es decir, solo se puede estimar su valor
esperado.
E (Y0 ) X 0

[2.92]
En realidad, como tampoco es posible conocer E( Y0 ) tenemos que
estimarla. Su estimador es el punto correspondiente sobre la recta de
la FRM,

Econometra bsica
Lineal de dos variables

Modelo

Y0 X 0

[2.93]
Es importante considerar que el valor real de Y0 casi siempre es
distinto a Y0 por las siguientes razones:
a) El valor de Y0 no es igual a E( Y0 )
b) La FRM no es igual a la FRP debido a la existencia del error
muestral.
1.3.1 Prediccin individual
Formalmente, el error de pronstico individual se puede escribir
como,
Y0 Y0 [Y0 E (Y0 )] [ E (Y0 ) Y0 ]

Y se puede escribir tambin de la forma,


Y0 Y0 X 0 0 X 0

Ntese que, el error de pronstico, es una combinacin lineal de las


variables aleatorias independientes 0 , 1 , 2 ,, n ,. Siendo cada i
una variable aleatoria con una distribucin normal entonces el error
del pronstico tambin es una variable aleatoria con una distribucin
normal y quedar definida por su media y variancia. La media puede
obtenerse de la forma siguiente,
E[Y0 Y0 ] E[ X 0 0 X 0 ]

E[Y0 Y0 ] X 0 E ( 0 ) E ( ) X 0 E ( )
E[Y0 Y0 ] 0

Luego, su variancia es,


E[(Y0 Y0 ) E (Y0 Y0 )] 2 E[Y0 Y0 ] 2

Por tanto,
E[Y0 Y0 ] 2 E{[Y0 E (Y0 )] [ E (Y0 ) Y0 ]}2
E[Y0 Y0 ] 2 E[Y0 E (Y0 )] 2 E[ E (Y0 ) Y0 ] 2 2 E[Y0 E (Y0 )][ E (Y0 ) Y0 ]

Siendo,

Econometra bsica
Lineal de dos variables

Modelo

2 E[Y0 E (Y0 )][ E (Y0 ) Y0 ] 2 E[ 0 ][ X 0 X 0 ]


2 E[Y0 E (Y0 )][ E (Y0 ) Y0 ] 2 E[ 0 ][( ) ( ) X 0 ]

2 E[Y0 E (Y0 )][ E (Y0 ) Y0 ] 2 E[ 0 ][ ] 2 X 0 E[ 0 ][ ]


2 E[Y0 E (Y0 )][ E (Y0 ) Y0 ] 0

De modo que,
E[Y0 Y0 ] 2 E[Y0 E (Y0 )]2 E[ E (Y0 ) Y0 ] 2

El cual tambin podemos escribirlo como,


Y2 Y = u2 + e2

Retomando la relacin anterior tenemos,


E[Y0 Y0 ]2 E[ X 0 0 X 0 ]2 E[ X 0 X 0 ]2
E[Y0 Y0 ]2 E[ 0 ]2 E[ X 0 X 0 ]2

E[Y0 Y0 ]2 E[ 0 ]2 E[( ) ( ) X 0 ]2
E[Y0 Y0 ]2 u2 E ( ) 2 X 02 E ( ) 2 2 X 0 E[( )( )]

2
X2 2
1
2
2
2 u

E[Y0 Y0 ] u

X
2X0
u
0
n xi2
xi2

2
2
X

2
X
X

X
1
2
0
0
E[Y0 Y0 ] 1
2
u
n
x

1 ( X 0 X )2 2

E[Y0 Y0 ] 1
u
n
xi2

1 ( X 0 X )2 2

Y20 Y0 1
u
n
xi2

[2.94]

En resumen,

X
u2
xi2

Econometra bsica
Lineal de dos variables

Modelo

(Y0 Y0 ) ~ N (0, Y2 Y )
0

Por tanto,

Y0 Y0

Z1

1 1 (X 0 X )

n
xi2

~ N (0,1)

u2

[2.95]
Siendo,

V1

(n 2) u2
~ n2 2
2
u

Entonces,

Y0 Y0

Z1

V1
n2

2
1 1 ( X 0 X ) u2

n
xi2

(n 2) u2
u2
n2

~ t n2

Simplificando se obtiene,

t n2

Y0 Y0

2
1 1 ( X 0 X ) u2

n
xi2

[2.96]
Finalmente, la expresin anterior se puede utilizar para realizar
afirmaciones de tipo probabilstico acerca de los pronsticos.
Concretamente, es posible establecer intervalos de confianza con una
determinada probabilidad de que contenga el valor real de Y0 .
Considerando que el nivel de significancia es el 5%, entonces,

P (t n 2,0.025

Y0 Y0

1 1 ( X 0 X ) u2

n
xi2

De donde obtenemos,

t n 2,0.025 ) 0.95

Econometra bsica
Lineal de dos variables

1 (X 0 X )2

Y0 t n 2, 0.025 1

n
xi2

[2.97]

Modelo

u2

1.3.2 Prediccin media


Formalmente, la verdadera prediccin media, est dada por,
E (Y0 ) X 0

El cual estimamos mediante la FRM,


Y0 X 0

Que tambin, es una combinacin lineal de las variables aleatorias


independientes 1 , 2 ,, n ,. Siendo cada i una variable aleatoria
con una distribucin normal entonces la prediccin media es una
variable aleatoria con una distribucin normal y quedar definida por
su media y variancia. La media puede obtenerse de la forma
siguiente,
E (Y0 ) E ( ) X 0 E ( )
Puesto que los estimadores mnimo cuadrticos son insesgados se
obtiene,
E (Y0 ) X 0

La varianza de la prediccin media est definida por:


E[Y0 E (Y0 )]2 VAR (Y0 ) E[ X 0 X 0 ]2

VAR (Y0 ) E[ ) ( ) X 0 ]2

O alternativamente,
VAR (Y0 ) VAR [ X 0 ] VAR ( ) X 02VAR ( ) 2 X 0COV ( , )

u2
X2 2
1
2

VAR (Y0 )

X
2X 0
u
0
n xi2
xi2

X
u2
xi2

Econometra bsica
Lineal de dos variables

Modelo

2
(
X

X
)
1

2
0
VAR (Y0 )
2
u
n
x

En resumen,

1 (X X )
Y0 ~ N ( X 0 ,[ 0 2 ] u2 )
n
xi
Por tanto,
2

Y0 E (Y0 )

Z2

1 (X 0 X )2 2

u
2
n
x
i

~ N (0,1)

Siendo,

V1

(n 2) u2
~ n2 2
2
u

Entonces,

Y0 E (Y0 )
Z2
V1
n2

1 (X 0 X )2 2

u
2
n
x
i

(n 2) u2
u2
n2

~ t n 2

Simplificando se obtiene,

t n 2

Y0 E (Y0 )
1 ( X 0 X )2 2

u
2
n
x
i

Finalmente, la expresin anterior se puede utilizar para realizar


afirmaciones de tipo probabilstico acerca de los pronsticos.
Concretamente, es posible establecer intervalos de confianza con una
determinada probabilidad de que contenga el valor medio de Y0 ,
E (Y0 ) . Considerando que el nivel de significancia es el 5%, entonces,

Econometra bsica
Lineal de dos variables

P(t n 2,0.025

Modelo

Y0 E (Y0 )
1 ( X 0 X )2

n
xi2

t n 2, 0.025 ) 0.95

u2

[2.98]
De donde obtenemos,
1 ( X X )2
Y0 t n 2, 0.025 0 2
n
xi

[2.99]

u2

Econometra bsica
Lineal de dos variables

Modelo

Das könnte Ihnen auch gefallen