Beruflich Dokumente
Kultur Dokumente
CAPTULO 2
MODELO DE REGRESIN DE DOS
VARIABLES
CONTENIDO
Inferencia estadstica
Prediccin
Y f (X )
,
Y
0
1
X
Y 1 2 X
0 2 1
Yi
Xi
i 1,2,3,..., m
Yi 1 2 X i
0 2 1
Yi 1 2 X i
Yi 1 2 X i i
,
0 2 1
E ( i / X i ) 0
Media
E ( i j / X i , X j ) 0
Covarianza
E ( i2 / X i ) 2
Varianza
i ~ NID (0, 2 )
Xi
Son fijas !!
E (Yi ) 1 2 X i
Yi 1 2 X i i
Se deduce:
E (Yi / X i ) 1 2 X i
Puesto que:
E ( i / X i ) 0
Xi
E (Yi / X i ) 1 2 X i
Yi 1 2 X i i
Si el objetivo es estimar:
,
E (Yi / X i ) 1 2 X i
Considerando una muestra de n pares de valores para las variables
involucradas en el modelo y asumiendo un mtodo apropiado se puede
postular que la estimacin muestral es la siguiente:
Yi 1 2 X i
Donde:
Yi 1 2
E (Yi / X i ) 1 2
FRM : Yi 1 2 X i
Yi
Yi 1 2 X i
ei
Yi
E (Yi / X i ) 1 2 X i
E (Yi / X i )
Consumo
Semanal, US$
P ( X i ,Yi )
Xi
Ingreso Semanal, US$
P ( X i ,Yi )
Yi
ei
Yi 1 2 X i
ei
Yi
P ( X i ,Yi )
Xi
Ingreso Semanal, US$
ei Yi 1 2 X i
Elevando al cuadrado y aplicando el operador de sumatoria se tiene:
2
2
[
Y
X
]
i i 1 2 i
2
[ ei ]
1
1
2
[ ei ]
2
2
2
e
i
Sea mnimo.
[Y X ] 0
2
[Y X ] 0
2
[ ei2 ] 2 [Yi 1 2 X i ][ X i ] 0
2
[e ] 0
i
[e ][ X ] 0
i
n1 2 X i
X
Y
X
i i 1 i 2 i
[1]
[2]
Consumo
Ingreso
Aleatorio
Observacin
X*Y
X^2
65
100
6,500
10,000
14
90
120
10,800
14,400
51
165
240
39,600
57,600
24
102
160
16,320
25,600
49
145
240
34,800
57,600
32
120
180
21,600
32,400
27
116
160
18,560
25,600
34
135
180
24,300
32,400
45
157
220
34,540
48,400
10
55
80
4,400
6,400
211,420
310,400
Sumatoria
1150
1680
Promedio
115
168
X
Y 1,150
X Y 211,420 X
i
i
2
i
1,680
n 10
310,400
1 6.30113636
2 0.64701705
Por tanto, la FRM es:
Yi 6.30113636 0.64701705 X i
El consumo autnomo estimado es US$ 6.3 semanales
Ingreso
Consumo
Estimado
Error Muestral
Aleatorio
N
Observaci
n
YEST
E*X
65
100
71.00284136
-6
-600
14
90
120
83.94318236
727
51
165
240
161.5852284
820
24
102
160
109.8238644
-8
-1,252
49
145
240
161.5852284
-17
-3,980
32
120
180
122.7642054
-3
-498
27
116
160
109.8238644
988
34
135
180
122.7642054
12
2,202
45
157
220
148.6448874
1,838
10
55
80
58.06250036
-3
-245
Sumatoria
Promedio
1,150
1,680
115
168
1,150
115
6.30113636
Pendiente
0.64701705
[ei ] 0
[e ][ X ] 0
i
Y n1 2 X
Y Y
De la FRM se tiene:
Yi 1 2 X i
Y n
i
2 X i
Yi Y 2 ( X i X )
y i 2 xi
Donde:
y i Yi Y
xi X i X
Y 1 2 X
FRMD
ei Yi Yi Yi Y Y Y (Yi Y ) (Yi Y ) yi y i
Elevando al cuadrado y aplicando el operador de sumatoria:
2
2
2
(
y
y
)
(
y
x
)
i i i i 2 i
2
2
[ ei ]
[
y
x
]
0
i
2 i
2
2
x
y
x
[ ei2 ] 2 [ yi 2 xi ][ xi ] 0
i i
2 i 0
2
Por tanto:
xi yi
1 Y 2 X
2
2
xi
xi y i 18,220
2
x
i 28,160
X 168
Y 115
Reemplazando se tiene:
xy
x
i
2
i
0.647017045
1 Y 2 X 6.30113636 4
Ingreso
X
xy
x^2
64
yest
43.997159
1
31.056818
2
46.585227
3
5.1761363
6
5184
46.585227
3
65
100
-50
-68
3400
4624
90
120
-25
-48
1200
2304
165
240
50
72
3600
5184
102
145
160
240
-13
30
-8
72
104
2160
120
180
12
60
144
116
160
-8
-8
64
135
180
20
12
240
144
157
55
1,150
220
80
1,680
42
-60
0
52
-88
0
2184
5280
18,220
2704
7744
28,160
7.7642045
5
5.1761363
6
7.7642045
5
33.644886
4
-56.9375
0
-6
6
3
-8
-17
-3
6
12
8
-3
0
ex
408.19318
2
290.72727
3
245.86363
6
62.590909
1
1194.1363
6
33.170454
5
49.409090
9
146.82954
5
434.46590
9
269.5
0
xy
x
i
2
i
1 Y 2 X
x y
x
w y
2
2
2
i
Donde:
2 wi (Yi Y )
wi
xi
2
x
i
Siendo:
2 wiYi
2 w1Y1 w2Y2 w3Y3 w4Y4 ... wnYn
2 wiYi
Considerando que:
Yi 1 2 X i i
2 wi [ 1 2 X i i ]
2 1 wi 2 wi X i wi i
E ( 2 ) 2 wi E ( i )
E ( 2 ) 2
Como:
E ( i ) 0
2 2 wi i
E[ 2 2 ]2 E[ wi i ]2
Var [ 2 ] E[ wi i ]2
Var ( 2 ) E ( w11 w2 2 ... wn n ) 2
2
Var ( 2 )
2
x
i
2 ci y i ci (Y i Y ) ciYi
Reemplazando se tiene:
2 ci (1 2 X i i ) 1 ci 2 ci X i ci i
Aplicando el operador de esperanza matemtica:
E ( 2 ) 2
c X
i
E ( i ) 0
2 2 ci i
Despejando, elevando al cuadrado y aplicando el operador de esperanza
matemtica, se tiene:
Var ( 2 ) E ( 2 2 ) 2 E ( ci i ) 2
Var ( ) E (c c ... c ) 2
2
Z 2 ci2 1 ci 2 ci X i
La varianza ser mnima si se cumple que:
Z
0
ci
Z
0
1
Z
0
2
Z
2ci 2 1 2 X i 0
ci
Z
ci 0
1
Z
( ci X i 1) 0
ci
1
ci
[1 2 X i ]
2
2
1
n1 2 X i 0
[n1 2 X i ] 0
2
2
1
2
2
2
c
X
i i 2 2 1 i 2 i
1
i
2
i
ci
De donde:
2 2 X
1
2
x
i
2 2
2
2
x
i
xi
ci
2
x
i
ci wi ?
2 ci y i
x y
x
i
2
i
Var ( 2 ) 2 ci2
2
x
i
Yi 1 2 X i i
Y su contraparte muestral:
Yi 1 2 X i ei
A partir de,
ei yi y i
E ( ei2 ) (n 2) 2
Se obtiene:
2
E
(
e
i )
2
n2
2
e
i
n2
yi y i ei
Elevando al cuadrado y aplicando el operador de sumatoria se tiene:
2
2
e
(
y
y
)
i i i
Como:
2
2
2
y
i i i 2 yi e
y e ( x )e
i
Entonces:
2
2
2
y
i i i
2 i
2 xi ei 0
Yi
Yi 1 2 X i
ei
Yi
Total
Yi Y
Debido al residuo
Yi
Yi Y
Debido a la regresin
Consumo
Semanal, US$
Yi
Xi
SEC i
i
r2
2
STC yi2
y
i
r r
2
x y
x y
i
2
i
2
i
Incorrelacin
230
180
130
80
30
140
150
160
170
180
190
200
Ingreso
X
xy
x^2
65
100
-50
-68
3400
4624
90
120
-25
-48
1200
2304
165
240
50
72
3600
5184
102
160
-13
-8
104
64
145
240
30
72
2160
5184
120
180
12
60
144
116
160
-8
-8
64
135
180
20
12
240
144
157
220
42
52
2184
2704
55
80
-60
-88
5280
7744
1,150
0
18,220Hill, p28,160
FUENTE:
Gujarati, 1,680
Damodar N. 0
(2004) "Econometra"
McGraw
37.
115
168
0
0
Fuente: Gujarati (2004) "Econometra" Pg.
37
6.3011363
1,822
0.6470170
2,816
yest
43.997159
1
31.056818
2
46.585227
3
5.1761363
6
46.585227
3
7.7642045
5
5.1761363
6
7.7642045
5
33.644886
4
-56.9375
0
0
y^2
-6
2,500
625
2,500
-8
169
-17
900
-3
25
12
400
1,764
-3
0
0
3,600
12,484
1,248
yest^2
e^2
1935.7500
1
36.034099
964.52595 36.685046
6
5
11.660672
2170.1834
8
26.792387 61.212842
7
2
275.06976
2170.1834
4
60.282872 7.6408267
2
7
26.792387
7
60.282872
2
1131.9783
8
3241.8789
1
11,789
1,179
38.144660
4
149.71469
69.807923
9
9.3789062
5
695
70
STC
SEC
SCR
12,484
11,789
695
Por tanto:
2
2
y
e
SEC i
695
i
2
r
1
1
0.94
2
2
STC yi
12,484
yi
x y
x y
i
2
i
2
i
18,220
0.97
28,160 12,484
2
e
695
i
2
86.9187
n2
8
Yi i
Yi X i i
Yi 1 2
1
i
Xi
1
1 2 X i i
Yi
LnYi 1 2 LnX i i
LnYi 1 2 X i i
Yi a bX 2i cX 22i i
Yi 1 2 X 2i 3 X 3i i
Yi 1 2 X 2i 3 X 3i ... k X ki i
Yi 1 2 LnX i i
PRUEBAS DE HIPTESIS
El modelo clsico de regresin lineal normal (MCRLN)
El MCRLN supone que:
E ( i / X i ) 0
E[ i E ( i )]2 E[ i2 ] 2
E[ i E ( i )][ j E ( j )] 0
El cual puede expresarse como:
i ~ NID(0, 2 )
Cualquier funcin lineal de variables normalmente distribuidas estar
tambin normalmente distribuida.
Se relaciona con otras distribuciones.
PRUEBAS DE HIPTESIS
Propiedades de los estimadores MCO bajo el supuesto de normalidad
Z1
1 1
~ N (0,1)
2 2
Xi
2
x
i
2 2
Z2
~ N (0,1)
2
2
x
i
2
(n 2) 2 ~ n2 2
O alternativamente,
2
e
i ~ 2
n2
2
PRUEBAS DE HIPTESIS
Teoremas tiles relacionadas con la distribucin normal
Teorema 1:
Z i ~ NI (0,1)
Teorema 2:
Z1 ~ N (0,1)
V2 ~ k2
2
2
Z
~
i n
i 1
Z1
~ tk
V2
k
Teorema 3:
V1 ~ k21
V2 ~ k22
Teorema 4:
t k2 F1,k
V1 / k1
~ Fk1 ,k 2
V2 / k 2
PRUEBAS DE HIPTESIS
Utilizando los teoremas planteados se deducen
Considerando que:
Z2
2 2
~ N (0,1)
2
V2 (n 2) 2 ~ n2 2
2
x
i
tn2
2 2
2
2
x
i
2
(n 2) 2
n2
2 2 2 2
2
S 2
xi2
PRUEBAS DE HIPTESIS
Utilizando los teoremas planteados se deducen
Por el teorema 1:
2 2
Z2
~ N (0,1)
2
2
x
i
2
2
]
x
2 i
2
Z 22 [ 2 2 2 ]2 2
1
2
2
x
i
Como tambin:
[ 2 2 ]2 xi2
V2 (n 2)
~ n2 2
F1,n 2
2
1
2
( n 2) 2
n2
PRUEBAS DE HIPTESIS
En resumen se tiene las siguiente variables aleatorias
Z1
1 1
X
n x
2
i
~ N (0,1)
2
i
1 1
X
n x
2
i
2
i
~ tn2
2 2
Z2
~ N (0,1)
2
2
x
i
2 2
2
x
i
[ 2 2 ]2 xi2
~ F1,n 2
2
~ tn2
PRUEBAS DE HIPTESIS
No existe relacin entre la variable endgena y la exgena
La relacin entre la variable endgena y exgena viene dada por la
dependencia lineal del valor medio de la variable endgena respecto de la
variable exgena:
E (Yi / X i ) 1 2 X i
La hiptesis de no relacin entre la variable endgena y la variable exgena
es:
H0 : 2 0
Si no tenemos ningn conocimiento previo respecto a los valores de los
parmetros de la regresin, la hiptesis alternativa ser:
H A : 2 0
PRUEBAS DE HIPTESIS
No existe relacin entre la variable endgena y la exgena
Para contrastar la hiptesis nula utilizamos el estadstico de prueba
deducido:
t
2
2 2
2
2
x
i
t
2
2
2
2
x
i
PRUEBAS DE HIPTESIS
No existe relacin entre la variable endgena y la exgena
Debido a que el estadstico de prueba sigue una distribucin t se puede
utilizar para determinar si un valor t particular es grande o pequeo
estableciendo intervalos de confianza como el siguiente:
Pr[t / 2
Donde:
2 2
t / 2 ] 1
2
xi2
PRUEBAS DE HIPTESIS
Esquema de prueba de significancia individual
Se rechaza la
hiptesis nula
Se rechaza la
hiptesis nula
Area A = rea B
(A+B) = el nivel
deseado
de
significancia
Area A
Area B
- Valor
critico
+ Valor
critico
PRUEBAS DE HIPTESIS
Determinacin de los valores crticos
Distribucin de t Student
0.025
0.025
- 2.086
+ 2.086
INFERENCIA ESTADSTICA
Prueba de significancia individual Ejemplo hipottico.
Hiptesis:
H A : 2 0
H0 : 2 0
Estadstico de prueba:
tn2
Regla de decisin:
2
0.6470
11.65
2
86.9187
2
28,160
x
i
Se rechaza
Se rechaza
Se acepta
0.05
-2.306
Valor critico
0.05
2.306
Valor critico
11.65
INFERENCIA ESTADSTICA
Algunos aspectos prcticos
Si el nmero de grados de libertad es 20 y si el nivel de significancia, se
fija en 0.05, entonces la hiptesis nula puede ser rechazada si el t
calculado excede a 2 en valor absoluto.
Cmo se formula las hiptesis?: no existe regla prctica
Rechazar o no rechazar la hiptesis nula depende en forma crtica del
nivel de significancia: Rechazar la hiptesis nula siendo esta verdadera
(error tipo I).
Una vez que se ha obtenido un estadstico de prueba se puede obtener
la probabilidad exacta de cometer un error tipo I: el nivel de significancia
ms bajo al cual puede rechazarse una hiptesis nula.
0.05
0.05
PRUEBAS DE HIPTESIS
Prueba de significancia global
Puede demostrarse que:
E ( SEC ) E ( 22 x i ) 2 22 xi2
2
ei
[1]
E ( SRC ) E (
n2
) E ( 2 ) 2
[2]
Hiptesis:
H 0 : 2 0
PRUEBAS DE HIPTESIS
No existe relacin entre la variable endgena y la exgena
Estadstico de prueba:
F1,n 2
[ 2 2 ]2 xi2
F1,n 2
22 xi2
Pr[
2 2
Fk1 ,k2 , ] 1
2
2
x
i
PRUEBAS DE HIPTESIS
Esquema de prueba de significancia individual
Se rechaza la
hiptesis nula
Nivel de significancia
deseado
+ Valor
critico
PRUEBAS DE HIPTESIS
Determinacin de los valores crticos
Distribucin F Snedecor
+ 4.11
INFERENCIA ESTADSTICA
Prueba de significancia global Ejemplo hipottico.
Hiptesis:
H A : 2 0
H0 : 2 0
Estadstico de prueba:
22 xi2 [0.418631][28,160]
F1,8
135.6285
2
86.9187
Regla de decisin:
Se acepta
Se rechaza
0.05
0.90
0.10
0.05
3.46
Valor critico
135.6285
PRUEBAS DE HIPTESIS
Tabla ANOVA ejemplo hipottico.
SUMA DE CUADRADOS
GRADOS
DE
LIBERTAD
yi2 22 x i
ei
n-2
STC
n-1
FUENTE DE VARIACIN
2
i
Regla de decisin:
FC FT
Se rechaza la hiptesis.
SUMA PROMEDIO DE
CUADRADOS
22 xi2
ei / n 2
2
PREDICCIN
Prediccin
de Y correspondiente a un valor
PREDICCIN
Prediccin Individual
Dado el siguiente Modelo:
Yi 1 2 X i i
Supongamos que para un valor de:
Deseamos predecir:
X0
Y0
Y0 X 0 0
E (Y0 ) X 0
Y0 X 0
El valor de
Y0
Y0
PREDICCIN
Media del error de prediccin individual
PREDICCIN
Varianza del error de prediccin individual
1 (X X )
E[Y0 Y0 ]2 1 0 2
n
xi