Beruflich Dokumente
Kultur Dokumente
Y = a + b X,
a se denomina la ordenada en el origen y b la pendiente de la recta.
De manera que el modelo a ajustar es
Yi = a + bXi + i
i = 1,2,,n.
En forma matricial Y = a1 + bX + e
donde Y` = (y1, y2, , yn), 1` =(1,1,,1), X` =(x1, x2, , xn), `= (1, 2, n)
Se supone que se verifican las siguientes hiptesis:
1.
2.
3.
, i = 1,...,n.
La distribucin es normal,
Y/X=xi ~ N(a + bxi , 2)
O, equivalentemente, i ~ N(0,2), i = 1,...,n.
4.
i 1
yi a bxi
i 1
yi a bxi
2 yi a bxi 0
a
i
2 yi a bxi xi 0
b
i
Que nos dar un sistema de dos ecuaciones normales y dos incgnitas (a, b).
Resolviendo el sistema:
na
x
y
bS
2
x
y = a + bx con los
S xy
S 2x
x x
b'
S xy
S 2y
a ' x b' y
o bien:
xx
S xy
S 2y
y y
varianzas son siempre positivas). Una covarianza positiva nos dar dos coeficientes de
regresin positivos y sus correspondientes rectas de regresin crecientes. Si la
covarianza es negativa, las dos rectas de regresin sern decrecientes al ser negativas
sus pendientes. En caso de que la covarianza valga cero, las rectas de regresin sern
paralelas a los ejes coordenados y perpendiculares entre s.
2
VNE y i y i y i a bxi
i
e
2
y es la estimacin de la
VE y i y
VARIACIN TOTAL
La variacin total es la suma de los cuadrados de las desviaciones de los
valores observados a la media
VT y i y
COEFICIENTE DE DETERMINACIN
El problema de la variacin residual es que viene afectada por las unidades de
medida y esto imposibilita la comparacin de la dependencia entre grupos de variables.
Obtenemos una medida relativa (es decir, que no dependa de las unidades y est entre
cero y uno) de la bondad de ajuste dividiendo la variacin debida a la regresin entre la
variacin total
Se define el COEFICIENTE DE DETERMINACIN COMO:
R cuadrado
VE
VT
o bien
R cuadrado
bb '
S
S
xy
2
x
S
S
xy
2
y
xy
COEFICIENTE DE CORRELACIN
Dadas dos variables aleatorias cualesquiera X e Y, una medida de la relacin
lineal que hay entre ambas variables es el coeficiente de correlacin definido por
COV ( X , Y )
( X ) (Y )
S XY
S X SY
S XY
1 n
xi y i X Y
n i 1
)R
Por tanto, r[-1,1]. Este coeficiente es una buena medida de la bondad del ajuste
de la recta de regresin. Evidentemente, existe una estrecha relacin entre r y
modelo:
r es una medida de la relacin lineal entre las variables X e Y.
= 0 r =0
1
y puede utilizarse la siguiente regla
n
2
n
r significativo
PREDICCIN
El objetivo ltimo de la regresin es la prediccin de una variable para un valor
determinado de la otra. La prediccin de Y para X = x 0 ser simplemente el valor
obtenido en la recta de regresin de Y sobre X al sustituir el valor de x por x0.
Es claro que la fiabilidad de esta prediccin ser tanto mayor cuando
mayor sea la correlacin entre las variables (es decir mayor sea R cuadrado o r ).
INTERVALOS DE CONFIANZA PARA LOS PARMETROS
El estimador
El estadstico
2
nS X
N
(
b
,
)
Esto es,
nS X2
Por tanto la V ar(
- disminuye al aumentar n,
- disminuye al aumentar sx2
- disminuye al disminuir
El estimador
La distribucin de
X2
nS X2
X2
nS X2
- disminuye al aumentar n,
- disminuye al aumentar sx2
- disminuye al disminuir
- disminuye al disminuir
2
SR
residuos.
S R2
VNE
n2
(n 2) S R2
2n 2
2
b b
S x n Tn 2
SR
SR
SX
t / 2 , n 2
Tn 2
X2
S X2
a S R
X2
1
1 2 t / 2 , n 2
n
S X
Los estadsticos
independientes
Como ya se ha indicado el parmetro
un punto del rango de la X, por ejemplo, al estudiar la relacin entre las variables peso y
altura de un colectivo de personas. Por ello tiene inters la ecuacin de la recta de
regresin que utiliza solo el parmetro b. Esta ecuacin es la siguiente
y i y b( x i x ) i
o bien,
y i y b( x i x )
INTERPRETACIN GEOMTRICA
Considrense los siguientes vectores del espacio n-dimensional Rn
Y ( y1 , y 2 ,..., y n )
Vector de 1
X ( x1 , x 2 ,..., x n )`
Y a1 bX
e
i 1
.
Y, en particular, es ortogonal a estos dos vectores, esto es,
n
e t 1 ei 0
i 1
n
e t X ei x i 0
i 1
2
i
.
y
y e
son ortogonales y
por tanto
2
2
Y Y e 2
y
i 1
2
i
i 1
i 1
y i2 ei2
b b
S x n Tn 2
SR
El estadstico T0
la regin crtica es
b
S x n Tn 2 , por tanto
SR
T0 t / 2 , n 2
H0 : a 0
H1 : a 0
Aunque este contraste tiene menor inters por su escaso significado. En este
T0
SR
Tn 2
X2
S X2
yi yi
2
2
y
y
y
=
+ i
i
i
VE y i y
VE
residual
VNE yi y i ei
i
total
n-2 2
VT
i
yn-1
i
Valor F
VE
2
SR
2
SR
S Y2
F0
VE
2
SR
f ,1, n 2
La regin crtica es