Sie sind auf Seite 1von 36

ANLISIS DE REGRESIN

MLTIPLE y
CORRELACIN /1
REGRESIN MULTIPLE Y
CORRELACIN
MODELO DE REGRESION
MULTIPLE
Error estndar de
estimacin
Coeficiente de
determinacin : r
2
r
2
corregido
Pruebas inferenciales
Pruebas de hiptesis
Intervalos de confianza
Multicolinealidad Modelos
cuadrticos
INTRODUCCION
c + | + + | + | + | =
k k 2 2 1 1 0
x ... x x Y
Modelo de Regresin mltiple poblacional
k k 2 2 1 1 0
x

... x

x

Y

| + + | + | + | =
Modelo de Regresin mltiple estimado
Los mismos supuestos del modelo de regresin simple mas otros :

El numero de observaciones n > k (numero de variables
independientes.

Las variables independientes deben ser no correlacionadas
multicolinealidad, afecta los signos de los coeficientes.

El modelos de regresin mltiple
Ejemplo: Se analiz la publicidad para explicar o predecir el
numero de pasajeros. (error estndar de 0.907 y r
2
del 94%).
Incorporaremos una segunda variable explicativa, con el
principio de que el ingreso es una determinante importante
de la demanda de pasajeros.
2 2 1 1 0
x

x

Y

| + | + | =
Regresin lineal mltiple Matricial
El modelo de regresin lineal mltiple con k variables
predictoras y basado en n observaciones est dado por:
(
(
(
(
(

=
(
(
(
(
(
(

=
(
(
(
(
(

=
(
(
(
(
(

=
n
k
nk n n
k
k
X X X
X X X
X X X
X
yn
y
y
Y
c
c
c
c
|
|
|
|

2
1
1
0
2 1
2 22 21
1 12 11

1
1
1
2
1
i ik k i i i
x x x Y c | | | | + + + + + = ...
2 2 1 1 0
1 * 1 * ) 1 ( ) 1 ( * 1 * n k k n n
X Y c | + =
+ +
Estimacin del vector de parmetros | por MCO

Se tiene que minimizar la suma de cuadrados de los
errores (SCE)
) X Y ( ) X Y ( SCE
T T
1 i
2
i
| | = c c = c =
=
Haciendo operaciones con los vectores y matrices
| | + | | + | = X X X XY Y X 2 Y Y SCE
T T T T T T T
Derivando SCE con respecto a | e igualando a
cero se obtiene el
sistema de ecuaciones normales
0 X X 2 Y X 2
SCE
T T
= | + =
| c
c
Y X X X
T T
= |
Despejando | se obtiene:
Y X ) X X (

T 1 T
= |
LA LINEA DE M.C.O PARA LOS DATOS DEL NUMERO DE
PASAJEROS
c + | + | + | =
2 2 1 1 0
x x Y
(X1) (X2) (Y)
MES PUBLICIDAD
INGRESO
(miles de
dolares)
NUMERO DE
PASAJEROS
1 10 2,4 15
2 12 2,72 17
3 8 2,08 13
4 17 3,68 23
5 10 2,56 16
6 15 3,36 21
7 10 2,24 14
8 14 3,2 20
9 19 3,84 24
10 10 2,72 17
11 11 2,07 16
12 13 2,33 18
13 16 2,98 23
14 10 1,94 15
15 12 2,17 16
MATRICES Y, X, BETA ESTIMADO, y e
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(

=
16
15
23
18
16
17
24
20
14
21
16
23
13
17
15
Y
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(

=
2,17 12 1
1,94 10 1
2,98 16 1
2,33 13 1
2,07 11 1
2,72 10 1
3,84 19 1
3,2 14 1
2,24 10 1
3,36 15 1
2,56 10 1
3,68 17 1
2,08 8 1
2,72 12 1
2,4 10 1
x
(
(
(

|
|
|
= |
2
1
0

(
(
(
(

c
c
c
= c
T
2
1
...
Y X ) X X (

T 1 T
= |
X
T
X
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(

=
2,17 12 1
1,94 10 1
2,98 16 1
2,33 13 1
2,07 11 1
2,72 10 1
3,84 19 1
3,2 14 1
2,24 10 1
3,36 15 1
2,56 10 1
3,68 17 1
2,08 8 1
2,72 12 1
2,4 10 1
x
(
(
(

=
2,17 1,94 2,98 2,33 2,07 2,72 3,84 3,2 2.24 3.36 2.56 3.68 22,08 2.7 2.4
12 10 16 13 11 10 19 14 10 15 10 17 8 12 10
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
T
X
(
(
(

=
3 . 113 4 . 525 29 . 40
4 . 525 2469 187
29 ,. 40 187 15
X
T
X
(
(
(
(
(

=



2
2
X 2 X 1 X 2 X
2 X 1 X
2
1
X 1 X
2 X 1 X T
X
T
X
X
T
Y
(
(
(

=
2,17 1,94 2,98 2,33 2,07 2,72 3,84 3,2 2.24 3.36 2.56 3.68 22,08 2.7 2.4
12 10 16 13 11 10 19 14 10 15 10 17 8 12 10
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
T
X
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(

=
16
15
23
18
16
17
24
20
14
21
16
23
13
17
15
Y
(
(
(

=
(
(
(

6 . 746
0 . 3490
0 . 268
) Y 2 X (
) Y 1 X (
Y
Y
T
X
MATRIZ INVERSA DE X
T
X
(
(
(

(
(
(
(
(




80 . 0 13 . 0 48 . 0
13 . 0 03 . 0 01 . 0
48 . 0 01 . 0 48 . 1
1
2
2
X 2 X 1 X 2 X
2 X 1 X
2
1
X 1 X
2 X 1 X T
1
) X
T
X (
(
(
(

= |
44 . 1
84 . 0
53 . 3
Y
T
X
1
) X
T
X (

ESTIMACIONES
2
X 44 . 1
1
X 84 . 0 53 . 3 Y

+ + =
Propiedades del estimador MCO
Dado que es una variable aleatoria tiene distribucin la
cual esta dada por:






El estimador MCO es insesgado

El estimador MCO es el mejor estimador dentro de
los estimadores lineales insesgados de | .
1 2
2
) ( ) /

(
) / (
)

=
=
=
X X X Var
I X Var
E
T
n
o |
o c
| |
|

Beta es un estimador eficiente


de varianza mnima
)
1
) X
T
X (
2
, ( N


o | ~ |
Cmo estimar a o
2
(varianza de los errores)?

Modelo Estimador de o
2
c | | |
c | |
+ + + + =
+ + =
k
X
k
X Y
X Y
...
1 1 0
1 0
2
)

(
2

1
2
1 0
1
2
2

=

= =
n
X Y
n
n
i
i i
n
i
i
| | c
o
1

1
2
2

=

=
k n
n
i
i
c
o
n-k-1 representa los grados de libertad (g.l) para el modelo general de
los MCO con n observaciones y k Variables independientes.

gl= n-(k+1) = (numero de observaciones) (numero de parmetros estimados)
Estimacin de la varianza o
2

El estimador MCO de la varianza de los errores es:
1 k n

T

1 k n
n
1 i
2
i

1 k n
) Y
T
X
T

Y
T
Y (
1 k n
SCE
2


c c
=

=
c
=

|
=

= o

Y
T
Y 4960
B
T
3,53 0,84 1,44
X
T
Y
268
3490
746,62
BTXTY= 4951,9
SCE= 4960-4951,9= 8,10162
68 . 0
12
102 . 8
2
= = o
IC, PH
VARIANZA DE LOS BETAS ESTA DADA POR
1
) X
T
X (
2
) X /

( Var

o = |
(
(
(




(
(
(
(

(
(
(
(
(




80 . 0 13 . 0 48 . 0
13 . 0 03 . 0 01 . 0
48 . 0 01 . 0 48 . 1
Ckk ... 1 Ck 0 Ck
...
k 1 C ... 11 C 10 C
k 0 C ... 01 C 00 C
1
2
2
X 2 X 1 X 2 X
2 X 1 X
2
1
X 1 X
2 X 1 X T
1
) X
T
X (
Ckk

...
11 C

00 C

k
1
0
o =
|
o
o =
|
o
o =
|
o
1
) ( ) /

(

= X
T
X X DESV o |
COEFICIENTE DE DETERMINACIN MLTIPLE

Medida de bondad del ajuste fuerza de la relacin entre Y y
las Xs
SCE SCR SCT que Dado
SCT
SCR
2
r
+ =
=
SCT
SCE
1
2
r =
Descomposicin de la variacin total de Y

= = =
+ =
n
i i
i i
n
i
i
Y Y Y Y
1 1
2 2
1
2

( ) (
c
c
) ( )

(
2 2
Y X Y Y Y n Y X Y n Y Y
T T T T T T
| | + =
) ( )

(
2 2
c c |
T T T T
Y n Y X Y n Y Y + =
SCT
SCE
SCT
SCR
R = = 1
2
2 2
2
2
1

Y n Y Y Y n Y Y
Y n Y X
R
T
T
T
T T

=
c c |
SCT = SCR + SCE
INFERENCIAS ACERCA DE LOS PARMETROS
PRUEBAS INDIVIDUALES SOBRE |
1
0
1
:
1
0
1
:
0
= = | | H H
) 2 (
~
1

1 1

=
n
t
S
t
|
| |
1

|
S
Error estndar de la distribucin de 1

|
1.
2.
/t/ > t
o/2,n-K-1

Rechazo Ho
Acepto H1
3.
REGLA DE
DECISIN:
Ckk

...
11 C

00 C

k
1
0
o =
|
o
o =
|
o
o =
|
o
EVALUACION DEL MODELO GLOBAL
TODAS LAS VARIABLES TIENEN UN VALOR EXPLICATIVO?
:
1
0 ... 3
2 1
:
0
i i
i i
H
k
H = = = = = = = | | | | | |
FUENTE DE
VARIACION SC g.l. CM F
P-
VALO
R
REGRESION SCR k CMR=(SCR/k) CMR/CME
ERROR SCE n-k-1 CME=(SCE/n-k-1)
TOTAL SCT n-1
FUENTE DE VARIACION SC g.l. CM F P-VALOR
REGRESION 163,63 2 81,815 121,18347 1,10E-08
ERROR 8,1016 12 0,675
TOTAL 171,73 14
ANALISIS DE MULTICOLINEALIDAD
VARIABLES INDEPENDIENTES CORRELACIONDAS
ENTRE SI, (X1, X2,Xk).
r: coeficiente de correlacin X1, X2,.
Problemas de la multicolinealidad
Incapacidad para separar los efectos
Coeficientes no confiables
El error estndar de los coeficientes presentan mucha
variacin
Signo de los coeficientes opuestos
COMO SE DETECTA LA MULTICOLINEALIDAD?
MATRIZ DE CORRELACION ENTRE LAS VARIABLES
Columna 1 Columna 2
Columna 1 1,00000
Columna 2 0,86982132 1,0000
Pearson correlation of X1 and X2
0
12
:
1
H 0
12
:
0
H = =
) 1 k n (
t ~
r
S
12
r
t


=
r
S
Error estndar del coeficiente de correlacin
1 k n
2
12
r 1
r
S

=
1.
2.
/t/ > t
o/2,n-k-1

Rechazo Ho
Acepto H1
3.
REGLA DE
DECISIN:
HIPOTESIS SOBRE LA CORRELACION
0
12
:
1
H 0
12
:
0
H = =
85 . 11
0734 . 0
0 87 . 0
=

= t
0734 . 0
13
93 . 0 1
=

=
r
S
REGLA DE
DECISIN:
o = 0,05 o/2 = 0,025

t
0.025, 13
= 2,16
/11,85/ > 2.16 RECHAZO Ho, ACEPTO Ha

A un nivel de significancia del 5% ingresos
correlacionado con la publicidad
FACTOR DE INFLACION DE LA VARIANZA: FIV
Es un medida del grado de multicolinealidad en que contribuye
dicha variable
Regresin de x1 vs otras variables x2,x3, .
Regresin de x2 vs otras variables x3, .
y se calcula el FIV

2
r 1
1
FIV

=
28 . 14
) 93 . 0 ( 1
1
=

= FIV
Multicolinealidad es grave cuando
el FIV es mayor a 10 o la suma de
FIV para todos los X es mayor a 10

TALLER CLASE REGRESIN
MLTIPLE GRATEL
REGRESIN MLTIPLE
Taller regresin mltiple .doc
1. Importar el archivo de Excel
Ubicacin de la hoja en Excel
Sin fechas
fechas
Para ver la base de datos es gretl
Matriz de correlacin
Estimacin de parmetros
Supuesto de independencia de los errores
Taller casita 3. entrega antes de examen
El gerente de produccin de una empresa importante fabricante de muebles, estudia las calificaciones de
desempeo laboral de una muestra de 15 electricistas de mantenimiento . Para ingresar al depto de
mantenimiento recursos humanos aplica un examen de aptitud. El gerente de produccin obtuvo la calificacin
de cada uno de ellos incluidos en la muestra. A dems, determino cuales electricistas eran miembros de un
sindicato (cdigo =1) y cuales no lo eran (cdigo=0).

trabajador
calificacin
de
desempeo
calificacio
n de
aptitud
miembro del
sindicato
1 58 5 0
2 53 4 0
3 33 10 0
4 97 10 0
5 36 2 0
6 83 7 0
7 67 6 0
8 84 9 0
9 98 9 1
10 45 2 1
11 97 8 1
12 90 6 1
13 96 7 1
14 66 3 1
15 82 6 1
1. Anlisis de correlacin .
2. Estimacin de parmetros del modelo
3. Qu variables son significativas en el
modelo?
4. El modelo logra explicar el comportamiento
del desempeo laboral?
5. Qu porcentaje de la variabilidad del
comportamiento del desempeo laboral es
explicada por el modelo propuesto?
6. Si aumenta en 2 puntos la calificacin de
aptitud qu efecto tendra en el
comportamiento del desempeo laboral?
7. Cual es la Varianza esperada
8. Validacin del supuestos del modelo
seleccin
Validacin de supuestos
homogeneidad

Das könnte Ihnen auch gefallen