Sie sind auf Seite 1von 27

Anlisis de Datos

Tema :
Regresin Lineal Mltiple

Dr. Ricardo Castro Garca

Regresin Lineal Mltiple

Objetivos: Al terminar podr:

1.

Realizar una regresin lineal mltiple

2.

Realizar una prueba de hiptesis para probar si la regresin es significativa.

3.

Probar la significancia de la regresin

4.

Obtener una tabla ANOVA para la regresin lineal mltiple

Regresin lineal mltiple

Una de las aplicaciones importantes de los


pronsticos implica la estimacin del valor
de una variable de respuesta Y o la
prediccin de algn valor futuro de Y con
base al conocimiento de una variable
relacionada X Regresin Lineal Simple, o a un
conjunto de variables independientes
relacionadas
X1, X2, . . . Xk, Regresin Lineal Mltiple.

Regresin lineal mltiple

En la mayor parte de los problemas de


investigacin donde se aplica el anlisis de
regresin se necesita ms de una variable
independiente en el modelo de regresin. La
complejidad de la mayor parte de los
mecanismos cientficos es tal que para ser
capaces de predecir una respuesta
importante se necesita un modelo de
regresin mltiple.

Regresin lineal mltiple

Cuando este modelo es lineal en los


coeficientes se denomina modelo de
regresin lineal mltiple. Para el caso de k
variables independientes X1, X2,....,Xk, el valor
de Y est dada por el modelo de regresin
lineal mltiple

Regresin lineal mltiple


Variable
dependiente

Y=f(X1, X2,....,Xk)

Variables
independientes

Variable dependiente: es la variable que se


desea explicar o predecir; tambin se le
denomina variable respuesta.
Variables independientes: Son las variables
que explican a la variable dependiente;
tambin se le denomina regresoras.

Determinacin del modelo de Regresin Lineal Mltiple


Como la regresin lineal mltiple trata de predecir el comportamiento de Y
usando X1, X2,....,Xk entonces se propone un modelo de regresin lineal
mltiple de la forma:
Y 0 1 X 1 2 X 2 .... k X k Caso Poblacional

Y b0 b1 X 1 b2 X 2 .... bk X k e

Caso Muestral

Donde:
Y es llamada la variable de respuesta o dependiente,
X1, X2,....,Xk son las variables predictoras o independientes,
0 es la ordenada al origen del plano de regresin
k es el cambio esperado de la respuesta Y por cambio unitario en Xk
tambin llamados coeficientes de regresin.
es un error aleatorio, el cual se supone que tiene media 0 y varianza
constante 2.

Determinacin del modelo de Regresin Lineal Mltiple

El modelo poblacional solo puede estimarse


con los datos muestrales es decir el modelo

Y 0 1 X 1 2 X 2 .... k X k
Se estima considerando que no es posible
conocer con precisin el error e por lo tanto el
modelo de regresin lineal mltiple queda:

Y b0 b1 X 1 b2 X 2 .... bk X k

Propsito de la Regresin Lineal Mltiple

El propsito del anlisis de regresin


mltiple es determinar un hiperplano que se
ajuste a los datos muestrales mejor que
cualquier otro hiperplano que pueda
dibujarse.

Propsito de la Regresin Lineal Mltiple

Datos para la regresin lineal mltiple


observacin Respuesta

Regresores

X1

X2

Xi

Y1

X11

X12

X1k

Y2

X21

X22

X2k

Y3

X31

X32

X3k

Yn

Xn1

Xn2

Xnk

Mtodo de los Mnimos Cuadrados Ordinarios:


Estimacin de los coeficientes de regresin

El modelo muestral de regresin lineal mltiple


usando los datos anteriores esta dado por:

Yi 0 1 X i1 2 X i 2 .... k X ik i
k

Yi 0 j X ij i
j 1

i 1, 2, 3,..., n

Mtodo de los Mnimos Cuadrados Ordinarios:


Estimacin de los coeficientes de regresin

La solucin de las ecuaciones normales para


los estimadores por mnimos cuadrados son:

0 , 1 , 2 ,..., k
Es mas cmodo manejar los modelos de
regresin lineal mltiple cuando se expresan en
notacin matricial.

Mtodo de los Mnimos Cuadrados Ordinarios:


Estimacin de los coeficientes de regresin

En notacin matricial.

Y X
En donde

Y1
Y
2

Y


Yn

1 X 11 X 1k
1 X

X
12
2k

X X ij

1 X n1 X nk

Mtodo de los Mnimos Cuadrados Ordinarios:


Estimacin de los coeficientes de regresin

En notacin matricial.

Y X

1

2

En donde

0

1

Mtodo de los Mnimos Cuadrados Ordinarios:


Estimacin de los coeficientes de regresin

El estimador de por mnimos cuadrados es

( X X ) X Y
T

El vector de valores ajustados Yi que


corresponden a los valores observados
1

Yi es

X X ( X X ) X Y HY
Y
T

Mtodo de los Mnimos Cuadrados Ordinarios:


Estimacin de los coeficientes de regresin

La matriz H de nn se conoce como la matriz


sombrero:
1

H X(X X) X
T

El error se calcula por:

eYY

e Y X
e Y HY
e (I H)Y

Ejemplo 1
Datos del tiempo de entrega
Una embotelladora de bebidas gaseosas analiza las rutas
de servicio de las maquinas expendedoras en su sistema
de distribucin. Le interesa predecir el tiempo necesario
para que el representante de ruta atienda las maquinas
expendedoras en una tienda. El ingeniero industrial
responsable ha sugerido que las dos variables de estudio
mas importantes que afectan el tiempo de entrega (Y) son
la cantidad de caja de producto establecido (X1), y la
distancia caminada por el representante (X2).

Ejemplo 1
El ingeniero ha reunido 25 observaciones de tiempo de
entrega que se muestran en la siguiente tabla
Datos de tiempo de entrega
Observacin
nmero
1
2
3
4
5

Tiempo De entrega
minutos
Y
16.68
11.5
12.03
14.88
13.75

Cantidad
de cajas
X1
7
3
3
4
6

Distancia
(pies)
X2
560
220
340
80
150

Ejemplo 1
Observacin
nmero
6
7
8
9
10
11
12
13
14
15

Datos de tiempo de entrega


Tiempo De entrega
minutos
Y
18.11
8
17.83
79.94
21.5
40.33
21
13.5
19.75
24

Cantidad
de cajas
X1
7
2
7
30
5
16
10
4
6
9

Distancia
(pies)
X2
330
110
210
1460
605
688
215
255
462
448

Ejemplo 1
Datos de tiempo de entrega
Observacin
nmero
16
17
18
19
20
21
22
23
24
25

Tiempo De entrega
minutos
Y

Cantidad
de cajas
X1

Distancia
(pies)
X2

29
15.35
19
9.5
35.1
17.9
52.32
18.75
19.83
10.75

10
6
7
3
17
10
26
9
8
4

776
200
132
36
770
140
810
450
635
150

Para ajustar el modelo de regresin mltiple primero


se forma la matriz X y el vector Y.

X=

560

16.68

220

11.5

340

12.03

80

14.88

150

330

13.75

110

210

30

1460

605

16

688

10

215

255

462

448

10

776

200

29

18.11
8
17.83
79.94
21.5
40.33
21
13.5
Y=

19.75
24

132

15.35

36

19

17

770

9.5

10

140

35.1

26

810

17.9

450

52.32

635

18.75

150

19.83
10.75

La matriz XTX es

XTX=

560

..

220

..

..

..

..

560

220

..

250

150

25

219

10232

219

3055

133899

10232

133899

6725688

El vector XTYes
16.68

XY=

..

11.5

..

..

560

220

..

250

10.75

599.6
=

7375.44
337072

T
1 T

El estimador de por mnimos cuadrados es ( X X ) X Y

^0
^1

^3

25

219

10232

-1

599.6

219

3055

133899

7375.4

10232

133899

6725688

337072

0.11322

-0.00444

-0.00008

599.6

-0.00454

0.00274

-0.00004

7375.4

-0.00008

-0.00004

0.000001

337072

2.34123
=

1.61591
0.01438

Y =2.34123+1.6159X1+0.0143X2

Anlisis de regresin: Y vs. X1, X2

La ecuacin de regresin es
Y = 2.24 + 1.62 X1 + 0.0146 X2
Predictor
Constante
X1
X2

Coef
SE Coef T
P
2.242
1.121 2.00 0.058
1.6215
0.1746 9.29 0.000
0.0145 0.003694 3.95 0.001

VIF
3.118
3.118

S = 3.33279 R-cuad. = 95.8% R-cuad.(ajustado) = 95.5%


PRESS = 488.935 R-cuad.(pred) = 91.66%

Anlisis de varianza

Fuente

GL

Regresin
Error residual
Total

2
22
24

SC
5620.2
244.4
5864.6

CM

2810.1 252.99 0.000


11.1

Das könnte Ihnen auch gefallen