Sie sind auf Seite 1von 25

1

Anlisis de Regresin Lineal


Simple
LOGRO
Al finalizar la sesin, el estudiante ser capaz de:

Elaborar e interpretar adecuadamente el grfico de dispersin de la variable
independiente y la dependiente.
Plantear adecuadamente un modelo de regresin lineal simple.
Validar el modelo de regresin lineal simple.
Estimar e interpretar los coeficientes del modelo de regresin lineal simple.
Estimar e interpretar correctamente intervalos de confianza para los valores
medio e individuales.
Comprobar el ajuste del modelo de regresin lineal simple.
Realizar las estimaciones adecuadas de la variable de inters del campo de su
especialidad en base a los resultados obtenidos del anlisis de regresin lineal
simple.

2
TEMARIO

Anlisis de Regresin Lineal Simple
Predicciones:
Prediccin puntual
Prediccin intervalo
Se puede estimar la ganancia anual de la
empresa conociendo la inversin en I y D?
4
El vicepresidente de Computadoras S.A, compaa dedicada a la
fbrica y venta de computadores porttiles y de escritorio, opina que las
ganancias anuales de la empresa dependen de la cantidad gastada en
investigacin y desarrollo. Sin embargo, el presidente de la compaa
no est de acuerdo y ha solicitado pruebas.


El vicepresidente necesita pruebas respecto a la relacin
entre las ganancias y la inversin en investigacin y
desarrollo
Qu modelo puede presentar el vicepresidente que sustenten su
teora? Ser esta ecuacin lineal o no lineal?
Qu variables tendr que medir?
Cul es la ecuacin que ayudar a predecir las ganancias
anuales en funcin de la cantidad presupuestada en I y D?
Qu precisin se puede esperar al usar este modelo de toma de
decisiones?
5
6
Anlisis de Regresin Lineal
7
Es el estudio de la relacin lineal existente entre una variable aleatoria
Y, llamada variable dependiente y otra variable X, llamada variable
independiente o explicativa.
El objetivo principal es estimar Y para un valor especifico de X.
El modelo de regresin poblacional tiene la siguiente forma:

0 1 i i i
Y X e | | = + +
i=1, 2, , n
Variable
dependiente
Variable
predictora
(independiente)
Parmetros
Error ~ NID(0,o
2
)
8
Los pares de observaciones pueden representarse grficamente
en un diagrama de dispersin o nube de puntos.
Segn el diagrama de dispersin se puede establecer algn tipo
de relacin lineal entre las variables.
Si el diagrama de dispersin indica la existencia de una relacin
de tipo lineal, entonces se utilizan los datos para estimar esta
ecuacin.
Diagrama de dispersin
9
Diferentes tipos de Diagrama de dispersin:
Posibles Relaciones entre X y Y
Determine en los siguientes casos si existe alguna relacin entre las
variables y cul sera el tipo de relacin que presentan.


10
Ejercicio:
0
0.5
1
1.5
2
2.5
3
3.5
0 2000 4000 6000 8000
A

o
s

d
e

e
s
t
u
d
i
o

Sueldo en nuevos soles
0
0.05
0.1
0.15
0.2
0.25
0.3
0 2 4 6
H
o
r
a
s

d
e

c
a
p
c
i
t
a
c
i

n

Tiempo de produccin de tornillos (en horas)
0
0.5
1
1.5
2
2.5
3
3.5
0 1 2 3 4 5 6
N

m
e
r
o

d
e

t
r
a
b
a
j
a
d
o
r
e
s

Tiempo de produccin de tornillos (en horas)
A
B
C
Modelo lineal
Buen ajuste
Modelo no lineal
Buen ajuste
Variables no relacionadas
El procedimiento matemtico utilizado para el proceso de
estimacin es el de mnimos cuadrados.
El mtodo consiste en determinar una ecuacin que ocasione que
la suma de los errores al cuadro sea mnima.
Los parmetros estimados estn expresados por:
2
1 1
2
1 1 1
1

|
.
|

\
|
|
.
|

\
|
|
.
|

\
|
|
.
|

\
|
|
.
|

\
|
=


= =
= = =
n
i
i
n
i
i
n
i
i
n
i
i i
n
i
i
x x n
y x y x n
|
x y
1 0

| | =
11
Estimacin de parmetros
X Y
1 0

| | + =
Coeficiente de interseccin: . Es valor de la ordenada de la
recta (el valor de y) cuando x = 0.
Coeficiente de regresin poblacional estimada: . Mide el
cambio que se producir en la variable dependiente Y por un cambio
unitario en la variable X. La relacin de X e Y puede ser:
Directa: (pendiente positiva)
Inversa: (pendiente negativa)

)

(
0
|
)

(
1
|
0 >

1
|
0 <

1
|
Donde:
12
Ecuacin estimada
13
Normalidad de los errores:



El estadstico de prueba: Kolmogorov-Smirnov.

Decisin:
Cuando el P-valor > Nivel de significacin
No se Rechaza H0

Los residuos del modelo se distribuyen normalmente. Se cumple el supuesto
de Normalidad de errores.



Supuestos del modelo
e normlament n distribuye se no simple lineal regresin de modelo del residuos Los : H
e normalment n distribuye se simple lineal regresin de modelo del residuos Los : H
1
0
14
Independencia de los errores



Estadstico de prueba: Durbin Watson: Prueba la No correlacin
lineal entre los errores.

ntes independie son no simple lineal regresin de modelo del residuos Los : H
ntes independie son simple lineal regresin de modelo del residuos Los : H
1
0
Autocorrelacin
positiva
Autocorrelacin
negativa
No hay
Autocorrelacin
1 DW 3
0 1 3 4
15
Fuentes de
variacin
Grados de
libertad
Suma de
cuadrados
Cuadrado
medio
F calculado
Regresin 1 SCR CMR (1) Fc

= (1)/(2)
Error n 2 SCE=SCT-SCR CME

(2)
Total n 1 SCT
Hiptesis:
0 : H
0 : H
1 1
1 0
=
=
|
| (No existe relacin lineal entre X e Y)
(Si existe relacin lineal entre X e Y)
Estadstico de prueba:
) 1 , 2 , 1 (
F ~ F
o
=
n calc
CME
CMR
( )
n
Y
Y SC SCT
i
i Y
2
2

= =
( )
n
X
X SC
i
i
X
2
2

=
X
SC SCR =
2
1
|
Validar el modelo : Anlisis de variancia
Coeficiente de determinacin:
16
Medida de Bondad de Ajuste: Mide la proporcin de la variabilidad
total de Y que es explicada por X a travs del modelo de regresin
lineal simple.
Coeficiente de no determinacin:
Expresa la proporcin de la variabilidad de Y que es no es explicada
por el modelo de regresin estimado.
2 2
: 0 1
SCR
R siendo R
SCT
= s s
SCT
SCR
R = 1 1
2
2
R
2
1 R
Ajustes del modelo
17
Coeficiente de determinacin: R
2
18
Intervalos de confianza
Para un valor medio:
SCX
x x
n
Se t y IC
GLE i y
i
2
0
) 2 / , (
) ( 1

) (

+ =
o

Para un valor individual:


SCX
x x
n
Se t y Y IC
GLE i i
2
0
) 2 / , (
) ( 1
1

) (

+ + =
o
donde:
CME = Se
0 1 0 0

x y | | + =
Prediccin
El vicepresidente de la empresa Computadoras S.A con el objetivo de probar que
existe una relacin entre las ganancias anuales y la cantidad gastada en
investigacin y desarrollo, ha obtenido la siguiente informacin mensual elegida al
azar.




A un nivel de significacin del 5%,
a. Verifique si se cumplen los supuestos necesarios para elaborar el anlisis de
regresin.
b. Valide el modelo a travs del anlisis de variancia.
c. Presente el modelo estimado e interprete los coeficientes de regresin
estimados.
d. Determine la variancia total de la variable dependiente explicada a travs del
modelo.
e. Estime e interprete con una confianza del 95% la ganancia anual, si se invierten
$ 32,000 en I&D.






19
Ejercicio:
Y = Ganancia anual
(miles de dlares)
91 95 93 98 97 97 92 94 89 90 92 95
X = Inversin en I &D
(miles de dlares)
33 12 18 3 4 8 20 5 37 33 15 10
a. Verifique si se cumplen los supuestos necesarios para elaborar el anlisis de
regresin.













A un nivel de significacin del 5%, p-valor > 0.05, no existe evidencia estadstica
para rechazar Ho.
Los residuos del modelo de regresin lineal simple se distribuyen normalmente.






20
Ejercicio:
e normlament n distribuye se no simple lineal regresin de modelo del residuos Los : H
e normalment n distribuye se simple lineal regresin de modelo del residuos Los : H
1
0
a. Verifique si se cumplen los supuestos necesarios para elaborar el anlisis de
regresin.














Dado que el valor estadstico Durbin Watson est entre 1 y 3, podemos afirmar
que los residuos del modelo de regresin lineal simple son independientes.







21
Ejercicio:
ntes independie son no simple lineal regresin de modelo del residuos Los : H
ntes independie son simple lineal regresin de modelo del residuos Los : H
1
0
1DW3
Anlisis de regresin: Y = Ganancia anual X = Inversin en I &D
Anlisis de Varianza

Fuente GL SC Ajust. MC Ajust. Valor F Valor p
Regresin 1 77.8527 77.8527 51.68 0.000
X = Inversin en I&D 1 77.8527 77.8527 51.68 0.000
Error 10 15.0640 1.5064
Falta de ajuste 9 14.5640 1.6182 3.24 0.408
Error puro 1 0.5000 0.5000
Total 11 92.9167


Estadstico de Durbin-Watson = 1.60744

b. Presente el modelo estimado e interprete los coeficientes de regresin
estimados.





22
Ejercicio:
X Y 221 . 0 2 . 97

=
221 . 0

1
= |
2 . 97

0
= |

Coeficientes

EE del
Trmino Coef coef. Valor T Valor p VIF
Constante 97.238 0.620 156.93 0.000
X = Inversin en I &D (miles de -0.2215 0.0308 -7.19 0.000 1.00


Ecuacin de regresin

Y = Ganancia anual = 97.238 - 0.2215 X = Inversin en I&D
23
c. Valide el modelo a travs del anlisis de variancia.

H0: 1=0
H1: 10







Estadstico de prueba: F=51.68 P-valor=0.000 < alfa=0.05 Se Rechaza H0

A un nivel de significacin del 5%, existe relacin lineal entre las ganancias anuales y la
cantidad gastada en investigacin y desarrollo.

d. Determine la variancia total explicada de la variable dependiente a travs del modelo.

Ejercicio:
(No existe relacin lineal entre la cantidad gastada en I y D, y las ganancias anuales)
(Si existe relacin lineal entre la cantidad gastada en I y D, y las ganancias anuales)
Anlisis de regresin: Y = Ganancia anual X = Inversin en I D
Anlisis de Varianza

Fuente GL SC Ajust. MC Ajust. Valor F Valor p
Regresin 1 77.8527 77.8527 51.68 0.000
X = Inversin en I &D (miles de 1 77.8527 77.8527 51.68 0.000
Error 10 15.0640 1.5064
Falta de ajuste 9 14.5640 1.6182 3.24 0.408
Error puro 1 0.5000 0.5000
Total 11 92.9167


d. Estime e interprete con una confianza del 95% la ganancia anual si se invierten $
32,000 en I&D.






24
Ejercicio:
SCX
x x
n
Se t y Y IC
GLE i i
2
0
) 2 / , (
) ( 1
1

) (

+ + =
o
( ) (87.112 ; 93.189)
i
IC Y =
Autoevaluacin
1. Uno de los supuestos de un modelo de regresin es que los
errores se distribuyan normalmente.

2. El coeficiente de no determinacin expresa la proporcin de
variabilidad explicada con el modelo de regresin.

3. A travs del modelo de regresin se pueden realizar
estimaciones futuras respecto a la variable independiente.

( F )
Indique V o F segn corresponda en los siguientes
enunciados:
25
( F )
( F )

Das könnte Ihnen auch gefallen