Sie sind auf Seite 1von 17

REGRESION LINEAL Y MULTIPLE

YAIR ANTONIO ARTEAGA ARTEAGA


FREY FERNANDO BALLESTEROS DIAZ
TANIA MILENA CASTRO PEA
Tutor (a)
MARCOS CASTRO

UNIVERSIDAD DE CARTAGENA
A Programa: INGENIERIA DE SISTEMAS
ESTADISTICA INFERENCIAL
V SEMESTRE
LORICA-CORDOBA
2016

1. Sobre un conjunto de conductores se ha realizado una encuesta para analizar su edad


(Y) y el nmero de accidentes que han sufrido (X). A partir de la misma, se
obtuvieron los siguientes resultados:
X/Y
0
1
2

(20,30 (30,40 (40,50


]
]
]
74
82
78
7
6
5
3
2
2
2

(50,60 (60,70
]
]
72
7
6
5
1
1

A partir de estos datos, se le pide que determine para esta distribucin las curvas de
regresin de
Y sobre X y de X sobre Y.
Sea y: la variable edad(x)
X: la variable nmeros de accidentes (y)
PROMEDIO DE EDAD
25
35
45
55
65
25
35
45
55
65
25
35
45
55
65

NUMERO DE
ACCIDENTES
0
0
0
0
0
1
1
1
1
1
2
2
2
2
2

NUMERO DE
PERSONAS
74
82
76
72
7
7
6
5
6
5
3
2
2
1
1

La curva de y sobre x es

b=

,
,

a=

=196

b=
a=
y/x= -2,23880x+47.089
ahora de x/y
,

=455625

b=
a=
x/y=0.000000001x+0.933
2. Para la economa espaola, disponemos de los datos anuales redondeados sobre
consumo final de los hogares a precios corrientes (Y) y renta nacional disponible neta
(X), tomados de la Contabilidad Nacional de Espaa base 1995 del INE, para el
perodo 1995-2002, ambos expresados en miles de millones de euros:
AO 1995
1996
1997
1998
1999
2000
2001
2002
Yt

2586

2736

2897

3089

3310

3550

3771

4004

Xt

3817

4022

4265

4543

4865

5202

5533

5900

Considerando que el consumo se puede expresar como funcin lineal de la renta (Yt=a + b
Xt), determine:

a) Los parmetros a y b de la recta de regresin.


Sea y: la variable consumo
X: la variable renta Los
parmetros son

b=

n=8

b
b

b= 0.6834

a=
a
a= 160138
b) La varianza de la variable consumo y su descomposicin en varianza explicada y no
explicada por el modelo.

La varianza explicada es:

El modelo es:

y= 0.6834x-1.60

= 9658,88
La varianza del no explicada del modelo es:

c) el coeficiente de determinacin

Donde
Sxy=
Sxx=
Syy=

=0.999800

d)

si la renta para x=650.00 millones de euros, entonces las


predicciones y^= 0.6834x-1.60 y^=0.6834(650.000)-1.60

=444208.4 millones de euro

e)

r=

donde

Sxx=

Syy=
Sxy=
Sxx=
Sxx =38289.638
Syy=
Syy =17887.72
Sxy=
Sxy =26168.26375
r=

3. Se supone que se puede establecer cierta relacin lineal entre


las exportaciones de un pas y la produccin interna de dicho
pas.
En el caso de Espaa, tenemos los datos anuales
(expresados en miles de millones de pesetas) para tales
variables correspondientes al quinquenio 1992-96 en la
siguiente tabla:
A Produc
os cin
19
92 52.654
19
93 53.972
19
94 57.383
19
95 61.829
19
96 65.381

Exportaci
ones
10.420
11.841
14.443
16.732
18.760

A partir de tal informacin, y considerando como vlida dicha


relacin lineal, se pide: a) Si la produccin para el ao 1997 fue
de 2.210.6100 millones de pesetas, cul sera la prediccin de
las exportaciones para este ao?
Qu grado de precisin
tendra dicha prediccin?
b) Si sabemos que las exportaciones para 1997 fueron de
69.045.704 millones de pesetas, cul sera la produccin
interna aproximada para ese ao? Qu grado de confianza
dara usted a esta prediccin?
c) Qu tanto por ciento de la varianza de las exportaciones
no
vienen explicadas por la Produccin interna, y se
debe a otro tipo de variables?
d) e) El coeficiente de correlacin
sea y: variable produccin
X: variable exportacin

Y=bx + a
#=bx + n
a) Para saber la produccin de las exportaciones calculamos el modelo de
regresin de la forma:

Y: bx + a

donde b

a=
n=5

b=

b=
b=1.55070
a=
luego el mdulo de regresin es:
y^= 1.55070x +179.2643
1. Como la produccin para el ao 1997 fue de 2210.6100 millones
de pesetas.
2210.6100= 1.55070x+179.2643
2210.6100-179.2643=1.55070x
2031.345604=1.55070x

X=
X=1309.953959 millones de exportaciones

2. Para el grado de precisin hacemos


Y-

Para x= 1309.95
Y=1.55070(1309.95)+ 179.2643
=2210.60
Con

1----t

t0.05/2= 0,025, n=5


9

.025, v=n-1 ------t0,025,

4=2,776

Sxx=

a) Como las exportaciones para el ao 1997 son de 69045704


millones, entonces la produccin interna seria para este ao de:
Y=1.55070(69045709)+ 179.2643
Y =1070693525 millones de pesetas, comparando este valor y el
del punto anterior el grado de confianza sea de 95%.
3. Para esto calculamos
Ry/x= r
S2xy=
S2xy =

S2xy =
S2xy = 5273.78

10

Sxx=
Sxx= 1089.28
Syy=

r
r
r2=0,9876 r2=98.76%
100-98.76%=1.24% de varianza que no es explicada por las
variables. Coeficiente de correlacin
r=
r=

4. De una distribucin de dos variables se conocen los


siguientes datos: rxy = 09; sx = 12; sy = 21; x =5; y =10 A
partir de los mismos, obtnganse las rectas de regresin
mnimo cuadrticas de X sobre Y y de Y sobre X.

rXy=0.9,

sx= 1,2 ,

como rxy=

sy=2,1

, x=5,

mxy=

rxsxsy mxy=(0.9)(1.20)(2.10)
mxy =2,26
bxy=

= bxy=

11

y=10

x=bxy(y-y^)+x x
=0,51(y-10)+5 x
=0,51(y-10)+5 x
=0,51y-5,1+5
X= 0,51y-0,1

Y para y sobre x y=
bxy(x-x)+y y=0.51(x5)+10 y =0,51x 2,25 +
10 y =0,51x 7,45
5. A partir de un conjunto de valores de las variables X e Y,

se ha determinado la regresin de Y sobre X, obtenindose


la siguiente recta:
Y*=10+045X; R2=09; x =20
Se pide que, a partir de la definicin de la anterior recta,
determine los parmetros de la recta de regresin de X sobre
Y.

sea y= 10 + 0.45x ,
un r2= 0,9
, x=20
Hallar los parmetros a y b de la ecuacin y= bx + a a= y
bx de la ecuacin bxy 0,45, pero x=bxy(y-y) + x sobre y.
como bxy= 0,45 axy= 10 dyx= y
bxy X r2=

byxbxy

entonces 0.9=

byxbxy

12

byx=2 entonces

byx=

ayx= 10

0,45(20) ayx =1 luego los parmetros son


ayx=1 ,

byx=2

7. Se han observado, en varios modelos de automviles, los datos de

potencia del motor (X), en caballos, y la aceleracin (Y), medida


en el
nmero de segundos necesarios para acelerar de 0 a
100 Km./h.
La tabla adjunta refleja los valores
obtenidos.
X
Y

50
15

75
12

90
105

100
10

120
9

150
8

A partir de tales datos, se ha decidido expresar la aceleracin en


funcin de la potencia mediante el ajuste de una funcin
potencial
(mediante el correspondiente cambio logartmico). Bajo esta
hiptesis: a) Determine la funcin de ajuste y el ECM
conseguido.
b) Si aumenta la potencia de un motor en un 10%, en qu
porcentaje repercutir dicho aumento en la aceleracin
prevista? Depende ello de la potencia que tenga el motor en
cuestin?
c) El coeficiente de correlacin.
Sea y: variable aceleracin
X: variable motor
a) Para determinar la funcin de ajuste y ECM mediante el modelo =
bx + a

b=

13

a=

= 20.85132, luego la funcin

de ajuste es:
= -0.06796x + 20.85132
El error cuadrtico medio es:
SSE =

SSE = 30.875 28.11845 = 2.75655


b) si x= 10 y se aumenta en 10% entonces x= 10.1
= -0.06796(10.1) + 20.85132 = 20.1649
= -0.06796(10) + 20.85132 = 20.17

Repercutir en el aumento significativo de 0.01 o 1% en la


aceleracin prevista, si clara a mayor potencia mayor aceleracin.}

c)

= 5875 Sxx =

= 63125 -

Syy =

8. En un nuevo proceso artesanal de fabricacin de cierto artculo


que est implantado, se ha considerado que era interesante ir
anotando peridicamente el tiempo medio (medido en minutos)
que se utiliza para realizar una pieza (variable Y) y el nmero de
das desde que empez dicho proceso de fabricacin (variable X).
Con ello, se pretende analizar cmo los operarios van
adaptndose al nuevo proceso, mejorando paulatinamente su

14

ritmo de produccin conforme van adquiriendo ms experiencia


en l. A partir de las cifras recogidas, que aparecen en la tabla
adjunta, se decide ajustar una funcin exponencial que explique
el tiempo de fabricacin en funcin del nmero de das que se
lleva trabajando con ese mtodo.

X 1
0
Y 3
5

2
0
2
8

3
0
2
3

4
0
2
0

5
0
1
8

6
0
1
5

7
0
1
3

Desde el correspondiente ajuste propuesto, se pide que


determine:
a) Qu tiempo se predecira para la fabricacin del artculo
cuando se lleven 100 das?
b) Qu tiempo transcurrira hasta que el tiempo de fabricacin
que se prediga sea de 10 minutos?
c) Qu porcentaje de tiempo se reduce por cada da que pasa?
d) El coeficiente de correlacin
sea:

Y: la variable tiempo medio para realizar una pieza X:


la variable nmero de das del proceso de fabricacin.
a) Determinar el modelo que prediga la
donde

b
a=

= 35.5714- 0.34642(X)
Ahora para x = 100 das, el tiempo medio de fabricacin de la
pieza es de:
= 35.5714- 0.34642 (100) = 0.9294
b) Cuando y = 10 minutos, el tiempo transcurrido de fabricacin de la pieza es:

15

= 35.5714- 0.34642(X)
10- 35.5714 = -0.34642(X)
- 25.5714 = 0.34642(X)
X=
c) El coeficiente de correlacin es:

10Un estudiante de la Escuela Universitaria de Estudios


Empresariales de la 10. Universidad de Sevilla, para poder
pagarse sus estudios, debe trabajar como camarero en un bar
de copas de su localidad. A este establecimiento, suelen
acudir todos los jvenes de la zona. Este ao, con los
conocimientos aprendidos, decide por fin estudiar la relacin
existente entre la cantidad de sal de las galletas saladas y el
consumo de bebidas, ya que es costumbre dar al cliente este
aperitivo cuando pide una consumicin. Se sabe que las
galletas no pueden tener una concentracin de sal superior a
3'5 gramos por cada 1000 galletas y, por ello, decide ir
variando a partir de 1 gramo la concentracin de 0'5 en 0'5
gramos cada semana e ir anotando el incremento en caja
semanalmente, obteniendo la siguiente tabla:
Gramos de sal por

16

Ingresos

1000
1
1,5
2
2,5
3

140300
150000
165000
175000
200000

A partir de tales cifras, se quiere conocer:


a) Considera justificado el planteamiento de un modelo lineal
para expresar la relacin entre las variables?
b) Si el propietario desea unos ingresos de 160.000 pesetas, qu
cantidad de sal debera aportar por cada 1000 galletas? Si
aporta el mximo permitido de sal, cul sera el ingreso en
caja? Explicar cul de las dos predicciones le merece mayor
confianza.
c) Cul sera la variacin porcentual de los ingresos cuando la
cantidad de sal aumenta en un 1% sobre el ltimo valor de la
tabla? Si aumentamos en 1gr. la sal por cada 1000 galletas,
cunto variarn los ingresos?
d) El coeficiente de correlacin Sea:
y: La variable ingreso x: La
variable gramos de sal

Luego el modelo es = bx +a entonces = 28880x + 108300


Si los ingresos son y=160000 pesetas
17

160000 = 28880x + 108300


160000 108300 = 28880x

Si se aparta el mximo de sal el ingreso ser:


= 28880(3.5) + 108300 = 209380 pesetas
El modelo formal explica mejor el comportamiento de los ingresos ya que
est ms ajustado.
c)

Si se aumenta en 1% sobre el ltimo valor tenemos:


= 28880 (3.03) + 108300 = 195806.4 pesetas
Para x=3
= 28880 (3) + 108300 = 194940 pesetas
Luego la variacin porcentual es:

d) El coeficiente de correlacin es:

18