You are on page 1of 4

Taller Machine Learning

Einer Mejia Lpez y Eduardo Moya


7 de marzo de 2017

1. En el conjunto de datos mtcars, ajustar un modelo de regresin lineal de weight (predictor) en mpg
(respuesta). Obtenga un intervalo de confianza del 95% para las mpg esperado en el weight promedio. Cul
es el limite inferior del intervalo?. Como se interpreta el coeficiente del weight?
Tomando las variables asignadas tendriamos el siguiente modelo

data(mtcars)
pred <- mtcars[,"wt"]
res <- mtcars[,"mpg"]
reg<-lm(res~pred);reg

##
## Call:
## lm(formula = res ~ pred)
##
## Coefficients:
## (Intercept) pred
## 37.285 -5.344

As, se tiene que el modelo lineal ajustado es

yb = 37.285 5.344(W t)

Por lo tanto tenemos que por cada unnidad en que incremente el peso del vehiculo tendremos como respuesta
que el promedio de millas por galon se vera reducida en 5.344.
Luego un intervalo de confianza para mpg esperado en el weight promedio es:
s
1 2
(X0 X)
E(by ) t(0.95,n2) +P
2
b
n (Xi X)

entonces

predict(reg, newdata = data.frame(pred = mean(pred)), interval = ("confidence"))

## fit lwr upr


## 1 20.09062 18.99098 21.19027

As, el limite inferior del intervalo de confianza al 95% es 18.99098


2. Considere nuevamente la regresin en el conjunto de datos mtcars, con mpg como (respuesta) del weight
(en 1,000 lbs), Una tonelada corta se define como 2.000 libras. Construir un intervalo de confianza del 95%
para el cambio esperado en mpg por 1 aumento de peso de tonelada corta. D el limite inferior.
Cambiaremos la unidad del predictor de 1000 libras a 2000 libras. Tenemos que

1
reg1 <- lm(res ~ I(pred/2))
Coef <- coef(summary(reg1))
(Coef[2,1] + c(-1, 1) * qt(.975, df = reg1$df) * Coef[2, 2])

## [1] -12.97262 -8.40527

Por lo tanto el limite inferior es -12.97262


3. Considere el conjunto de datos mtcars, ajuste un modelo de regresin con mpg como la respuesta incluya el
nmero de cilindros cyl como variable factor y weight como variable de confusin. D la estimacin ajustada
para el cambio esperado en mpg comparando 8 cilindros con 4.
primero convertimos las variables columna a factor para hacer la comparacin

mtcars$cyl <- factor(mtcars$cyl)


mtcars$am <- factor(mtcars$am)
levels(mtcars$am) <- c('-auto', '-manual')

Luego se ajusta el modelo

reg2 <- lm(mpg ~ cyl + wt, mtcars);reg2

##
## Call:
## lm(formula = mpg ~ cyl + wt, data = mtcars)
##
## Coefficients:
## (Intercept) cyl6 cyl8 wt
## 33.991 -4.256 -6.071 -3.206

Por lo tanto la estimacin ajustada para el cambio esperado en mpg comparando 8 cilindros con 4 es:

summary(reg2)$coef[3, 1]

## [1] -6.07086

4. Considere el conjunto de datos mtcars, ajuste un modelo como sigue:

reg3<-lm(mpg ~ I(wt * 0.5) + factor(cyl), data = mtcars)

Como se interpreta el coeficiente wt ?


Se ajusto el siguiente modelo

reg3

##
## Call:
## lm(formula = mpg ~ I(wt * 0.5) + factor(cyl), data = mtcars)
##
## Coefficients:
## (Intercept) I(wt * 0.5) factor(cyl)6 factor(cyl)8
## 33.991 -6.411 -4.256 -6.071

2
As el coeficiente wt se interpreta como el cambio estimado que se espera en MPG por una tonelada de
aumento de peso para un nmero especfico de cilindros ya sea 4, 6 o 8.
5. Considere el siguiente conjunto de datos

x = c(0.586, 0.166, -0.042, -0.614, 11.72)


y = c(0.549, -0.026, -0.127, -0.751, 1.344)

De la diagonal de la matriz Hat para el punto ms influyente. se tienen los siguientes datos

pred

## [1] 2.620 2.875 2.320 3.215 3.440 3.460 3.570 3.190 3.150 3.440 3.440
## [12] 4.070 3.730 3.780 5.250 5.424 5.345 2.200 1.615 1.835 2.465 3.520
## [23] 3.435 3.840 3.845 1.935 2.140 1.513 3.170 2.770 3.570 2.780

res

## [1] 21.0 21.0 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 17.8 16.4 17.3 15.2
## [15] 10.4 10.4 14.7 32.4 30.4 33.9 21.5 15.5 15.2 13.3 19.2 27.3 26.0 30.4
## [29] 15.8 19.7 15.0 21.4

Luego se ajusta el modelo

reg4 <- lm(res ~ pred);reg4

##
## Call:
## lm(formula = res ~ pred)
##
## Coefficients:
## (Intercept) pred
## 37.285 -5.344

As los valores de la matrix hat son:

h<-hatvalues(reg4);h

## 1 2 3 4 5 6
## 0.04326896 0.03519677 0.05837573 0.03125017 0.03292182 0.03323551
## 7 8 9 10 11 12
## 0.03544265 0.03127502 0.03140238 0.03292182 0.03292182 0.05575179
## 13 14 15 16 17 18
## 0.04010861 0.04192052 0.17047665 0.19533191 0.18379417 0.06611662
## 19 20 21 22 23 24
## 0.11774978 0.09562654 0.05031684 0.03433832 0.03284761 0.04431718
## 25 26 27 28 29 30
## 0.04452785 0.08664873 0.07035096 0.12911356 0.03132522 0.03798993
## 31 32
## 0.03544265 0.03769190

Luego el mas influyente es:

3
max(hatvalues(reg4))

## [1] 0.1953319