Sie sind auf Seite 1von 4

Ubungsblatt 5 BK05 Mathematik und Statistik

Lineare Regression in R
10.11.2014

Juttas VW, die Zweite

Jutta A. mochte ihren 5 Jahre alten VW verkaufen und findet in der NRZ folgende Verkaufsangebote
f
ur das gleiche Modell:
Preis [1000 e]

9.45

8.40

6.80

6.50

4.75

1.47

8.60

5.60

2.70

3.89

Alter [Jahre]

10

Dateneingabe:

> vw <- data.frame(


+
alter = c(
1,
2,
3,
3,
6,
10,
2,
4,
8,
7),
+
preis = c(9.45, 8.40, 6.80, 6.50, 4.75, 1.47, 8.60, 5.60, 2.70, 3.89)
+
)
Grafische Darstellung als Scatterplot:

> plot(vw$alter, vw$preis,


# erst x, dann y
+
xlim = c(0, 11),
# L
ange x-Achse
+
ylim = c(0, 11),
# L
ange y-Achse
+
xlab = "Alter (Jahre)",
# Beschriftung x-Achse
+
ylab = "Verkaufspreis (1000 Euro)",
+
main = "Verkaufspreise von VWs in Abh
angigkeit vom Alter")
>
> # Argument main: Titel
uber dem Diagramm

10

Verkaufspreise von VWs in Abhngigkeit vom Alter

Verkaufspreis (1000 Euro)

6
Alter (Jahre)

10


Ubungsblatt
5

BK05 WiSe 2014/15

Varianzen und Kovarianz:

> var(vw$alter)
[1] 8.933333
> var(vw$preis)
[1] 6.951049
> cov(vw$alter, vw$preis)

# egal, ob x oder y zuerst

[1] -7.750667
Geradengleichung mit Methode der kleinsten Quadrate:

> vw.model <- lm(vw$preis ~ vw$alter) # y ~ x


> vw.model
Call:
lm(formula = vw$preis ~ vw$alter)
Coefficients:
(Intercept)
9.8070

vw$alter
-0.8676

Ausgleichsgerade: y = f (x) = 9.807 0.868x


Ausgleichsgerade einzeichnen:

> plot(vw$alter, vw$preis,


+
xlim = c(0, 11),
+
ylim = c(0, 11),
+
xlab = "Alter (Jahre)",
+
ylab = "Verkaufspreis (1000 Euro)",
+
main = "Verkaufspreise von VWs in Abh
angigkeit vom Alter")
> abline(vw.model)
# Geradengleichung


Ubungsblatt
5

BK05 WiSe 2014/15

10

Verkaufspreise von VWs in Abhngigkeit vom Alter

Verkaufspreis (1000 Euro)

10

Alter (Jahre)

Pearsonscher Makorrelationskoeffizient r:

> cor(vw$alter, vw$preis)

# egal, ob x oder y zuerst

[1] -0.9835742
Bestimmtheitsma B:

> cor(vw$alter, vw$preis)^2


[1] 0.9674182

BK05 WiSe 2014/15

Ubungsblatt
5

Orangenb
aume

An f
unf Orangenb
aumen wurde zu verschieden Zeitpunkten (in Tagen nach der Auspflanzung) der
Stammumfang in mm gemessen. Die Daten sind im Datensatz Orangen.dta gespeichert.
a)

Welcher Korrelationstyp liegt hier vor? Was ist also X, was Y ?

b) Stellen Sie den Zusammenhang zwischen Alter und Umfang grafisch dar. Besteht hier ein in etwa
linearer Zusammenhang?
c) Bestimmen Sie die Geradengleichung, die den Zusammenhang zwischen Alter und Stammumfang
beschreibt. Zeichnen Sie die ermittelte Gerade auch in Ihre grafische Darstellung ein.
d)

Welchen Stammumfang hatten die Baume ungefahr am Tag der Auspflanzung?

e) Berechnen Sie eine geeignete Mazahl, um die Starke des Zusammenhangs zwischen Alter und
Stammumfang zu quantifizieren.
f) Berechnen Sie die Standardabweichung f
ur die Umfange der ersten Messung (Tag 118) und der
letzten Messung (Tag 1582). Sehen Sie sich auch den Scatterplot noch einmal an. Welche Aussage
l
asst sich bez
uglich der Streuung treffen? Welche Erklarung gibt es daf
ur? Welche Voraussetzung der
linearen Regression ist hier eigentlich verletzt? Was bedeutet das f
ur die Verlasslichkeit, mit der wir
den Stammumfang der B
aume mit Hilfe unserer Regressionsgleichung vorhersagen konnen?