Sie sind auf Seite 1von 9

Klausur Quantitative Methoden I — Statistik Prof. Dr.

Jörg Naeve

Klausur QM I - Teil 2: Statistik


Wintersemester 2014 / 2015
Name: Matrikelnummer:

Bitte bearbeiten Sie alle vier Aufgaben. In jeder Aufgabe ist die erreichbare Punktzahl
angegeben. Sie können in diesem Teil 50 der insgesamt 100 Punkte erreichen, sollten also
etwa die Hälfte der verfügbaren Gesamtzeit von 120 Minuten auf diesen Teil verwenden.
Auf dem Klausurbogen befindet sich nach jeder Teilaufgabe ein Kästchen. In dieses
Kästchen schreiben Sie bitte Ihre Lösung.
Viel Erfolg!

Aufgabe 1
Bitte geben Sie bei den folgenden Merkmalen jeweils die passende Messskala an (denken
Sie dabei daran, die drei möglichen Kardinalskalen zu unterscheiden). Handelt es sich
um diskrete oder stetige Merkmale? Sind die Merkmale häufbar? (10 Punkte)
1.1 Der Gewinn eines Unternehmens bei unterschiedlichen Produktionsplänen.
Lösung:
Die passende Messskala ist eine Verhältnisskala (kardinal), da zwar der Nullpunkt fest-
liegt, die Einheit aber variieren kann (Euro, Cent, Dollar etc.). In unseren Modellen
handelt es sich um ein stetiges Merkmal, mit einer kleinsten Geldeinheit wird es diskre-
tisiert. Es ist nicht häufbar, es sei denn man würde den Gewinn nach unterschiedlichen
Bilanzierrungsmethoden berechnen.

1.2 Die Zahl der Strafrunden unterschiedlicher Mannschaften in einem Biathlon-


Staffelrennen.
Lösung:
Die passende Messkala ist eine Absolutskala (kardinal). Es handelt sich um ein diskretes
und nicht häufbares Merkmal.

Seite 1 von 9
Klausur Quantitative Methoden I — Statistik Prof. Dr. Jörg Naeve

1.3 Die Bachelorabschlüsse der Bewerberinnen für ein Masterprogramm.


Lösung:
Dies ist ein nominales Merkmal (man könnte es allerdings nach der Eignung für das
Masterprogramm auch als ordinal auffassen). Es handelt sich um ein diskretes Merkmal.
Es ist häufbar, da Bewerberinnen mehr als einen Bachelaorabschluss besitzen können.

1.4 Der Siedepunkt unterschiedlicher Lösungen in einem Chemie-Labor.


Lösung:
Die passende Messkala ist eine Intervallskala (kardinal), da bei der Temperatur sowohl
der Nullpunkt als auch die Einheit variabel sind. Es ist ein stetiges Merkmal, das nicht
häufbar ist.

1.5 Die Platzierung von Musiktiteln in einer Jahreshitparade 2014.


Lösung:
Dies ist ein ordinal messbares Merkmal. Es handelt sich um ein diskretes Merkmal.
Da es unterschiedliche Jahreshitparaden gibt, liegt es nahe, es als häufbar anzusehen,
wenngleich ein titel in jeder konkreten Jahreshitparade nur eine Platzierung hat.

Seite 2 von 9
Klausur Quantitative Methoden I — Statistik Prof. Dr. Jörg Naeve

Aufgabe 2
Bundesverkehrsminister Dobrinth möchte in einer Rede etwas zur Entwicklung des deut-
schen Fernbusmarkts nach der Liberalisierung im Jahr 2013 sagen. In seinem Ministeri-
um wurden dazu bereits einige Daten gesammelt. Da allerdings alle Mitarbeiter derzeit
voll damit ausgelastet sind, die neue Mautplakette zu entwerfen, beauftragt Dobrinth
Sie, aus den vorliegenden Daten jeweils einen geeigneten Mittelwert zu berechnen. Da
er Studierenden nicht-bayerischer Hochschulen gegenüber grundsätzlich eher skeptisch
ist, möchte er jeweils auch eine Begründung dafür, welchen Mittelwert Sie verwenden.
(10 Punkte)

2.1 Eine repräsentative Fahrgastanalyse hat ergeben, dass unter den Fahrgästen
473 Schülerinnen, 546 Schüler, 176 Hausfrauen, 908 Studentinnen, 1024 Studenten, 908
männliche Arbeitnehmer, 423 weibliche Arbeitnehmer und 245 Personen waren, deren
Status nicht aufgenommen wurde. Berechnen Sie bitte einen Mittelwert für den Status
der Fahrgäste in der Studie.
Lösung:
Der Status ist ein nominales Merkmal, daher eignet sich als Mittelwert nur der dichteste
oder häufigste Wert. Dieser ist x̄D = Student (1024).

2.2 Die sieben großen Anbieter von Fernbusverbindungen haben 40, 8, 19, 210, 48, 250
und 55 vollzeitäquivalente Stellen geschaffen. Bitte Sie berechnen einen Mittelwert für
die Zahl dieser Stellen.
Lösung:
Hier handelt es sich um ein metrisches Merkmal (Absolutskala), das aufsummiert wird.
Hier ist also das arithmetische Mittel anzuwenden.
1 1
x̄ = (40 + 8 + 19 + 210 + 48 + 250 + 55) = · 630 = 90, 00.
7 7
Die durchschnittliche Zahl der Stellen ist 90.

Seite 3 von 9
Klausur Quantitative Methoden I — Statistik Prof. Dr. Jörg Naeve

2.3 In einer Zufriedenheitsumfrage unter den Fernbusreisenden wurde ermittelt, dass


17 Prozent sehr zufrieden, 32 Prozent zufrieden, 31 Prozent einigermaßen zufrieden und
20 Prozent unzufrieden waren. Bitte Sie berechnen einen Mittelwert für das Maß an
Zufriedenheit unter den befragten Fahrgästen.
Lösung:
Es handelt sich in diesem Fall um ein ordinales Merkmal. Daher ist der Median oder
Zentralwert x̄Z der geeignete Mittelwert.
Der Median ist einigermaßen zufrieden“, da der Anteil der Befragten, die zufriedener
17 ”32 49
sind, mit 100 + 100 = 100 = 0, 49 kleiner ist als 12 = 0, 5 und der Anteil derer, die
20
unzufriedener sind, mit 100 = 0, 20 ebenfalls.

2.4 Zuletzt wurde für das Jahr 2013 festgestellt, dass die Fahrgastzahlen in Fernbussen
im ersten Quartal um 41.558309 Prozent, im zweiten Quartal um 26.073432 Prozent, im
dritten Quartal um 78.467418 Prozent und im vierten Quartal um 58.945103 Prozent
zugenommen hat. Berechnen Sie einen Mittelwert für die Veränderung der Zahl der
Fernbusreisenden über den betrachten Zeitraum.
Lösung:
Es handelt sich hier um ein metrisches Merkmal. Die Steigerungsraten werden über die
Quartale multiplikativ verknüpft. Daher verwenden wir das geometrische Mittel x̄G .
1
x̄G = (1.41558309 · 1.26073432 · 1.78467418 · 1.58945103) 4

1
= (5.0625) 4 = 1.5.

Durchschnittlich hat sich die Zahl der Fernbusreisenden pro Quartal um 50 Prozent
erhöht.

Seite 4 von 9
Klausur Quantitative Methoden I — Statistik Prof. Dr. Jörg Naeve

Aufgabe 3

Gegeben seien die folgenden Paare von Beobachtungen für die Merkmale X und Y :
(2; 2), (1; 2), (1; 4) und (1; 2). (15 Punkte)
3.1 Bestimmen Sie die folgenden Zusammenhangsmaße
a) die Kovarianz

Lösung:
Wir benutzen eine Tabelle:
xi yi xi · yi
8 8 64
4 8 32
4 16 64
4 8 32
1
P
4
· 5 10 48

Die Mittelwerte sind x̄ = 5 und ȳ = 10. Die Kovarianz ist COV (X, Y ) = 48−10·5 = −2.

b) den Korrelationskoeffizienten

Lösung:
Der Korrelationskoeffizient ist rXY = COV(X,Y
sX sY
)
. Wir benötigen also noch die Standard-
abweichungen bzw. die Varianzen. Diese ermitteln wir wiederum mit Hilfe einer Tabelle.
xiyi x2i yi2
8 8 64 64
4 8 16 64
4 16 16 256
4 8 16 64
1
P
4
· 5 10 28 112

Wir erhalten
√ s2X = 28 − 52 = 3 also sX = 3 = 1, 7321 und s2Y = 112 − 102 = 12 also
sY = 12 = 3, 46410162.
Damit ist der Korrelationskoeffizient r = √ −2

3· 12
= − 31 = −0, 33.

Seite 5 von 9
Klausur Quantitative Methoden I — Statistik Prof. Dr. Jörg Naeve

c) den Rangkorrelationskoeffizienten

Lösung:
6 d2i
P
Der Rangkorrelationskoeffizient ist rs = 1 − , wobei di = x∗i − yi∗ die Differenz
n(n2 − 1)
der Rangzahlen ist (in der Tabelle sind alle möglichen Kombinationen, diese auf- oder
absteigend zuzuordnen angegeben).
x∗ ∗
x∗∗ ∗ ∗ 2 ∗ 2
i − yi =  i − yi = x∗
i − yi = x∗∗
i − yi  =
xi yi x∗ x∗∗ yi∗ yi∗∗
− x∗∗ yi∗∗ 2 ∗∗ 2
∗∗
i i − x∗ ∗∗ 
i − yi i − yi x∗∗
i − x∗
i − yi
8 8 1 4 3 2 −2 1 4 1
4 8 3 2 3 2 0 −1 0 1
4 16 3 2 1 4 2 1 4 1
4 8 3 2 3 2 0 −1 0 1
P
20 40 10 10 10 10 0 0 8 4

Also ist der Rangkorrelationskoeffizient rs = 1 − 4·(46·8


2 −1) = 1 −
6·8
60
= 1− 8
10
= 2
10
= 0, 2
6·4 6·4 4 6
bzw. rs = 1 − 4·(42 −1) = 1 − 60 = 1 − 10 = 10 = 0, 6.

d) den korrigerten Kontingenzkoeffizienten nach Pearson.

Lösung:
In der Tabelle stehen jeweils h(xj ; yk ) und he (xj ; yk ), das sich als Produkt der
Randhäufigkeiten durch 4 ergibt.
P
yi = 8 yi = 16
xi = 4 2, 94 1, 34 3
xi = 8 1, 34 0, 14 1
P
3 1 4

2 X 2 2 12 12
2
2
X (h(xj ; yk ) − he (xj ; yk ))2 − 14 4 4
− 41
χ = = 9 + 3 + 3 + 1
j=1 k=1
he (xj ; y k ) 4 4 4 4
1 1 1 1 16 4
=+ + + = = = 0, 44.
36 12 12 4 36 9
q
χ2
Der Kontingenzkoeffizient nach Pearson ist CP = χ2 +n
. Zusätzlich muss dieser mit
q
C∗
dem Korrekturfaktor C ∗ −1
multipliziert werden, wobei C ∗ das Minimum der Zeilen
und Spalten der Kontingenztabelle ist, also hier 2.

s s
4
r r r
χ2 C∗ 9 2 1 √
Ckorr = · = 4 · = · 2 = 0.447213595.
χ2 + n C∗ − 1 9
+4 2−1 10

Seite 6 von 9
Klausur Quantitative Methoden I — Statistik Prof. Dr. Jörg Naeve

3.2 Auf dem Niveau welcher Messskala müssen die Merkmale X und Y mindestens
messbar sein, damit das folgende Maß sinnvoll verwendet werden kann, um ihren Zu-
sammenhang zu beschreiben?

i) Der Kontingenzkoeffizient nach Cramér.

Lösung:
Beide Merkmale müssen mindestens nominal messbar sein.

ii) Der Korrelationskoeffizient.

Lösung:
Beide Merkmale müssen metrisch messbar sein.

iii) Der Rangkorrelationskoeffizient.

Lösung:
Beide Merkmale müssen mindestens ordinal messbar sein.

Seite 7 von 9
Klausur Quantitative Methoden I — Statistik Prof. Dr. Jörg Naeve

Aufgabe 4
Gegeben sind folgende Wertepaare (xi ; yi ): (6; 1), (0; 5), (3; 3), (4; 2) und (2; 4).
(15 Punkte)
4.1 Bitte bestimmen Sie eine lineare KQ-Regressionsfunktion ŷ = a + bx, die den
Zusammenhang zwischen den Merkmalen X und Y beschreibt.
Lösung:

Die Formeln für die Parameter der Regressionsgeraden lauten


X X
1 2 1
n
xi ȳ − x̄ n
xi yi COV(X,Y )
a = 2
und b = .
sX s2X

Um diese zu berechnen benutzen wir folgende Tabelle.


xi yi x2i yi2 xi yi
8 1 64 1 8
2 5 4 25 10
5 3 25 9 15
6 2 36 4 12
4 4 16 16 16
25 15 145 55 61

Wir erhalten die Mittelwerte x̄ = 25


5
= 5 und ȳ = 15
5
= 3.
2 145 2 61
Die Varianz von X ist sX = 5 − 5 = 4 und die Kovarianz COV (X, Y ) = 5
−5·3=
12,2 − 15 = −2,8.
Damit ergeben sich die Regressionskoeffizienten als
145 61
5
·3−5· 5 −2,8
a = = 6,5 und b = = −0,7.
4 4

Die Gleichung der Regressiongerade ist demnach

ŷ = 6,5 − 0,7 · x.

Seite 8 von 9
Klausur Quantitative Methoden I — Statistik Prof. Dr. Jörg Naeve

4.2 Berechnen Sie bitte den Korrelationskoeffizienten r und das Bestimmtheitsmaß B 2


und geben sie eine kurze Interpretation.
Lösung:
Der Korrelationskoeffizient berechnet sich als r = COV(X,Y
sX sY
)
.
p √
Die Standardabweichung von X √ist sX = s2X = 4 = 2. Die Varianz von Y ist s2Y =
55
5
− 32 = 2 und damit ist sY = 2 = 1, 4142. Also ist r = −2.8√ = −1.4
2 2
√ = −0.989949494.
2
Für eine lineare Regression gilt B 2 = r 2 , also hier B 2 = (−0.989949494)2 = 0.98.
Die Aussage ist, dass die Regressionsgerade eine negative Steigung aufweist (r hat nega-
tives Vorzeichen) und den Zusammenhang der beiden betrachteten Merkmale annähernd
perfekt beschreibt (B 2 ≃ 1).

4.3 Stellen Sie die Beobachtungen und die Regressionsgerade grafisch dar.
Lösung:
yi

6 ŷ = 6,5 − 0,7x
5 (2,5)

4 (4,4)

3 (5,3)

2 (6,2)

1 (8,1)

xi
1 2 3 4 5 6 7 8 9 10

4.4 Welche Steigung hätte die lineare KQ-Regressionsfunktion x̂ = a′ + b′ y? Können


Sie etwas über ihren Schnittpunkt mit der linearen KQ-Regressionsfunktion ŷ = a + bx
sagen?
Lösung:
Die Steigung wäre

COV (X, Y ) −2,8


b′ = 2
= = −1,4.
sY 2

Der Schnittpungkt ist der Punkt (x̄, ȳ) = (5,3).

Seite 9 von 9

Das könnte Ihnen auch gefallen