Beruflich Dokumente
Kultur Dokumente
1. Frage
Zur Erklärung der Variablen Y stehen als erklärende Variablen X1 und X2 zur Verfügung.
Im Folgenden sehen Sie eine ANOVA zum Testen von M0 : Y = β0 + gegen
M12 : Y = β0 + β1 X1 + β2 X2 + :
Model 1: y ~ 1
Model 2: y ~ x1 + x2
Res.Df RSS Df Sum of Sq F Pr(>F)
1 101 179.16
2 99 177.54 2 1.6248 0.453 0.637
Lösung
(a) falsch: Die Nullhypothese wird verworfen, wenn der p-Wert kleiner als 0.05 ist.
(b) falsch: Die Alternativhypothese: ”Mindestens einer der beiden Parameter β1 , β2 ist
ungleich 0” kann nachgewiesen werden, wenn der p-Wert kleiner als 0.05 ist.
(c) falsch: Das Bestimmtheitsmaß wird berechnet aus R 2 = 1 − RSSM12 /RSSM0 = 0.01.
(d) richtig: Das Bestimmtheitsmaß wird berechnet aus R 2 = 1 − RSSM12 /RSSM0 = 0.01.
(e) falsch: Mit der vorliegenden ANOVA-Tabelle wird das Testproblem H0 : Y = β0 +
gegen die Alternative HA : Y = β0 + β1 X1 + β2 X2 + getestet, nicht aber ein einzelner
Parameter alleine.
2. Frage
Im Rahmen Ihrer Tätigkeit für das Risikomanagement einer Bank interessiert Sie der Zu-
sammenhang zwischen dem Merkmal X = „Umsatzveränderung gegenüber dem Vorjahr”
(in Mio.) und dem Merkmal Y = „unbezahlt gebliebene Kreditverbindlichkeiten” (in Mio.). Für
die Branche „Industriebetriebe” ergeben sich folgende Kenngrößen:
Merkmal X Merkmal Y
Mittelwert −9.0 3.6
Varianz 50.30 10.80
Lösung
Man beginnt mit der Berechnung der Regressionsgeraden yi = β0 +β1 xi +εi . Die Berechnung
der Regressionskoeffizienten erfolgt durch:
r
sy 10.8
β̂1 = rxy · = −0.8 · = −0.3707,
sx 50.3
β̂0 = ȳ − β̂1 · x̄ = 3.6 − (−0.3707) · (−9) = 0.26374.
Jetzt kann der Schätzwert der unbezahlten Kredite für einen Umsatzrückgang von 6 Mio
berechnet werden:
3. Frage
In der Strategieabteilung eines Unternehmens werden die Preise von Konkurrenzprodukten
beobachtet.
Für die Verkaufsmengen Y eines eigenen Produktes sowie für die Preise der zwei wichtig-
sten Konkurrenzprodukte (P1 und P2) wurde das folgende zweifache Regressionsmodell
erstellt:
Y = β0 + β1 P1 + β2 P2 +
Die Daten der letzten 60 Monate führten zu folgendem Ergebnis:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 666.50 296.1564 2.2505 0.02829
P1 0.71 1.7166 0.4136 0.68072
P2 0.68 0.4070 1.6708 0.10024
Welche der folgenden Aussagen dazu sind richtig (Signifikanzniveau 5%)?
(a) Bei Preisen der Konkurrenz von P1 = 28.2 und P2 = 38.6 erwartet man eine Verkaufs-
menge von Y = 712.77.
(b) Bei einer Reduktion von P1 um 3 Einheiten erwartet man (wenn P2 gleichbleibt), dass
sich die Verkaufsmenge Y um 2.13 verringert.
(c) Bei einer Erhöhung von P2 um 4 Einheiten erwartet man bei gleichbleibendem P1 eine
Erhöhung der Verkaufsmenge Y um 2.72.
(d) Der Koeffizient von P1 ist signifikant von 0 verschieden.
(e) In diesem Modell hat P2 keinen signifikanten Einfluss auf Y .
Lösung
(a) True: Einsetzen in die Regressionsgleichung ergibt: 666.5 + 0.71 · 28.2 + 0.68 · 38.6 =
712.77.
(b) True: Reduktion von P1 und Wert von β1 ergeben Änderung bei Y : 0.71 · (−3) = −2.13
(c) True: Erhöhung von P2 und Wert von β2 ergeben Änderung bei Y : 0.68 · 4 = 2.72
(d) False: Der p-Wert des Tests für β1 gibt die Antwort: 0.68072.
(e) True: Der p-Wert des Tests für β2 gibt die Antwort: 0.10024.
Statistik – Aufgabensammlung – Kapitel 8 3
4. Frage
Ein Mode-Designer möchte untersuchen, ob sich sein wichtigstes Produkt (ein Polo-Hemd)
besser verkauft, wenn er als Logo ein Bild von einem Reiter auf die Brust stickt. Deshalb
führt er folgende Kundenbefragung durch: Es werden 17 Testpersonen ausgewählt. Zu-
nächst zeigt man ihnen das Polo-Hemd mit Logo und fragt nach einer Bewertung auf einer
Skala von 0 (schlecht) bis 10 (gut). Dann zeigt man ihnen das Polo-Hemd ohne Logo und
fragt nach einer weiteren Bewertung. Der Mode-Designer stellt nun folgende Frage: Unter-
scheidet sich die mittlere Kundenbewertung überhaupt für das Polo-Hemd mit bzw. ohne
Logo?
Sie sollen ihm helfen, diese Frage zu beantworten. Eines der beiden folgenden Testergeb-
nisse könnte dabei hilfreich sein.
Paired t-test
mit.Logo ~ ohne.Logo
(a) falsch: Die Frage ist, ob sich die mittleren Bewertungen unterscheiden.
(b) falsch: Es liegt eine Frage nach Bewertungsunterschieden für gepaarte Daten vor.
Für eine solche Fragestellung ist dies keine geeignete Visualisierung.
(c) richtig: Die Frage ist, ob die mittlere Bewertung für das Polo-Hemd mit Logo dieselbe
ist wie ohne Logo.
Statistik – Aufgabensammlung – Kapitel 8 4
(d) richtig: Die Differenz zwischen den durchschnittlichen Bewertungen mit und ohne Lo-
go beträgt 0.9492. Die durchschnittliche Bewertung für das Produkt ohne Logo kann
daher berechnet werden: (7.08) - (0.9492) = 6.1308.
(e) richtig: Es handelt sich um einen Test für gepaarte Daten. Die zugehörige T -Größe
hat einen p-Wert von 0.000526 und ist damit signifikant.
5. Frage
(a) Für X1 = 3.01 und X2 = −2.95 ist aus dem zweifachen linearen Regressionsmodell für
Y der Wert −2.71 zu erwarten. (Runden Sie auf 2 Nachkommastellen.)
(b) Weil die T -Größe gleich 5.24 ist, wird die Hypothese H0 : β1 = β2 = 0 verworfen
(Signifikanzniveau 5%).
(c) Die Hypothese H0 : β2 = 0 wird beibehalten, weil der p-Wert größer als 0.05 ist (Signi-
fikanzniveau 5%).
(d) Die Hypothese H0 : β1 = 0 wird beibehalten (Signifikanzniveau 5%).
(e) Wenn X1 um eine Einheit fällt und X2 gleich bleibt, dann fällt Y um ungefähr 0.06.
Lösung
(a) richtig: Der Schätzwert ŷ wird durch Einsetzen in die Regressionsgleichung berech-
net: 1.121 + (−0.057) · (3.01) + (1.24) · (−2.95) = −2.71.
(b) falsch: Wir haben nur die T -Größen angegeben. Auf Basis der T -Größen kann aber
immer nur ein einzelner Parameter getestet werden und nicht mehrere gemeinsam,
wie hier β1 und β2 .
(c) falsch: Die Nullhypothese wird verworfen, wenn der zugehörige p-Wert kleiner als
0.05 ist. Hier ist der p-Wert gleich 8.87e-07.
(d) richtig: Die Nullhypothese wird verworfen, wenn der zugehörige p-Wert kleiner als
0.05 ist. Hier ist der p-Wert gleich 0.807.
(e) falsch: Da das Vorzeichen des Regressionskoeffizienten zu X1 negativ ist und X1 um
eine Einheit fällt, steigt Y , und zwar um 0.06 Einheiten.