Beruflich Dokumente
Kultur Dokumente
Persönliche Daten
Zuname:
Beleg-ID
Vorname: 15082710001
Unterschrift: Ersatzbeleg
Matrikelnummer geprüft
1. 0 . 1 0 1
2. NNM
3. (a) X (b) X (c) X (d) X (e) X
5. 0 . 5 0 0
6. 3 . 8 1 2
7. 3 . 0 3 3
8. 9 9 8 . 9 2 0
1 0 1 3 . 0 8 0
1. Frage
In einem Supermarkt ist die wöchentliche Nachfrage nach einem bestimmten Produkt nor-
malverteilt mit Mittelwert 335 und Standardabweichung 29. Jeweils am Montag noch vor
der Öffnung des Supermarkts wird das Lager neu aufgefüllt.
Nach Ergänzung des Lagerbestandes sind 372 Einheiten des Produkts vorhanden. Mit wel-
cher Wahrscheinlichkeit reicht in dieser Woche der Lagerbestand nicht aus, um die Nach-
frage zu decken?
Lösung
Wenn wir mit X die Nachfrage nach diesem Produkt bezeichnen, ist P(X > 372) zu berech-
nen.
Da X einer Normalverteilung mit Mittelwert 335 und Standardabweichung 29 folgt, kommen
wir durch Standardisieren rasch zur Lösung:
372 − 335
P(X > 372) = 1 − P(X ≤ 372) = 1 − P(Z ≤ ) = 1 − Φ(1.276)
29
Unter Verwendung einer Tabelle der Normalverteilung gelangen wir zu:
2. Frage
Welcher der drei in der Vorlesung besprochenen Skalentypen
N : Nominalskala (auch: qualitative oder kategorielle Skala)
O : Ordinalskala (auch: Rangskala)
M : metrische Skala (beinhaltet Intervallskala, Quotientenskala, Rationalskala, Verhältnis-
skala)
ist am besten geeignet, um folgende Variablen zu modellieren?
• Familienstand: ledig (=1), verheiratet (=2), geschieden (=3), verwitwet (=4).
• Das Geschlecht von Studierenden an der WU.
• Das Alter von Wohnungen (in Jahren), die in Wien zum Verkauf stehen.
Schreiben Sie bitte auf den Antwortbeleg nur die Anfangsbuchstaben der entsprechenden
Skalen (N, O, und M) in der richtigen Reihenfolge. Dabei kann ein Buchstabe auch mehr-
fach vorkommen.
Lösung
Bearbeitungszeiten
0.015
0.010
Dichte
0.005
0.000
15
30
45
60
75
90
105
120
Zeit (Minuten)
Abbildung 1: Histogramm
0.20
0.15
0.10
0.05
0.00
−15 −10 −5
(a) Diese Daten können von einer Normalverteilung mit Mittel -9 und Varianz Standardabweichung 2
erzeugt worden sein.
(b) Die vorliegenden Daten sind annähernd symmetrisch.
(c) Das Mittel der Daten ist eindeutig kleiner als das obere Quartil.
(d) Diese Daten können aus einer Gleichverteilung stammen.
(e) Die Daten weisen eine starke Streuung in Relation zum Mittel auf.
Lösung
(a) richtig: Überprüft wird anhand von Symmetrieverhalten und dem Gewicht in der Mitte
bzw. den Rändern, ob die Daten ursprünglich aus einer Normalverteilung kommen.
(b) richtig: Erkennen des Symmetrieverhaltens von normalverteilten oder gleichverteilten
Daten als symmetrisch und (gespiegelten) gammaverteilten Daten als schief.
(c) richtig: Erkennen, dass durch Asymmetrie (ohne zu großen Effekt extremster Ausrei-
ßer) das Mittel in Richtung des schweren Randes verzerrt wird bzw. bei Symmetrie
annähernd dem Median entspricht.
(d) falsch: Überprüft wird anhand von Symmetrieverhalten und dem Gewicht in der Mitte
bzw. den Rändern, ob die Daten ursprünglich aus einer Gleichverteilung kommen.
(e) falsch: Die Daten streuen stark, wenn der robuste Schätzer des Variationskoeffizien-
ten größer als 1 ist.
5. Frage
Abbildung 3 zeigt die empirische Verteilungsfunktion von Schadensfällen (in 1000 GE). Wie
groß ist der Anteil der Schadensfälle, die mindestens 4000 GE betragen?
Lösung
Aus Abbildung 3 kann man fn (X ≤ 4000), die relative Häufigkeit der Schadensfälle, die
Klausur Statistik: 15082710001 5
1.0 1.0
0.9 0.9
0.8 0.8
0.7 0.7
0.6 0.6
0.5 0.5
0.4 0.4
0.3 0.3
0.2 0.2
0.1 0.1
0.0 0.0
0 1 2 3 4 5 6 7 8 9 10 11 12
höchstens 4000 betragen, ablesen. Man erhält fn (X ≤ 4000) ≈ 0.5 (siehe Abbildung 4).
Der Anteil der Schadensfälle, die mindestens 4000 GE betragen, ist damit 1 − 0.5 = 0.5.
Anmerkung: Da die Verteilungsfunktion nicht ganz exakt abgelesen werden kann, werden
Ergebnisse im Intervall [0.45, 0.55] toleriert.
6. Frage
Eine Umfrage unter österreichischen Arbeitnehmern (166~Männer und 100~Frauen) mit
der Frage „Sind Sie für eine Verlängerung der Arbeitszeit auf 40 Stunden?“ wurde von
72.89% der befragten Männer und 28% der befragten Frauen mit „JA!“ beantwortet.
Zeigen diese Daten, dass der Anteil der männlichen Arbeitnehmer, die Befürworter der
40-Stunden-Woche sind, größer als 58.3% ist? Berechnen Sie die Teststatistik für den ent-
sprechenden Test.
Lösung
Unter der Null-Hypothese wird unterstellt, dass die Antwort der männlichen Arbeitnehmer
mit Wahrscheinlichkeit θ0 = 0.583 „JA!“ ist. Für das Berechnen der Teststatistik benötigt man
weiters die Stichprobengröße n = 166 und die beobachtete relative Häufigkeit fn = 0.7289.
Die Teststatistik ist dann gegeben durch
f − θ0
T = qn
θ0 ·(1−θ0 )
n
0.7289 − 0.583
= q
0.583·(1−0.583)
166
Klausur Statistik: 15082710001 6
1.0
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0
0 1 2 3 4 5 6 7 8 9 10 11 12
= 3.812
Anmerkung: Eine Entscheidung über die Null-Hypothese (Verwerfen oder Beibehalten) ist
in dieser Aufgabe nicht gefragt.
7. Frage
Eine genaue Überprüfung von mehreren Schadensfällen, die bei einer Versicherung gemel-
det wurden, zeigte etliche betrügerische Schadensfälle. Abbildung 5 gibt für verschiedene
Versicherungssparten an, wieviele Fälle genau überprüft wurden und wie groß die Anzahl
der betrügerischen Fälle war:
Zeigen diese Daten für die Versicherungsbranche Brandschutz, dass die bisher vermutete
Häufigkeit von 66% nicht korrekt ist? Berechnen Sie die Teststatistik für den entsprechen-
den Test.
Lösung
Unter der Null-Hypothese wird unterstellt, dass in der Versicherungsbranche Brandschutz
mit Wahrscheinlichkeit θ0 = 0.66 ein Schadensfall betrügerisch ist. Für das Berechnen der
Teststatistik benötigt man weiters die Stichprobengröße n = 145 und die beobachtete rela-
tive Häufigkeit fn = 113
145 . Die Teststatistik ist dann gegeben durch
f − θ0
T = qn
θ0 ·(1−θ0 )
n
113
− 0.66
= q145
0.66·(1−0.66)
145
Klausur Statistik: 15082710001 7
Schadensfaelle
Krankenversicherung
Brandschutz
Autohaftpflicht
Haushaltsversicherung
Hausversicherung
0
11
16
26
76
86
93
113
137
145
Abbildung 5: Balkendiagramm; dunkel ist der Anzahl der betrügerischen Fälle, hell der Anzahl
der nichtbetrügerischen Fälle.
= 3.033
Anmerkung: Eine Entscheidung über die Null-Hypothese (Verwerfen oder Beibehalten) ist
in dieser Aufgabe nicht gefragt.
8. Frage
Die Firma Z GmbH produziert Traubenzucker, der in Packungen zu je 1000g abgefüllt wird.
Um festzustellen, ob diese Angabe auch den Tatsachen entspricht, werden 150 Packungen
2
überprüft. Dabei erhält man x̄ = 1006 und sn−1 = 8259 als Maßzahlen. Berechnen Sie das
66%-Konfidenzintervall für den Erwartungswert des Gewichts.
Lösung
Das Konfidenzintervall mit einer statistischen Sicherheit von 1 − α für den Erwartungswert
µ lautet
" r r #
σ̂ 2 σ̂ 2
x̄ − N1−α/2 , x̄ + N1−α/2 .
n n
Anmerkung: Schätzt man σ 2 durch s2 (falsch!), erhält man das Intervall [998.943, 1013.057].
Bitte beachten Sie, dass ein Intervall gefragt ist. Deshalb ist bei der Lösung erst die linke
Schranke und dann die rechte Schranke einzutragen.
9. Frage
Bei einem Versicherungsunternehmen werden die Bearbeitungszeiten bei 70 Schadens-
meldungen erhoben. Mit einem T-Test soll überprüft werden, ob die mittlere Bearbeitungs-
zeit über 80 Minuten liegt (Signifikanzniveau 5%).
Klausur Statistik: 15082710001 8
data: dauer
t = 1.4829, df = 69, p-value = 0.07133
alternative hypothesis: true mean is greater than 80
95 percent confidence interval:
79.8135 Inf
sample estimates:
mean of x
81.5
Lösung
(a) TRUE: Richtig. Die Nullhypothese besagt, dass dieser Wert nicht übertroffen wird.
(b) FALSE: So hoch sind die Freiheitsgrade.
(c) FALSE: Das ist der Wert der Teststatistik.
(d) FALSE: Wenn der p-Wert kleiner als das Signifikanzniveau ist, ist das Ergebnis signi-
fikant.
(e) TRUE: Liegt der p-Wert über dem Signifikanzniveau, wird die Nullhypothese beibehal-
ten. Sonst wird sie verworfen.
10. Frage
Ein Paketzustelldienst stellt in Stoßzeiten angelernte Kräfte zur Paketsortierung ein. Nach
einer eintägigen Einschulung arbeiten sie selbstständig in der Paketsortierung. Natürlich
sind diese Aushilfskräfte nicht so schnell wie dauernd angestelltes Personal, das durch-
schnittlich 380 Pakete in der Stunde sortiert. Die Managerin der Paketsortierung hofft aber,
dass mehr als 80% von deren Leistung (also mehr als 304 Paktete) auch die Anlernkräfte
erbringen können.
Nach einer Woche wird bei 45 zufällig ausgewählten Anlernkräften erhoben, wieviel Pakete
diese in einer Stunde sortieren. Es soll überprüft werden, ob die Anlernkräfte durchschnitt-
lich auf einen Wert von mehr als 304 Paketen kommen.
Welche der folgenden Aussagen sind richtig?
(a) Aus einem Histogramm kann die Verteilung des Sortierleistung abgelesen werden.
(b) Hohe Werte der Varianz zeigen an, dass die Sortierleistung hoch ist.
(c) In der Alternativhypothese wird behauptet, dass der durchschnittliche Sortierleistung
mehr als 380 Pakete umfasst.
(d) Der Test arbeitet mit der Hypothese HA : µ < 304.
(e) Ein Ein-Stichproben t-Test (One Sample t-test) gegen die durchschnittliche Sortierlei-
stung des angestellten Personals (380) ist eine geeignete Methode.
Klausur Statistik: 15082710001 9
Lösung
Die Sortierleistung von Anlernkräften wird erhoben. Somit liegt eine metrische (oder quan-
titative) Angabe vor. Die Beschreibung kann numerisch durch Maßzahlen, grafisch durch
Histogramme und Boxplots erfolgen.
Mit der Stichprobe soll getestet werden, ob die mittlere Sortierleistung (in der Population
aller Anlernkräfte) über 304 liegt. Dazu kann ein t-Test gegen diesen vorgegebenen Wert,
ein Ein-Stichproben t-Test, eingesetzt werden. Da von Interesse ist, ob die durchschnittliche
Sortierleistung einen Wert übersteigt, liegt ein einseitiger Test vor. Die Hypothese H0 : µ ≤
304 wird gegen HA : µ > 304 getestet.
Damit lassen sich nun obige Aussagen als richtig oder falsch bewerten:
(a) TRUE
(b) FALSE
(c) FALSE
(d) FALSE
(e) FALSE