Sie sind auf Seite 1von 9

Wirtschaftsuniversität Wien

Klausur Statistik 2015-08-27

Persönliche Daten

Zuname:
Beleg-ID

Vorname: 15082710001

Unterschrift: Ersatzbeleg

Matrikelnummer geprüft

1. 0 . 1 0 1
2. NNM
3. (a) X (b) X (c) X (d) X (e) X

4. (a) X (b) X (c) X (d) (e)

5. 0 . 5 0 0

6. 3 . 8 1 2

7. 3 . 0 3 3

8. 9 9 8 . 9 2 0
1 0 1 3 . 0 8 0

9. (a) X (b) (c) (d) (e) X

10. (a) X (b) (c) (d) (e)


Klausur Statistik: 15082710001 2

1. Frage

In einem Supermarkt ist die wöchentliche Nachfrage nach einem bestimmten Produkt nor-
malverteilt mit Mittelwert 335 und Standardabweichung 29. Jeweils am Montag noch vor
der Öffnung des Supermarkts wird das Lager neu aufgefüllt.
Nach Ergänzung des Lagerbestandes sind 372 Einheiten des Produkts vorhanden. Mit wel-
cher Wahrscheinlichkeit reicht in dieser Woche der Lagerbestand nicht aus, um die Nach-
frage zu decken?
Lösung
Wenn wir mit X die Nachfrage nach diesem Produkt bezeichnen, ist P(X > 372) zu berech-
nen.
Da X einer Normalverteilung mit Mittelwert 335 und Standardabweichung 29 folgt, kommen
wir durch Standardisieren rasch zur Lösung:

372 − 335
P(X > 372) = 1 − P(X ≤ 372) = 1 − P(Z ≤ ) = 1 − Φ(1.276)
29
Unter Verwendung einer Tabelle der Normalverteilung gelangen wir zu:

1 − Φ(1.276) = 1 − 0.899 = 0.101

2. Frage
Welcher der drei in der Vorlesung besprochenen Skalentypen
N : Nominalskala (auch: qualitative oder kategorielle Skala)
O : Ordinalskala (auch: Rangskala)
M : metrische Skala (beinhaltet Intervallskala, Quotientenskala, Rationalskala, Verhältnis-
skala)
ist am besten geeignet, um folgende Variablen zu modellieren?
• Familienstand: ledig (=1), verheiratet (=2), geschieden (=3), verwitwet (=4).
• Das Geschlecht von Studierenden an der WU.
• Das Alter von Wohnungen (in Jahren), die in Wien zum Verkauf stehen.
Schreiben Sie bitte auf den Antwortbeleg nur die Anfangsbuchstaben der entsprechenden
Skalen (N, O, und M) in der richtigen Reihenfolge. Dabei kann ein Buchstabe auch mehr-
fach vorkommen.
Lösung

• Familienstand: ledig (=1), verheiratet (=2), geschieden (=3), verwitwet (=4). N


• Das Geschlecht von Studierenden an der WU. N
• Das Alter von Wohnungen (in Jahren), die in Wien zum Verkauf stehen. M
3. Frage
Bei einem Versicherungsunternehmen werden die Bearbeitungszeiten von Schadensmel-
dungen erhoben. In Abbildung 1 ist die Verteilung von 200 Bearbeitungszeiten (in Minuten)
durch ein Histogramm dargestellt.
Welche der folgenden Aussagen sind richtig?
(a) Die Verteilung ist rechtsschief.
(b) Der Median ist kleiner als der Mittelwert.
Klausur Statistik: 15082710001 3

Bearbeitungszeiten

0.015
0.010
Dichte

0.005
0.000

15

30

45

60

75

90

105

120
Zeit (Minuten)

Abbildung 1: Histogramm

(c) Der Schiefekoeffizient ist positiv.


(d) Der Median ist kleiner als 45.
(e) Bei weniger als einem Viertel dauerte die Bearbeitung der Schadensmeldungen 90
Minuten oder länger.
Lösung
Es liegt eine klar schiefe Verteilung vor. Sind niedrige Werte häufiger als hohe zu beobach-
ten, ist die Verteilung rechtsschief (Schiefekoeffizient positiv), sonst linksschief (Schiefeko-
effizient negativ).
Zur Beantwortung der zwei letzten Fragen genügt es, die Quartile ungefähr zu lokalisieren,
also abzuschätzen, in welchem Intervall sie liegen.
Q0.25 in ( 15 ; 30)
Q0.50 in ( 30 ; 45)
Q0.75 in ( 45 ; 60)
Damit lassen sich nun obige Aussagen als richtig oder falsch bewerten.
(a) TRUE: Das Histogramm ist eindeutig nicht symmetrisch.LangeBearbeitungszeiten sind
seltener alskurze.
(b) TRUE: Die sehr langen Bearbeitungsdauern ziehen den Median nicht so stark nach
rechts wie den Mittelwert.
(c) TRUE: Bei einer rechtsschiefen Verteilung ist der Schiefekoeffizient positiv.
(d) TRUE: Der Median ist im Intervall (30 ; 45).
(e) TRUE: Das obere (oder dritte) Quartil ist im Intervall (45 ; 60).
4. Frage
Abbildung 2 zeigt die Verteilung einer Stichprobe dargestellt durch ein Histogramm. Welche
der folgenden Aussagen sind richtig? (Anmerkung: Die Aussagen sind entweder ungefähr
richtig oder deutlich falsch.)
Klausur Statistik: 15082710001 4

0.20
0.15
0.10
0.05
0.00

−15 −10 −5

Abbildung 2: Histogramm der Verteilung

(a) Diese Daten können von einer Normalverteilung mit Mittel -9 und Varianz Standardabweichung 2
erzeugt worden sein.
(b) Die vorliegenden Daten sind annähernd symmetrisch.
(c) Das Mittel der Daten ist eindeutig kleiner als das obere Quartil.
(d) Diese Daten können aus einer Gleichverteilung stammen.
(e) Die Daten weisen eine starke Streuung in Relation zum Mittel auf.

Lösung

(a) richtig: Überprüft wird anhand von Symmetrieverhalten und dem Gewicht in der Mitte
bzw. den Rändern, ob die Daten ursprünglich aus einer Normalverteilung kommen.
(b) richtig: Erkennen des Symmetrieverhaltens von normalverteilten oder gleichverteilten
Daten als symmetrisch und (gespiegelten) gammaverteilten Daten als schief.
(c) richtig: Erkennen, dass durch Asymmetrie (ohne zu großen Effekt extremster Ausrei-
ßer) das Mittel in Richtung des schweren Randes verzerrt wird bzw. bei Symmetrie
annähernd dem Median entspricht.
(d) falsch: Überprüft wird anhand von Symmetrieverhalten und dem Gewicht in der Mitte
bzw. den Rändern, ob die Daten ursprünglich aus einer Gleichverteilung kommen.
(e) falsch: Die Daten streuen stark, wenn der robuste Schätzer des Variationskoeffizien-
ten größer als 1 ist.

5. Frage
Abbildung 3 zeigt die empirische Verteilungsfunktion von Schadensfällen (in 1000 GE). Wie
groß ist der Anteil der Schadensfälle, die mindestens 4000 GE betragen?
Lösung
Aus Abbildung 3 kann man fn (X ≤ 4000), die relative Häufigkeit der Schadensfälle, die
Klausur Statistik: 15082710001 5

1.0 1.0

0.9 0.9

0.8 0.8

0.7 0.7

0.6 0.6

0.5 0.5

0.4 0.4

0.3 0.3

0.2 0.2

0.1 0.1

0.0 0.0

0 1 2 3 4 5 6 7 8 9 10 11 12

Abbildung 3: Schäden in 1000 GE

höchstens 4000 betragen, ablesen. Man erhält fn (X ≤ 4000) ≈ 0.5 (siehe Abbildung 4).
Der Anteil der Schadensfälle, die mindestens 4000 GE betragen, ist damit 1 − 0.5 = 0.5.
Anmerkung: Da die Verteilungsfunktion nicht ganz exakt abgelesen werden kann, werden
Ergebnisse im Intervall [0.45, 0.55] toleriert.

6. Frage
Eine Umfrage unter österreichischen Arbeitnehmern (166~Männer und 100~Frauen) mit
der Frage „Sind Sie für eine Verlängerung der Arbeitszeit auf 40 Stunden?“ wurde von
72.89% der befragten Männer und 28% der befragten Frauen mit „JA!“ beantwortet.
Zeigen diese Daten, dass der Anteil der männlichen Arbeitnehmer, die Befürworter der
40-Stunden-Woche sind, größer als 58.3% ist? Berechnen Sie die Teststatistik für den ent-
sprechenden Test.
Lösung
Unter der Null-Hypothese wird unterstellt, dass die Antwort der männlichen Arbeitnehmer
mit Wahrscheinlichkeit θ0 = 0.583 „JA!“ ist. Für das Berechnen der Teststatistik benötigt man
weiters die Stichprobengröße n = 166 und die beobachtete relative Häufigkeit fn = 0.7289.
Die Teststatistik ist dann gegeben durch

f − θ0
T = qn
θ0 ·(1−θ0 )
n
0.7289 − 0.583
= q
0.583·(1−0.583)
166
Klausur Statistik: 15082710001 6

1.0

0.9

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

0.0

0 1 2 3 4 5 6 7 8 9 10 11 12

Abbildung 4: Schäden in 1000 GE

= 3.812

Anmerkung: Eine Entscheidung über die Null-Hypothese (Verwerfen oder Beibehalten) ist
in dieser Aufgabe nicht gefragt.
7. Frage
Eine genaue Überprüfung von mehreren Schadensfällen, die bei einer Versicherung gemel-
det wurden, zeigte etliche betrügerische Schadensfälle. Abbildung 5 gibt für verschiedene
Versicherungssparten an, wieviele Fälle genau überprüft wurden und wie groß die Anzahl
der betrügerischen Fälle war:
Zeigen diese Daten für die Versicherungsbranche Brandschutz, dass die bisher vermutete
Häufigkeit von 66% nicht korrekt ist? Berechnen Sie die Teststatistik für den entsprechen-
den Test.
Lösung
Unter der Null-Hypothese wird unterstellt, dass in der Versicherungsbranche Brandschutz
mit Wahrscheinlichkeit θ0 = 0.66 ein Schadensfall betrügerisch ist. Für das Berechnen der
Teststatistik benötigt man weiters die Stichprobengröße n = 145 und die beobachtete rela-
tive Häufigkeit fn = 113
145 . Die Teststatistik ist dann gegeben durch

f − θ0
T = qn
θ0 ·(1−θ0 )
n
113
− 0.66
= q145
0.66·(1−0.66)
145
Klausur Statistik: 15082710001 7

Schadensfaelle

Krankenversicherung

Brandschutz

Autohaftpflicht

Haushaltsversicherung

Hausversicherung
0

11
16

26

76

86

93

113

137

145
Abbildung 5: Balkendiagramm; dunkel ist der Anzahl der betrügerischen Fälle, hell der Anzahl
der nichtbetrügerischen Fälle.

= 3.033

Anmerkung: Eine Entscheidung über die Null-Hypothese (Verwerfen oder Beibehalten) ist
in dieser Aufgabe nicht gefragt.
8. Frage
Die Firma Z GmbH produziert Traubenzucker, der in Packungen zu je 1000g abgefüllt wird.
Um festzustellen, ob diese Angabe auch den Tatsachen entspricht, werden 150 Packungen
2
überprüft. Dabei erhält man x̄ = 1006 und sn−1 = 8259 als Maßzahlen. Berechnen Sie das
66%-Konfidenzintervall für den Erwartungswert des Gewichts.
Lösung
Das Konfidenzintervall mit einer statistischen Sicherheit von 1 − α für den Erwartungswert
µ lautet
" r r #
σ̂ 2 σ̂ 2
x̄ − N1−α/2 , x̄ + N1−α/2 .
n n

Um ein Konfidenzintervall mit einer statistischen Sicherheit von 1 − α = 0.66 zu bekommen,


ist N1−α/2 gleich dem 83% Quantil der Standardnormalverteilung, das durch das Ablesen in
der Normalverteilungstabelle als gleich 0.9542 bestimmt werden kann. Die wahre Varianz
σ 2 wird durch die Stichprobenvarianz σ̂ 2 = sn−1
2
geschätzt. Das Konfidenzintervall lautet
somit
" r r #
8259 8259
= 1006 − 0.9542 , 1006 + 0.9542
150 150
= [998.92, 1013.08] .

Anmerkung: Schätzt man σ 2 durch s2 (falsch!), erhält man das Intervall [998.943, 1013.057].
Bitte beachten Sie, dass ein Intervall gefragt ist. Deshalb ist bei der Lösung erst die linke
Schranke und dann die rechte Schranke einzutragen.
9. Frage
Bei einem Versicherungsunternehmen werden die Bearbeitungszeiten bei 70 Schadens-
meldungen erhoben. Mit einem T-Test soll überprüft werden, ob die mittlere Bearbeitungs-
zeit über 80 Minuten liegt (Signifikanzniveau 5%).
Klausur Statistik: 15082710001 8

One Sample t-test

data: dauer
t = 1.4829, df = 69, p-value = 0.07133
alternative hypothesis: true mean is greater than 80
95 percent confidence interval:
79.8135 Inf
sample estimates:
mean of x
81.5

(a) Der Test arbeitet mit der Hypothese H0 : µ ≤ 80.


(b) Der Wert der Teststatistik ist: 69
(c) Der Mittelwert in der Stichprobe ist 1.48.
(d) Es liegt ein signifikantes Ergebnis vor.
(e) Die Entscheidung lautet: Der Erwartungswert der Bearbeitungszeiten ist nicht größer
als 80.

Lösung

Ein einseitiger T-Test mit der Alternativhypothese HA : µ > 80 wurde gerechnet.


Der Wert der Teststatistik ist 1.48, der p-Wert beträgt rund 0.0713.

(a) TRUE: Richtig. Die Nullhypothese besagt, dass dieser Wert nicht übertroffen wird.
(b) FALSE: So hoch sind die Freiheitsgrade.
(c) FALSE: Das ist der Wert der Teststatistik.
(d) FALSE: Wenn der p-Wert kleiner als das Signifikanzniveau ist, ist das Ergebnis signi-
fikant.
(e) TRUE: Liegt der p-Wert über dem Signifikanzniveau, wird die Nullhypothese beibehal-
ten. Sonst wird sie verworfen.

10. Frage
Ein Paketzustelldienst stellt in Stoßzeiten angelernte Kräfte zur Paketsortierung ein. Nach
einer eintägigen Einschulung arbeiten sie selbstständig in der Paketsortierung. Natürlich
sind diese Aushilfskräfte nicht so schnell wie dauernd angestelltes Personal, das durch-
schnittlich 380 Pakete in der Stunde sortiert. Die Managerin der Paketsortierung hofft aber,
dass mehr als 80% von deren Leistung (also mehr als 304 Paktete) auch die Anlernkräfte
erbringen können.
Nach einer Woche wird bei 45 zufällig ausgewählten Anlernkräften erhoben, wieviel Pakete
diese in einer Stunde sortieren. Es soll überprüft werden, ob die Anlernkräfte durchschnitt-
lich auf einen Wert von mehr als 304 Paketen kommen.
Welche der folgenden Aussagen sind richtig?

(a) Aus einem Histogramm kann die Verteilung des Sortierleistung abgelesen werden.
(b) Hohe Werte der Varianz zeigen an, dass die Sortierleistung hoch ist.
(c) In der Alternativhypothese wird behauptet, dass der durchschnittliche Sortierleistung
mehr als 380 Pakete umfasst.
(d) Der Test arbeitet mit der Hypothese HA : µ < 304.
(e) Ein Ein-Stichproben t-Test (One Sample t-test) gegen die durchschnittliche Sortierlei-
stung des angestellten Personals (380) ist eine geeignete Methode.
Klausur Statistik: 15082710001 9

Lösung
Die Sortierleistung von Anlernkräften wird erhoben. Somit liegt eine metrische (oder quan-
titative) Angabe vor. Die Beschreibung kann numerisch durch Maßzahlen, grafisch durch
Histogramme und Boxplots erfolgen.
Mit der Stichprobe soll getestet werden, ob die mittlere Sortierleistung (in der Population
aller Anlernkräfte) über 304 liegt. Dazu kann ein t-Test gegen diesen vorgegebenen Wert,
ein Ein-Stichproben t-Test, eingesetzt werden. Da von Interesse ist, ob die durchschnittliche
Sortierleistung einen Wert übersteigt, liegt ein einseitiger Test vor. Die Hypothese H0 : µ ≤
304 wird gegen HA : µ > 304 getestet.
Damit lassen sich nun obige Aussagen als richtig oder falsch bewerten:

(a) TRUE
(b) FALSE
(c) FALSE
(d) FALSE
(e) FALSE

Das könnte Ihnen auch gefallen