Sie sind auf Seite 1von 5

Statistik – Aufgabensammlung – Kapitel Uebersichtsfrage5-8 1

1. Frage
Bio-Lebensmittel werden zusehends beliebter. Jeder Supermarkt hat schon Bio-Lebensmittel
im Angebot, es gibt in vielen Städten sogar Supermärkte mit nur Bio-Angebot. Daneben gibt
es die traditionellen Bio-Läden.
In einer Untersuchung wurden folgende Variablen erhoben:

• BioLM: Ausgaben von Haushalten für Bio-Lebensmittel (in Euro pro Jahr)
• Wohnort: Wohnortkategorie mit der Einteilung:
– Wien: stellvertretend für eine Großstadt
– GILS: Graz, Innsbruck, Linz und Salzburg als Vertreter größerer Städte
– Stadt: andere Städte mit mindestens 10000 Einwohnern
– Sonst: Ortschaften (Dörfer, Städte) mit weniger als 10000 Einwohnern

Die Forschungsfrage lautet: Unterscheiden sich die durchschnittliche Ausgaben für Bio-
Lebensmittel in den Wohnortkategorien? Welche der im Kurs Statistik vorgestellten Metho-
den können eingesetzt werden?
Welche der folgenden Aussagen dazu sind richtig?

(a) Die Responsevariable (abhängige Variable) ist metrisch, die erklärende Variable kate-
gorial.
(b) Einen guten Überblick über die Verteilung der Variablen BioLM in den vier Wohnortka-
tegorien bieten gestapelte Balkendiagramme.
(c) Zur numerischen Beschreibung können Mittelwerte und Standardabweichungen der
Variablen Wohnort berechnet werden.
(d) Mit einer zweifachen ANOVA kann getestet werden, ob sich der Erwartungswert von
BioLM in den Wohnortkategorien unterscheidet.
(e) Die Alternativhypothese des passenden Verfahrens besagt, dass sich zumindest ei-
ner der innerhalb der Wohnortkategorien gebildeten Erwartungswerte von BioLM den
anderen unterscheidet.

Lösung
Die Variable BioLM ist metrisch (quantitativ), Wohnort ist eine Einteilung in vier Kategorien,
also kategorial.
Die Variable BioLM ist die abhängige Variable (Responsevariable), ihre Lage (Erwartungs-
wert) soll in den Kategorien von Wohnort verglichen werden. Das ist das klassische An-
wendungsgebiet einer einfachen ANOVA.
Als grafische Beschreibung sind parallele Boxplots geeignet. Zur numerischen Beschrei-
bung sind Maßzahlen von BioLM in jeder Wohnortkategorie geeignet.
Zum Vergleich aller vier Wohnortkategorien bezüglich BioLM kann eine einfache ANOVA
mit der Nullhypothese H0 : µWien = µGILS = µStadt = µSonst eingesetzt werden. Wenn nur zwei
Wohnortkategorien verglichen werden, sind sowohl t-Test als auch U-Test (Mann-Whitney-
Wilcoxon-Test) denkbare Werkzeuge.
Damit lassen sich nun obige Aussagen als richtig oder falsch bewerten:

(a) TRUE
(b) FALSE
(c) FALSE
(d) FALSE
(e) TRUE
Statistik – Aufgabensammlung – Kapitel Uebersichtsfrage5-8 2

2. Frage
In einer Stadt sollen der motorisierte Verkehr und die damit verbundenen Probleme redu-
ziert werden. Ein Teil der Wege, die bisher mit Auto, Motorrad oder Mopeds zurückgelegt
wurden, soll mit dem Fahrrad absolviert werden. In einer Statuserhebung werden in einer
Stichprobe von 300 Personen Daten über folgende Variablen erhoben:

• RadKM: Kilometer, die in den letzten zwei Monaten mit dem Fahrrad zurückgelegt
wurden
• Alter: Alterskategorie der Untersuchungsperson:
jung (bis 30 Jahre), alt (über 30 Jahre)
• Gender: Geschlecht der Untersuchungsperson mit den Stufen Frau und Mann

Die Forschungsfrage lautet: Unterscheidet sich die durchschnittliche Anzahl der mit dem
Fahrrad zurückgelegten Kilometer in den Gruppen, die durch Alter und Gender gebildet
werden?
Welche der folgenden Aussagen sind richtig?

(a) Sowohl Response- als auch erklärende Variable sind metrisch.


(b) Die Verteilung der Responsevariablen (abhängige Variable) Alter wird in den Katego-
rien von Gender verglichen.
(c) Zur numerischen Beschreibung können Mittelwerte und Standardabweichungen der
Variablen RadKM in den vier Gruppen berechnet werden.
(d) Den Einfluss von Alter auf RadKM kann mit Korrelation untersucht werden.
(e) Mit F-Tests kann eine Auswahl aus Modellen zwischen RadKM ∼ Alter * Gender (dem
komplexesten Modell) und RadKM ∼ 1 (dem einfachsten Modell) getroffen werden.

Lösung
Die Variable RadKM ist metrisch (quantitativ). Alter ist eine Einteilung in zwei Alterskatego-
rien, also kategorial; ebenso Gender.
Die Variable RadKM ist die abhängige Variable (Responsevariable), ihre Lage (Erwartungs-
wert) soll in den Gruppen, die aus den Kategorien von Alter und Gender gebildet werden
können, verglichen werden. Das ist das klassische Anwendungsgebiet einer zweifachen
ANOVA.
Als grafische Beschreibung sind parallele Boxplots und Interaktionsplots geeignet. Zur nu-
merischen Beschreibung können Mittelwerte von RadKM in den einzelnen Gruppen errech-
net werden.
Damit lassen sich nun obige Aussagen als richtig oder falsch bewerten:

(a) FALSE
(b) FALSE
(c) TRUE
(d) FALSE
(e) TRUE

3. Frage
Im Rahmen einer soziologischen Studie wird bei 200 Personen im Alter zwischen 25 und
30 Jahren sowohl deren höchste abgeschlossene Ausbildung als auch die höchste ab-
geschlossene Ausbildung der Eltern (bei unterschiedlichen Ausbildungsniveaus der Eltern
wird das höhere der beiden Ausbildungsniveaus gewertet) erhoben. Danach werden die
Ausbildungsniveaus in drei Gruppen eingeteilt:
Statistik – Aufgabensammlung – Kapitel Uebersichtsfrage5-8 3

• Sekundarstufe I: Grundschule
• Sekundarstufe II: Abschluss einer AHS, BHS, HAK, HBLA, ..
• Tertiarstufe: Abschluss einer Fachhochschule, Universität oder Akademie
Es soll erforscht werden, ob bzw. inwieweit das Ausbildungsniveau von Personen durch
jenes ihrer Eltern beeinflusst wird.
Welche der folgenden Aussagen sind richtig?

(a) Beide beobachteten Variablen (Ausbildungsniveaus der Eltern und der Kinder) sind
ordinal.
(b) Die Verteilung in der Stichprobe kann mit einem Mosaikplot grafisch beschrieben wer-
den.
(c) Zur numerischen Beschreibung des Zusammenhangs in der Stichprobe kann ein Kor-
relationskoeffizient berechnet werden.
(d) Ein Unabhängigkeitstest für Kontingenztafeln ist die geeignete Testmethode.
(e) Die Alternativhypothese bedeutet, dass es keinen Zusammenhang zwischen dem Aus-
bildungsniveau der Eltern und dem der Kinder gibt.

Lösung
Sowohl das Ausbildungsniveau der Befragten als auch das von deren Eltern sind auf einer
Ordinalskala gemessen worden. Es liegen also pro Person zwei kategoriale Variablen mit
jeweils drei Kategorien vor.
Die Beschreibung der Stichprobe kann numerisch durch eine Kontingenztafel (Kreuztabel-
le) und daraus abgeleitete relative Häufigkeiten erfolgen, grafisch durch Balkendiagramme
oder Mosaikplots erfolgen.
Für die Untersuchung der Fragestellung kann der Korrelationskoeffizient nicht verwendet
werden, es liegen ja keine metrischen Variablen vor. Wir sind in unseren Methoden auf
den χ2 -Unabhängigkeitstest bei Kontingenztafeln beschränkt. Die Nullhypothese der Un-
abhängigkeit bedeutet, dass das Ausbildungsniveau der Kinder nicht von dem der Eltern
abhängt.
Damit lassen sich nun obige Aussagen als richtig oder falsch bewerten:

(a) TRUE
(b) TRUE
(c) FALSE
(d) TRUE
(e) FALSE

4. Frage
In einer sportwissenschaftlichen Studie wird unter anderem untersucht, ob bei Spielen der
1. Fußball-Liga weniger technische Fehler passieren als in Spielen der 2. Liga. Je Liga wer-
den 20 Spiele analysiert, die entsprechenden Fehlerhäufigkeiten erhoben.

(a) Die abhängige Variable ist die Fehlerhäufigkeit im jeweiligen Spiel und somit metrisch.
(b) Zur grafischen Beschreibung können paralle Boxplots der Fehlerhäufigkeiten erstellt
werden.
(c) Die numerische Beschreibung der Stichprobe kann durch Median und Quartilsabstand
der Fehlerhäufigkeiten in jeder Liga erfolgen.
(d) Der Test arbeitet mit der Nullhypothese H0 : µLiga1 ≤ µLiga2 .
Statistik – Aufgabensammlung – Kapitel Uebersichtsfrage5-8 4

(e) Als Test kommt ein Ein-Stichproben t-Test (One sample t-test) in Frage.

Lösung

Die Anzahl technischer Fehler ist eine metrische (oder quantitative) Angabe. Spiele werden
in zwei Ligen beobachtet, es liegen unabhängige Stichproben vor.
Die Beschreibung kann numerisch durch Maßzahlen für jede Gruppe, grafisch durch paral-
lele Boxplots erfolgen.
Mit der Stichprobe soll auf Lageunterschiede zwischen den beiden Gruppen getestet wer-
den. Dazu kann – bei passender Verteilung in den zwei Gruppen – ein Zwei-Stichproben
t-Test eingesetzt werden. Als robuste Alternative steht der Wilcoxon-Mann-Whitney-Test zur
Verfügung.
Da von Interesse ist, ob in der 1. Liga weniger technische Fehler passieren als in der 2. Liga,
liegt ein einseitiger Test vor. Im Zwei-Stichproben t-Test stehen sich die Hypothesen H0 :
µLiga1 ≥ µLiga2 und HA : µLiga1 < µLiga2 gegenüber.

(a) TRUE
(b) TRUE
(c) TRUE
(d) FALSE
(e) FALSE

5. Frage
Ein stark expandierendes Handelsunternehmen der Elektro- und Elektronikbranche beklagt
viele Reklamationen von unzufriedenen oder schlecht beratenen Kunden. Ein Grund dafür
könnte sein, dass viele der neu aufgenommenen VerkäuferInnen nur angelernt wurden und
für eine gutes Verkaufsgespräch zu wenig Fachkenntnis besitzen.
Schulungen für alle MitarbeiterInnen im Verkauf werden durchgeführt. Nach einem Monat
wird von 15 Filialen des Handelsunternehmens erhoben, wieviele Reklamationen in einer
Woche einlangen. Diese Zahlen werden mit den entsprechenden Werten vor den Schu-
lungsmaßnahmen verglichen.
Welche der folgenden Aussagen sind richtig?

(a) Wenn Mittelwert und Median der Differenzen nahe bei 0 sind, ist kaum eine Änderung
in der durchschnittlichen Reklamationsanzahl erfolgt.
(b) Ein Boxplot der Differenzen bietet eine Übersicht über den Unterschied zwischen den
Reklamationen vor und nach den Schulungen.
(c) Als Test kommt ein t-Test für gepaarte Stichproben (paired t-Test) in Frage.
(d) Als Test kommt ein Wilcoxon-Mann-Whitney-Test in Frage.
(e) Als Test kommt ein Zwei-Stichproben t-Test in Frage.

Lösung
Die Anzahl an Reklamationen pro Woche ist eine metrische (oder quantitative) Angabe. Die
Anzahl an Reklamationen vor der Schulung soll mit der Anzahl an Reklamationen nach der
Schulung verglichen werden. Da in der Stichprobe pro Filiale zwei Werte (Anzahl Reklama-
tionen vor und nach der Schulung) vorliegen, haben wir keine unabhängigen Stichproben,
sondern verbundene (oder gepaarte) Stichproben.
Dieser Besonderheit begegnet man dadurch, dass paarweise Differenzen gebildet und un-
tersucht werden.
Statistik – Aufgabensammlung – Kapitel Uebersichtsfrage5-8 5

Die Beschreibung kann numerisch durch Maßzahlen der Differenzen, grafisch durch Histo-
gramme und Boxplots der Differenzen erfolgen.
Mit der Stichprobe soll getestet werden, ob es zu einem Rückgang bei den Reklamationen
gekommen ist. Dazu kann ein t-Test der Differenzen gegen diesen vorgegebenen Wert 0
eingesetzt werden. Diesen Test nennt man auch Paardifferenzentest (t-Test für gepaarte
Stichproben, paired t-Test).
Da von Interesse ist, ob die Reklamationen weniger geworden sind, liegt ein einseitiger Test
vor. Die Hypothese H0 : µvorher ≤ µnachher wird gegen HA : µvorher > µnachher getestet.
Damit lassen sich nun obige Aussagen als richtig oder falsch bewerten:
(a) TRUE
(b) TRUE
(c) TRUE
(d) FALSE
(e) FALSE

Das könnte Ihnen auch gefallen