Sie sind auf Seite 1von 61

Kapitel 7

Kontingenztafeln

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 0 / 61
[ Kontingenztafeln ]

Einleitung: Entscheidungen des VwGH

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 1 / 61
Entscheidungen des Verwaltungsgerichtshofs
Gegen Abgaben- und speziell gegen Steuerbescheide kann
Berufung eingelegt werden. In 2. Instanz ist die Berufungsbe-
hörde der Verwaltungsgerichtshof (VwGH). Seit Juli 1999 sind
als RechtsvertreterInnen vor dem VwGH nicht nur Rechtsan-
wältInnen sondern auch WirtschaftsprüferInnen zugelassen.

In einer Studie wurden die Entscheidungen des VwGH zwischen


2000 und 2004 in Abgabensachen untersucht.
Ein Untersuchungsgegenstand war die Vertretung (Rechtsan-
waltIn oder WirtschaftsprüferIn) vor dem VwGH.

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 2 / 61
Entscheidungen des Verwaltungsgerichtshofs

Eine Auszählung von mehr als 3000 Entscheidungen - hier nur Abweisung der Berufung,
Aufhebung (völlig oder teilweise) des Abgabenbescheides - ergibt:

VwGH−Entscheidungen
Vertretung

1.0
tw. Aufh.
Entscheidung RA WP

0.8
Entscheidung
Abweisung 2061 210

0.6
Aufh.

0.4
Aufhebung 916 102

0.2
Abw.
teilweise Aufhebung 122 8

0.0
RA WP

Vertretung

Gibt es Unterschiede in den Häufigkeiten der einzelnen Entscheidungen je nachdem, ob die


Vertretung durch RechtsanwältInnen oder WirtschaftsprüferInnen erfolgt ist?

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 3 / 61
[ Kontingenztafeln ]

Häufigkeitstabellen

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 4 / 61
Marktforschungsbeispiel

Zur Demonstration der wichtigsten Begriffe und zweier wichtiger Verfahren dient ein neues
Beispiel.
Eine Marktforschungsstudie an 300 Personen (90 Frauen, 90 Männer, 120 Kinder) zu
einer neuen Zahnpasta hat bezüglich Geschmack folgendes Resultat gezeigt:

Personengruppe
Geschmack Frau Mann Kind Summe
gut 32 28 90 150
mittel 18 14 4 36
schlecht 40 48 26 114
Summe 90 90 120 300

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 5 / 61
Marktforschungsbeispiel

Zur Demonstration der wichtigsten Begriffe und zweier wichtiger Verfahren dient ein neues
Beispiel.
Eine Marktforschungsstudie an 300 Personen (90 Frauen, 90 Männer, 120 Kinder) zu
einer neuen Zahnpasta hat bezüglich Geschmack folgendes Resultat gezeigt:

Personengruppe
Geschmack Frau Mann Kind Summe
gut 32 28 90 150
mittel 18 14 4 36
schlecht 40 48 26 114
Summe 90 90 120 300

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 6 / 61
Kontingenztafeln

Die zwei kategorialen Variablen Personengruppe (mit Kategorien Frau, Mann, Kind) und
Geschmack (mit Kategorien gut, mittel, schlecht) wurden an 300 Beobachtungseinheiten
erhoben.

Die Auszählung der Häufigkeiten aller Kombinationen von Kategorien führt zur
Kontingenztafel (oder Kreuztabelle, Kreuzklassifikation). Die Elemente dieser
Kontingenztafel nennt man Zellen.

Formal: Gegeben sind zwei kategoriale Variablen A (mit Kategorien a1 , a2 bis aI ) und B
(mit Kategorien b1 bis bJ ). Damit lassen sich die Ereignisse Ai definieren, dass (A = ai ),
und analog die Ereignisse Bj , dass (B = bj ).

Die Zellen enthalten dann die beobachteten (observed) Häufigkeiten, wie oft Ai und Bj
gemeinsam in der Stichprobe aufgetreten sind: oij = h(Ai ∩ Bj ).

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 7 / 61
Kontingenztafeln

b1 b2 ··· bJ Summe
a1 o11 o12 ··· o1J o1+
a2 o21 o22 ··· o2J o2+
.. .. .. .. .. ..
. . . . . .
aI oI1 oI2 ··· oIJ oI +
Summe o+1 o+2 ··· o+J o++ = n

Häufig ergänzt man die Kontingenztafel um Zeilensummen oi + und Spaltensummen o+j .


Diese nennt man Randhäufigkeiten oder Ränder der Kontingenztafel.

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 8 / 61
Relative Häufigkeiten

Die Zellen einer Kontingenztafel enthalten absolute Häufigkeiten. Stellt man diese in
Relation zur Gesamtzahl der Beobachtungen (= n), erhält man die zugehörigen relativen
Häufigkeiten:
h(Ai ∩ Bj ) oij
f (Ai ∩ Bj ) = =
n n
Diese nennt man hier auch kurz Gesamtprozent.

Geschmack Frau Mann Kind


gut 0.107 0.093 0.300
mittel 0.060 0.047 0.013
schlecht 0.133 0.160 0.087

Die Eintragung in der 1. Zeile und 1. Spalte bedeutet, dass 10.7% der Testpersonen aus der
Gruppe Frau waren und den Geschmack der Zahnpasta als gut eingestuft haben.

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 9 / 61
Relative Häufigkeiten

Vergleicht man die Eintragungen in der Kontingenztafel nicht mit n sondern mit den
zugehörigen Randhäufigkeiten, erhält man bedingte relative Häufigkeiten.
Zeilenprozent
h(Ai ∩ Bj ) oij
f (Bj |Ai ) = =
h(Ai ) oi +
Vergleich mit der jeweiligen Zeilensumme. Zeilensummen der bedingten relativen
Häufigkeiten ergeben 1 (= 100%).
Spaltenprozent
h(Ai ∩ Bj ) oij
f (Ai |Bj ) = =
h(Bj ) o+j
Vergleich mit der jeweiligen Spaltensumme. Spaltensummen der bedingten relativen
Häufigkeiten ergeben 1 (= 100%).

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 10 / 61
Spaltenprozent

Folgende Tabelle enthält die bedingten relativen Häufigkeiten für Geschmack gegeben
Personengruppe.

Geschmack Frau Mann Kind


gut 0.356 0.311 0.750
mittel 0.200 0.156 0.033
schlecht 0.444 0.533 0.217
1.000 1.000 1.000

Die Eintragung in der 1. Zeile und 3. Spalte bedeutet, dass von den Kindern 75% den
Geschmack als gut eingestuft haben.

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 11 / 61
Zeilenprozent

Folgende Tabelle enthält die bedingten relativen Häufigkeiten für Personengruppe gegeben
Geschmack eingetragen.

Geschmack Frau Mann Kind


gut 0.213 0.187 0.600 1.000
mittel 0.500 0.389 0.111 1.000
schlecht 0.351 0.421 0.228 1.000

Hier bedeutet etwa die Eintragung in der 1. Zeile und 3. Spalte, dass von den Testpersonen,
die den Geschmack als gut eingestuft haben, 60% Kinder waren.

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 12 / 61
[ Kontingenztafeln ]

Grafische Beschreibung

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 13 / 61
Gruppierte Balkendiagramme

Für die grafische Beschreibung werden meist Balkendiagramme, gruppiert oder gestapelt,
eingesetzt. Am einfachsten sind gruppierte Balkendiagramme: links einmal gruppiert
nach Personengruppe, rechts nach Geschmack.

gut Frau
80

80
mittel Mann
schlecht Kind
absolute Haeufigkeiten

absolute Haeufigkeiten
60

60
40

40
20

20
0

0
Frau Mann Kind gut mittel schlecht

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 14 / 61
Gestapelte Balkendiagramme – absolute Häufigkeiten

Der Zusammenhang der zwei Variaben ist in aller Regel einfacher abzulesen aus
gestapelten Balkendiagrammen: entweder für absolute Häufigkeiten. . .
120

100 120 140


schlecht Kind
100

mittel Mann
gut Frau
absolute Haeufigkeiten

absolute Haeufigkeiten
80

80
60

60
40

40
20

20
0

Frau Mann Kind 0 gut mittel schlecht

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 15 / 61
Gestapelte Balkendiagramme – relative Häufigkeiten

. . . oder bedingte relative Häufigkeiten, die den Zusammenhang noch deutlicher


visualisieren.
1.0

1.0
schlecht Kind
mittel Mann
0.8

0.8
gut Frau
Spaltenprozent

Zeilenprozent
0.6

0.6
0.4

0.4
0.2

0.2
0.0

0.0
Frau Mann Kind gut mittel schlecht

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 16 / 61
Mosaikplot

Zusätzlich kann man durch die Balkenbreite die Häufigkeiten der bedingenden Variablen
(hier der Personengruppen) darstellen.

1.0
schlecht

0.8
Geschmack

0.6
mittel

0.4
0.2
gut

0.0
Frau Mann Kind

Personengruppe
Department of Statistics and Mathematics – WU Wien
c 2008, 2015 Statistik – 7 – Kontingenztafeln – 17 / 61
Konstruktion der Diagramme

Gruppierte Balkendiagramme
Die Höhe der Balken entspricht den absoluten Häufigkeiten.
Gestapelte Balkendiagramme
Die Höhe der Balkenschichten entspricht entweder den absoluten Häufigkeiten
(gestapelt pro Zeile oder Spalte) oder den bedingten relativen Häufigkeiten (d.h.
Zeilen- oder Spaltenprozent).
Mosaikplot
Die Höhe der Balkenschichten entspricht den bedingten relativen Häufigkeiten (d.h.
Zeilen- oder Spaltenprozent). Die Breite der Balken entspricht der Randverteilung der
bedingenden Variablen.

(Durch diese Konstruktion entsprechen die Flächeninhalte der Balkenschichten den


(absoluten) Häufigkeiten.)

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 18 / 61
[ Kontingenztafeln ]

χ2-Test

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 19 / 61
Homogenität

Im Beispiel der Marktforschung ist von Interesse ist, ob die Verteilung der Variablen
Geschmack in den 3 durch Personengruppe eingeteilten Gruppen gleich ist.

Allgemeine Fragestellung im Homogenitätsproblem: Unterscheidet sich die Verteilung


einer kategorialen Variablen A (der abhängigen Variablen) in zwei oder mehreren Gruppen
(definiert durch die erklärende Variable B)?

H0 : die Verteilung der abhängigen Variablen A ist in allen Gruppen gleich


HA : die Verteilung der abhängigen Variablen A ist nicht in allen Gruppen gleich

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 20 / 61
Homogenität ⇔ Unabhängigkeit

Diese Homogenitäts-Nullhypothese gleicher Verteilung der kategorialen Variable A in allen


durch B definierten Gruppen bedeutet formal:

P (Ai |Bj ) = P (Ai )


Unter Verwendung der Definition bedingter Wahrscheinlichkeiten:

P (Ai ∩ Bj )
P (Ai |Bj ) = = P (Ai )
P (Bj )
oder:

P (Ai ∩ Bj ) = P (Ai )P (Bj )


Dies entspricht also genau der Nullhypothese, dass Ai und Bj stochastisch unabhängig
sind (siehe Mathematik-Skriptum).

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 21 / 61
Unabhängigkeit

Die Fragestellung im Marktforschungsbeispiel kann also auch umformuliert werden: Ist die
Variable Geschmack unabhängig von der Variablen Personengruppe?

Allgemeine Fragestellung im Unabhängigkeitsproblem: Sind zwei kategoriale Variablen A


und B stochastisch unabhängig?
H0 : A und B sind stochastisch unabhängig
HA : A und B sind nicht stochastisch unabhängig (sie sind gekoppelt)

Unabhängigkeitsproblem und Homogenitätsproblem sind äquivalent. Als Methode zur


Beantwortung der Fragestellung wird der χ2 -Test vorgestellt.

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 22 / 61
χ2 -Test: Erwartete Häufigkeiten

Unter Annahme der Unabhängigkeit (H0 ) der beiden Variablen gilt für die Wahrscheinlichkeit
für eine Eintragung in Zeile i und Spalte j

P (Ai ∩ Bj ) = P (Ai ) · P (Bj )

Zur Schätzung von P (Ai ) und P (Bj ) werden die relativen Häufigkeiten der Randverteilung
verwendet:
oi + o+j
P (Ai ) ≈ f (Ai ) = und P (Bj ) ≈ f (Bj ) =
n n
Unter H0 erwartet man in n Beobachtungen die Häufigkeiten eij :
oi + o+j
n · P (Ai ∩ Bj ) = n · P (Ai ) · P (Bj ) ≈ n · · = eij
n n

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 23 / 61
Erwartete Häufigkeiten

Eine Formel zur Berechnung der erwarteten (expected) Häufigkeiten (eij ) im allgemeinen
Fall ist somit:
oi + · o+j
eij =
n
Also: Die erwarteten Häufigkeiten sind das Produkt der zugehörigen Randsummen dividiert
durch Stichprobenumfang.

Für das Marktforschungsbeispiel sind die erwarteten Häufigkeiten:

Geschmack Frau Mann Kind


gut 45.0 45.0 60.0
mittel 10.8 10.8 14.4
schlecht 34.2 34.2 45.6

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 24 / 61
Berechnung von X 2

Um zu erfassen, ob sich beobachtete und erwartete Häufigkeiten nicht nur in einzelnen


Zellen sondern über die gesamte Tafel stark unterscheiden, wird der Pearson X 2 -Wert
berechnet:

I X
J
X (oij − eij )2
X2 =
eij
i =1 j =1

Große Werte von X 2 sprechen gegen Unabhängigkeit.

Im Marktforschungsbeispiel gilt:

(32 − 45)2 (28 − 45)2 (26 − 45.6)2


X2 = + + ··· + = 53.414
45 45 45.6

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 25 / 61
Bewertung von X 2

Unter H0 hat X 2 asymptotisch eine χ2 -Verteilung mit df = (I − 1) · (J − 1) Freiheitsgraden


(I Zeilenzahl, J Spaltenzahl). Übersteigt der X 2 -Wert also das (1 − α)-Quantil einer solchen
χ2 -Verteilung, wird H0 verworfen.
Dichten der Chi−Quadrat Verteilung mit verschiedenen Freiheitsgraden df
0.8
0.6

df = 1
df = 2
df = 3
df = 4
0.4

df = 6
df = 9
0.2

0 2 4 6 8 10 12
x
Department of Statistics and Mathematics – WU Wien
c 2008, 2015 Statistik – 7 – Kontingenztafeln – 26 / 61
Bewertung von X 2

Unter H0 hat X 2 asymptotisch eine χ2 -Verteilung mit df = (I − 1) · (J − 1) Freiheitsgraden


(I Zeilenzahl, J Spaltenzahl). Übersteigt der X 2 -Wert also das (1 − α)-Quantil einer solchen
χ2 -Verteilung, wird H0 verworfen.

Bei einer Vierfeldertafel (I = 2, J = 2, df = 1) ist das 95%-Quantil 3.84.

Im Marktforschungsbeispiel ist der Vergleichswert das Quantil einer χ2 -Verteilung mit


df = (3 − 1) · (3 − 1) = 4, der Wert beträgt 9.49.
Der beobachtete Wert von X 2 = 53.414 ist weit größer, daher wird H0 verworfen.

Die Abweichungen oij − eij oder (besser) die Beiträge (oij − eij )/ eij zu X 2 können bei solch
einem signifikanten Resultat zur Interpretation der Abhängigkeit herangezogen werden.

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 27 / 61
χ2 -Test mit R

Über den R-Output gelangt man natürlich zur selben Entscheidung:

Pearson’s Chi-squared test

data: Zahnpasta
X-squared = 53.414, df = 4, p-value = 6.982e-11

Die Werte X 2 = 53.414 und df = 4 werden angezeigt. Da p < 0.05 wird H0 verworfen: Die
Personengruppen haben nicht gleiche Geschmäcker.

Vergleicht man die Differenzen zwischen beobachteten und erwarteten Werten, fällt auf,
dass wesentlich mehr Kinder (nämlich 90) als erwartet (nämlich 60) den Geschmack als gut
eingestuft haben.

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 28 / 61
[ Kontingenztafeln ]

Vergleich von Anteilen

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 29 / 61
Vergleich von Anteilen

Ein wichtiges Einsatzgebiet für den χ2 -Test ist der Vergleich von Anteilen in mehreren
Gruppen.
Sollen etwa im Zahnpastabeispiel nur die Anteile derer verglichen werden, die den
Geschmack der Zahnpasta als schlecht einstufen, erhält man folgende Tabelle (keine
Unterscheidung der Geschmacksgruppen gut und mittel ⇒ Zusammenlegen dieser beiden
Geschmacksgruppen):

Personengruppe
Geschmack Frau Mann Kind Summe
gut/mittel 50 42 94 186
schlecht 40 48 26 114
Summe 90 90 120 300

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 30 / 61
Vergleich von Anteilen

Berechnung über χ2 -Test:

Pearson’s Chi-squared test

data: Zahnpasta2
X-squared = 24.156, df = 2, p-value = 5.684e-06

Interpretation: Das Ergebnis ist signifikant. Die Anteile der Personen, die den Geschmack
der Zahnpasta als schlecht einstufen, ist in den drei Gruppen unterschiedlich.

Das bedeutet nicht unbedingt, dass sich alle Personengruppen untereinander


unterscheiden. So würde der Vergleich von Frauen und Männern keine signifikanten
Unterschiede zeigen.

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 31 / 61
Vergleich von Anteilen

1.0
schlecht

0.8
Geschmack

0.6
0.4
gut/mittel

0.2
0.0
Frau Mann Kind

Personengruppe
Department of Statistics and Mathematics – WU Wien
c 2008, 2015 Statistik – 7 – Kontingenztafeln – 32 / 61
[ Kontingenztafeln ]

Beispielaufgaben: χ2-Test

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 33 / 61
Beispielaufgabe 1: χ2 -Test

In einer Befragung zum Fahrverhalten wurde bei 500 AutofahrerInnen erhoben, welche
Risikofaktoren im Fahrverhalten (Möchte möglichst wenig überholt werden, Häufiges
Lückenspringen im Kolonnenverkehr, usw.) vorliegen.
Eine Einteilung der AutofahrerInnen in Risikogruppen (Risiko gering und Risiko erhöht) und
nach Geschlecht ergab folgende Einteilung:

Risiko Frau Mann


erhoeht 71 118
gering 154 157

Ein χ2 -Test zur Überprüfung von Unterschieden im Risikoverhalten zwischen den


Geschlechtern lieferte einen X 2 -Wert von 6.78.

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 34 / 61
Beispielaufgabe 1: χ2 -Test

In der Stichprobe ist der Anteil von Personen mit geringem Risiko bei Frauen höher als
bei Männern. richtig (Frauen: 0.684; Männer: 0.571)
Die Anzahl der Freiheitsgrade beträgt 2. falsch
Die Nullhypothese lautet: Das Risikoverhalten ist bei Frauen und Männern gleich.
richtig
Die Nullhypothese wird verworfen. richtig
Der Test weist nach, dass das Risiko bei Frauen geringer ist. (Signifikanzniveau 5%)
richtig

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 35 / 61
Beispielaufgabe 1: χ2 -Test

In der Stichprobe ist der Anteil von Personen mit geringem Risiko bei Frauen höher als
bei Männern. richtig (Frauen: 0.684; Männer: 0.571)
Die Anzahl der Freiheitsgrade beträgt 2. falsch
Die Nullhypothese lautet: Das Risikoverhalten ist bei Frauen und Männern gleich.
richtig
Die Nullhypothese wird verworfen. richtig
Der Test weist nach, dass das Risiko bei Frauen geringer ist. (Signifikanzniveau 5%)
richtig

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 36 / 61
Beispielaufgabe 2: χ2 -Test
In einer Befragung zum Freizeitverhalten wurde bei 400 Befragten erhoben, welche
Interessen in der Freizeit verfolgt werden.
Das Ergebnis für die Interessen an Kultur und an Sport gibt die folgende Tabelle wieder:

Kultur
Sport nie manchmal oft
nie 32 25 32
manchmal 62 74 48
oft 66 31 30

Ein χ2 -Test ergibt:

Pearson’s Chi-squared test

data: Freizeit
X-squared = 16.344, df = 4, p-value = 0.00259

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 37 / 61
Beispielaufgabe 2: χ2 -Test

Die Teststatistik ist kleiner als 19.84. richtig


Die Anzahl der Freiheitsgrade beträgt 4. richtig
Die Alternativhypothese lautet: Das Verfolgen der Interessen für Kultur und der
Interessen für Sport sind unabhängig. falsch
Die Nullhypothese wird beibehalten. falsch
Der Test weist nach, dass das Verfolgen der Interessen für Kultur und der Interessen
für Sport gekoppelt (= nicht unabhängig) sind. richtig

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 38 / 61
Beispielaufgabe 2: χ2 -Test

Die Teststatistik ist kleiner als 19.84. richtig


Die Anzahl der Freiheitsgrade beträgt 4. richtig
Die Alternativhypothese lautet: Das Verfolgen der Interessen für Kultur und der
Interessen für Sport sind unabhängig. falsch
Die Nullhypothese wird beibehalten. falsch
Der Test weist nach, dass das Verfolgen der Interessen für Kultur und der Interessen
für Sport gekoppelt (= nicht unabhängig) sind. richtig

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 39 / 61
[ Kontingenztafeln ]

Symmetrie

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 40 / 61
Symmetrie

In einem Großbetrieb soll eine neue Verwaltungssoftware eingeführt werden. 70


TeilnehmerInnen eines Einschulungskurses werden über die neue Software vor und nach
der Schulung befragt.

Einstellung nachher
Einstellung vorher positiv negativ
positiv 15 11
negativ 23 21

Hat sich die Einstellung geändert?

Formal: Sind die Randverteilungen der Variablen gleich? Ist P (A) = P (B )?

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 41 / 61
Datenlage

Hätte man einige KursteilnehmerInnen vor der Schulung und die anderen danach befragt,
könnte ein χ2 -Test eingesetzt werden, um die Anteile der positiv Eingestellten zu
vergleichen.

Aber: Es liegen keine unabhängigen Stichproben vor. Pro SchulungsteilnehmerIn gibt es


zwei Bewertungen: eine Bewertung vor und eine nach der Schulung (ein Paar von
Bewertungen). Bei einigen hat sich die Bewertung nicht geändert, bei einigen schon. Die
Änderungen können in zwei Richtungen erfolgen: von positiv zu negativ und umgekehrt.

Wie im Symmetrieproblem des Kapitels 5 spricht man von gepaarten Daten oder
verbundenen Stichproben.

Wenn sich in der Gesamtbewertung deutlich etwas geändert haben soll, muss es deutlich
mehr Änderungen in eine Richtung als in die andere gegeben haben.

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 42 / 61
Symmetrie-Test

Die Frage nach Änderung der Einstellung führt also zu folgendem Testproblem.

H0 : Der Anteil der Änderungen ist in jede Richtung gleich (= 1/2).


HA : Die Anteile unterscheiden sich.

Für dieses Problem kann also der Test für Anteile aus Kapitel 3 verwendet werden.

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 43 / 61
Symmetrie-Test

Es hat insgesamt 34 Änderungen in der Bewertung gegeben, 11 von positiv zu negativ, 23


in die andere Richtung (p = 11/34 = 0.32353).

11/34 − 0.5
T = q = −2.058
0 .5 ·0 .5
34

Interpretation:
Der Absolutbetrag der T -Statistik ist größer als 1.96, daher ist das Ergebnis signifikant.
Die Einstellungsänderungen sind nicht in jede Richtung gleich wahrscheinlich.
In der Stichprobe hat sich die Einstellung zur neuen Software verbessert (23 zu 11).
Daher läuft die Interpretation in diese Richtung: Es gibt signifikant mehr
Einstellungsänderungen von negativ zu positiv als umgekehrt.

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 44 / 61
Symmetrie-Test

Asymptotic binomial test

data: 11 and 34
Z = -2.058, p-value = 0.03959
alternative hypothesis: true probability of success
is not equal to 0.5
95 percent confidence interval:
0.1662797 0.4807792
sample estimates:
probability of success
0.3235294

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 45 / 61
Signifikanz und Relevanz

Bei den vorgestellten Symmetrietests werden nur die Zellen der Vierfeldertafel
berücksichtigt, die eine Änderung anzeigen.
Sonntagsfrage: 500 Personen wurden einmal zwei Monate und einmal eine Woche vor
einer Wahl über die Parteipräferenz zwischen den zwei dominanten Parteien befragt.

Eine Woche davor


Zwei Monate davor Partei A Partei B
Partei A 194 11
Partei B 23 272

Die Eintragungen in der Hauptdiagonale zeigen an, dass fast die meisten Personen in der
Parteipräferenz gleich geblieben sind. Zwar würde ein signifikantes Ergebnis im
Symmetrietest angezeigt werden (dieselben Gegendiagonalelemente wie vorhin), dieses
wäre aber bei dieser Verteilung der Parteipräferenzen nicht von Bedeutung!

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 46 / 61
[ Kontingenztafeln ]

Beispielaufgabe: Symmetrietest

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 47 / 61
Beispielaufgabe: Symmetrietest

Vor einer Wahl stellen sich die SpitzenkandidatInnen der kandidierenden Parteien in
mehreren TV-Duellen den Fragen von Zuschauern und Journalisten.
200 Personen wurden vor und nach diesen TV-Duellen über die Präferenz für eine der
beiden größten Parteien befragt. In der folgenden Tabelle sind die Parteipräferenzen zu den
zwei Zeitpunkten zusammengefasst:

Nach TV-Duell
Vor TV-Duell Partei A Partei B
Partei A 74 31
Partei B 16 79

Zur Überprüfung, ob die Änderungen in der Parteipräferenz klar für eine der beiden Parteien
sprechen, ergab ein Anteilstest einen Wert der Teststatistik von 2.188.

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 48 / 61
Beispielaufgabe: Symmetrietest

In der Stichprobe hat es mehr Wechsel von A zu B gegeben als umgekehrt. richtig
Die Nullhypothese lautet: Die Wahrscheinlichkeit, in der Parteipräferenz vorne zu
liegen, ist für beide Parteien gleich. falsch
Die Alternativhypothese wird angenommen. richtig
Der Test weist nach, dass es mehr Änderungen von Partei A zu Partei B als umgekehrt
gibt. (Signifikanzniveau 5%) richtig
Unter den Befragten hat Partei A nach den TV-Duellen die Mehrheit. falsch

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 49 / 61
Beispielaufgabe: Symmetrietest

In der Stichprobe hat es mehr Wechsel von A zu B gegeben als umgekehrt. richtig
Die Nullhypothese lautet: Die Wahrscheinlichkeit, in der Parteipräferenz vorne zu
liegen, ist für beide Parteien gleich. falsch
Die Alternativhypothese wird angenommen. richtig
Der Test weist nach, dass es mehr Änderungen von Partei A zu Partei B als umgekehrt
gibt. (Signifikanzniveau 5%) richtig
Unter den Befragten hat Partei A nach den TV-Duellen die Mehrheit. falsch

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 50 / 61
[ Kontingenztafeln ]

Einleitungsbeispiel: VwGH-Entscheidungen
2000–2004

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 51 / 61
Einleitungsbeispiel: VwGH-Entscheidungen 2000–2004

Die wichtigsten Entscheidungen des VwGH in Abgabensachen, getrennt für


RechtsanwältInnen und WirtschaftsprüferInnen ausgezählt, sind in der folgenden Tabelle
sowohl in absoluten als auch in bedingten relativen Häufigkeiten gegeben:

absolut in %
Entscheidung RA WP RA WP
Abweisung 2061 210 66.5 65.6
Aufhebung 916 102 29.6 31.9
teilweise Aufhebung 122 8 3.9 2.5

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 52 / 61
VwGH: Balkendiagramme

Ein Balkendiagramm mit absoluten Häufigkeiten ist für den Vergleich kaum geeignet, eines
mit bedingten relativen Häufigkeiten weit besser.

VwGH−Entscheidungen VwGH−Entscheidungen

1.0
3000

teilweise Aufhebung teilweise Aufhebung


Aufhebung Aufhebung

0.8
Abweisung Abweisung
absolute Haeufigkeiten

relative Haeufigkeiten
2000

0.6
0.4
1000

0.2
500

0.0
0

RA WP RA WP

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 53 / 61
VwGH: Mosaikplot

Im Mosaikplot wird zusätzlich deutlich, dass weit weniger WirtschaftsprüferInnen die


Berufungen vor dem VwGH vertreten haben.
VwGH−Entscheidungen

1.0
tw. Aufh.

0.8
Entscheidung

0.6
Aufh.

0.4
0.2
Abw.

0.0
RA WP

Vertretung
Department of Statistics and Mathematics – WU Wien
c 2008, 2015 Statistik – 7 – Kontingenztafeln – 54 / 61
VwGH: χ2 -Test

Die beobachteten und erwarteten erwarteten Häufigkeiten können zur händischen


Berechnung des X 2 -Wertes verwendet werden.

beobachtet erwartet
Entscheidung RA WP RA WP
Abweisung 2061 210 2058.447 212.553
Aufhebung 916 102 922.721 95.279
teilweise Aufhebung 122 8 117.833 12.167

(2061 − 2058.447)2 (210 − 212.553)2


X2 = + + · · · = 2.132
2058.447 212.553

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 55 / 61
VwGH: χ2 -Test in R

Bequemer sind die wesentlichen Testdaten dem R-Output zu entnehmen:

Pearson’s Chi-squared test

data: VwGH
X-squared = 2.1315, df = 2, p-value = 0.3445

Interpretation: Aufgrund des p-Wertes kann nicht auf Unterschiede in den Häufigkeiten für
die einzelnen Entscheidungen zwischen den beiden Vertretungsarten (RA oder WP)
geschlossen werden.

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 56 / 61
[ Kontingenztafeln ]

Achtung: Überinterpretation

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 57 / 61
Wer Musikschulen schließt, gefährdet die innere Sicherheit.

Mit diesem Satz pointierte im Jahr 2000 der damalige deutsche Innenminister Otto Schily
bei einem Musikschul-Kongress in Nordrhein-Westfalen eine Studie mit dem Ergebnis:
Kinder, die ein Instrument spielen, sind weniger anfällig für kriminelle Einflüsse als Kinder
ohne musische Erziehung.

Der Vorsitzende der Fachgruppe Musik der IG Medien Hessen, Uwe Schmidt, fasste im
Jänner 2001 dieses Resultat bei der Eröffnung des Symposiums zum Thema
Musikunterricht für die Gesellschaft in Darmstadt etwas moderater mit: "Musische Kinder
werden seltener kriminell" zusammen (laut dpa-Meldung vom 20.1.2001).

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 58 / 61
Signifikanz 6= Kausalität

Beide Interpretationen der Studie, vor allem die erste, gehen (bewusst oder nicht) in eine
kausale Richtung: weil die Kinder ein Musikinstrument spielen, werden sie nicht kriminell.

Bei solch kausalen Interpretationen ist Vorsicht geboten. Möglicherweise gibt es Faktoren,
die sowohl darauf Einfluss haben, ob Jugendliche ein Musikinstrument erlernen, als auch
auf die Gefahr, dass sie kriminell auffällig werden.
In diesem Beispiel etwa: Bildungsstatus und/oder Einkommen der Eltern.

Die meisten empirischen Studien lassen kausale Interpretationen nicht zu (im Unterschied
zu Experimenten, etwa in der Psychologie).

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 59 / 61
Die eigentliche Studie

Eine direkte präventive Wirkung von Musikerziehung sei allerdings schwer zu messen,
betonte der Lehrstuhlinhaber für Kriminologie an der Universität Mainz, Michael Bock.
Vorbeugend gegen kriminelle Einflüsse wirkten allgemein Freizeitaktivitäten in einem klar
strukturierten Umfeld. Dies habe ein Vergleich des Verhaltens von 200 Häftlingen mit 200
nicht auffälligen jungen Erwachsenen ergeben.
Musizieren gehöre zu denjenigen Freizeitbeschäftigungen, die einen strukturierten,
Bindungen schaffenden Rahmen erzeugten. Deshalb sei es nötig, die Musikpädagogik
wieder mehr zu betonen.
(dpa-Meldung vom 20.1.2001).

Department of Statistics and Mathematics – WU Wien


c 2008, 2015 Statistik – 7 – Kontingenztafeln – 60 / 61

Das könnte Ihnen auch gefallen