Beruflich Dokumente
Kultur Dokumente
Kontingenztafeln
Eine Auszählung von mehr als 3000 Entscheidungen - hier nur Abweisung der Berufung,
Aufhebung (völlig oder teilweise) des Abgabenbescheides - ergibt:
VwGH−Entscheidungen
Vertretung
1.0
tw. Aufh.
Entscheidung RA WP
0.8
Entscheidung
Abweisung 2061 210
0.6
Aufh.
0.4
Aufhebung 916 102
0.2
Abw.
teilweise Aufhebung 122 8
0.0
RA WP
Vertretung
Häufigkeitstabellen
Zur Demonstration der wichtigsten Begriffe und zweier wichtiger Verfahren dient ein neues
Beispiel.
Eine Marktforschungsstudie an 300 Personen (90 Frauen, 90 Männer, 120 Kinder) zu
einer neuen Zahnpasta hat bezüglich Geschmack folgendes Resultat gezeigt:
Personengruppe
Geschmack Frau Mann Kind Summe
gut 32 28 90 150
mittel 18 14 4 36
schlecht 40 48 26 114
Summe 90 90 120 300
Zur Demonstration der wichtigsten Begriffe und zweier wichtiger Verfahren dient ein neues
Beispiel.
Eine Marktforschungsstudie an 300 Personen (90 Frauen, 90 Männer, 120 Kinder) zu
einer neuen Zahnpasta hat bezüglich Geschmack folgendes Resultat gezeigt:
Personengruppe
Geschmack Frau Mann Kind Summe
gut 32 28 90 150
mittel 18 14 4 36
schlecht 40 48 26 114
Summe 90 90 120 300
Die zwei kategorialen Variablen Personengruppe (mit Kategorien Frau, Mann, Kind) und
Geschmack (mit Kategorien gut, mittel, schlecht) wurden an 300 Beobachtungseinheiten
erhoben.
Die Auszählung der Häufigkeiten aller Kombinationen von Kategorien führt zur
Kontingenztafel (oder Kreuztabelle, Kreuzklassifikation). Die Elemente dieser
Kontingenztafel nennt man Zellen.
Formal: Gegeben sind zwei kategoriale Variablen A (mit Kategorien a1 , a2 bis aI ) und B
(mit Kategorien b1 bis bJ ). Damit lassen sich die Ereignisse Ai definieren, dass (A = ai ),
und analog die Ereignisse Bj , dass (B = bj ).
Die Zellen enthalten dann die beobachteten (observed) Häufigkeiten, wie oft Ai und Bj
gemeinsam in der Stichprobe aufgetreten sind: oij = h(Ai ∩ Bj ).
b1 b2 ··· bJ Summe
a1 o11 o12 ··· o1J o1+
a2 o21 o22 ··· o2J o2+
.. .. .. .. .. ..
. . . . . .
aI oI1 oI2 ··· oIJ oI +
Summe o+1 o+2 ··· o+J o++ = n
Die Zellen einer Kontingenztafel enthalten absolute Häufigkeiten. Stellt man diese in
Relation zur Gesamtzahl der Beobachtungen (= n), erhält man die zugehörigen relativen
Häufigkeiten:
h(Ai ∩ Bj ) oij
f (Ai ∩ Bj ) = =
n n
Diese nennt man hier auch kurz Gesamtprozent.
Die Eintragung in der 1. Zeile und 1. Spalte bedeutet, dass 10.7% der Testpersonen aus der
Gruppe Frau waren und den Geschmack der Zahnpasta als gut eingestuft haben.
Vergleicht man die Eintragungen in der Kontingenztafel nicht mit n sondern mit den
zugehörigen Randhäufigkeiten, erhält man bedingte relative Häufigkeiten.
Zeilenprozent
h(Ai ∩ Bj ) oij
f (Bj |Ai ) = =
h(Ai ) oi +
Vergleich mit der jeweiligen Zeilensumme. Zeilensummen der bedingten relativen
Häufigkeiten ergeben 1 (= 100%).
Spaltenprozent
h(Ai ∩ Bj ) oij
f (Ai |Bj ) = =
h(Bj ) o+j
Vergleich mit der jeweiligen Spaltensumme. Spaltensummen der bedingten relativen
Häufigkeiten ergeben 1 (= 100%).
Folgende Tabelle enthält die bedingten relativen Häufigkeiten für Geschmack gegeben
Personengruppe.
Die Eintragung in der 1. Zeile und 3. Spalte bedeutet, dass von den Kindern 75% den
Geschmack als gut eingestuft haben.
Folgende Tabelle enthält die bedingten relativen Häufigkeiten für Personengruppe gegeben
Geschmack eingetragen.
Hier bedeutet etwa die Eintragung in der 1. Zeile und 3. Spalte, dass von den Testpersonen,
die den Geschmack als gut eingestuft haben, 60% Kinder waren.
Grafische Beschreibung
Für die grafische Beschreibung werden meist Balkendiagramme, gruppiert oder gestapelt,
eingesetzt. Am einfachsten sind gruppierte Balkendiagramme: links einmal gruppiert
nach Personengruppe, rechts nach Geschmack.
gut Frau
80
80
mittel Mann
schlecht Kind
absolute Haeufigkeiten
absolute Haeufigkeiten
60
60
40
40
20
20
0
0
Frau Mann Kind gut mittel schlecht
Der Zusammenhang der zwei Variaben ist in aller Regel einfacher abzulesen aus
gestapelten Balkendiagrammen: entweder für absolute Häufigkeiten. . .
120
mittel Mann
gut Frau
absolute Haeufigkeiten
absolute Haeufigkeiten
80
80
60
60
40
40
20
20
0
1.0
schlecht Kind
mittel Mann
0.8
0.8
gut Frau
Spaltenprozent
Zeilenprozent
0.6
0.6
0.4
0.4
0.2
0.2
0.0
0.0
Frau Mann Kind gut mittel schlecht
Zusätzlich kann man durch die Balkenbreite die Häufigkeiten der bedingenden Variablen
(hier der Personengruppen) darstellen.
1.0
schlecht
0.8
Geschmack
0.6
mittel
0.4
0.2
gut
0.0
Frau Mann Kind
Personengruppe
Department of Statistics and Mathematics – WU Wien
c 2008, 2015 Statistik – 7 – Kontingenztafeln – 17 / 61
Konstruktion der Diagramme
Gruppierte Balkendiagramme
Die Höhe der Balken entspricht den absoluten Häufigkeiten.
Gestapelte Balkendiagramme
Die Höhe der Balkenschichten entspricht entweder den absoluten Häufigkeiten
(gestapelt pro Zeile oder Spalte) oder den bedingten relativen Häufigkeiten (d.h.
Zeilen- oder Spaltenprozent).
Mosaikplot
Die Höhe der Balkenschichten entspricht den bedingten relativen Häufigkeiten (d.h.
Zeilen- oder Spaltenprozent). Die Breite der Balken entspricht der Randverteilung der
bedingenden Variablen.
χ2-Test
Im Beispiel der Marktforschung ist von Interesse ist, ob die Verteilung der Variablen
Geschmack in den 3 durch Personengruppe eingeteilten Gruppen gleich ist.
P (Ai ∩ Bj )
P (Ai |Bj ) = = P (Ai )
P (Bj )
oder:
Die Fragestellung im Marktforschungsbeispiel kann also auch umformuliert werden: Ist die
Variable Geschmack unabhängig von der Variablen Personengruppe?
Unter Annahme der Unabhängigkeit (H0 ) der beiden Variablen gilt für die Wahrscheinlichkeit
für eine Eintragung in Zeile i und Spalte j
Zur Schätzung von P (Ai ) und P (Bj ) werden die relativen Häufigkeiten der Randverteilung
verwendet:
oi + o+j
P (Ai ) ≈ f (Ai ) = und P (Bj ) ≈ f (Bj ) =
n n
Unter H0 erwartet man in n Beobachtungen die Häufigkeiten eij :
oi + o+j
n · P (Ai ∩ Bj ) = n · P (Ai ) · P (Bj ) ≈ n · · = eij
n n
Eine Formel zur Berechnung der erwarteten (expected) Häufigkeiten (eij ) im allgemeinen
Fall ist somit:
oi + · o+j
eij =
n
Also: Die erwarteten Häufigkeiten sind das Produkt der zugehörigen Randsummen dividiert
durch Stichprobenumfang.
I X
J
X (oij − eij )2
X2 =
eij
i =1 j =1
Im Marktforschungsbeispiel gilt:
df = 1
df = 2
df = 3
df = 4
0.4
df = 6
df = 9
0.2
0 2 4 6 8 10 12
x
Department of Statistics and Mathematics – WU Wien
c 2008, 2015 Statistik – 7 – Kontingenztafeln – 26 / 61
Bewertung von X 2
data: Zahnpasta
X-squared = 53.414, df = 4, p-value = 6.982e-11
Die Werte X 2 = 53.414 und df = 4 werden angezeigt. Da p < 0.05 wird H0 verworfen: Die
Personengruppen haben nicht gleiche Geschmäcker.
Vergleicht man die Differenzen zwischen beobachteten und erwarteten Werten, fällt auf,
dass wesentlich mehr Kinder (nämlich 90) als erwartet (nämlich 60) den Geschmack als gut
eingestuft haben.
Ein wichtiges Einsatzgebiet für den χ2 -Test ist der Vergleich von Anteilen in mehreren
Gruppen.
Sollen etwa im Zahnpastabeispiel nur die Anteile derer verglichen werden, die den
Geschmack der Zahnpasta als schlecht einstufen, erhält man folgende Tabelle (keine
Unterscheidung der Geschmacksgruppen gut und mittel ⇒ Zusammenlegen dieser beiden
Geschmacksgruppen):
Personengruppe
Geschmack Frau Mann Kind Summe
gut/mittel 50 42 94 186
schlecht 40 48 26 114
Summe 90 90 120 300
data: Zahnpasta2
X-squared = 24.156, df = 2, p-value = 5.684e-06
Interpretation: Das Ergebnis ist signifikant. Die Anteile der Personen, die den Geschmack
der Zahnpasta als schlecht einstufen, ist in den drei Gruppen unterschiedlich.
1.0
schlecht
0.8
Geschmack
0.6
0.4
gut/mittel
0.2
0.0
Frau Mann Kind
Personengruppe
Department of Statistics and Mathematics – WU Wien
c 2008, 2015 Statistik – 7 – Kontingenztafeln – 32 / 61
[ Kontingenztafeln ]
Beispielaufgaben: χ2-Test
In einer Befragung zum Fahrverhalten wurde bei 500 AutofahrerInnen erhoben, welche
Risikofaktoren im Fahrverhalten (Möchte möglichst wenig überholt werden, Häufiges
Lückenspringen im Kolonnenverkehr, usw.) vorliegen.
Eine Einteilung der AutofahrerInnen in Risikogruppen (Risiko gering und Risiko erhöht) und
nach Geschlecht ergab folgende Einteilung:
In der Stichprobe ist der Anteil von Personen mit geringem Risiko bei Frauen höher als
bei Männern. richtig (Frauen: 0.684; Männer: 0.571)
Die Anzahl der Freiheitsgrade beträgt 2. falsch
Die Nullhypothese lautet: Das Risikoverhalten ist bei Frauen und Männern gleich.
richtig
Die Nullhypothese wird verworfen. richtig
Der Test weist nach, dass das Risiko bei Frauen geringer ist. (Signifikanzniveau 5%)
richtig
In der Stichprobe ist der Anteil von Personen mit geringem Risiko bei Frauen höher als
bei Männern. richtig (Frauen: 0.684; Männer: 0.571)
Die Anzahl der Freiheitsgrade beträgt 2. falsch
Die Nullhypothese lautet: Das Risikoverhalten ist bei Frauen und Männern gleich.
richtig
Die Nullhypothese wird verworfen. richtig
Der Test weist nach, dass das Risiko bei Frauen geringer ist. (Signifikanzniveau 5%)
richtig
Kultur
Sport nie manchmal oft
nie 32 25 32
manchmal 62 74 48
oft 66 31 30
data: Freizeit
X-squared = 16.344, df = 4, p-value = 0.00259
Symmetrie
Einstellung nachher
Einstellung vorher positiv negativ
positiv 15 11
negativ 23 21
Hätte man einige KursteilnehmerInnen vor der Schulung und die anderen danach befragt,
könnte ein χ2 -Test eingesetzt werden, um die Anteile der positiv Eingestellten zu
vergleichen.
Wie im Symmetrieproblem des Kapitels 5 spricht man von gepaarten Daten oder
verbundenen Stichproben.
Wenn sich in der Gesamtbewertung deutlich etwas geändert haben soll, muss es deutlich
mehr Änderungen in eine Richtung als in die andere gegeben haben.
Die Frage nach Änderung der Einstellung führt also zu folgendem Testproblem.
Für dieses Problem kann also der Test für Anteile aus Kapitel 3 verwendet werden.
11/34 − 0.5
T = q = −2.058
0 .5 ·0 .5
34
Interpretation:
Der Absolutbetrag der T -Statistik ist größer als 1.96, daher ist das Ergebnis signifikant.
Die Einstellungsänderungen sind nicht in jede Richtung gleich wahrscheinlich.
In der Stichprobe hat sich die Einstellung zur neuen Software verbessert (23 zu 11).
Daher läuft die Interpretation in diese Richtung: Es gibt signifikant mehr
Einstellungsänderungen von negativ zu positiv als umgekehrt.
data: 11 and 34
Z = -2.058, p-value = 0.03959
alternative hypothesis: true probability of success
is not equal to 0.5
95 percent confidence interval:
0.1662797 0.4807792
sample estimates:
probability of success
0.3235294
Bei den vorgestellten Symmetrietests werden nur die Zellen der Vierfeldertafel
berücksichtigt, die eine Änderung anzeigen.
Sonntagsfrage: 500 Personen wurden einmal zwei Monate und einmal eine Woche vor
einer Wahl über die Parteipräferenz zwischen den zwei dominanten Parteien befragt.
Die Eintragungen in der Hauptdiagonale zeigen an, dass fast die meisten Personen in der
Parteipräferenz gleich geblieben sind. Zwar würde ein signifikantes Ergebnis im
Symmetrietest angezeigt werden (dieselben Gegendiagonalelemente wie vorhin), dieses
wäre aber bei dieser Verteilung der Parteipräferenzen nicht von Bedeutung!
Beispielaufgabe: Symmetrietest
Vor einer Wahl stellen sich die SpitzenkandidatInnen der kandidierenden Parteien in
mehreren TV-Duellen den Fragen von Zuschauern und Journalisten.
200 Personen wurden vor und nach diesen TV-Duellen über die Präferenz für eine der
beiden größten Parteien befragt. In der folgenden Tabelle sind die Parteipräferenzen zu den
zwei Zeitpunkten zusammengefasst:
Nach TV-Duell
Vor TV-Duell Partei A Partei B
Partei A 74 31
Partei B 16 79
Zur Überprüfung, ob die Änderungen in der Parteipräferenz klar für eine der beiden Parteien
sprechen, ergab ein Anteilstest einen Wert der Teststatistik von 2.188.
In der Stichprobe hat es mehr Wechsel von A zu B gegeben als umgekehrt. richtig
Die Nullhypothese lautet: Die Wahrscheinlichkeit, in der Parteipräferenz vorne zu
liegen, ist für beide Parteien gleich. falsch
Die Alternativhypothese wird angenommen. richtig
Der Test weist nach, dass es mehr Änderungen von Partei A zu Partei B als umgekehrt
gibt. (Signifikanzniveau 5%) richtig
Unter den Befragten hat Partei A nach den TV-Duellen die Mehrheit. falsch
In der Stichprobe hat es mehr Wechsel von A zu B gegeben als umgekehrt. richtig
Die Nullhypothese lautet: Die Wahrscheinlichkeit, in der Parteipräferenz vorne zu
liegen, ist für beide Parteien gleich. falsch
Die Alternativhypothese wird angenommen. richtig
Der Test weist nach, dass es mehr Änderungen von Partei A zu Partei B als umgekehrt
gibt. (Signifikanzniveau 5%) richtig
Unter den Befragten hat Partei A nach den TV-Duellen die Mehrheit. falsch
Einleitungsbeispiel: VwGH-Entscheidungen
2000–2004
absolut in %
Entscheidung RA WP RA WP
Abweisung 2061 210 66.5 65.6
Aufhebung 916 102 29.6 31.9
teilweise Aufhebung 122 8 3.9 2.5
Ein Balkendiagramm mit absoluten Häufigkeiten ist für den Vergleich kaum geeignet, eines
mit bedingten relativen Häufigkeiten weit besser.
VwGH−Entscheidungen VwGH−Entscheidungen
1.0
3000
0.8
Abweisung Abweisung
absolute Haeufigkeiten
relative Haeufigkeiten
2000
0.6
0.4
1000
0.2
500
0.0
0
RA WP RA WP
1.0
tw. Aufh.
0.8
Entscheidung
0.6
Aufh.
0.4
0.2
Abw.
0.0
RA WP
Vertretung
Department of Statistics and Mathematics – WU Wien
c 2008, 2015 Statistik – 7 – Kontingenztafeln – 54 / 61
VwGH: χ2 -Test
beobachtet erwartet
Entscheidung RA WP RA WP
Abweisung 2061 210 2058.447 212.553
Aufhebung 916 102 922.721 95.279
teilweise Aufhebung 122 8 117.833 12.167
data: VwGH
X-squared = 2.1315, df = 2, p-value = 0.3445
Interpretation: Aufgrund des p-Wertes kann nicht auf Unterschiede in den Häufigkeiten für
die einzelnen Entscheidungen zwischen den beiden Vertretungsarten (RA oder WP)
geschlossen werden.
Achtung: Überinterpretation
Mit diesem Satz pointierte im Jahr 2000 der damalige deutsche Innenminister Otto Schily
bei einem Musikschul-Kongress in Nordrhein-Westfalen eine Studie mit dem Ergebnis:
Kinder, die ein Instrument spielen, sind weniger anfällig für kriminelle Einflüsse als Kinder
ohne musische Erziehung.
Der Vorsitzende der Fachgruppe Musik der IG Medien Hessen, Uwe Schmidt, fasste im
Jänner 2001 dieses Resultat bei der Eröffnung des Symposiums zum Thema
Musikunterricht für die Gesellschaft in Darmstadt etwas moderater mit: "Musische Kinder
werden seltener kriminell" zusammen (laut dpa-Meldung vom 20.1.2001).
Beide Interpretationen der Studie, vor allem die erste, gehen (bewusst oder nicht) in eine
kausale Richtung: weil die Kinder ein Musikinstrument spielen, werden sie nicht kriminell.
Bei solch kausalen Interpretationen ist Vorsicht geboten. Möglicherweise gibt es Faktoren,
die sowohl darauf Einfluss haben, ob Jugendliche ein Musikinstrument erlernen, als auch
auf die Gefahr, dass sie kriminell auffällig werden.
In diesem Beispiel etwa: Bildungsstatus und/oder Einkommen der Eltern.
Die meisten empirischen Studien lassen kausale Interpretationen nicht zu (im Unterschied
zu Experimenten, etwa in der Psychologie).
Eine direkte präventive Wirkung von Musikerziehung sei allerdings schwer zu messen,
betonte der Lehrstuhlinhaber für Kriminologie an der Universität Mainz, Michael Bock.
Vorbeugend gegen kriminelle Einflüsse wirkten allgemein Freizeitaktivitäten in einem klar
strukturierten Umfeld. Dies habe ein Vergleich des Verhaltens von 200 Häftlingen mit 200
nicht auffälligen jungen Erwachsenen ergeben.
Musizieren gehöre zu denjenigen Freizeitbeschäftigungen, die einen strukturierten,
Bindungen schaffenden Rahmen erzeugten. Deshalb sei es nötig, die Musikpädagogik
wieder mehr zu betonen.
(dpa-Meldung vom 20.1.2001).