Beruflich Dokumente
Kultur Dokumente
I. Abstract
Zeitungsartikel wie jener in der NZZ vom 30. Juni 2013 lassen aufhorchen: „Zugang zum
Langzeitgymnasium erhalten heute nicht die klügsten Kinder, sondern jene Sprösslinge,
deren Eltern die Vorbereitungskurse bezahlen können“.1 Ob sich eine solche Aussage auch
im Kanton Aargau machen lässt, und von welchen anderen Faktoren gute Bildung abhängen
könnte, habe ich untersucht. So habe ich den Gymnasiasten-, Bezirks-, Sekundar- und
Realschüleranteil jeder Aargauer Gemeinde bestimmt. Diese Grössen stellte ich der
Bevölkerungsdichte, dem Reinvermögen, den Wähleranteilen der vier grössten Parteien,
dem Ausländeranteil und dem durchschnittlichen steuerbaren Einkommen pro
steuerpflichtige Person gegenüber. Die meisten verwendeten Zahlen hatte ich aus der
statistischen Datenbank des Kantons Aargau. Tatsächlich wird der Bezirks- und
Realschüleranteil einer Gemeinde vom durchschnittlichen Einkommen pro steuerpflichtige
Person, dem Reinvermögen und dem Ausländeranteil beeinflusst. Das Reinvermögen, die
Bevölkerungsdichte, der FDP-, SP- und SVP Wähleranteil und das durchschnittliche
Einkommen pro steuerpflichtige Person beeinflussen - wenn teilweise auch nur in geringem
Masse - den Gymnasiastenanteil der Aargauer Gemeinden.
II. Vorwort
Ich möchte folgenden Personen danken, die mich während des Arbeitsprozesses unterstützt
haben:
• Daniel Cahn für die Gewährung des kostenlosen Zugangs zur kantonalen
statistischen Datenbank.
• Peter Hartmann (dipl. math. ETH / Executive MBA HSG, Inhaber der Firma AFO-
Marketing, wo ich mein Praktikum gemacht habe) für die fachmännische Beratung
und die Tipps, die er mir gegeben hat, vor allem bei der Datensammlung.
• Christiane Okonek (PD Dr. rer. pol., Mitarbeiterin der AFO-Marketing) für die
Beantwortung und Klärung aller meiner Fragen, die während des Arbeitsprozesses
im Zusammenhang mit Statistik entstanden sind und auch für die teilweise
Aufbereitung meiner Daten.
• Prof. Dr. Werner Stahel, Seminar für Statistik, ETH Zürich, für die Beantwortung
meiner Anfrage bezüglich eines Fehlers in der von mir verwendeten Fachliteratur.
Weiter möchte ich mich bei Herrn Michel Hauswirth bedanken, der mich während des
ganzen Arbeitsprozesses als Betreuungsperson unterstützt hat.
3
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
III. Inhaltsverzeichnis
1 Einleitung ....................................................................................................................... 6
1.1 Motivation................................................................................................................ 6
1.2 Ziele ........................................................................................................................ 6
2 Theoretische Grundlagen ............................................................................................... 7
2.1 Benutzung von SPSS .............................................................................................. 7
2.1.1 Skalenniveaus von Daten ................................................................................. 7
2.1.2 Verwendete Funktionen im SPSS .................................................................... 8
2.2 Lagemasse und Streuungsmasse in der Statistik .................................................... 9
2.3 Die Stärke des Zusammenhangs zwischen zwei Variablen ....................................10
2.3.1 Die grafische Beschreibung.............................................................................10
2.3.2 Der Korrelationskoeffizient von K. Pearson .....................................................11
2.3.3 Der Korrelationskoeffizient nach Spearman ....................................................13
2.4 Die einfache lineare Regression .............................................................................14
2.5 Die multiple lineare Regression ..............................................................................18
3 Methode ........................................................................................................................19
3.1 Datensammlung .....................................................................................................19
3.2 Datenaufbereitung ..................................................................................................20
3.2.1 Gymnasiastenanteil .........................................................................................21
3.2.2 Bezirks-, Sekundar- und Realschüleranteil ......................................................23
3.2.3 Bevölkerungsdichte .........................................................................................23
3.2.4 Reinvermögen .................................................................................................23
3.2.5 Wähleranteile der vier grössten Parteien .........................................................24
3.2.6 Ausländeranteil ...............................................................................................24
3.2.7 Steuerbares Einkommen pro Monat ................................................................24
3.3 Analyse ..................................................................................................................25
4 Darstellung der Ergebnisse ...........................................................................................26
4.1 Analyse des Gymnasiastenanteils ..........................................................................26
4.1.1 mit der Bevölkerungsdichte .............................................................................27
4.1.2 mit dem Reinvermögen ...................................................................................28
4.1.3 mit den Wähleranteilen....................................................................................30
4.1.4 mit dem Ausländeranteil ..................................................................................32
4.1.5 mit dem durchschnittlichen steuerbaren Einkommen.......................................33
4.2 Formulierung einer multiplen linearen Regressionsgleichung .................................34
4.3 Zusammenhänge auf der Sekundarstufe I..............................................................35
4
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
5
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
1 Einleitung
1.1 Motivation
1.2 Ziele
Leitfrage:
Welche in den aargauischen Gemeinden statistisch erhobenen Daten beeinflussen wie die
Verteilung der Schüler auf die verschiedenen Leistungsniveaus der Schulen?
Teilfragen:
1. Welche Aussagen lassen sich über die Verteilung der Schüler auf die verschiedenen
Leistungsniveaus der Schulen in den Gemeinden des Kantons Aargau machen?
6
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
ausländischen Schülern haben oder, dass städtische Gemeinden einen höheren Anteil an
Gymnasiasten haben als ländliche.
Kurz gesagt will ich herausfinden, ob sich, wenn man gewisse statistisch erhobene Daten
einer Aargauer Gemeinde (wie z.B. die Kaufkraft, den Ausländeranteil, die
Bevölkerungsdichte, etc.) kennt, ableiten lässt, ob sie z.B. einen hohen Anteil an
Bezirksschülern und infolgedessen auch einen hohen Anteil an Gymnasiasten hat.
Aufgrund des obigen Abschnitts aus der Projektvereinbarung habe ich mich entschlossen, in
den Theorieteil auch das Modell der statistischen linearen Regression und der multiplen
linearen Regression aufzunehmen.
2 Theoretische Grundlagen
2.1 Benutzung von SPSS
2.1.1 Skalenniveaus von Daten
(vgl. Universität Zürich, Skalenniveau, 2010 und Wikipedia, Skalenniveau, 2013)
Für die Wahl der Methode muss man zuerst wissen, welches Skalenniveau die einzelnen
Variablen haben. Die Daten haben verschiedene Eigenschaften und Qualitäten, welche vom
Skalenniveau bestimmt werden. So verwendet man beispielsweise bei unterschiedlichen
Skalierungen auch unterschiedliche Korrelationskoeffizienten. Folgend stelle ich die
drei wichtigsten Skalenniveaus vor:
2. Ordinalskala oder auch Rangskala: Daten, die ordinalskaliert sind, ergeben eine
klare Rangreihe. Man kann aber keine Aussagen über die absoluten Abstände
zwischen den Werten machen. Ein Beispiel dafür sind Schulnoten. Es lässt sich hier
keine numerische Aussage darüber machen, wie viel besser eine 6 als eine 3 ist.
Auch muss der Abstand zwischen einer 3 und einer 4 nicht gleich gross sein wie der
Abstand von einer 4 und einer 5.
3. Kardinalskala: Bei kardinalskalierten Merkmalen lässt sich eine Aussage über die
Abstände der Daten machen. Ein Beispiel dafür ist die Körpergrösse. Jemand, der
200 cm gross ist, ist gegenüber jemandem, der 180 cm gross ist genau gleich viel
7
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
grösser als jemand der 185 cm gross ist gegenüber einem 165 cm grossen
Menschen.
• Das Streudiagramm (s. Kap. 2.3.1): Das Streudiagramm erstellt man über
Diagramme => Veraltete Dialogfelder => Streu-/Punktdiagramm => Einfaches
Streudiagramm => Definieren => Variable auf X- bzw. Y-Achse auswählen => Ok.
8
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
Masszahlen, die beschreiben, wo das Zentrum der Daten ist, nennt man Lagemasse.
Masszahlen, welche angeben, wie stark die Daten variieren, nennt man Streuungsmasse.
Ein Beispiel dazu: Die Körpergrösse variiert viel stärker als die Schuhgrössen variieren, die
Streuungsmasse sollen daher für die Körpergrösse grössere Werte ergeben, als für die
Schuhgrösse. Der folgende kleine, hypothetische Datensatz mit nur 10 Werten soll für die
Erläuterung und Berechnung der verschiedenen Lage – und Streuungsmasse dienen:
1
x̅ = n ∑ni=1 xi
• ̃: Zunächst werden die Daten sortiert und der Wert in der Mitte
Der Median 𝒙
bestimmt. Ist die Anzahl von Werten ungerade, so ist der Wert eindeutig (der Wert
der in der Rangliste in der Mitte liegt). Bei einer geraden Anzahl von Werten mittelt
man die beiden Werte, die der Mitte am nächsten sind:
9+10
2
7, 8, 9, 9, ⏞
9, 10, 10, 12, 13, 16
19
Der Median ist also 2
= 9,5
• Die Varianz 𝒔𝟐 : Ist ein Mass für die Grösse der Abweichung von einem Mittelwert.
Um sie zu erhalten berechnet man die Differenz der Beobachtungen 𝑥𝑖 vom
Mittelwert 𝑥̅ , quadriert diese und zählt diese Quadrate zusammen und teilt durch n-1:
9
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
1
s2 = n−1 ∑ni=1(xi − x̅)2
Wobei 𝑥̅ für den Mittelwert steht. Diesen haben wir oben berechnet: Er beträgt 10,3.
• Die Standardabweichung s: Das ist die mittlere Abweichung einer Streuung. Um sie
zu berechnen, zieht man die Wurzel aus der Varianz 𝑠 2 :
1
s = √n−1 ∑ni=1(xi − x̅)2
s = √7,1222 ≈ 2,669
Zur grafischen Beschreibung der Daten werden sogenannte Streudiagramme erstellt. Die
Werte der einen Variable bestimmen die x-Koordinate, die Werte der anderen Variable die y-
Koordinate der Punkte. Folgendes Beispiel soll den Zusammenhang zwischen den
gefahrenen Meilen und dem Preis von Gebrauchtwagen zeigen. Jeder Punkt des
Streudiagramms stellt dabei einen Gebrauchtwagen dar. Der negative Zusammenhang ist
sofort ersichtlich: Je höher der Meilenstand, desto geringer ist auch der Preis. Wenn man die
Daten in einem Streudiagramm zeichnet, so erkennt man sofort, ob es sich um einen
linearen Zusammenhang handelt und ob es allfällige Ausreisser gibt, die den Wert des
Korrelationskoeffizienten stark beeinflussen können. (siehe Kap. 2.3.2)
10
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
Der Wert des Korrelationskoeffizienten ist unabhängig vom Massstab, das heisst es ist nicht
von Bedeutung, ob etwa die Körpergrösse in Metern oder Zentimetern gemessen wird. Die
Einheiten der Variablen spielen also keine Rolle für den Wert des Korrelationskoeffizienten,
sofern innerhalb der einzelnen Variable immer die gleiche Einheit verwendet wird. Der
Korrelationskoeffizient ist normiert und geht von -1 bis 1, wobei 1 bzw. -1 nur erreicht
werden, wenn alle Punkte in einem Streudiagramm exakt auf einer Geraden mit positiver
bzw. negativer Steigung liegen. Wenn der Korrelationskoeffizient ein negatives Vorzeichen
hat, so bedeutet dies einen negativen Zusammenhang: Je höher die x-Werte, desto niedriger
sind durchschnittlich die y-Werte. Ist der Korrelationskoeffizient positiv, so entspricht dies
einem positiven Zusammenhang: Je höher die x-Werte, desto höher sind durchschnittlich
auch die y-Werte. Je grösser der Betrag von r ist, desto stärker der Zusammenhang
zwischen den zwei Variablen und desto konzentrierter liegen die Punkte um eine (gedachte)
Gerade. Auf den folgenden Abbildungen sind drei Streudiagramme mit den zugehörigen
11
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
Abbildung 2.3: Extrem hohe Abbildung 2.4: Fast keine Abbildung 2.5: Kein
Korrelation Korrelation linearer Zusammenhang
Obwohl die Berechnung des Korrelationskoeffizienten von Hand mühselig und fehleranfällig
ist, will ich es hier mit einem sehr kleinen Datensatz probieren:
Beispiel: Wir wollen die Stärke des Zusammenhangs zwischen dem Bruttolohn pro Monat
und der Anzahl Bildungsjahre mit Hilfe des Korrelationskoeffizienten berechnen:
12
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
Der Wert des Korrelationskoeffizienten wird in der Literatur unterschiedlich interpretiert. Doch
ist man sich einig, dass bei einer sozialwissenschaftlichen Untersuchung schon ein
geringerer Betrag des Korrelationskoeffizienten ausreicht, um als Korrelation eingestuft zu
werden als bei einer mathematischen. Deshalb habe ich mich für folgende Interpretation, die
sozialwissenschaftliche Gegebenheiten berücksichtigt, entschieden:
(vgl. Haider, Deskriptive Statistik, 1999, S. 9)
Die Frage nach der Stärke des Zusammenhangs zwischen zwei Variablen ist auch in Fällen,
in denen der Zusammenhang keiner linearen Beziehung folgt oder wenn die Variablen nur
ordinalskaliert sind, von Interesse. Die Anwendung des Korrelationskoeffizienten nach
Spearman kann aber auch bei intervallskalierten Daten sinnvoll sein, da er gegenüber
Ausreissern robuster ist als der Korrelationskoeffizient nach Pearson.
6 ∑n 2
i=1 di
rs = 1 − wobei di = rg(xi ) − rg(yi )
n(n2 −1)
13
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
Beispiel: Wir nehmen wieder unseren kleinen Datensatz, fügen aber, damit 𝑟𝑠 nicht eins wird,
einen Datensatz hinzu:
(6)(2) 12 1
rs = 1 − (4)(15)
=1− 60
=1− 5
= 0,8
Ich gehe nochmals auf das in Kap. 2.3.1 erwähnte Beispiel ein: Wir interessieren uns nun
dafür, welche Form der Zusammenhang zwischen Meilenstand und Preis der
Gebrauchtwagen hat, nicht aber für die Stärke des Zusammenhangs. Indem wir den Preis für
einen Gebrauchtwagen in eine funktionale Form mit dem Meilenstand stellen, wollen wir den
Preis durch den Meilenstand erklären.
Bemerkung: Es ist mir bewusst, dass der Preis der Fahrzeuge noch von vielen anderen
Faktoren wie z.B. der Farbe, der Anzahl an Services, usw. abhängig ist. Dazu mehr in
Kapitel 2.5.
Allgemein ausgedrückt soll eine Responsevariable (oder abhängige Variable) durch
eine erklärende Variable (oder unabhängige Variable) beschrieben werden.
14
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
Y= α + βX + έ
15
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
Doch wie berechnet man die Werte α und β für diese lineare Gleichung?
Auf dem Streudiagramm ist zu sehen, dass nur wenige Datenpunkte genau auf dem Graph
der Geraden liegen. Der Abstand der Geraden zu einem Datenpunkt wird Residuum
genannt. Man ermittelt nun die Regressionsgerade, indem man die Residuen aller Punkte
minimiert. Dafür wird normalerweise das so genannte Verfahren der kleinsten Quadrate
verwendet: Die Residuen aller Datenpunkte werden quadriert, summiert und dann minimiert
(Extremalproblem). Die Regressionsgerade ist genau diejenige Gerade, bei der die Residuen
minimal sind. (Vgl. Universität Zürich, Einfache lineare Regression, 2010)
Doch wie erhält man nun die Steigung β und den y-Achsenabschnitt α? Es gilt folgender
Zusammenhang (vgl. Stahel, Lineare Regression, 2008, S.11 und www.klaus-
gach.de/dateien/stats/korr02.doc, 12. 09. 2013, S. 8):
∑n ̅)(xi − x̅)
i=1(yi − y (rx,y )(sy )
β= ∑n ̅ )2
= α = y̅ − βx̅
i=1(xi − x sx
Entweder:
oder:
32 +(−32 )+02
𝑠𝑥 = √ 2
= √9 = 3
16
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
(0,995)(4272,002)
β= 3
≈ 1416,667 α = 9500 − [(1416,667)(16)] ≈ −13166,667
Bemerkung: Ich habe jeweils mit den exakten, im Taschenrechner gespeicherten Werten
gerechnet.
Das SPSS bestätigt:
Hier habe ich einen Fehler in der von mir verwendeten Fachliteratur gefunden. Im Buch hiess
es:
b steht hier für die Steigung und a für den y-Achsenabschnitt der Regressionsgeraden. Ich
habe b zuerst mit der in Abbildung 2.10 ersichtlichen Formel ausgerechnet und bin dann
natürlich nicht auf das von SPSS gelieferte Resultat gekommen. Ich suchte lange nach
einem Fehler in meiner Rechnung, fand aber keinen. Schliesslich stellte ich fest, dass es das
korrekte Resultat gäbe, wenn sy im Zähler und sx im Nenner stehen würden. Danach fand ich
auch zahlreiche Internetquellen, bei denen in dieser Formel sy im Zähler und sx im Nenner
stand. Grundsätzlich vertraue ich eher der Fachliteratur als dem Internet.
Deshalb schrieb ich ein Mail an Prof. Dr. Werner Stahel vom Seminar für Statistik an der
ETH Zürich, da ich am Besuchstag der ETH seine Vorlesung „Das Modell der statistischen
linearen Regression“ besucht hatte, worin ich mein Anliegen darlegte.
17
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
Er antwortete mir umgehend und bestätigte, dass im Buch ein Fehler vorliegt. Ich habe dem
Verlag ein Mail geschrieben, indem ich ihn auf den Fehler aufmerksam machte.
Kommen wir zurück auf das Beispiel mit der Beschreibung der Beziehung zwischen dem
Preis eines Gebrauchtwagens und dem Meilenstand. Wie in Kapitel 2.4 erwähnt, ist der Preis
eines Gebrauchtwagens nicht nur vom Meilenstand abhängig, sondern beispielsweise auch
davon, wie oft der Wagen im Service war. Deshalb müssen wir das Modell der einfachen
linearen Regression, wo nur eine erklärende Variable vorkommt, erweitern auf das Modell
mit mehreren erklärenden Variablen. Dies führt zum Modell der multiplen linearen
Regression:
Y = α + β1 𝑋1 +…β𝑘 𝑋𝑘 + έ
𝑌̂ = α + β1 𝑋1 +…β𝑘 𝑋𝑘
Bemerkung: Ich nehme die einfache lineare Regression und die multiple lineare Regression
noch in den Theorieteil, damit man am Schluss mit den statistisch erhobenen Merkmalen, die
ich in die Untersuchung miteinbeziehe, den zu erwartenden Gymnasiastenanteil jeder
Gemeinde berechnen könnte.
18
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
3 Methode
3.1 Datensammlung
Das Thema meiner Arbeit sollte nicht nur mich, sondern auch die im Kanton Aargau
lebenden und an unserem Bildungssystem interessierten Bürger und vor allem auch viele
Kantonsschüler ansprechen.
Zu Beginn suchte ich im statistischen Jahrbuch danach, welche statistisch erhobenen
Kennzahlen überhaupt mit der Schülerverteilung auf die verschiedenen Leistungsniveaus
korrelieren könnten.
Bald stiess ich auf der Webseite des Kantons Aargau2 auf die statistische Datenbank. Da auf
der Webseite in der Beschreibung der Datenbank zu lesen war, dass auch Daten auf
Gemeindeebene und solche von früheren Jahren vorhanden sind, beantragte ich sofort den
Zugang zur Datenbank. Dazu musste ich das Formular „Vertrag über die Benutzung der
Datenbank der «Statistik Aargau»“ ausfüllen. Darin heisst es u.a.: „Dem Benutzer ist es
untersagt, die Daten Dritten für deren eigene Arbeiten weiterzugeben oder sonstwie
zugänglich zu machen“3. So ist es rechtlich bereits heikel, die Daten der Betreuungsperson
und der zweitbeurteilenden Lehrperson weiterzugeben. Doch ist dies unumgänglich, wenn
meine Zahlen nachvollziehbar sein sollen.
Weiter heisst es darin, dass die Benutzung durch öffentliche Schulen des Kantons Aargau
zwar kostenlos ist, für Privatpersonen jedoch 100 CHF pro Jahr koste. Als ich das
ausgefüllte Formular abgeschickt hatte, schrieb ich an die Kontaktperson für die Benutzung
der Datenbank, Herrn Daniel Cahn, ein Mail, in dem ich erklärte, ich sei ein Schüler der
Neuen Kantonsschule Aarau und benötigte die Daten für meine Maturarbeit. Am nächsten
Tag antwortete er, dass er mir den Zugang gratis gewähre. Auch die Zugangsdaten
(Benutzername und Passwort) seien aufgeschaltet und ich könne nun auf die Datenbank
zugreifen.
Zuerst suchte ich nach Daten, die auf Gemeindeebene erhoben sind und überlegte dann,
welche dieser Daten am ehesten mit dem Gymnasiastenanteil (s. 3.2.1) und ev. mit dem
Bezirks-, Sekundar- und Realschüleranteil korrelieren könnten. So entschied ich mich für die
Bevölkerungsdichte, das Reinvermögen, das durchschnittliche steuerbare Einkommen pro
steuerpflichtige Person, den Ausländeranteil und für die Wähleranteile der vier grössten
Parteien bei den Grossratswahlen vom 21.10.2012.
2https://www.ag.ch/de/dfr/statistik/daten_fakten/datenfakten.jsp
3https://www.ag.ch/media/kanton_aargau/dfr/dokumente_3/statistik/statistische_datenbank/Vertrag_-
_Benutzung_statistische_Datenbank.pdf, 19.09.2013, S.1
19
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
3.2 Datenaufbereitung
Zuerst musste ich sämtliche Daten auf den gleichen Stand bringen, indem ich die
Gemeindefusionen von 2010 bis 2013 berücksichtigte. Heute zählt der Aargau 216
Gemeinden und ich wollte meine Daten auf diesen aktuellsten Stand bringen. Auf Wikipedia
findet man alle Gemeindefusionen der Schweiz seit dem Jahr 2000. Da meine ältesten
verwendeten Daten aus dem Jahre 2009 stammen und es in diesem Jahr im Kanton Aargau
keine Gemeindefusionen gab, liste ich hier die Gemeindefusionen ab 2010 auf (vgl.
Wikipedia, Gemeindefusionen in der Schweiz, 2013):
20
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
Diese Auflistung war für die Datenaufbereitung äusserst wichtig, da ich sie bei sämtlichen
von mir verwendeten Daten konsultieren musste.
Am Beispiel der Fusion der Gemeinden Aarau und Rohr zur Gemeinde Aarau stelle ich
beispielhaft dar, wie ich bei allen weiteren Fusionen vorgegangen bin. Das Beispiel gehört
zur Datenaufbereitung, um das durchschnittliche steuerbare Einkommen pro steuerpflichtige
Person zu erhalten (s. 3.2.7)
Das Bundesamt für Statistik weist jeder einzelnen Gemeinde eine eindeutige BFS Nummer
zu.
Wenn die Daten zu unterschiedlichen Zeitpunkten erhoben wurden (so wird beispielsweise
der Bevölkerungsbestand jeder Gemeinde jährlich am 30.06. und am 31.12. erhoben), so
wählte ich die Daten nach folgenden Kriterien aus: Einerseits sollten sie möglichst aktuell
sein und andererseits sollte auch zeitlich keine zu grosse Abweichung zu Ende Jahr 2011
bestehen, da zu diesem Zeitpunkt die Zahlen erhoben wurden, woraus ich den
Gymnasiastenanteil berechnete. Dies ist deshalb wichtig, weil der Gymnasiastenanteil später
bei allen Auswertungen die abhängige Variable sein wird.
3.2.1 Gymnasiastenanteil
Um den Gymnasiastenanteil zu berechnen habe ich die Anzahl der Gymnasiasten nach
Wohnort mit 100 multipliziert und dann durch die Anzahl der 15- bis 19-Jährigen, die in der
betreffenden Gemeinde wohnen, dividiert. Die Daten der Anzahl 15- bis 19-Jähriger wurden
21
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
am 31.12.2011 erhoben, die Zahlen der Gymnasiasten nach Wohnort am 15.11.2011. Die
Zeitdiffernz ist also sehr klein, der Wert sollte dementsprechend auch genau sein.
Doch fiel mir bald auf, dass einige grössere Gemeinden einen Gymnasiastenanteil von null
Prozent aufweisen. Ich suchte die betreffenden Gemeinden auf einer Karte und stellte fest,
dass sie sich alle in der Nähe der Kantonsgrenze befinden. Dies liess mich auf die Idee
kommen, dass einige Aargauer Gymnasiasten das Gymnasium in einem angrenzenden
Kanton besuchen. Bei den Auswertungen würde dies natürlich das Resultat massiv
verfälschen. Also rief ich beim Departement für Bildung, Kultur und Sport (BKS) an und
fragte, wo ich nachschauen könne, in welchen Gemeinden die Bezirksschüler der vierten
Klasse die Möglichkeit haben, in ein ausserkantonales Gymnasium überzutreten. Die
zuständige Person vom BKS erklärte mir, dass dies im regionalen Schulabkommen von 2009
geregelt sei und verwies mich auf die Webseite der Nordwestschweizerischen
Erziehungsdirektorenkonferenz4. Weiter erklärte sie, ich solle bei den an den Aargau
grenzenden Kantonen die Listen öffnen und unter Gymnasiasten der Sekundarstufe II die
entsprechenden Codes ablesen (z.B. AG 3/AG 8). In der „Code-Liste per 1.8.2013
(deutschsprachige Fassung)“ kann man die entsprechenden Gemeinden und
Bezirksschulkreise, die zu den Codes gehören, ablesen. So konnte ich bereits die
Gemeinden Beinwil am See, Birrwil, Burg, Menziken, Reinach, Gontenschwil, Zetzwil,
Schmiedrued, Sins, Auw, Islisberg und Arni als Gemeinden eruieren, in denen die Schüler
das Gymnasium in einem Nachbarkanton besuchen. Für den Code AG 6 sind nur die
Bezirksschulkreise angegeben. Also musste ich herausfinden, welche Gemeinden zum
entsprechenden Bezirksschulkreis gehören. Diese Information fand ich auf der Webseite des
Departements für Bildung, Kultur und Sport5. Der Bezirksschulkreis Laufenburg läuft auf
dieser Webseite unter Laufenburg-Mettauertal und umfasst folgende Gemeinden:
Laufenburg, Sisseln, Kaisten, Ittenthal, Sulz, Etzgen, Mettau, Wil, Oberhofen, Hottwil,
Gansingen und Schwaderloch. Der Bezirsschulkreis Rheinfelden läuft unter KS Unteres
Fricktal und umfasst folgende Gemeinden: Rheinfelden, Kaiseraugst, Olsberg, Magden,
Buus, Wintersingen, Maisprach, Mumpf, Obermumpf, Stein und Münchwilen. Der
Bezirksschulkreis Möhlin läuft unter Möhlintal und umfasst die Gemeinden Möhlin, Wallbach,
Zeiningen, Zuzgen, Hellikon, Wegenstetten, Schupfart, Mumpf (Wahlfreiheit zwischen
Bezirksschulkreisen Möhlin und Rheinfelden) und Oberrüti. Der Bezirksschulkreis Frick läuft
unter Frick-Staffelegg und umfasst: Frick, Eiken, Oeschgen, Gipf-Oberfrick, Wittnau,
Wölflinswil, Oberhof, Densbüren, Herznach, Ueken, Zeihen, Hornussen, Bözen, Effingen,
Elfingen, Stein und Münchwilen (die letzten beiden mit Wahlfreiheit zwischen den
Bezirksschulkreisen Frick und Rheinfelden).
4 http://nwedk.d-edk.ch/regionales-schulabkommen-2009
5 http://www.ag.ch/bks/de/pub/regos_schulkreise/bezirksschulkreise.php
22
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
Da ich die Zahl der Aargauer, die das Gymnasium in einem Nachbarkanton besuchen, nicht
kenne, müssen also alle oben erwähnten Gemeinden für die Analyse weggelassen werden.
Nun muss man sich auch das Umgekehrte überlegen: Gibt es auch Ausserkantonale, die im
Kanton Aargau das Gymnasium besuchen? Dies muss ich nicht näher abklären, denn ich
habe den Anteil an Gymnasiasten nach Wohnort berechnet. Da in den Daten keine
ausserkantonalen Gemeinden auftauchen, haben wir nun die korrekte Zahl an
Gymnasiasten.
3.2.3 Bevölkerungsdichte
Um die Bevölkerungsdichte zu berechnen, habe ich die Anzahl Einwohner pro Gemeinde am
30.06.2011 durch die jeweilige Gesamtfläche vom 01.01.2011 dividiert. Dies ergibt die
Anzahl Einwohner pro Hektare. Ich will herausfinden, ob der Grad der Urbanisierung einen
Einfluss auf den Gymnasiastenanteil hat.
3.2.4 Reinvermögen
Definition: Das Reinvermögen ist das gesamte Vermögen abzüglich der Schulden.
Das Reinvermögen pro Einwohner konnte ich aus der Datenbank kopieren. Die Daten
stammen vom 31.12.2009, denn aktuellere waren keine vorhanden. Die Zahlen für das
Reinvermögen wurden also eins bis drei Jahre früher erhoben, als die meisten anderen in
meiner Arbeit vorkommenden Merkmale, was den Stellenwert des Reinvermögens in der
Analyse relativiert. Da beim Mittelwert Ausreisser (wie z.B. in der Gemeinde
23
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
Meisterschwanden, wo der Uhrenkönig Hayek wohnt) das Resultat stark verfälschen können,
habe ich auch den Median genommen. Festzuhalten ist weiter, dass die Zahlen für das
Reinvermögen für die Gemeinde Aarau fehlen.
3.2.6 Ausländeranteil
Um den Ausländeranteil zu berechnen, habe ich die Anzahl Ausländer pro Gemeinde mit
100 multipliziert und durch die gesamte Wohnbevölkerung der Gemeinde dividiert. Die
Zahlen stammen vom 30.06.2012. Ich wollte herausfinden, ob die weit verbreitete Meinung
richtig ist, dass ein hoher Ausländeranteil einen tieferen Gymnasiastenanteil und somit ein
tieferes Bildungsniveau zur Folge hat.
6 http://www.srf.ch/news/wie-viel-wird-an-ihrem-wohnort-verdient
7 http://www.estv.admin.ch/dokumentation/00075/00076/00701/01362/index.html?lang=de
24
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
in der letzten Spalte - die Anzahl der steuerpflichtigen Personen zu finden. Nun hat der
Verfasser des Artikels das gesamte steuerbare Einkommen pro Gemeinde durch die Anzahl
der steuerpflichtigen Personen der betreffenden Gemeinde geteilt. Dies ergibt dann das
durchschnittliche Einkommen pro steuerpflichtige Person pro Jahr. Diese Zahl durch 12
geteilt, ergibt das durchschnittliche Einkommen pro steuerpflichtige Person pro Monat. Als
ich die beiden oben erwähnten Sheets gefunden hatte, kopierte ich jeweils die beiden letzten
Spalten in eine neue Excel Tabelle. Da in dieser Tabelle aber alle Gemeinden der Schweiz
enthalten waren, schaute ich nach, von wo bis wo die BFS Nummern der Gemeinden des
Kantons Aargau gehen und stellte fest, dass die erste Gemeinde Aarau die BFS Nummer
4001 und die letzte Gemeinde Bad Zurzach die BFS Nummer 4323 hat. Also liess ich durch
den Filter im Excel nur die Gemeinden mit BFS Nummern zwischen 4001 und 4323
ausgeben.
Wenn nun der Verfasser des Artikels z.B. für Aarau nicht das gleiche durchschnittliche
steuerbare Einkommen erhalten hat wie ich, liegt das daran, dass er im Gegensatz zu mir
die Gemeindefusionen nicht berücksichtigt hat. Ich habe also das gesamte steuerbare
Einkommen und die Anzahl steuerpflichtiger Personen von Aarau und Rohr addiert und
daraus das für Aarau „neue“ durchschnittliche Einkommen pro Person und Monat
berechnet(s. Tabelle 4).
Die Daten stammen von der Steuerperiode 2009, denn aktuellere Daten waren keine
vorhanden. Die für die Berechnung des durchschnittlichen steuerbaren Einkommens pro
Gemeinde verwendeten Zahlen wurden also eins bis drei Jahre früher erhoben, als die
meisten anderen in meiner Arbeit verwendeten.
3.3 Analyse
Bei der Analyse der Daten werde ich wie folgt vorgehen: Zuerst werde ich sämtliche
unabhängigen Merkmale, die ich untersucht habe, in einem Streudiagramm mit dem
Gymnasiastenanteil und ev. mit dem Bezirks-, Sekundar- und Realschüleranteil als
abhängige Variable vom SPSS aufzeichnen lassen. Daraus ist erkennbar, ob es eine lineare
Beziehung zwischen den beiden Variablen gibt. Falls dies nicht der Fall ist, bestimme ich den
Korrelationskoeffizienten nach Spearman. Falls ein linearer Zusammenhang besteht, kann
man den Korrelationskoeffizienten nach Pearson bestimmen. Weiter werde ich bei den
Merkmalen, bei denen ein deutlicher linearer Zusammenhang besteht, die Gleichung der
Regressionsgeraden angeben, so dass man am Schluss durch die multiple lineare
Regression den zu erwartenden Gymnasiastenanteil vorhersagen könnte, wenn man die
statistisch erhobenen Kennzahlen (die unabhängigen Variablen) und die
Regressionskoeffizienten der Regressionsgleichung kennt.
25
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
Auf folgender Karte sind alle Aargauer Gemeinden, auch diejenigen, deren Gymnasiasten
die Möglichkeit haben ein ausserkantonales Gymnasium zu besuchen, eingezeichnet. Je
grösser die Kreisfläche, desto höher ist der Gymnasiastenanteil.
Zu beachten ist bei den folgenden Teilkapiteln (Reinvermögen, Wähleranteile und dem
durchschnittlichen Einkommen pro steuerpflichtige Person), dass die Gymnasiasten selber
kaum zu diesem Resultat beitragen.
26
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
Hier ist ein schwacher positiver linearer Zusammenhang ersichtlich. Die Varianz in den
Daten ist sehr hoch. Der Korrelationskoeffizient nach Pearson beträgt 0,316. Es gibt also
eine mittlere Korrelation. Die vier Gemeinden mit der grössten Bevölkerungsdichte sind
Wettingen, Turgi, Brugg und Aarau. Ihr Gymnasiastenanteil liegt zwischen 15 und 25%. Der
Mittelwert des Gymnasiastenanteils der von mir untersuchten Gemeinden beträgt 11,72 und
der Median 11,18%. Die vier Gemeinden mit der grössten Bevölkerungsdichte liegen also
alle deutlich über dem Mittelwert und dem Median.
Wenn der lineare Zusammenhang zwischen den beiden Variablen und dementsprechend
auch die Korrelationskoeffizienten so gering sind, ist es weniger sinnvoll die
Regressionsgleichung zu bestimmen. Die Summe der Differenzen zwischen den erwarteten
und den tatsächlichen Werten des Gymnasiastenanteils (oder umgekehrt) ist bei einem so
schwachen Zusammenhang viel grösser, als wenn die Punkte des Streudiagramms alle
beinahe auf der Regressionsgeraden lägen. Dieser Umstand ist mir auch bei jeder weiteren
Regressionsgleichung, die ich bestimme, bewusst. Da ich aber am Schluss des Kapitels 4
eine multiple lineare Regression mit den am meisten korrelierenden Merkmalen formulieren
will, werde ich die einfache Regressionsgleichung auch bei weiteren Merkmalen bestimmen.
Da man auch ohne Zugang zur statistischen Datenbank ein Merkmal wie die
Bevölkerungsdichte einer Gemeinde ohne weiteres erhältlich machen kann (z.B. auf
27
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
Wikipedia), möchte ich die Regressionsgleichung trotzdem formulieren. Für den erwarteten
Gymnasiastenanteil einer Aargauer Gemeinde gilt:
Ertwarteter Gymnasiastenanteil = 9,478 + (0,451 ∗ 𝐴𝑛𝑧𝑎ℎ𝑙 𝐸𝑖𝑛𝑤𝑜ℎ𝑛𝑒𝑟 𝑝𝑟𝑜 ℎ𝑎 𝑝𝑟𝑜 𝐺𝑒𝑚𝑒𝑖𝑛𝑑𝑒)
Eine weitere Schwäche dieser Gleichung ist auch, dass der Gymnasiastenanteil nie unter
9,478 % fallen kann, da die Anzahl Einwohner pro Hektare nie negativ ist.
Wenn man Abbildung 4.4 anschaut, kommt man klar zum Schluss, dass ein positiver linearer
Zusammenhang besteht. Allerdings sticht auch sofort ins Auge, dass es, was den Mittelwert
des Reinvermögens betrifft, einen gewaltigen Ausreisser (mit 102 beschriftet) und drei nicht
so markante Ausreisser gibt. Der „gewaltige“ Ausreisser ist die Gemeinde
Meisterschwanden, in der der Uhrenkönig Hayek lebt. Sein Vermögen wurde im Jahr 2006
von der Wirtschaftszeitschrift „Bilanz“ auf 3-4 Milliarden CHF geschätzt8. Die drei anderen
Ausreisser sind Geltwil, Bergdietikon und Oberwil-Lieli. Alle drei Gemeinden liegen an oder
sehr nahe der Kantonsgrenze zu Zürich. Eine Erklärung dafür wäre, dass der niedrige
Steuerfuss der Gemeinden reiche Spitzenverdienender aus dem Kanton Zürich anlockt.
In knapp 63% der Gemeinden haben deren Bürger ein durchschnittliches Reinvermögen
zwischen 200‘000 und 299‘999 CHF.
Der Korrelationskoeffizient nach Pearson beträgt 0,235. Hier gibt es also eine mittlere
Korrelation.
Abbildung 4.5 zeigt ebenfalls den Mittelwert des Reinvermögens, nur sind die vier Ausreisser
weggelassen worden. Da nun die Achsen nicht mehr gleich skaliert sind wie in Abbildung 4.4
ist der lineare Zusammenhang nicht mehr so offensichtlich. Da der Median robuster gegen
Ausreisser ist, gleicht die Abbildung 4.5 ein wenig der Abbildung 4.6.
Bei Abbildung 4.6 ist ein sehr schwacher positiver linearer Zusammenhang ersichtlich. Der
Korrelationskoeffizient nach Pearson beträgt 0,122. Dies ist eine sehr geringe Korrelation.
Bei 25% der Gemeinden liegt der Median des Reinvermögens zwischen 40‘000 und 49‘999
CHF, bei 21% zwischen 30‘000 und 39‘999 CHF. Die beiden Gemeinden mit dem höchsten
Median sind wieder Oberwil-Lieli und Bergdietikon.
Das heisst also, dass es in diesen Gemeinden nicht wie in Meisterschwanden einen grossen
Ausreisser gibt, sondern dass viele Bürger ein grosses Reinvermögen haben. In einer
Situation wie Meisterschwanden, wo es extreme Ausreisser gibt, ist der Median für die
Gemeinde repräsentativer als der Mittelwert.
Wähleranteil SVP: Es ist ein klarer linearer Zusammenhang ersichtlich: Je höher der
Gymnasiastenanteil, desto kleiner ist der SVP Wähleranteil. Der Korrelationskoeffizient nach
Pearson beträgt -0,371. Das ist eine mittlere Korrelation. 53,6% der Gemeinden haben einen
SVP Wähleranteil zwischen 30 und 39,99%. Bei den 15 Gemeinden mit einem SVP
Wähleranteil von mehr als 50% liegt der durchschnittliche Gymnasiastenanteil bei 10%, bei
den drei Gemeinden mit einem SVP Wähleranteil von weniger als 20% liegt er bei 22,1%. Da
die SVP bis 1971 Bauern- Gewerbe- und Bürgerpartei hiess, lässt sich daraus schliessen,
dass sie also vor allem Bauern und Gewerbetreibende anspricht und weniger Akademiker.
Weiter ist sie konservativ und betont auch immer wieder den grossen Stellenwert einer
30
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
Berufslehre. Ein weiterer Grund ist, dass SVP-Wähler oft auf dem Land leben, man kann
zwischen Bevölkerungsdichte und SVP Wähleranteil eine hohe negative Korrelation
ausmachen. In Kap. 4.1.1 ist der positive Zusammenhang zwischen Gymnasiastenanteil und
Bevölkerungsdichte gezeigt worden. Die Regressionsgleichung lautet:
Hier kann der Gymnasiastenanteil nicht grösser als 20,635% werden, da der SVP
Wähleranteil nie negativ sein kann.
Wähleranteil SP: Hier ist ein schwacher positiver linearer Zusammenhang festzustellen. Der
Korrelationskoeffizient nach Pearson ist 0,330. Auch hier besteht also eine mittlere
Korrelation. 61,4% der Gemeinden haben einen SP Wähleranteil zwischen 10 und 19,99%.
29,5% der Gemeinden haben einen SP Wähleranteil zwischen 0 und 9,99%. In diesen
Gemeinden ist der durchschnittliche Gymnasiastenanteil 9,4%. Bei den 15 Gemeinden mit
einem höheren SP Wähleranteil als 20% beträgt er 15,1%. Ein Grund dafür könnte sein,
dass SP-Wähler oft in der Stadt leben und die positive Korrelation zwischen
Bevölkerungsdichte und Gymnasiastenanteil habe ich in Kap. 4.1.1 gezeigt. Der
Korrelationskoeffizient nach Pearson zwischen der Bevölkerungsdichte und dem SP-
Wähleranteil beträgt 0,577. Es kann also von einer hohen Korrelation gesprochen werden.
Früher galt die SP als „Arbeiterpartei“. Dass dieses Image nicht mehr aktuell ist, scheinen
auch meine Resultate zu bestätigen. Die Regressionsgleichung lautet:
Wähleranteil FDP: Hier ist ein sehr schwacher positiver linearer Zusammenhang ersichtlich.
Der Korrelationskoeffizient nach Pearson beträgt 0,264. Auffällig ist, dass Abbildung 4.8 und
4.9 sehr ähnlich aussehen. 70,5% der Gemeinden haben einen FDP Wähleranteil zwischen
10 und 19,99%, davon haben 55,6% der Gemeinden einen Wähleranteil zwischen 10 und
14,99%. 12 Gemeinden haben einen FDP Wähleranteil von 20% oder mehr. In diesen
Gemeinden ist der durchschnittliche Gymnasiastenanteil 12%. Bei den 22,3% der
Gemeinden mit einem FDP Wähleranteil zwischen 0 und 9,99% ist er 9,4%. Früher galt die
FDP als „Akademikerpartei“, aber offenbar wenden sich Akademiker auch zunehmend der
SP zu. FDP-Wähler sind oft führende Köpfe in der Wirtschaft. Sie erleben also den Wert
einer soliden Bildung täglich und wollen für die Wirtschaft auch genügend Fachkräfte
ausbilden lassen.
31
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
Wähleranteil CVP: Es ist kein linearer Zusammenhang ersichtlich. Die Abbildung 4.10
gleicht einer Punktwolke, was auch im Korrelationskoeffizienten nach Spearman, der nur
0,01 beträgt, zum Ausdruck kommt. Bei den 24,1% der Gemeinden mit einem CVP
Wähleranteil von mehr als 20% beträgt der Median des Gymnasiastenanteils 10,2%. Bei den
Gemeinden mit einem CVP Wähleranteil zwischen 0 und 4,99% beträgt dieser Median 9,4%.
Wie ihr Name Christlichdemokratische Volkspartei schon sagt, gehören ihre Wähler auch
heute noch vorwiegend der katholischen Konfession an. Bildung und Konfession sind heute
(im Gegensatz zum Mittelalter) völlig unabhängig voneinander, was auch mein Resultat
widerspiegelt. Die drei Gemeinden mit den höchsten CVP Wähleranteilen sind Dietwil,
Beinwil (Freiamt) und Geltwil, die alle im Freiamt liegen. Dies hat historische Gründe: Die
katholischen Habsburger waren einst Schirmherren dieses Gebiets. Auch im Norden des
Kantons liegen viele Gemeinden mit einem hohen CVP Wähleranteil.
Auch hier besteht kein linearer Zusammenhang. Der Korrelationskoeffizient nach Spearman
beträgt 0,161. Bei den 18,1% der Gemeinden mit einem Ausländeranteil von weniger als
10% liegt der Median des Gymnasiastenanteils bei 9%. Bei den 10% der Gemeinden mit
einem Ausländeranteil von über 30% liegt der Median des Gymnasiastenanteils bei 9,9%.
Der Ausländeranteil einer Gemeinde beeinflusst also überraschenderweise den
Gymnasiastenanteil nicht. Gründe dafür könnten sein, dass einerseits die Ausländer eher in
städtischen Gemeinden wohnen (Korrelationskoeffizient nach Pearson: 0,643). Den positiven
Zusammenhang zwischen Bevölkerungsdichte und Gymnasiastenanteil habe ich in Kap.
32
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
4.1.1 gezeigt. Andererseits ist bei der ausländischen Wohnbevölkerung einer Gemeinde in
der Regel die ausländische Jugend überdurchschnittlich stark vertreten. Das Verhältnis
zwischen der Anzahl Ausländer- und Schweizerkinder verschiebt sich immer mehr
zugunsten der ausländischen Kinder, da die Geburtenrate ausländischer Frauen höher ist als
diejenige der Schweizer Frauen. Somit steigt der Anteil ausländischer Gymnasiasten,
während der Anteil Schweizer Gymnasiasten abnimmt.
Hier ist der lineare Zusammenhang klar ersichtlich: Je höher das durchschnittliche
Einkommen pro steuerpflichtige Person, desto höher ist auch der Gymnasiastenanteil. Der
Korrelationskoeffizient nach Pearson beträgt 0,452. Dies ist ebenfalls eine mittlere
Korrelation, aber es ist die höchste aller von mir untersuchten mit der abhängigen Variable
Gymnasiasten. Bei den 9,6% der Gemeinden mit einem höheren durchschnittlichen
Einkommen pro steuerpflichtige Person als 7‘500 CHF liegt der Mittelwert des
Gymnasiastenanteils bei 17,4%. Bei den 5,4% der Gemeinden mit einem tieferen
durchschnittlichen Einkommen pro steuerpflichtige Person als 5‘500 CHF liegt der Mittelwert
des Gymnasiastenanteils bei 9,1%. 54,2% der Gemeinden haben ein durchschnittliches
steuerbares Einkommen pro steuerpflichtige Person zwischen 6‘000 und 6‘999 CHF.
33
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
Es ist zu sehen, dass der errechnete y-Achsenabschnitt nicht mit demjenigen in Abbildung
4.12 übereinstimmt. Der Grund dafür ist, dass die Skala auf der x-Achse erst mit knapp 5000
CHF beginnt. In Abbildung 4.13, wo das durchschnittliche Einkommen auf der x-Achse bei
null beginnt, ist zu sehen, dass der errechnete y-Achsenanbschnitt mit dem in der Grafik
übereinstimmt.
Die drei Gemeinden mit dem höchsten durchschnittlichen Einkommen pro steuerpflichtige
Person sind Oberwil-Lieli, Bergdietikon und Remetschwil. Oberwil-Lieli und Bergdietikon
waren bereits unter den Top Drei beim Reinvermögen (Kap.4.1.2). Auch fällt bei vielen
Gemeinden mit einem hohen durchschnittlichen Einkommen pro steuerpflichtige Person die
geografische Nähe zum Kanton Zürich auf. In diesen Gemeinden wohnen also viele Pendler,
die ihr Einkommen im Kanton Zürich erzielen, wo die Löhne den höheren Lebenskosten
angepasst sind.
Um den positiven Zusammenhang zu erklären, sehe ich zwei Möglichkeiten: Einerseits
haben gut verdienende Eltern die Möglichkeit, die schulische Laufbahn ihrer Kinder finanziell
(z.B. mit Nachhilfestunden) zu unterstützen. Andererseits haben die gut verdienenden Eltern
wahrscheinlich selber eine höhere Schulbildung und legen deshalb auch mehr Wert auf die
Ausbildung ihrer Kinder und könnten sie, wenn nötig, auch mit persönlichem Know-how
unterstützen.
Aus dem durchschnittlichen Einkommen pro steuerpflichtige Person, aus dem SVP- und SP
Wähleranteil und aus der Bevölkerungsdichte als unabhängige Variablen will ich nun die
Regressionsgleichung formulieren:
34
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
Die folgende Tabelle enthält die Korrelationskoeffizienten der Bezirks-, Sekundar- und
Realschüleranteile mit allen von mir untersuchten Merkmalen:
Legende:
• Bez/Sek/Real: Bezirks- Sekundar- und Realschüleranteil
• Bevdi: Bevölkerungsdichte
• RVM: Reinvermögen Median
• SVP/SP/FDP/CVP: Wähleranteile SVP, SP, FDP und CVP
• AuslA: Ausländeranteil
• dEinkpstP: durchschnittliches Einkommen pro steuerpflichtige Person
• Kein linearer Zusammenhang ersichtlich: Korrelationskoeffizient nach Spearman
• Linearer Zusammenhang: Korrelationskoeffizient nach Pearson
Da der Wert des Korrelationskoeffizienten nach Spearman häufig sehr nahe bei null ist und
weil bei diesem Korrelationskoeffizienten kein linearer Zusammenhang besteht, gehe ich nur
kurz auf die Werte des Korrelationskoeffizienten nach Pearson ein:
• Reinvermögen: Aus der Tabelle ersichtlich ist, dass bei Gemeinden mit einem
grösseren Reinvermögen pro Person der Anteil Bezirksschüler grösser ist.
Umgekehrt ist bei Gemeinden mit einem geringeren Reinvermögen pro Person der
Anteil Realschüler höher.
• Ausländeranteil: In Gemeinden mit einem höheren Ausländeranteil gibt es einen
kleineren Bezirksschüleranteil und umgekehrt bei einem höheren Ausländeranteil
einen höheren Realschüleranteil. Bei der Analyse mit dem Gymnasiastenanteil war
kein linearer Zusammenhang ersichtlich. Offenbar entscheiden sich auch viele
aargauische Bezirksschüler mit Schweizerpass dafür, nach der Bezirksschule nicht
das Gymnasium zu besuchen.
• Durchschnittliches Einkommen pro steuerpflichtige Person: In Gemeinden mit
einem höheren durchschnittlichen Einkommen pro steuerpflichtige Person ist der
35
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
Die Datenaufbereitung, bei der ich die aus verschiedenen Jahren stammenden Daten auf
den gleichen Stand brachte, indem ich die Gemeindefusionen berücksichtigte, beanspruchte
sehr viel Zeit. Diese Datenaufbereitung von Hand erforderte höchste Sorgfalt, um
Fehlerfreiheit garantieren zu können. Im Nachhinein gesehen hätte ich mich lieber noch
länger mit dem Theorieteil befasst, um die SPSS-Kommandosprache (Syntax) soweit zu
erlernen, dass das SPSS dies erledigt hätte.
Erst als ich Zugang zur statistischen Datenbank hatte, wurde mir bewusst wie vielfältig unser
Schulsystem ist. Allein auf der Mittelschulstufe gibt es neben den Gymnasiasten auch
noch die Wirtschaftsmittelschule, die Fachmittelschule, die Informatikmittelschule und die
Aargauische Maturitätsschule für Erwachsene. Um meine Fragestellungen umfassender
beantworten zu können, hätte man möglichst alle Stufen (von der Primarschule bis zur
Universität) miteinbeziehen sollen. Dies wäre aber schon deshalb nicht möglich gewesen,
36
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
weil in der statistischen Datenbank viele Daten im Bereich der Bildung nicht auf
Gemeindeebene vorliegen.
Weiter hätte man zu jedem der von mir untersuchten Merkmale noch mehr Aussagen
machen können, z.B. über die Varianz.
5.3 Fazit
Mit dem Gymnasiastenanteil als abhängige Variable korrelieren folgende Merkmale mittel bis
schwach (absteigend sortiert nach dem Betrag des Korrelationskoeffizienten nach Pearson):
Kein linearer Zusammenhang konnte ich beim CVP Wähleranteil bei den Grossratswahlen
2012 und beim Ausländeranteil feststellen.
Mit dem Gymnasiastenanteil als abhängige Variable gab es bei 6 von 8 (das Reinvermögen
als ein Merkmal) untersuchten Merkmalen einen linearen Zusammenhang, was einem Anteil
von 75% entspricht. Auf dem Niveau der Sekundarstufe I gab es nur in 6 von 24 Fällen einen
linearen Zusammenhang, also in 25% der Fälle. Spannend wäre es nun herauszufinden, ob
sich diese „Entwicklung“ fortsetzt. Dies könnte man untersuchen, indem man als abhängige
Variable z.B. den Anteil Studierender auf Universitätsstufe pro Gemeinde (nach Wohnort)
37
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
hätte. Läge auf dieser höheren Stufe in mehr als 75% der Fälle ein linearer Zusammenhang
vor?
Der Kanton Zürich ist, was die finanzielle Situation seiner Bürger betrifft, ein Kanton der
Extreme, verglichen mit dem Kanton Aargau. Deshalb ist es möglich, dass im Kanton Zürich
viel Geld und gute Bildung stärker zusammenhängen als im Kanton Aargau. Provokative
Aussagen, wie dass die Schwamendinger Kinder eine fünfmal geringere Chance als die
Zürichberg-Sprösslinge haben, ins Langzeitgymnasium aufgenommen zu werden, wären
aber auch im Kanton Aargau möglich, wenn man nur die Extremwerte miteinander vergleicht:
Die Gemeinde Oberwil-Lieli mit dem grössten durchschnittlichen Einkommen pro
steuerpflichtige Person hat einen 4,6 Mal höheren Gymnasiastenanteil als Hallwil mit dem
kleinsten durchschnittlichen Einkommen pro steuerpflichtige Person. Oder: Die Gemeinde
Oberwil-Lieli mit dem höchsten Reinvermögen (Median) hat einen knapp drei Mal höheren
Gymnasiastenanteil als die Gemeinde Spreitenbach mit dem kleinsten Median beim
Reinvermögen.
Das Beispiel zeigt: Provokative Aussagen lassen sich, wenn man nur Extremwerte
berücksichtigt, einfach machen. Mindestens für den Kanton Aargau gilt jedoch, sofern man
38
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
„alle“9 Gemeinden in die Analyse miteinbezieht, dass es zwar auch eine schwache bis
mittlere Korrelation gibt, der Zusammenhang jedoch nie so stark ist wie diese Extremwerte
es vermuten lassen.
6 Zusammenfassung
Meine Praktikumszeit bei der AFO-Marketing, die mir als sehr informativ und interessant in
Erinnerung bleiben wird, brachte mich auf die Idee, mein dort erworbenes Wissen noch zu
vertiefen und meine Maturarbeit im Bereich der Datensammlung, Datenaufbereitung und
Datenanalyse zu schreiben. Da die Bildung im bisherigen Leben eines Kantonsschülers ein
zentraler Bestandteil ist, dachte ich mir, dass die meisten Gymnasiasten auch an
Fragestellungen im Zusammenhang mit der Bildung im Kanton Aargau interessiert wären.
Deshalb wollte ich herausfinden, welche statistisch erhobenen Merkmale einer Aargauer
Gemeinde wie stark die Verteilung der Schüler auf die verschiedenen Leistungsniveaus
beeinflussen.
Bei der Suche nach digital vorliegenden Daten stiess ich bald auf die statistische Datenbank
des Kantons Aargau, wo Daten auch aus verschiedenen Jahren und auf Gemeindeebene
vorlagen. Die Kontaktperson für die Benutzung der Datenbank, Herr Daniel Cahn, gewährte
mir freundlicherweise kostenlosen Zugang. Aus einer riesigen Menge von statistisch
erhobenen Daten wählte ich die Anzahl Gymnasiasten und die Anzahl der 15- bis 19-
Jährigen nach Wohnort, woraus ich den Gymnasiastenanteil pro Gemeinde bildete, aus. Um
auch Daten der Sekundarstufe I miteinbeziehen zu können, bildete ich die Summe der
Bezirks-, Sekundar- und Realschüler pro Gemeinde und errechnete daraus die jeweiligen
prozentualen Anteile. Die so erhaltenen Zahlen stellte ich mit der Bevölkerungsdichte, dem
Reinvermögen, den Wähleranteilen der vier grössten Parteien bei den Grossratswahlen
2012, dem Ausländeranteil und dem durchschnittlichen Einkommen pro steuerpflichtige
Person - immer pro Gemeinde - gegenüber. Da die Daten nicht alle vom gleichen Datum
erhältlich waren und in den letzten Jahren einige Gemeindefusionen stattfanden, musste ich
vorgängig, um von einheitlichen Daten ausgehen zu können, diese Gemeindefusionen
berücksichtigen. In meinen Daten sind also, gemäss dem heutigen Stand, 216 Aargauer
Gemeinden vorhanden. Da jedoch in einigen an der Kantonsgrenze liegenden Gemeinden
die Schüler der Sekundarstufe I und die Gymnasiasten die Schule im Nachbarkanton
besuchen und diese deshalb in meinen Daten nicht als Aargauer Schüler erscheinen,
musste ich die betreffenden Gemeinden für die weiteren Arbeitsschritte weglassen.
9Alle Gemeinden, deren Schüler nicht die Möglichkeit haben, eine ausserkantonale Schule zu
besuchen.
39
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
Zunächst liess ich vom SPSS - mit der abhängigen Variable Gymansiastenanteil und mit
allen von mir ausgewählten unabhängigen Variablen - Streudiagramme zeichnen. Darauf ist
sowohl ersichtlich, ob ein linearer Zusammenhang vorliegt, wie auch, ob Ausreisser
vorhanden sind, die den Wert des Korrelationskoeffizienten nach Pearson stark beeinflussen
könnten. Sofern ein linearer Zusammenhang vorhanden war, berechnete ich den Wert des
Korrelationskoeffizienten nach Pearson, andernfalls denjenigen nach Spearman. Dort, wo
der lineare Zusammenhang am deutlichsten erkennbar war, berechnete ich noch die
Koeffizienten der Regressionsgleichung.
Kein linearer Zusammenhang mit dem Gymnasiastenanteil ist beim CVP Wähleranteil und
beim Ausländeranteil ersichtlich. Beim Reinvermögen (Median) besteht eine schwache
Korrelation, beim FDP Wähleranteil, bei der Bevölkerungsdichte, beim SP Wähleranteil, beim
SVP Wähleranteil und beim durchschnittlichen Einkommen pro steuerpflichtige Person eine
mittlere Korrelation.
Beim Bezirks-, Sekundar- und Realschüleranteil als abhängige Variablen besteht, auf dem
Leistungsniveau der Sekundarschule, mit keinem der untersuchten Merkmale ein linearer
Zusammenhang. Auf der Real- und Bezirksschulstufe gibt es beim Reinvermögen (Median),
beim Ausländeranteil und beim durchschnittlichen Einkommen pro steuerpflichtige Person
einen linearen Zusammenhang und eine mittlere Korrelation. Es gibt also tatsächlich
statistisch erhobene Daten vom Wohnort des Schülers, die den Gymnasiastenanteil und
somit auch die Bildungschancen, beeinflussen.
Schön wäre es gewesen, wenn in der statistischen Datenbank auch die Anzahl Studenten
auf Universitätsniveau pro Wohnort vorhanden gewesen wären, um in die Analyse neben der
Sekundarstufe I und II noch eine weitere Bildungsstufe miteinbeziehen zu können.
40
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
7 Quellenverzeichnis
7.1 Literaturverzeichnis
Haider, G. (1999). Deskriptive Statistik. Gefunden am 02.08.2013 unter
https://www.sbg.ac.at/erz/people/paschon/Internet_Kassel/MODUL%2012%20Korrelation.pd
f
Hatzinger, R. und Nagel, H. (2013). Statistik mit SPSS. Fallbeispiele und Methoden. 2.,
aktualisierte Auflage. München: Pearson.
7.2 Abbildungsverzeichnis
Abbildung 2.1: Benutzeroberfläche von SPSS....................................................................... 8
Abbildung 2.2: Das Streudiagramm ......................................................................................11
Abbildung 2.3: Extrem hohe Korrelation ...............................................................................12
Abbildung 2.4: Fast keine Korrelation ...................................................................................12
Abbildung 2.5: Kein linearer Zusammenhang .......................................................................12
Abbildung 2.6: Bestätigung des Korrelationskoeffizienten vom SPSS ..................................13
Abbildung 2.7: Bestätigung des Rangkorrelationskoeffizienten vom SPSS...........................14
Abbildung 2.8: Die Regressionsgerade ................................................................................15
Abbildung 2.9: Bestätigung der Regressionsgleichung .........................................................17
Abbildung 2.10: Fehler in der Fachliteratur ...........................................................................17
Abbildung 3.1: Die statistische Datenbank des Kantons Aargau...........................................20
Abbildung 4.1: Der Gymnasiastenanteil ................................................................................26
Abbildung 4.2: Bevölkerungsdichte.......................................................................................27
41
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
7.3 Tabellenverzeichnis
Tabelle 1: Beispieldatensatz zur Berechnung des Korrelationskoeffizienten nach Pearson ..12
Tabelle 2: Beispieldatensatz zur Berechnung des Korrelationskoeffizienten nach Spearman
.............................................................................................................................................14
Tabelle 3: Beispieldatensatz zur Berechnung der Regressionsgleichung .............................16
Tabelle 4: Beispiel einer Gemeindefusion ............................................................................21
Tabelle 5: Korrelationskoeffizienten Sekundarstufe I ............................................................35
42
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
8 Anhang
43
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
44
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
45
Beeinflusst der Wohnort die Bildungschancen? Gérald Huber G4E
46