Sie sind auf Seite 1von 420

de Gruyter Lehrbuch

Jacobs/Jungnickel Einfhrung in die Kombinatorik


Konrad Jacobs
Dieter Jungnickel
Einfhrung in die
Kombinatorik
2., vllig neu bearbeitete und erweiterte Auflage

Walter de Gruyter
Berlin New York 2004
Konrad Jacobs
Abtsberg 25
96049 Bamberg
Dieter Jungnickel
Institut fr Mathematik
Universitt Augsburg
Universittsstrae 14
86135 Augsburg
Mathematics Subject Classification 2000: 05-01
Gedruckt auf surefreiem Papier, das die US-ANSI-Norm ber Haltbarkeit erfllt.
ISBN 3-11-016727-1
Bibliografische Information Der Deutschen Bibliothek
Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen
Nationalbibliografie; detaillierte bibliografische Daten sind im Internet
ber http://dnb.ddb.de abrufbar.
Copyright 2004 by Walter de Gruyter GmbH & Co. KG, 10785 Berlin.
Dieses Werk einschlielich aller seiner Teile ist urheberrechtlich geschtzt. Jede Verwer-
tung auerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des
Verlages unzulssig und strafbar. Das gilt insbesondere fr Vervielfltigungen, berset-
zungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen
Systemen.
Printed in Germany.
Umschlaggestaltung: Hansbernd Lindemann, Berlin.
Texterfassung in LAT
E
X und Konvertierung der Dateien: I. Zimmermann, Freiburg.
Druck und Bindung: Hubert & Co. GmbH & Co. KG, Gttingen.
Vorwort zur zweiten Auage
Seit demErscheinen der erstenAuage dieses Buches sind nunmehr zwanzig Jahre
vergangen. F ur die Neuauage haben Herr Kollege Jacobs und der Verlag de Gruy-
ter mich um eine gr undliche

Uberarbeitung gebeten. Ich habe dabei die imVorwort
zur ersten Auage von Herrn Jacobs genannte Zielsetzung und den prinzipiellen
Aufbau seines Buches respektiert, mich aber trotzdemnicht nur auf die Beseitigung
von Druckfehlern und kleineren Irrt umern beschr ankt. Neben verh altnism aig ge-
ringf ugigen

Anderungen in der Darstellung und einigen vereinfachten Beweisen
sowie vielen neuen Literaturhinweisen stehen die gr undliche Umarbeitung mehre-
rer Kapitel (insbesondere die uber Lateinische Quadrate, Codes, projektive Ebenen
und Blockpl ane) im Lichte neuerer Entwicklungen, was auch zu einigen umfang-
reichen Erg anzungen gef uhrt hat. Insgesamt werden diese Teile nun doch syste-
matischer pr asentiert, wenn es auch dabei bleibt, da eine vollst andige Theorie
im hier gesetzten Rahmen nicht geboten werden kann. Es sind so wie ich den-
ke etliche weitere Rosinen zu dem von Herrn Jacobs angesprochenen Kuchen
hinzugekommen, wie beispielsweise
mehr Anwendungen aus der Codierungstheorie (Pr ufziffersysteme,
CRC-Codes),
Anwendungen von Codes und projektiven Ebenen in der Kryptographie
(Authentikation von Nachrichten, Zugangskontrolle zu geheimen Informa-
tionen),
mehr uber Blockpl ane, zum Beispiel der Zusammenhang zur bekannten
Hadamardschen Ungleichung, f ur die wir einen besonders kurzen Beweis
eingeschlossen haben, und Differenzmengen, inklusive eines eleganten Be-
weises f ur den ber uhmten Hallschen Multiplikatorsatz,
mehr uber projektive Ebenen und R aume, insbesondere uber Kollineationen
(Satz von Singer) und interessante Unterstrukturen wie Unterebenen, Blocka-
demengen und B ogen, wobei die B ogen einen verbl uffenden Zusammenhang
zur Codierungstheorie liefern,
ein besonders kurzer und eleganter Beweis des F unffarbensatzes,
vi Vorwort zur zweiten Auage
um nur einige besondere Highlights zu nennen. Dabei haben nat urlich auch meine
pers onlichen Interessen eine gewisse Rolle gespielt. Insgesamt hoffe ich aber, dem
Geist der ersten Auage treu geblieben zu sein und das Buch noch reichhaltiger
und damit vielleicht auch noch eine Spur reizvoller gemacht zu haben.
Trotzdembleiben notgedrungen viele wichtigeAspekte der Kombinatorik g anz-
lich auen vor, wie etwa die eminent wichtige Matroid-Theorie, die Theorie der
Assoziationsschemata, die probabilistische Methode oder die extremale Kombina-
torik. F ur die Matroidtheorie sei der Leser auf die B ucher von Tutte [1971], Welsh
[1976], Oxley [1992], Recski [1989] und White [1986], [1987], [1992] verwiesen.
ZumThemaAssoziationsschemata empfehlen wir Bannai und Ito [1984] sowie Zie-
schang [1995], und zur probabilistischen Methode sollte man Erd os und Spencer
[1974], Alon und Spencer [1992] sowie f ur algorithmische Aspekte Habib et
al. [1998] konsultieren. Zur extremalen Kombinatorik vergleiche man Baranov und
Stechkin [1995] sowie Jukna [2001]; f ur die extremale Graphentheorie ist nach wie
vor das Buch von Bollobs [1978] die Standardreferenz.
Andere wichtigeAspekte kommen sicherlich ebenfalls etwas zu kurz; so spielen
bei uns weder Algorithmen noch Anwendungen eine groe Rolle, wenn sie auch
gelegentlich angesprochen werden. Es sind aber gerade diese beiden Themen, die
die enorme auermathematische N utzlichkeit der Kombinatorik erkl aren. Stellver-
tretend f ur viele m ogliche Referenzen sei der an realen Anwendungen etwa im
VLSI-Design oder beimEntwurf von Kommunikations- undVerkehrsnetzwerken
interessierte Leser auf die B ucher von Lengauer [1990], Korte et al. [1990] sowie
Bermond [1992] verwiesen. Auf diese Themen k onnen wir leider gar nicht einge-
hen; immerhin werden wir zu Anwendungen in der Kryptographie im Text einiges
sagen. Dagegen bleibt leider auch das vielf altig anwendbare

Traveling Salesman
Problem auf der Strecke, das bestens dazu geeignet w are, nahezu alle relevan-
ten Aspekte der modernen kombinatorischen Optimierung kennenzulernen; daf ur
m ussen wir unsere Leser auf die beiden wunderbaren Sammelwerke von Lawler et
al. [1985] sowie Gutin und Punnen [2002] verweisen.
Ich danke demVerlag de Gruyter und insbesondere Herrn Manfred Karbe f ur die
gute Betreuung dieses Buchprojektes und die stets angenehme Zusammenarbeit.
Mein ganz besonderer Dank gilt meinem fr uheren Studenten, Herrn Dr. Andreas
Enge, der das Manuskript mit groer Aufmerksamkeit gelesen und zahlreiche Ver-
besserungsvorschl age gemacht hat. Die noch verbleibenden Irrt umer gehen ganz
und gar zu meinen Lasten.
Augsburg, Juli 2003 Dieter Jungnickel
Vorwort zur ersten Auage
Es gibt verschiedene Arten, Kombinatorik zu lernen. Will man Berufs-Kombinato-
riker werden, so kann man z. B.
(a) dem in der Rota-Schule gepegten Trend zur Systematisierung kombinato-
rischer Schluweisen folgen, wie etwa Rota [1975], Aigner [1979], Graver
und Watkins [1977] oder
(b) versuchen, Kombinatorik im indisch-israelisch-ungarischen Stil (liebevoll-
dynamisches Stellen und L osen von Einzelproblemen im Lichte groer Leit-
ideen) zu treiben und zur Ein ubung etwa das Buch von Lovzs [1979] durch-
arbeiten.
Das Literaturverzeichnis gibt einen Einblick in die F ulle der ver offentlichten Lehr-
b ucher und Monographien.
Das vorliegende Buch schliet soweit wie m oglich an das B andchen von Ry-
ser [1963] an. Es wendet sich nicht so sehr an zuk unftige Berufskombinatoriker,
sondern vor allem an Mathematiker jeder Arbeitsrichtung, die einen knappen, viel-
seitigen Einblick in die Kombinatorik gewinnen und mit bescheidenemtechnischen
Aufwandschnell aneineVielzahl ber uhmter Resultate herankommenwollen. Damit
sind insbesondere Studenten und auch Gymnasiallehrer angesprochen (die Kom-
binatorik wird wegen ihres Reizes und ihrer Direktheit in Zukunft eine wachsende
Bedeutung im Schulunterricht haben).
Ich habe deshalb, bildlich gesprochen, versucht, einen m oglichst kleinen Ku-
chen mit m oglichst vielen Rosinen zu backen. Die Themenauswahl ist aus dem
Inhaltsverzeichnis ersichtlich. K urzer behandelt sind einige Themen, die an sich
nicht zum klassischen Themenkanon der Kombinatorik geh oren, z. B. das Dikta-
torproblem und einige Symmetrie-Eigenschaften der Morse-Folge 01101001. . .
Der Versuchung, immer das allgemeinste m ogliche Resultat zu beweisen, habe
ich zu widerstehen gesucht. Auch auf die Einf uhrung vereinheitlichender Begrif-
fe (z. B. Inzidenzstruktur) habe ich absichtlich verzichtet. Die Kombinatorik ist
bunt und soll bunt bleiben. Ich habe vor allem nach dem Typischen getrach-
tet. So lernt man z. B. die typische Arbeitsweise der Ray-Chaudhuri-Schule hier
zweimal, bei der vollst andigen Widerlegung der Eulerschen Vermutung uber or-
thogonale lateinische Quadrate und bei der vollst andigen Behandlung des Kirk-
viii Vorwort zur ersten Auage
manschen Schulm adchenproblems im Falle der Dreierreihen, gr undlich kennen.
Dagegen habe ich die umfassenderen Existenzs atze f ur Blockpl ane und au osbare
Blockpl ane nur zitiert und nicht bewiesen. Verschiedene Grogebiete der modernen
Kombinatorik Graphentheorie, endliche Geometrie, Code-Theorie, Blockplan-
Theorie werden nur in typischen, aber, wie ich hoffe, gr undlichen Kostproben
vorgef uhrt; jedes dieser Gebiete w urde ein eigenes Studium erfordern. Eine Reihe
kombinatorischer Themen mute aus Platzgr unden entfallen (z.B. Such-Theorie,
Matroid-Theorie, Fluktuationstheorie, Gittergas-Kombinatorik, topologische und
wahrscheinlichkeitstheoretische Methoden, Hadamard-Matrizen, und auch die Per-
manententheorie, die mit demBeweis der van-der-Waerden-Vermutung durch Ego-
rychev [1981] und Falikman [1981] soeben einen sch onen Schritt vorw arts getan
hat, konnte ich nur streifen).
An verschiedenen Stellen habe ich Resultate aus anderen mathematischenTheo-
rien genutzt, aus der Gruppentheorie, aus der Theorie der endlichen K orper, aus
der elementaren Zahlentheorie, aus der Funktionentheorie. Diese Resultate werden
am betr. Ort durch hoffentlich ausreichende Erl auterungen herangeholt.
Zwecks Pege des Familiensinns unter Mathematikern habe ich das Literatur-
verzeichnis, soweit m oglich und tunlich, mit Vornamen und Lebensdaten ausge-
stattet. Ich hoffe, es sind mir keine Fehler unterlaufen.
Zur Bezeichnung: Satz III.5.1 bedeutet: Satz 5.1 aus Kap. III 5. Das Symbol
2 bezeichnet das Ende eines Beweises.
Zahlreichen Freunden und Kollegen bin ich zu Dank verpichtet. Mein Doktor-
vater, Herr Wilhelm Maak, dem ich dies Buch widme, hat mir vor langen Jahren
einen ersten Zugang zur Kombinatorik er offnet. Fachkundigen Rat haben mir vor
allemThomas Beth, Hillel Furstenberg, Dietrich K olzow, Klaus Leeb, Volker Strehl
und Benji Weiss gegeben; Maria Remnyi hat den Text kritisch gelesen und verbes-
sert. F ur die Herstellung der Reinschrift danke ich den Sekret arinnen des Erlanger
Mathematischen Instituts, voran Frau Helga Zech, und dem Verlag de Gruyter f ur
die sorgf altige publikatorische Betreuung und die gute Zusammenarbeit.
Erlangen, April 1983 Konrad Jacobs
Inhaltsverzeichnis
I Das kleine Einmaleins der Kombinatorik 1
1 Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2 Einfache Anzahlaussagen . . . . . . . . . . . . . . . . . . . . . . 6
3 Das Inklusions-Exklusions-Prinzip . . . . . . . . . . . . . . . . . 12
3.1 Das Inklusions-Exklusions-Prinzip mit Gewichten . . . . . . 13
3.2 Zahlentheoretische Anwendungen der Siebformel . . . . . . . 15
3.3 Das Problme des mnages . . . . . . . . . . . . . . . . . . 17
3.4 Permanenten . . . . . . . . . . . . . . . . . . . . . . . . . . 20
II Der Heiratssatz und seine Verwandten 23
1 Der Heiratssatz . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2 Zum Heiratssatz verwandte S atze . . . . . . . . . . . . . . . . . . 27
2.1 Die S atze von K onig und Dilworth . . . . . . . . . . . . . . 28
2.2 Die

Aquivalenz des Heiratssatzes mit den S atzen von K onig
und Dilworth . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.3 Verwandte Ergebnisse . . . . . . . . . . . . . . . . . . . . . 33
2.4 Der Satz von Menger . . . . . . . . . . . . . . . . . . . . . . 39
3 Das Schnitt-Flu-Theorem von Ford und Fulkerson . . . . . . . . 43
3.1 Gerichtete Graphen und Flu-Netzwerke . . . . . . . . . . . 44
3.2 Flumaximierung . . . . . . . . . . . . . . . . . . . . . . . 48
3.3 Fl usse, Matchings und disjunkte Wege . . . . . . . . . . . . . 54
3.4 Der Satz von Baranyai . . . . . . . . . . . . . . . . . . . . . 57
III Orthogonale lateinische Quadrate 62
1 Problemstellung und Historisches . . . . . . . . . . . . . . . . . . 62
2 Grundbegriffe und erste Existenzaussagen . . . . . . . . . . . . . 64
3 Endliche K orper . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4 Der Satz von MacNeish . . . . . . . . . . . . . . . . . . . . . . . 72
5 Differenzmatrizen . . . . . . . . . . . . . . . . . . . . . . . . . . 74
6 Widerlegung der Eulerschen Vermutung . . . . . . . . . . . . . . 78
7 Eine Anwendung: Authentikationscodes . . . . . . . . . . . . . . 82
x Inhaltsverzeichnis
IV Der Satz vom Diktator 87
1 Problemstellung . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
2 M achtige Familien . . . . . . . . . . . . . . . . . . . . . . . . . . 89
3 Auswege . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
V Fastperiodische 0-1-Folgen 96
1 Die Morse-Thue-Folge . . . . . . . . . . . . . . . . . . . . . . . 96
2 Fastperiodizit at . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
VI Der Satz von Ramsey 104
1 Die nite Version des Satzes von Ramsey . . . . . . . . . . . . . . 105
2 Die unendliche Version des Satzes von Ramsey . . . . . . . . . . . 109
VII Der Satz von van der Waerden 112
1 Arithmetische Progressionen . . . . . . . . . . . . . . . . . . . . 112
2 Beweis des Satzes von van der Waerden . . . . . . . . . . . . . . 114
3 Der Satz von Szemerdi . . . . . . . . . . . . . . . . . . . . . . . 118
4 Ergebnisse von Schur, Rado und Deuber . . . . . . . . . . . . . . 120
5 Der Satz von Hales und Jewett . . . . . . . . . . . . . . . . . . . 122
VIII Codes 128
1 Sofort bzw. eindeutig entzifferbare Codes . . . . . . . . . . . . . . 129
2 Pr ufziffersysteme . . . . . . . . . . . . . . . . . . . . . . . . . . 133
3 Fehlerkorrigierende Codes . . . . . . . . . . . . . . . . . . . . . 141
4 Lineare Codes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
5 Zyklische Codes und Polynomideale . . . . . . . . . . . . . . . . 152
6 BCH-Codes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
7 Bemerkungen zur Implementierung . . . . . . . . . . . . . . . . . 165
IX Endliche projektive Ebenen und R aume 171
1 Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172
2 Existenzfragen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
3 Polarit aten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
4 Das Freundschaftstheorem . . . . . . . . . . . . . . . . . . . . . 183
5 Kollineationen und der Satz von Singer . . . . . . . . . . . . . . . 186
6 B ogen und MDS-Codes . . . . . . . . . . . . . . . . . . . . . . . 189
7 Unterebenen und Blockademengen . . . . . . . . . . . . . . . . . 195
8 Anwendungen in der Kryptographie . . . . . . . . . . . . . . . . . 200
9 Afne Geometrien . . . . . . . . . . . . . . . . . . . . . . . . . . 204
Inhaltsverzeichnis xi
X Blockpl ane 209
1 Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210
2 Direkte Konstruktionen . . . . . . . . . . . . . . . . . . . . . . . 215
3 GDDs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222
4 Relative Differenzfamilien . . . . . . . . . . . . . . . . . . . . . . 226
5 Der PBD-H ullenoperator . . . . . . . . . . . . . . . . . . . . . . 228
6 Blockpl ane mit k 5 . . . . . . . . . . . . . . . . . . . . . . . . 232
7 Au osbare Blockpl ane . . . . . . . . . . . . . . . . . . . . . . . . 235
XI Symmetrische Blockpl ane und Differenzmengen 241
1 Symmetrische Blockpl ane: Grundlagen . . . . . . . . . . . . . . . 241
2 Der Satz von Bruck, Ryser und Chowla . . . . . . . . . . . . . . . 245
3 Hadamardmatrizen und Blockpl ane . . . . . . . . . . . . . . . . . 249
4 Eine rekursive Konstruktion . . . . . . . . . . . . . . . . . . . . . 255
5 Differenzmengen und Gruppenringe . . . . . . . . . . . . . . . . 259
6 Multiplikatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . 263
7 Der Mann-Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268
8 Planare Differenzmengen . . . . . . . . . . . . . . . . . . . . . . 270
9 Die Hadamardsche Ungleichung . . . . . . . . . . . . . . . . . . 275
XII Partitionen 277
1 Formale Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . 277
2 Erzeugende Funktionen von Partitions-Anzahlen . . . . . . . . . . 279
3 Eulers Pentagonalzahlen-Theorem . . . . . . . . . . . . . . . . . 283
XIII Die Abz ahltheorie von Plya 292
1 Der Zyklenindex einer Permutationsgruppe . . . . . . . . . . . . . 292
2 Das Lemma von Burnside . . . . . . . . . . . . . . . . . . . . . . 296
3 Der Satz von Plya . . . . . . . . . . . . . . . . . . . . . . . . . 300
4 B aume und Str unke . . . . . . . . . . . . . . . . . . . . . . . . . 303
5 Alkohole . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305
6 Die Anzahl der B aume auf n Punkten . . . . . . . . . . . . . . . . 309
XIV Kombinatorische Betrachtungen topologischen Ursprungs 314
1 Das K onigsberger Br uckenproblem . . . . . . . . . . . . . . . . . 314
2 Der Eulersche Polyedersatz . . . . . . . . . . . . . . . . . . . . . 317
3 Der F unffarbensatz . . . . . . . . . . . . . . . . . . . . . . . . . 322
4 Hamiltonsche Kreise . . . . . . . . . . . . . . . . . . . . . . . . . 327
5 Das Spernersche Lemma . . . . . . . . . . . . . . . . . . . . . . 331
6 Der Satz von Helly . . . . . . . . . . . . . . . . . . . . . . . . . . 334
xii Inhaltsverzeichnis
XV Spiele auf Graphen 338
1 Baumspiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 338
2 Das klassische Nim-Spiel . . . . . . . . . . . . . . . . . . . . . . 341
3 Spiele vom Typ Nim auf Graphen . . . . . . . . . . . . . . . . . . 344
XVI Spezielle Folgen von ganzen Zahlen 350
1 Die Fibonacci-Zahlen . . . . . . . . . . . . . . . . . . . . . . . . 350
2 Die Mnage-Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . 353
3 Die Rencontres-Zahlen . . . . . . . . . . . . . . . . . . . . . . . 353
4 Die Partitionszahlen . . . . . . . . . . . . . . . . . . . . . . . . . 354
5 Die Catalan-Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . 356
6 Die Bell-Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . 358
7 Die Stirling-Zahlen zweiter Art . . . . . . . . . . . . . . . . . . . 359
8 Die Stirling-Zahlen erster Art . . . . . . . . . . . . . . . . . . . . 363
9 Die Gau-Koefzienten . . . . . . . . . . . . . . . . . . . . . . . 365
Nachwort 369
Literaturverzeichnis 371
Index 395
I Das kleine Einmaleins der Kombinatorik
In diesem einf uhrenden Kapitel wollen wir einige elementare Aussagen und Prin-
zipien der klassischen Kombinatorik kennenlernen. Nach einem kurzen R uckblick
auf die wichtigsten Begriffe der Mengenlehre (der auch dazu dient, die von uns
verwendete Notation festzulegen) stellen wir drei grundlegende Abz ahlprinzipi-
en vor und leiten dann die einfachsten Anzahlaussagen f ur endliche Mengen her;
danach betrachten wir mit dem Inklusions-Exklusions-Prinzip ein etwas schwie-
rigeres Abz ahlverfahren, das von fundamentaler Bedeutung ist. Hier k onnen wir
dann bereits etliche anspruchsvollere Anwendungen behandeln.
1 Mengen
Die Kombinatorik besch aftigt sich uberwiegend mit endlichen Mengen. Das Un-
endliche kommt aber sogleich ebenfalls in die Kombinatorik hinein, weil sie S atze
zu beweisen sucht, die f ur Mengen ohne Beschr ankung der M achtigkeit (also der
Anzahl ihrer Elemente) gelten. Ferner bedient sich die Kombinatorik manchmal
analytischer, topologischer oder stochastischer Methoden, wodurch sie es mit den
reellen und den komplexen Zahlen oder auch mit topologischen R aumen zu tun
bekommt; dieser Fall tritt besonders dann ein, wenn man sogenannte asymptoti-
sche Aussagen beweisen will. Schlielich lassen sich manche Fragestellungen und
Ergebnisse der Kombinatorik von endlichen auf unendliche Mengen ubertragen. In
diesem Buch steht die Kombinatorik der endlichen Mengen im Vordergrund. Wo
dieser Rahmen uberschritten wird, werden wir die ben otigten Hilfsmittel per Zitat
ausdr ucklich, aber ohne Beweis bereitstellen. Aber auch beim Umgang mit end-
lichen Mengen werden wir uns Resultate aus anderen Gebieten der Mathematik,
insbesondere aus der Linearen Algebra, der Algebra der endlichen K orper und der
Theorie der endlichen Gruppen wieder per Zitat ohne Beweis zu Nutze machen.
Wir setzen voraus, da der Leser uber gewisse Grundkenntnisse aus der nai-
ven Mengenlehre, d. h. uber Mengen und Abbildungen, verf ugt. Es geht also nur
noch darum, an gewisse Begriffsbildungen aus dieser Theorie zu erinnern und Be-
zeichnungen festzulegen. Die gesamte Kombinatorik ist, wie praktisch jeder Zweig
der Mathematik, mit Hilfe der Begriffe

Menge und

Abbildung formulierbar.
Die weiteren Abschnitte dieses Kapitels haben auch den Zweck, dies an einfa-
2 I Das kleine Einmaleins der Kombinatorik
chen Beispielen zu demonstrieren; dadurch soll insbesondere klar werden, da zum
Verst andnis der Kombinatorik kein kombinatorischer Sonderverstand erforderlich
ist. Dennoch werden wir sp ater die konsequente Formulierung kombinatorischer
Aussagen rein mit Hilfe der Begriffe

Menge und

Abbildung oft nicht voll


durchf uhren, n amlichdann, wenneine andere beispielsweise verbale Ausdrucks-
weise nach unserer Meinung besser geeignet ist, das Gemeinte klarzumachen. Von
einem gewissen Stadium der Besch aftigung mit der Kombinatorik an sollte der Le-
ser im Stande sein, mengentheoretischen Klartext selbstst andig herzustellen, falls
er dies w unscht. Folgende Mengen werden uns besonders besch aftigen:
N = {1, 2, 3, . . . ] = die Menge der nat urlichen Zahlen;
Z = {0, 1, 1, 2, 2, . . . ] = {. . . , 1, 0, 1, . . . ]
= die Menge der ganzen Zahlen;
Z

= {0, 1, 2, . . . ] = {m [ m Z, m 0]
= N {0] = die Menge der ganzen Zahlen ab 0.
Das Rechnen mit Kongruenzen (mod m) in Nund Zwird als bekannt vorausgesetzt.
Ferner ben otigen wir immer wieder:
Q =
_
a
b

a, b Z, b ,= 0
_
= die Menge (auch: der K orper) der rationalen Zahlen
(womit wir eigentlich

Aquivalenzklassen von Br uchen meinen, die Klassenbildung
aber meist nicht explizit ben utzen);
R = die Menge (auch: der K orper) der reellen Zahlen;
C = die Menge (auch: der K orper) der komplexen Zahlen;
GF(q) = der endliche K orper mit q Elementen (wobei q eine Primzahl-
potenz ist, vgl. III.3).
Mengen mit genau r ( Z

) Elementen heien auch r-elementige Mengen oder


r-Mengen. Die leere Menge ist die einzige 0-Menge. Ist M eine Menge und
r Z

, so bezeichnet
2
M
die Menge aller Teilmengen von M einschlielich der
leeren Menge ;
_
M
r
_
die Menge der r-elementigen Teilmengen von M.
I.1 Mengen 3
Man nennt 2
M
auch die Potenzmenge von M. In der alteren Literatur ndet man statt
der hier verwendeten Bezeichnungen meist die Symbole P(M) bzw. P
r
(M). Aus
dem Zusammenhang sollte stets klar sein, ob wir mit 2
M
gerade die Potenzmenge
einer Menge oder aber eine Zahl meinen.
Die Mengenverkn upfungen , und Symbole wie

n
j=1
M
j
,
_

k=1
M
k
,

sI
M
s
werden als bekannt vorausgesetzt. Sind N und M Mengen, so nennt
man
M N = {x [ x M, x , N] die Differenz von M und N
(in dieser Reihenfolge);
M .N = (M N) (N M) = (M N) (M N)
die symmetrische Differenz von M und N.
Eine Menge von Mengen wird auch als ein Mengensystem bezeichnet. Eine Ab-
bildung einer nichtleeren Menge I in eine Menge wird auch eine Familie genannt.
I heit dann die Indexmenge der Familie. Ist x
i
das Bild von i I unter dieser
Abbildung, so schreibt man die Familie als (x
i
)
iI
. Bei speziellen I verwendet man
auch andere Schreib- und Sprechweisen:
(x
j
)
j{1,2]
= (x
1
, x
2
) (geordnetes) Paar
(y
k
)
k{1,...,n]
= (y
1
, . . . , y
n
) n-Tupel, n-Vektor
(z
l
)
lZ

= (z
0
, z
1
, . . . ) = z
0
z
1
. . . Folge
(y
m
)
mZ
= (. . . , u
1
, u
0
, u
1
, . . . )
= . . . u
1
u
0
u
1
. . . Folge
und dergleichen mehr. Dies alles gilt insbesondere bei Mengenfamilien, d. h. Ab-
bildungen einer Indexmenge in eine Menge von Mengen. Ist M eine nichtleere
Menge von Mengen, so bezeichnet
_
MM
M die Vereinigung aller Mengen aus M, d. h. die Menge aller Elemente,
die in mindestens einer Menge M Mvorkommen;
_
MM
M den Durchschnitt aller Mengen aus M, d. h. die Menge aller Elemente,
die in jeder Menge M Mvorkommen.
Ist M = , so setzt man

MM
M = ; hat man sich entschlossen, nur Teilmen-
gen einer festen Menge X zu betrachten, deniert man
_
M
M = X. Analoge
Bezeichnungen werden f ur Mengenfamilien verwendet.
4 I Das kleine Einmaleins der Kombinatorik
Ist (M
i
)
iI
eine Familie von nichtleeren Mengen, so deniert man ihr cartesi-
sches Produkt

iI
M
i
als die Menge aller Familien (x
i
)
iI
mit x
i
M
i
f ur alle
i I. Hierbei heit M
i
auch der i-te cartesische Faktor von

iI
M. F ur spezielle
I verwendet man auch andere Bezeichnungen wie M
1
M
2
, M
1
M
n
,
M
0
M
1
, M
1
M
0
M
1
, AB C etc. Da

iI
M
i
stets
nichtleer ist, ist gerade der Inhalt des sogenannten Auswahlaxioms; f ur unendliche
Familien ist dieses allgemein akzeptierte Axiom durchaus nicht unproblematisch,
worauf wir aber hier nicht eingehen k onnen. Ist in einer Mengenfamilie (M
i
)
iI
mindestens ein M
i
leer, so deniert man

iI
M = . Sind s amtliche M
i
gleich,
etwa gleich M, so schreibt man auch
M
I
statt

iI
M
i
,
M
n
statt M
1
M
n
,
M
n1
statt M
0
M
n
, etc.
M
I
ist also die Menge aller Abbildungen von I in M. Sind R, C nichtleere Mengen,
so heien Abbildungen R C M auch Matrizen oder Arrays; die Elemente
von R heien dann auch Zeilenindizes, die Elemente von C auch Spaltenindizes.
F ur ein festes j R heit die Einschr ankung unserer Abbildung auf {j] C
auch die j-te Zeile oder der j-te Zeilenvektor der Matrix; analog sind Spalten und
Spaltenvektoren deniert. F ur spezielle R, C verwendet man ublicherweise auch
spezielle Bezeichnungen f ur Matrizen, so etwa f ur mn -Matrizen
(a
(j,k)
)
(j,k){1,...,m]{1,...,n]
= (a
jk
)
j=1,...,m;k=1,...,n
=
_
_
a
11
. . . a
1n
a
m1
. . . a
mn
_
_
oder f ur unendliche Arrays
(b
(m,n)
)
(m,n)Z

N
= (b
mn
)
m=0,1,...; n=1,2,...
=
_
_
b
01
b
02
. . .
b
11
b
12
. . .
. . . . . . . . .
_
_
und dergleichen mehr. Wir werden die transponierte Matrix (a
ji
) zu einer Matrix
A = (a
ji
) mit A
T
bezeichnen.
Ein MengensystemMheit ( paarweise) disjunkt, wenn je zwei Mengen in M
leeren Schnitt haben. Entsprechend heit eine Mengenfamilie (M
i
)
iI
( paarweise)
disjunkt, wenn f ur alle i, j I mit i ,= j stets M
i
M
j
= gilt. Eine Mengenfa-
milie (M
i
)
iI
disjunkt machen bedeutet, zur neuen Mengenfamilie (M
i
{i])
iI
I.1 Mengen 5
ubergehen, die in der Tat disjunkt ist. Vereinigt man eine disjunkte Menge von
Mengen oder eine disjunkte Mengenfamilie, so spricht man auch kurz von dis-
junkter Vereinigung. Eine Darstellung einer Menge M als disjunkte Vereinigung
anderer Mengen nennt man auch eine (disjunkte) Zerlegung oder Partition von M,
die Bestandteile auch Atome oder Teile.
Teilmengen von M
1
M
2
werden auch als (bin are) Relationen zwischen Ele-
menten von M
1
und Elementen von M
2
bezeichnet, im Falle M
1
= M
2
= M auch
als (bin are) Relationen auf M. Der Leser sollte wissen, was Reexivit at, Symmetrie,
Transitivit at etc. einer Relation in einer Menge M bedeutet, was eine

Aquivalenz-
relation samt (

Aquivalenz-)Klassen und Repr asentanten ist, was man unter einer


partiellen Ordnung und unter einer Totalordnung in einer Menge versteht etc. Ist
f : X Y eine Abbildung der Menge X in die Menge Y, so nennt man die
Relation
G = G
f
= {(x, y) [ x X, y Y, y = f (x)] = {(x, f (x)) [ x X]
den Graphen der Abbildung f . Er hat folgende Eigenschaft: Zu jedem x X gibt
es genau ein y Y mit (x, y) G. Relationen G XY mit dieser Eigenschaft
und Abbildungen f : X Y sind mittels der Identikation G = G
f
nur zwei
Aspekte ein und derselben Sache. Da wir den Begriff des cartesischen Produkts
nicht ohne den Begriff der Abbildung formuliert haben (was jedoch m oglich w are),
ist der Abbildungsbegriff damit streng genommen nicht auf den Relationsbegriff
zur uckgef uhrt. (Noch strenger genommen ist jeder (z. B. mathematische) Text eine
Abbildung einer Menge von Pl atzen in eine Menge von Zeichen.) Wir rekapitulieren
abschlieend: Eine Abbildung g: M N heit
injektiv oder eine Injektion, wenn sie eindeutig ist, also aus x, y M, x ,= y stets
f (x) ,= f (y) folgt;
surjektiv oder eine Surjektion, wenn sie

auf ist, also wenn


f (M) = {f (x) [ x M] = N gilt;
bijektiv oder eine Bijektion, wenn sie injektiv und surjektiv ist.
Statt f (x) darf man auch f x oder x
f
, statt f (K) (= {f (x) [ x K] f ur
K M) darf man auch f K oder K
f
schreiben. Die zu einer Bijektion f : M N
inverse Abbildung von N in M wird mit f
1
bezeichnet. Bijektionen f : M
M heien auch Permutationen von M. F ur zwei Abbildungen f : M N und
g: N P ist die Komposition oder das Produkt g f durch g f : M P,
(g f )(x) = g(f (x)) f ur alle x M deniert (also:

erst f dann g). Die


Permutationen von M bilden mit diesem Produkt eine Gruppe, die man mit S
M
(bei M = {1, . . . , n] auch mit S
n
) bezeichnet und die symmetrische Gruppe auf M
(oder: auf n Elementen) nennt.
6 I Das kleine Einmaleins der Kombinatorik
2 Einfache Anzahlaussagen
Ist Meine Menge, sobezeichnet [M[ dieAnzahl ihrer Elemente. Der Kurz-Ausdruck

[M[ = m bedeutet ausf uhrlich

M ist eine Menge und hat genau m Elemente.


[M[ = 0 ist mit M = gleichbedeutend. Zwei nichtleere Mengen M, N sind ge-
nau dann gleichm achtig (d.h., es gilt [M[ = [N[), wenn es eine Bijektion M N
gibt. Eine Menge M heit endlich, wenn es keine Injektion f : M M mit
f (M) ,= M gibt (Dedekindsche Denition der Endlichkeit, Dedekind [1888]).
Eine nichtleere Menge M ist genau dann endlich, wenn es ein n N und eine
Bijektion M {1, . . . , n] gibt; es gilt dann [M[ = n. Ist M nicht endlich, so
schreiben wir [M[ = und k ummern uns nicht um die Unterscheidung verschie-
dener unendlicher M achtigkeiten.
Alle Anzahl-Untersuchungen der Kombinatorik kommen im Prinzip mit den
folgenden drei Grundtatsachen aus:
(I) Gibt es zwischen zwei Mengen eine Bijektion, so haben sie gleichviele Ele-
mente.
(II) Sind M und N disjunkt, so gilt [M N[ = [M[ [N[, bei disjunkter Vereini-
gung addieren sich also die M achtigkeiten. Im allgemeinen Fall gilt dagegen
[M N[ = [M[ [N[ [M N[.
(III) [M N[ = [M[ [N[, bei cartesischer Produkt-Bildung multiplizieren sich
also die M achtigkeiten.

Ubung 2.1. Mittels vollst andiger Induktion beweise man (II) und (III) und dehne
beide Aussagen auf beliebig viele Mengen aus.
Indem man die allgemeine Version von (III) auf N gleiche cartesische Faktoren
anwendet, erh alt man die Formel
(2.1) [M
N
[ = [M[
[N[
,
aus der wir durch geschickte Interpretation die folgende Aussage gewinnen.
Satz 2.2. Eine n-Menge besitzt genau 2
n
Teilmengen.
Beweis. Aus [{0, 1][ = 2 und [M[ = n folgt [{0, 1]
M
[ = 2
n
, wobei nach Denition
die Elemente von {0, 1]
M
s amtliche Abbildungen f von M in {0, 1] sind. Die
Zuordnung
f . E
f
= {k [ k M, f (k) = 1]
ist nun offenbar eine Bijektion zwischen {0, 1]
M
und 2
M
: Die Elemente von {0, 1]
M
sind die sogenannten Indikatorfunktionen von Teilmengen von M. (Diese Beob-
achtung motiviert auch die Notation 2
M
f ur die Potenzmenge der Menge M.) Nach
(I) sind wir fertig. 2
I.2 Einfache Anzahlaussagen 7
Als n achstes untersuchenwir die Frage, wieviele Injektionenes voneiner Menge
M in eine Menge N gibt, was uns insbesondere die M achtigkeit der Gruppe S
n
liefern wird.
Satz 2.3. Sei [M[ = m und [N[ = n, wobei m n gelte. Dann gibt es genau
n(n 1) . . . (n m1) Injektionen von M in N.
Beweis. Wir verwenden Induktion uber m. Ist m = 1 n, so ist genau ein Element
abzubilden; als Bilder stehen die n Elemente von N zur Verf ugung, weswegen die
gesuchte Anzahl n = n 1 1 ist, wie behauptet. Angenommen, man hat die
Behauptung f ur m 1 bewiesen und hat nun [M[ = m, [N[ = n m > 1. Wir
w ahlen ein beliebiges Element j
0
M und zerlegen die Menge I der Injektionen
von M in N disjunkt in n Teile:
I
k
= {f [ f : M N injektiv, f (j
0
) = k]
f ur k N. Das Atom I
k
dieser Partition ist nun durch die Abbildung

Ein-
schr ankung auf M {j
0
] bijektiv auf die Menge der Injektionen von M {j
0
]
in N {k] bezogen. Man hat [M {j
0
][ = m1, [N {k][ = n 1; nach Indukti-
onsannahme und (I) gilt somit [I
k
[ = (n 1) . . . (n m1) f ur alle k N. Nach
(II) folgt nun [I[ = n(n 1) . . . (n m1), also die Behauptung. 2
Korollar 2.4. F ur jede nat urliche Zahl n gilt
[S
n
[ = n' = n(n 1) . . . 2 1
Beweis. Hier ist M = N und die Injektionen sind im wesentlichen nach der
Dedekindschen Denition der Endlichkeit Bijektionen. 2
Wir haben beim obigen Beweis die Zur uckf uhrung aller Beweismittel auf (I),
(II), (III) bis auf das formaleAufschreiben gewisser Abbildungen vollst andig durch-
gef uhrt, damit der Leser einmal an einem Beispiel sieht, wie man das macht. In
Zukunft werden wir uns meist einer k urzeren Ausdrucksweise bedienen, in der der
obige Beweis etwa folgende Form hat: Wir k onnen M = {1, . . . , m] annehmen;
f ur die Abbildung von 1 bestehen n, f ur die Abbildung von 2 dann noch n 1, . . . ,
schlielich f ur die Abbildung von m dann noch n m1 M oglichkeiten; also ist
die gesuchte Anzahl n(n 1) . . . (n m1).
Als n achstes wenden wir uns den k-Teilmengen einer Menge N zu. Mittels
naheliegender Bijektionen und (I) sieht man, da die M achtigkeit von
_
N
k
_
= {M [ M N, [M[ = k]
8 I Das kleine Einmaleins der Kombinatorik
nur von k und der M achtigkeit nvon N abh angt; daher k onnen wir diese M achtigkeit
als die Denition des Binomialkoefzienten
_
n
k
_
verwenden. Man beachte, da diese
Denition f ur beliebige nicht-negative ganze Zahlen sinnvoll ist; im Falle n < k
ergibt sich dann trivialerweise
_
n
k
_
= 0. F ur den interessanten Bereich 0 k n
erhalten wir die folgenden wichtigen Formeln.
Satz 2.5. Es seien n, k Z

mit 0 k n. Dann gelten:


_
n
k
_
=
_
n 1
k 1
_

_
n 1
k
_
f ur k 1, (2.2)
_
n
k
_
=
n'
k'(n k)'
, (2.3)
_
n
n k
_
=
_
n
k
_
. (2.4)
Beweis. Zum Nachweis von (2.2) sei N eine n -Menge und 1 k n. Wir w ahlen
ein beliebiges Element j
0
N und zerlegen
_
N
k
_
disjunkt in folgende zwei Mengen
P und Q:
P = {M [ M N, [M[ = k, j
0
M],
Q = {M [ M N, [M[ = k, j
0
, M].
Offenbar gilt [P[ =
_
n1
k1
_
, da jedes M P durch Hinzuf ugen von j
0
zu einer
(k 1)-Teilmenge von N {j
0
] entsteht; weiter gilt [Q[ =
_
n1
k
_
unmittelbar nach
Denition. Damit folgt die Behauptung aus (II).
Wir k onnennun (2.2) verwenden, um(2.3) mit Induktion uber nk zubeweisen.
Der Induktionsanfang n = k = 0 sowie allgemeiner der Fall k = 0 sind trivial,
da dann beide Seiten gleich 1 sind. Sei nun 1 k n. Nach Induktionsannahme
folgt dann
_
n
k
_
=
_
n 1
k 1
_

_
n 1
k
_
=
(n 1)'
(k 1)'(n k)'

(n 1)'
k'(n k 1)'
=
(n 1)'(k n k)
k'(n k)'
=
n'
k'(n k)'
.
Schlielich ergibt sich (2.4) aus der trivialen Beobachtung, da die k-Teil-
mengen M von N durch die Bildung ihrer Komplemente N M bijektiv auf die
(n k)-Teilmengen von N abgebildet werden. 2
I.2 Einfache Anzahlaussagen 9
Die Denition der Binomialkoefzienten als M achtigkeit der Menge
_
N
k
_
f ur
eine n -Menge N hat denVorteil, sofort deren Ganzzahligkeit zu liefern, die man der
Formel
_
n
k
_
=
n'
k'(nk)'
, die sonst manchmal als Denition verwendet wird, ja nicht
unmittelbar ansieht. Die Formel (2.2) erm oglicht dann die sukzessive Berechnung
der Binomialkoefzienten durch einen Algorithmus, der lediglich mit Additionen
auskommt und wegen einer gern benutzten Schreibanordnung das Pascalsche Drei-
eck genannt wird. In
_
0
0
_
_
1
0
_ _
1
1
_
_
2
0
_ _
2
1
_ _
2
2
_
_
3
0
_ _
3
1
_ _
3
2
_ _
3
3
_
. . . . . . . . . . . . . . . . . . . . . . . . . . .
_
n 1
0
_
. . .
_
n 1
k 1
_ _
n 1
k
_
. . .
_
n 1
n 1
_
_
n
0
_ _
n
1
_
. . . . . . . . . . . .
_
n
k
_
. . . . . . . . . . . .
_
n
n 1
_ _
n
n
_
sind die randst andigen Binomialkoefzienten
_
n
0
_
gleich 1 und sonst jedes
_
n
k
_
die
Summe seiner beiden oberen Nachbarn
_
n1
k1
_
und
_
n1
k
_
. Numerisch ergibt sich f ur
die ersten sechs Zeilen des Pascalschen Dreiecks
1
1 1
1 2 1
1 3 3 1
1 4 6 4 1
1 5 10 10 5 1
Wir wollennocheine weitere anschauliche Interpretationder Binomialkoefzienten
erw ahnen. Dazu betrachten wir im Pascalschen Dreieck von der Spitze aus abstei-
gende

Zickzackpfade:
10 I Das kleine Einmaleins der Kombinatorik
Jeder von der Spitze aus umn Etagen herabf uhrender Zickzackpfad wird eineindeu-
tig durch eine Folge von n Anweisungen

links bzw.

rechts festgelegt. Kommt


dabei genau k-mal die Anweisung

rechts vor, so landet der Pfad an der


_
n
k
_
vor-
behaltenen Stelle. Jede solche Folge von Anweisungen entspricht nun eineindeutig
einer Teilmenge von {1, . . . , n], n amlich der Menge
{j {1, . . . , n] [ die j-te Anweisung lautet

rechts].
Damit ist die Menge der bei
_
n
k
_
landenden Zickzackpfade bijektiv auf
_
{1,...,n]
k
_
bezogen. Mit dieser Interpretation k onnen wir unseren Beweis f ur die
Formel (2.2) auch wie folgt formulieren: Man betrachte den Eintrag
_
n
k
_
des Pascal-
schen Dreiecks und teile die dort landenden Zickzackpfade in diejenigen, die mit

links, und diejenigen, die mit

rechts eintreffen, ein.


Als weitereAnwendung der Binomialkoefzienten beweisen wir den sogenann-
ten binomischen Lehrsatz:
Satz 2.6 (Binomischer Lehrsatz). Seien a, b zwei Elemente in einemkommutativen
Ring R. Dann gilt:
(2.5) (a b)
n
=
n

k=0
_
n
k
_
a
k
b
nk
(n = 0, 1, 2, . . . ).
Beweis. Die linke Seite von (2.5) ist das Produkt von n identischen Faktoren F
1
=
F
2
= = F
n
= a b. Aufgrund der Rechengesetze f ur kommutative Ringe
(Kommutativit at, Distributivit at etc.) ist (ab)
n
also die Summe aller Produkte, die
durchAuswahl von jeweils einemder Terme a bzw. b aus F
1
, . . . , F
n
entstehen. Ein
solches Produkt ist genau dann gleich a
k
b
nk
, wenn man aus genau k der Faktoren
F
i
den Term a w ahlt. Die Anzahl dieser Produkte ist somit gerade
[{I [ I {1, . . . , n], [I[ = k][ =
_
n
k
_
. 2
I.2 Einfache Anzahlaussagen 11
Insbesondere gilt dieser Satz 2.6 also f ur jeden K orper K sowie f ur den Po-
lynomring K[x] uber K. Der Leser m oge zur

Ubung einen Induktionsbeweis f ur
(2.5) geben, der die Formel (2.2) verwendet.
Bemerkung 2.7. Setzt manin(2.4) a = b = 1, soerh alt mandie n utzliche Identit at
(2.6) 2
n
=
n

k=0
_
n
k
_
=
n

k=0

_
N
k
_

2
N

,
womit sich ein weiterer Beweis f ur Satz 2.2 ergibt.

Ubung 2.8. Man beweise durch Induktion: Sind n > 0, r > 1, und sind
n
1
, . . . , n
r
> 0 mit n
1
n
r
= n gegeben, so gibt es genau
(2.7)
_
n
n
1
, . . . , n
r
_
=
n'
n
1
' . . . n
r
'
disjunkte Zerlegungen einer n-Menge in eine n
1
-Menge, eine n
2
-Menge, . . . , eine
n
r
-Menge. Man nennt die Zahlen (2.7) auch Multinomialkoefzienten.

Ubung 2.9. Man beweise den sogenannten Multinomialsatz:


(a
1
a
r
)
n
=

n
1
,...,n
r
0
n
1
n
r
=n
n'
n
1
' . . . n
r
'
a
n
1
1
. . . a
n
r
r

Ubung 2.10. Man beweise:


a)
n

k=0
(1)
k
_
n
k
_
= 0 (n = 1, 2, . . . ),
b)
n

k=0
_
n
k
_
2
=
_
2n
n
_
(n = 0, 1, . . . ),
c)
n

k=1
k
_
n
k
_
= n2
n1
(n = 1, 2, . . . ),
d)
n

k=1
k
2
_
n
k
_
= n(n 1)2
n2
(n = 2, 3, . . . ),
12 I Das kleine Einmaleins der Kombinatorik
e)
n

k=1
(1)
k1
k
_
n
k
_
= 1
1
2

1
n
(n = 1, 2, . . . ),
f)
_
n
0
_
< <
_
n
n/2
_
> >
_
n
n
_
(n gerade),
_
n
0
_
< <
_
n
(n 1)/2
_
=
_
n
(n 1)/2
_
> >
_
n
n
_
(n ungerade).

Ubung 2.11. Man beweise: Ist p eine Primzahl, so sind


_
p
1
_
, . . . ,
_
p
p1
_
durch p
teilbar.

Ubung 2.12. Sei [N[ = n, r N sowie


N
r
=
_
f [ f : N Z

kN
f (k) = r
_
.
Man beweise
[N
r
[ =
_
n r 1
n 1
_
=
_
n r 1
r
_
.
Hinweis:
_
nr1
n1
_
ist die Anzahl der M oglichkeiten, unter n r 1 in einer Reihe
aufgestellten Gegenst anden n 1 St uck zu

Scheidew anden zu ernennen.

Ubung 2.13. Seien n N, b


1
, b
2
, . . . Z

, b
1
2b
2
= n. Man bestimme
die Anzahl derjenigen Permutationen aus S
n
, die genau b
1
Fixpunkte, genau b
2
Zweierzyklen, genau b
3
Dreierzyklen, besitzen.
3 Das Inklusions-Exklusions-Prinzip
Seien N eine Menge von n Elementen und P
1
, . . . , P
r

Eigenschaften von Ele-


menten von N. Oft ist es von Interesse, herauszunden, wieviele der Elemente von
N genau s ( r) von diesen Eigenschaften haben. Eine Methode, dies Problem
exakt zu formulieren, geht wie folgt. Sei
N

= {k N [ k hat die Eigenschaft P

].

Eigenschaften von Elementen von N sind also formal nichts anderes als Teilmen-
gen von N. F ur jede Teilmenge M deniert man nun die Indikatorfunktion (oder
charakteristische Funktion)
M
durch

M
(k) =
_
1 f ur k M
0 f ur k , M.
I.3 Das Inklusions-Exklusions-Prinzip 13
Unser obiges Problem besteht dann darin, die M achtigkeit der Menge
_
k

=1

(k) = s
_
zu bestimmen. Im ersten Unterabschnitt dieses Paragraphen werden wir eine
L osungsformel f ur ein etwas verallgemeinertes Problem kennenlernen, in den dar-
auf folgenden Unterabschnitten verschiedene Anwendungen.
3.1 Das Inklusions-Exklusions-Prinzip mit Gewichten
Sei [N[ = n N und K ein K orper. Wir w ahlen eine Abbildung w: N K und
nennen f ur jedes k N das Element w(k) von K das Gewicht von k. DieAbbildung
w wird auch als Gewichtsfunktion bezeichnet; in vielenAnwendungen sind K = Q
und w = const = 1. F ur M N heit
w(M) =

kM
w(k)
das Gewicht von M (unter w).
Satz 3.1. Es seien N eine n-Menge, r N und N
1
, . . . , N
r
N. Man setze
f =
N
1

N
r
sowie f ur jedes s = 0, 1, . . . , r
W(s) =

S(
{1,...,r]
s
)
w
_
_
S
N

_
,
E
s
= {k [ f (k) = s].
E
s
besteht also gerade aus denjenigen Elementen k N, die in genau s der
Teilmengen N
1
, . . . , N
r
liegen. Dann gilt f ur s = 0, 1, . . . , r:
w(E
s
) =
r

t =s
(1)
t s
_
t
s
_
W(t ) (3.1)
= W(s)
_
s 1
s
_
W(s 1) (1)
rs
_
r
s
_
W(r)
Beweis. Wir denken uns die W(t ) auf der rechten Seite von (3.1) als Summen von
w-Werten ausgeschrieben und schauen nach, mit welchem Gesamtfaktor ein w(k)
darin auftritt. Ist k E
t
f ur t < s, so kommt k in keinem
_
iS
N
i
mit [S[ s vor,
also taucht w(k) in (3.1) rechts uberhaupt nicht auf. Ist k E
s
, so taucht w(k) genau
14 I Das kleine Einmaleins der Kombinatorik
einmal bei der Bildung von W(s) auf. Damit haben wir w(E
s
) schon beisammen
und m ussen nur noch zeigen, da f ur t > s und k E
t
der Term w(k) rechts in
(3.1) mit dem Gesamtfaktor 0 auftritt. Aber dieser Term taucht bei der Bildung von
W(t 1), . . . , W(n) gar nicht auf, bei der Bildung von W(t ) genau einmal, bei
der Bildung von W(t 1) genau
_
t
t 1
_
-mal, . . . , bei der Bildung von W(s) genau
_
t
s
_
-mal. Das ergibt rechts in (3.1) bei w(k) f ur dieses k einen Gesamtfaktor

__
t
t
_

_
t
t 1
__
t 1
s
_
(1)
t s
_
t
s
__
s
s
__
.
Nun gilt f ur s k t
_
t
k
__
k
s
_
=
t 'k'
k[(t k)'s[(k s)'
=
t '(t s)'
s[(t s)[(t k)[((t s) (t k))'
=
_
t
s
__
t s
t k
_
,
womit unser Gesamtfaktor die Gestalt

_
t
s
___
t s
0
_

_
t s
1
_
(1)
t s
_
t s
t s
__
hat. Nach dem binomischen Lehrsatz 2.6 ist diese eckige Klammer aber f ur t > s
gerade (1 1)
t s
= 0, wie gew unscht. 2
Der Fall s = 0 ergibt die folgende Formel f ur das Gewicht aller Elemente,
die keine der r untersuchten Eigenschaften haben, also in keiner der r gegebenen
Teilmengen von N liegen.
Korollar 3.2. Unter den Voraussetzungen von Satz 3.1 gilt
(3.2) w
_
N
r
_
i=1
N
i
_
= W(0) W(1) (1)
r
W(r).
2
Bemerkung 3.3. Spezialisiert man sich auf w = const = 1, so geht (3.2) in
(3.3)

N
r
_
i=1
N
i

=
r

t =0
(1)
t

S(
{1,...,r]
s
)

_
iS
N
i

(der 0-te Summand hat den Wert n) uber. Man nennt dies die Siebformel. Sie wird
u. a. Sylvester (1814 1897) zugeschrieben, war aber vielleicht schon den Bernoul-
lis (um 1700) bekannt.
I.3 Das Inklusions-Exklusions-Prinzip 15
3.2 Zahlentheoretische Anwendungen der Siebformel
Wir wollen nun die Siebformel (3.3) verwenden, um einige einfache zahlentheore-
tische Resultate zu erhalten. Wir rekapitulieren zun achst einige Bezeichnungen:
x gr ote ganze Zahl x
(m, n) gr oter gemeinsamer Teiler von m, n N
(m, n) = 1 m und n sind relativ prim (teilerfremd)
m|
| n m ist Teiler von n (m, n N)
m n m ist nicht Teiler von n (m, n N)
Satz 3.4. Seien n, r, a
1
, . . . , a
r
N. Falls a
1
, . . . , a
r
paarweise teilerfremd sind,
ist die Anzahl der durch keines der a
i
teilbaren nat urlichen Zahlen n gleich
(3.4) n
r

i=1
_
n
a
i
_

1i<jr
_
n
a
i
a
j
_
(1)
r
_
n
a
1
. . . a
r
_
Beweis. Seien N = {1, . . . , n] und N
i
= {k N [ a
i
|
| k]. F ur jede s-Teilmenge
S von {1, . . . , r] ist die Anzahl der durch alle a
i
mit i S, also durch

iS
a
i
teilbaren Zahlen n gleich
_
n/(

iS
a
i
)
_
. Nach (3.3) folgt die Behauptung. 2
Die Eulersche -Funktion ist durch
(n) = [{k [ 1 k n, (k, n) = 1][ (n N)
deniert.
Satz 3.5. F ur jedes n N gilt
(3.5) (n) = n

p[n
_
1
1
p
_
.
Beweis. Wir w ahlen in Satz 3.4 a
1
, . . . , a
r
als die Aufz ahlung der Primteiler von n.
Dann wird f ur i ,= j
_
n
a
i
a
j
_
=
n
a
i
a
j
und die rechte Seite von (3.4) geht in einen Ausdruck uber, den man leicht in die
rechte Seite von (3.5) umrechnet. 2
16 I Das kleine Einmaleins der Kombinatorik
Die M obius-Funktion : N {1, 0, 1] ist folgendermaen deniert:
(n) =
_

_
1 f ur n = 1
0 falls n durch das Quadrat einer Primzahl teilbar ist
(1)
r
falls n Produkt von r verschiedenen Primzahlen ist.
F ur auerordentlich weit reichende Verallgemeinerungen dieses Begriffs sowie des
folgenden Satzes verweisen wir auf Rota [1964].
Satz 3.6. F ur jedes n N gilt
(3.6) (n) = n

d[n
(d)
d
Beweis. Die rechte Seite von (3.6) ist gleich der rechten Seite von (3.4), wenn man
f ur a
1
, . . . , a
r
eine Aufz ahlung der Teiler von n nimmt. 2
F ur jede reelle Zahl x 0 bezeichnet man mit (x) die Anzahl der Primzahlen
x.
Satz 3.7. F ur jedes n N gilt
(3.7) (n) (

n) = 1

d[p
1
...p
r
(d)
_
n
d
_
,
wobei p
1
, . . . , p
r
die Primzahlen

n seien.
Beweis. Wir streichen aus der Folge 2, 3, . . . , n der Reihe nach die durch p
1
, die
durch p
2
, . . . , die durch p
r
teilbaren Zahlen. Dann sind alle Zahlen

n ge-
strichen.

Ubrig bleiben genau die Primzahlen p mit

n < p n, denn jede
Nicht-Primzahl aus diesem Bereich hat einen Primteiler

n. Nach (3.4) ist also
(n) (

n) =
_
n

1ir
_
n
p
i
_

1i<jr
_
n
p
i
p
j
_
(1)
r
_
n
p
1
. . . p
r
__
1,
was mittels der M obius-Funktion in die rechte Seite von (3.7) ubergeht. 2
Die am Anfang diese Beweises verwendete Methode wird das Sieb des Era-
tosthenes (ca. 284 ca. 200 v. Chr.) genannt. Siebmethoden spielen in der Zahlen-
theorie auch heute eine groe Rolle; Interessenten seien auf Halberstamund Richert
[1974] verwiesen.
I.3 Das Inklusions-Exklusions-Prinzip 17
3.3 Das Problme des mnages
Dieses bekannte Problemlautet verbal: n Ehepaare sollen umeinen runden Tisch in
bunter Reihe so gesetzt werden, da kein Ehemann neben seine Ehefrau zu sitzen
kommt; auf wieviele Arten geht dies?
Man wird zun achst die Damen so Platz nehmen lassen, da rechts und links von
jeder Dame genaueinStuhl frei bleibt. Hierf ur gibt es 2n' M oglichkeiten. Wir fragen
nun nach der Anzahl der M oglichkeiten, die Herren so zu setzen, da kein Herr seine
Ehefrau zur Nachbarin hat. Das bedeutet, da f ur jeden Herren zwei benachbarte
freie St uhle

verboten sind. Offenbar h angt die Anzahl der M oglichkeiten, die


Herren so zu setzen, nur von n ab; wir bezeichnen sie mit U(n). Man nennt U(n)
auch die n-te Mnage-Zahl. Unsere vorl auge Antwort auf die eingangs gestellte
Frage lautet also: 2n'U(n). Es bleibt die Aufgabe, die Mnage-Zahlen U(n) zu
bestimmen.
Lemma 3.8. Seien n, k N, k n und [{x
1
, . . . , x
n
][ = n. Man setze a(n, k) =
[A(n, k)[, wobei
A(n, k) =
_
M
_
{x
1
, . . . , x
n
]
k
_

{x
j1
, x
j
] M f ur j = 2, . . . , n
_
die Menge der M oglichkeiten bezeichnet, k Elemente aus {x
1
, . . . , x
n
] so zu w ahlen,
da man nie zwei aufeinanderfolgende erwischt. Dann gilt
a(n, k) =
_
n k 1
k
_
.
Beweis. Man hat a(n, 1) = n =
_
n11
1
_
und a(n, n) = 0 =
_
nn1
n
_
. Nun sei
1 < k < n. Wir zerlegen disjunkt:
A(n, k) = A
/
(n, k) A
//
(n, k)
mit
A
/
(n, k) = {M [ M A(n, k), x
1
M],
A
//
(n, k) = {M [ M A(n, k), x
1
, M].
Offenbar gilt
[A
/
(n, k)[ = a(n 2, k 1)
[A
//
(n, k)[ = a(n 1, k),
18 I Das kleine Einmaleins der Kombinatorik
womit wir die Rekursionsformel
a(n, k) = a(n 2, k 1) a(n 1, k)
erhalten. Aus ihr und den obigen Anfangswerten kann man alle a(n, k) eindeutig
berechnen. Also haben wir nur mehr zu zeigen, da auch die Binomialkoefzienten
_
nk1
k
_
dieser Rekursionsformel gen ugen. Dies ist der Fall:
_
(n 2) (k 1) 1
k 1
_

_
(n 1) k 1
k
_
=
_
n k
k 1
_

_
n k
k
_
=
_
n k 1
k
_
.
2
Lemma 3.9. Seien n, k N, k < n und [{x
1
, . . . , x
n
][ = n. Man setze b(n, k) =
[B(n, k)[, wobei B(n, k) die Menge
_
M
_
{x
1
, . . . , x
n
]
k
_

{x
1
, x
2
], {x
2
, x
3
], . . . , {x
n1
, x
n
], {x
n
, x
1
] M
_
bezeichne. Dann gilt
b(n, k) =
n
n k
_
n k
k
_
.
Beweis. Wir spalten B(n, k) ebenso auf wie die Menge A(n, k) im Beweis von
Lemma 3.8 und erhalten
b(n, k) = a(n 3, k 1) a(n 1, k)
=
_
(n 3) (k 1) 1
k 1
_

_
(n 1) k 1
k
_
=
_
n k 1
k 1
_

_
n k
k
_
=
_
k
n k
1
__
n k
k
_
=
n
n k
_
n k
k
_
.
2
Satz 3.10. F ur jede nat urliche Zahl n gilt
(3.8) U(n) =
n

i=0
(1)
i
2n
2n i
_
2n i
i
_
(n i)'
Beweis. Wir wendendie Siebformel (3.3) an. Die Menge N ist hier die n'-elementige
Menge aller Verteilungen der n Herren auf die n freien St uhle. Dabei seien die
2n St uhle der Reihe nach als 1, 1
/
, 2, 2
/
, . . . , n, n
/
numeriert und die Dame i sitze
I.3 Das Inklusions-Exklusions-Prinzip 19
o.B.d.A. auf dem Stuhl i
/
. Wenn dann Herr j auf dem Stuhl (j) platznimmt, sind
gerade s amtliche Permutationen in den folgenden Teilmengen von N verboten:
N
2j1
= { [ N, (j) = j] f ur j = 1, . . . , n;
N
2j
= { [ N, (j) = j 1] f ur j = 1, . . . , n 1;
N
2n
= { [ N, (n) = 1].
Dann gilt U(n) = [N

2n
i=1
N
i
[, und nach der Siebformel ergibt sich
U(n) =
2n

i=0
(1)
i

S(
{1,...,2n]
i
)

_
sS
N
s

.
Wir denken uns die Zahlen 1, . . . , 2n im Kreise angeordnet. Dann haben f ur je
zwei Nachbarn i, k die Mengen N
i
und N
k
einen leeren Durchschnitt. Unter mehr
als n der i benden sich aber immer zwei Nachbarn, weswegen der Durchschnitt
von mehr als n der Mengen N
i
stets leer ist. Also d urfen wir die Siebformel so
fortsetzen:
U(n) =
n

i=0
(1)
i

/
S(
{1,...,2n]
i
)

_
sS
N
i

,
wobei

/
bedeutet, da nur uber solche S summiert wird, bei denen keine zwei
Nachbarn in der Kreisanordnung auftreten. Nach Lemma 3.9 gibt es (f ur gegebe-
nes i) genau
2n
2ni
_
2ni
i
_
solche S
_
{1,...,2n]
i
_
. F ur jedes derartige S besteht
_
iS
N
i
aus allen , bei denen i Plazierungen von Herren vorgeschrieben sind; die anderen
n i Herren d urfen sich setzen, wie sie wollen, wof ur es (n i)' M oglichkeiten
gibt. Also ist
U(n) =
n

i=0
(1)
i
2n
2n i
_
2n i
i
_
(n i)',
wie behauptet. 2
Die bemerkenswerte Formel imSatz 3.10 stammt von Touchard [1934], der hier
angegebene Beweis von Kaplansky [1943]. Mehr uber die interessante Geschichte
des Problme des mnages und verwandte Fragestellungen ndet man bei Dutka
[1986]. Ein ahnliches, aber wesentlich einfacheres Problem ist das sogenannte
Problme des rencontres, das nach der Anzahl e
i
(n) der Permutationen in S
n
fragt,
die genau i Fixpunkte (= rencontres) haben. Hier f uhrt eine einfache Anwendung
des Inklusions-Exklusions-Prinzips schnell zum Ziel; eine andere L osung ndet
man in Korollar XIII.2.7.
20 I Das kleine Einmaleins der Kombinatorik

Ubung 3.11. Man beweise die Formel


(3.9) e
i
(n) =
n'
i'
ni

k=0
(1)
k
k'
und folgere daraus, da die Anzahl D
n
= e
0
(n) der xpunktfreien Permutationen
(

drangements) asymptotisch etwa 1/e ist, n amlich


(3.10)
D
n
n'

1
e
.
Wenn man also beispielsweise alle Kleidungsst ucke in einer nicht allzu kleinen
Garderobe zuf allig umordnet, wird mit Wahrscheinlichkeit >
1
3
niemand mehr
seinen eigenen Mantel zur uckerhalten!
3.4 Permanenten
Bekanntlich hat man sich bei der Bildung von Determinanten mit demVorzeichen
von Permutationen zu plagen. Schafft man diese Plage ab, indem man die Vorzei-
chen wegl at, so gelangt man zum Begriff der Permanenten.
1
Der Anschaulichkeit
halber werden wir hier stets von Permanenten reellwertiger Matrizen reden, auch
wenn man allgemeiner Matrizen uber einem beliebigen kommutativen Ring R be-
trachten k onnte.
Denition 3.12. Seien m, n N, m n und I die Menge aller Injektionen von
{1, . . . , m] in {1, . . . , n]. Ist
A =
_
_
a
11
. . . a
1n
. . . . . . . . . .
a
m1
. . . a
mn
_
_
eine (mn)-Matrix mit Eintr agen aus R, so nennt man
per(A) =

I
a
1(1)
. . . a
m(m)
die Permanente der Matrix A.
1
Daf ur handelt man sich allerdings ein viel schlimmeres Problem ein, da Permanenten sehr viel
schwerer zu berechnen sind; hier liegt ein sogenanntes NP-vollst andiges Problem vor, vgl. Garey und
Johnson [1979].
I.3 Das Inklusions-Exklusions-Prinzip 21

Ubung 3.13. Man berechne die Determinanten und Permanenten folgender Matri-
zen:
_
1 2
2 1
_
,
_
1 1
1 1
_
,
_
1 2
2 1
__
1 1
1 1
_
=
_
3 3
3 3
_
.
Man beachte, da sich also die Produktformel f ur Determinanten nicht auf Perma-
nenten ubertr agt.
Satz 3.14. Seien m, n N, m n, und A = (a
jk
)
j=1,...,m, k=1,...,n
eine (mn)-
Matrix uber R. F ur jedes R {1, . . . , n] bedeute A
R
die aus A durch Nullsetzen
aller a
jk
mit k R entstehende (mn)-Matrix. Wir bezeichnen f ur jede (mn)-
Matrix B = (b
jk
)
j=1,...,m, k=1,...,n
mit S(B) das Produkt der Zeilensummen von B:
S(B) =
m

j=1
n

k=1
b
jk
.
Dann gilt
per(A) =

[R[=nm
S(A
R
)
_
n m1
1
_

[R[=nm1
S(A
R
) (3.11)
(1)
m1
_
n 1
m1
_

[R[=n1
S(A
R
)
Beweis. Sei A die Menge aller Abbildungen von {1, . . . , m] nach {1, . . . , n]. Wir
denieren w: A R durch
w() = a
1(1)
. . . a
m(m)
f ur alle A.
F ur jedes j {1, . . . , n] sei
A
j
= { A [ j , ({1, . . . , m])].
Mit der Schreibweise aus Satz 3.1 gilt dann
W(s) =

[R[=s
S(A
R
),
wie sich der Leser uberlegen sollte. Nun ist aber per(A) gerade die Summe aller
derjenigen w(), f ur die in genau n m der A
j
liegt. Aus Satz 3.1 folgt daher
per(A) =
n

t =nm
(1)
t (nm)
_
t
n m
_

[R[=t
S(A
R
).
22 I Das kleine Einmaleins der Kombinatorik
Wegen
_
nmi
nm
_
=
_
nmi
i
_
(f ur i = 0, . . . , n m) liefert dies gerade die Behaup-
tung. 2
Insbesondere erh alt man f ur quadratische Matrizen die folgende Formel:
Korollar 3.15. Sei A = (a
ij
)
i,j=1,...,n
eine quadratische Matrix uber R. Dann gilt
(3.12) per(A) = S(A)
n1

k=1
(1)
k

[R[=k
S(A
R
).
2
Beispiel 3.16. Man kann Korollar 3.15 verwenden, um die folgende interessante
Formel zu beweisen:
(3.13) n' =
n1

k=0
(1)
k
_
n
k
_
(n k)
n
.
Dies folgt inder Tat unmittelbar aus (3.15), wennmandie offensichtliche Beziehung
per(J) = n' verwendet; dabei sei J die (n n)-Matrix, deren Eintr age s amtlich 1
sind.

Ubung 3.17. Man wende Korollar 3.15 auf die Matrix J I an, um eine weitere
Formel f ur die in

Ubung 3.11 bestimmte Anzahl D
n
der xpunktfreien Permuta-
tionen in S
n
zu erhalten.
Eine ber uhmte Vermutung von van der Waerden [1926] besch aftigte sich mit
den Werten von per(A) f ur die sogenannten doppelt-stochastischen Matrizen, also
(nn)-Matrizen A mit nichtnegativen reellen Eintr agen, f ur die s amtliche Zeilen-
und Spaltensummen 1 sind. Die van der Waerden-Vermutung besagt, da in diesem
Falle stets
per(A)
n'
n
n
gilt und Gleichheit nur f ur
A =
_
_
_
1
n
. . .
1
n
. . . . . .
1
n
. . .
1
n
_
_
_
eintritt. DieseVermutung war Jahrzehnte lang offen und wurde schlielich von Ego-
rychev [1981] und Falikman [1981] bewiesen. Etwas vereinfachte Darstellungen
dieses wichtigen Satzes ndet man in Kap. 12 des sch onen Buches von van Lint
und Wilson [2001] sowie bei Minc [1988], der auch eine immer noch lesenswerte
Monographie uber Permanenten geschrieben hat, siehe Minc [1978].
II Der Heiratssatz und seine Verwandten
In diesem Kapitel besch aftigen wir uns mit einer Gruppe von Resultaten, die eine
zentrale Rolle in der Kombinatorik einnehmen und obwohl sie sich mit recht un-
terschiedlich wirkenden Themen befassen in dem Sinne aquivalent sind, da man
jedendieser S atze ohne allzugroenAufwandaus jedemder anderenherleitenkann.
H aug bezeichnet man diesen Themenkomplex als Transversaltheorie, zumindest
dann, wenn man ihn mit dem sogenannten Heiratssatz angeht, wie wir es hier tun
werden; eine wesentlich ausf uhrlichere Darstellung der Transversaltheorie ndet
sich in dem als klassisch einzustufenden Buch von Mirsky [1971a]. Alternativ zu
dem hier und bei Mirsky verfolgten Ansatz kann man die Transversaltheorie auch
aus der Theorie der Netzwerk usse aufbauen, was zumindest vom algorithmischen
Standpunkt gesehen (wenn man also die von uns diskutierten Objekte konkret und
efzient bestimmen m ochte) beachtliche Vorteile hat; dieser Aufbau ist vom zwei-
ten Verfasser in einem

Ubersichtsartikel (siehe Jungnickel [1986]) skizziert und in
seiner Monographie uber Graphen, Netzwerke und Algorithmen (siehe Jungnickel
[1994]) n aher ausgef uhrt worden.
1 Der Heiratssatz
Der 1935 von Philip Hall bewiesene Heiratssatz ist ein Satz uber gewisse injekti-
ve Zuordnungen, die man als Verheiratungen interpretieren kann; im selben Jahr
bewies Maak [1935] einen gleich starken Satz. Sp ater stellte sich heraus, da der
Heiratssatz implizit bereits in einem beinahe zwanzig Jahre fr uher bewiesenen Er-
gebnis von K onig [1916] enthalten war. Die Bezeichnung

Heiratssatz und die


entsprechende Interpretation stammen von Weyl [1949], der von uns wiedergege-
bene Beweis von Halmos und Vaughan [1950] (vgl. auch Maak [1950]).
Beim Heiratssatz hat man es mit folgender Situation zu tun. Gegeben sind zwei
endliche Mengen D (die Menge der

Damen) und H (die Menge der

Herren).
Ist jedem d D eine Teilmenge F(d) von H zugeordnet, so sagt man, es sei ein
Befreundungssystem F gegeben; man interpretiert F(d) als Menge der Freunde der
Dame d. Mathematisch ist ein Befreundungssystem nichts weiter als eine Abbil-
dung f : D 2
H
, also eine Mengenfamilie. Injektive Abbildungen h: D H
werden in unserem Kontext auch Heiraten genannt (in der Literatur meist als
24 II Der Heiratssatz und seine Verwandten
Repr asentantensysteme bezeichnet): Man stellt sich vor, da die Dame d den Herrn
h(d) heiratet; die Injektivit at ist dann als Monogamie zu interpretieren. Man sagt,
die Heirat h: D H sei mit dem Befreundungssystem f : D 2
H
vertr aglich,
wennjede Dame einenihrer Freunde heiratet, wennalsostets h(d) F(d) gilt. Man
sagt weiter, die Befreundung F erf ulle die Bedingung (P) (

Party-Bedingung, in
der Literatur meist als Hallsche Bedingung bezeichnet), wenn auf keiner von eini-
gen Damen mit allen ihren Freunden veranstalteten Party Herrenmangel herrscht,
d. h. wenn
(P)

_
dD
0
F(d)

[D
0
[ f ur alle D
0
D
gilt. Es gilt nun der folgende Satz von Philip Hall [1935]:
Satz 1.1 (Heiratssatz). Seien D, H endliche Mengen. Dann sind f ur jedes Befreun-
dungssystem f : D 2
H
die beiden folgenden Aussagen aquivalent:
1. Es gibt mindestens eine mit F vertr agliche Heirat.
2. Es gilt die Bedingung (P).
Beweis. 1. 2. Sei h eine mit f : D 2
H
vertr agliche Heirat. Dann folgt f ur
jedes D
0
D

_
dD
0
D(d)

_
dD
0
{h(d)]

= [D
0
[;
das Gleichheitszeichen folgt dabei aus der Injektivit at von h, und das aus der
Vertr aglichkeit von h mit F. Also gilt die Bedingung (P).
2. 1. Wir f uhren den Beweis durch Induktion nach der Anzahl [D[ der Damen.
F ur [D[ = 1, etwa D = {d], ist [F(d)[ [d[ = 1 laut Bedingung (P), also kann
man durch Wahl eines beliebigen z F(d) und die Festsetzung h(d) = z eine mit
F vertr agliche Heirat h denieren. Sei nun [D[ 2, und die Implikation

2. 1.
sei bereits in allen F allen mit weniger als [D[ Damen bewiesen. Ferner sei F ein
die Bedingung (P) erf ullendes Befreundungssystem.
Fall I. Die Bedingung (P) ist in folgenden Sinne ubererf ullt:
()

_
dD
0
F(d)

[D
0
[ 1 f ur alle D
0
D mit D
0
,= , D.
Dann w ahlen wir d
0
D beliebig und w ahlen irgendein h
0
F(d
0
). Das geht
wegen [F(d
0
)[ 2 (einem Spezialfall von ()) sogar auf mindestens zwei Arten.
Wir stellen uns vor, wir h atten Dame d
0
mit Herrn h
0
bereits verheiratet und st unden
II.1 Der Heiratssatz 25
nun vor der Aufgabe, die verbliebenen Damen mit Freunden ,= h
0
zu verheiraten.
Hierzu wenden wir die Induktionsannahme auf D
/
= D
0
{d
0
], H
/
= H {h
0
],
F
/
(d) = F(d) H
/
an. Das geht, weil das Befreundungssystem F
/
: D
/
2
H
/
tats achlich die Bedingung (P) erf ullt: F ur D
/
0
D
/
mit D
/
0
,= gilt nach ()

_
dD
/
0
F
/
(d)

_
_
dD
/
0
F(d)
_
{h
0
]

_
dD
/
0
F(d)

1
[D
/
0
[ 1 1 = [D
/
0
[.
Also gibt es eine mit F
/
vertr agliche Heirat h
/
: D
/
H
/
. Durch
h(d) =
_

_
h
0
f ur d = d
0
h
/
(d) f ur d ,= d
0
entsteht nun eine mit F vertr agliche Heirat h : D H.
Fall II. Es gibt ein D
0
D mit D
0
,= , D und

_
dD
0
F(d)

= [D
0
[.
Nat urlich k onnen wir wegen [D
0
[ < [D[ die Induktionsannahme auf D
0
,
H
0
=

dD
0
F(d) und die Einschr ankung F
0
von F auf D
0
anwenden, denn
die Bedingung (P) ist f ur F
0
erf ullt, weil sie f ur F gilt. Wir erhalten eine mit F
0
vertr agliche Heirat h
0
: D
0
H
0
. Nun bilden wir D
1
= D D
0
, H
1
= H H
0
sowie F
1
(d) = F(d) H
0
f ur d D
1
. Wir k onnen wegen [D
1
[ < [D[ auch hier die
Induktionsannahme anwenden, wenn es uns gelingt, auch f ur F
1
die Bedingung (P)
nachzuweisen. Angenommen, (P) ist f ur F
1
nicht erf ullt. Dann gibt es ein D
2
D
1
mit D
2
,= und

dD
2
F
1
(d)

< [D
2
[. Dann aber bilden wir D

= D
0
D
2
und nden

_
dD

F(d)

_
dD
0
F(d)
_
dD
2
F(d)

H
0

_
_
dD
2
F(d) H
0
_

H
0

_
dD
2
[F(d) H
0
]

= [H
0
[

_
dD
2
F
1
(d)

< [D
0
[ [D
2
[ = [D

[,
26 II Der Heiratssatz und seine Verwandten
d. h. die Bedingung (P) w are f ur F : D 2
H
verletzt, ein Widerspruch. Also
funktioniert unser Plan, und es ergibt sich eine mit F
1
: D
1
2
H
1
vertr agliche
Heirat h
1
: D
1
H
1
. Durch
h(d) =
_

_
h
0
(d) f ur d D
0
h
1
(d) f ur d D
1
ist dann eine mit F vertr agliche Heirat h: D H gegeben. 2

Ubung 1.2. Man versch arfe den Heiratssatz wie folgt: Gilt f ur ein Befreundungs-
system F : D 2
H
die Party-Bedingung (P) sowie
[F(d)[ r > 0 f ur alle d D,
so gibt es
(1) im Falle r [D[ mindestens r'
(2) im Falle r > [D[ mindestens r'/(r [D[)'
verschiedene mit F vertr agliche Heiraten.

Ubung 1.3 (Haremssatz, Halmos und Vaughan [1950]). Man beweise: Sei
F : D 2
H
ein Befreundungssystem mit
(nP)

_
dD
0
F(d)

n[D
0
[ f ur alle D
0
D.
Dann gibt es mindestens eineAbbildung h: D 2
H
mit folgenden Eigenschaften:
(1) d ,= d
/
= h(d) h(d
/
) = ;
(2) [h(d)[ = n f ur alle d D;
(3) h(d) F(d) f ur alle d D.
Hinweis: Man ver-n-fache jede Dame.

Ubung 1.4 (Miller [1910]). Man zeige: Ist G eine endliche Gruppe und U eine
Untergruppe von G, so besitzen die linken und rechten Nebenklassen von G nach
U ein gemeinsames Repr asentantensystem.
Hinweis: Man interpretiere die linken Nebenklassen als

Damen, die rechten als

Herren und spreche von Freundschaft, wenn Dame und Herr sich schneiden.
II.2 Zum Heiratssatz verwandte S atze 27

Ubung 1.5 (van der Waerden [1927b]). Sei eine nichtleere, nicht notwendigend-
liche Menge. Ferner sei T 2

so beschaffen, da es U
1
, . . . , U
n
T mit
= U
1
U
n
gibt (man denke etwa an offene

Uberdeckungen eines Kom-
paktums). Man setze
N = min{n [ es gibt U
1
, . . . , U
n
T mit U
1
U
n
= ]
und nenne U T minimal, wenn

UU
U = und [U[ = N gilt. Man zei-
ge: Sind U, V T minimal, so gibt es Durchz ahlungen U = {U
1
, . . . , U
N
],
V = {V
1
, . . . , V
N
] mit U
1
V
1
,= , . . . , U
N
V
N
,= .
Hinweis: Man nenne U Uund V V befreundet, wenn U V ,= ist.

Ubung 1.6 (K onig [1916]). Sei M = (m


jk
)
j,k=1,...,n
eine reellwertige Matrix mit
nichtnegativen Eintr agen sowie Zeilen- und Spaltensummen 1, also:
n

k=1
m
jk
= 1 =
n

i=1
m
il
f ur j, l = 1, . . . , n;
Bekanntlich heit M dann eine doppelt-stochastische Matrix. Man zeige die Exi-
stenz einer Permutation S
n
mit
m
j,(j)
> 0 f ur j = 1, . . . , n;
die Zellen (1, (1)), . . . , (n, (n)) bilden also eine positive Diagonale f ur M.
Hinweis: Man setze D = {1, . . . , n] = H, nenne j und k befreundet, falls m
jk
> 0
ist, und wende den Heiratssatz auf diese Situation an.
Mit Hilfe des obigen Ergebnisses beweist man dann leicht den bekannten Satz
von Birkhoff [1946], da die Permutationsmatrizen (also die quadratischen Ma-
trizen mit Eintr agen 0 und 1, die in jeder Zeile und Spalte genau einen Eintrag 1
enthalten) die Extremalpunkte der (konvexen) Menge der doppeltstochastischen
Matrizen sind. Insbesondere erh alt man noch das folgende wichtige Ergebnis:
Korollar 1.7 (Lemma von K onig). Asei eine quadratische Matrix mit Eintr agen 0
und 1, f ur die alle Zeilen- und Spaltensummen gleich k sind. Dann ist Adie Summe
von k Permutationsmatrizen. 2
2 Zum Heiratssatz verwandte S atze
Der Heiratssatz ist ein tiefes und reizvolles mathematisches Resultat. Es ist aber
zugleich wie bereits einleitend erw ahnt nur eine von mehreren Varianten eines
28 II Der Heiratssatz und seine Verwandten
Grundgedankens, der die heute Transversaltheorie genannte umfassendere mathe-
matische Theorie beherrscht: Unter gewissen Bedingungen lassen sich zwei Ge-
gens atze vereinen (vgl. Harper und Rota [1971] sowie die Monographie von Mir-
sky [1971a]). In diesem Abschnitt wollen wir einen Teil der weiteren Varianten
dieses Gedankens kennenlernen, n amlich die S atze von K onig [1916] und Dil-
worth [1950]. Wir zeigen zun achst, da der Heiratssatz, der Satz von K onig und
der Satz von Dilworth aquivalente Aussagen sind, indem wir jeden dieser S atze
aus den jeweils anderen beiden S atzen herleiten. Im n achsten Abschnitt bewei-
sen wir dann das Schnitt-Flu-Theorem von Ford und Fulkerson [1956] und leiten
den Heiratssatz auch aus diesem Satz her. Schlielich beweisen wir noch mit dem
Satz von Menger [1927] eines der bekanntesten Resultate der Graphentheorie. Aus
innermathematischen Gr unden w are es uberdies von Interesse, den Heiratssatz auf
unendliche Mengen von Damen und Herren auszudehnen; wir wollen aber hier dar-
auf verzichten und verweisen den interessierten Leser beispielsweise auf Mirsky
[1971a].
2.1 Die S atze von K onig und Dilworth
Der erste Satz, den wir zumHeiratssatz in Beziehung setzen wollen, ist ein graphen-
theoretischer Satz von K onig [1916]. Der ungarische Mathematiker Denes K onig
(18841944) hat 1936 die erste Monographie uber Graphentheorie publiziert. Wir
werden zeigen, da sein Satz zum Heiratssatz aquivalent ist; wenn man so will, hat
also K onig 1916 bereits ein

Aquivalent des erst 1935 von Philip Hall bewiesenen
Heiratssatzes zutage gef ordert.
Um den Satz von K onig zu formulieren, stellen wir zun achst das ben otigte
Minimum an Begriffen aus der Graphentheorie zusammen. Ein Graph G ist ein
Paar G = (V, E) aus einer (bei uns stets endlichen) nichtleeren Menge V und
einer Menge E
_
V
2
_
. Die Elemente von V heien Punkte (oder auch Knoten bzw.
Ecke), die von E Kanten.
1
F ur eine Kante e = {a, b] heien a und b die Endpunkte
von e; man sagt, da a und b mit e inzident sowie da a und b adjazent sind; wir
schreiben auch kurz e = ab oder a
e
b. In diesem Unterabschnitt betrachten wir
nur eine spezielle Klasse von Graphen, die bipartiten Graphen. Diese zeichnen sich
dadurch aus, da es eine Zerlegung der Punktemenge V = S
.
T gibt, f ur die alle
Kanten einen Endpunkt in S und den anderen Endpunkt in T haben; es verlaufen
also keinerlei Kanten innerhalb von S bzw. T . Wir schreiben bipartite Graphen kurz
in der Form G = (S
.
T, E).
Wir ben otigen noch zwei weitere Begriffe. Eine uberdeckende Punktemenge
eines Graphen G = (V, E) ist eine Teilmenge W von V, f ur die jede Kante von
1
Die Wahl der Symbole V und E erkl art sich aus den entsprechenden englischen Bezeichnungen
f ur Punkte und Kanten, n amlich

vertex bzw.

edge.
II.2 Zum Heiratssatz verwandte S atze 29
G mit mindestens einem Punkt in W inzident ist; die minimale M achtigkeit einer
uberdeckenden Punktemenge von G wird mit (G) bezeichnet. Ein Matching
2
in
G ist eine Teilmenge M E, f ur die keine zwei Kanten in M einen gemeinsa-
men Endpunkt haben; die maximale M achtigkeit eines Matchings wird mit
/
(G)
bezeichnet. Matchings mit dieser M achtigkeit nennt man maximale Matchings.
Der Satz von K onig [1916] lautet nun
Satz 2.1 (Satz von K onig). Sei G = (S
.
T, E) ein bipartiter Graph. Dann ist die
maximale M achtigkeit eines Matchings von G gleich der minimalen M achtigkeit
einer uberdeckenden Punktemenge:
(2.1)
/
(G) = (G).
Ein weiterer Satz, der sich als aquivalent zum Heiratssatz erweisen wird, wur-
de 1950 von R. P. Dilworth publiziert; es handelt sich hierbei um eine Aussage
uber partiell geordnete Mengen. Wir erinnern kurz an einige Grundbegriffe aus der
Theorie der partiellen Ordnungen.
Sei X eine nichtleere Menge. Teilmengen R von X X heien bekanntlich
auch Relationen in X. Wir wollen hier statt R auch _ und statt (x, y) R auch
x _ y schreiben. Eine Relation _ in X heit eine partielle Ordnung auf X, wenn
sie folgende drei Eigenschaften besitzt:
(a) _ ist reexiv: x X = x _ x;
(b) _ ist antisymmetrisch: x, y X, x _ y, y _ x = x = y;
(c) _ ist transitiv: x, y, z X, x _ y, y _ z = x _ z.
Bekannte Beispiele sind neben der gew ohnlichen Kleinergleich-Relation
etwa auf den reellen Zahlen beispielsweise die Teilmengenbeziehung auf der
Potenzmenge einer Menge oder auch die Teilerrelation |
| auf N.
Ist _ eine partielle Ordnung auf der Menge X, so heit das Paar (X, _) auch
eine partiell geordnete Menge. Eine Menge K X heit eine Kette f ur (X, _),
wenn f ur alle x, y K mindestens eine der beiden Ungleichungen x _ y bzw.
y _ x erf ullt ist; die minimale Anzahl von Ketten, in die man X zerlegen kann,
wird mit (X, _) bezeichnet. Eine Menge A X heit eine Antikette f ur (X, _),
wenn keine zwei Elemente von A vergleichbar sind, d. h., wenn f ur x, y A mit
x ,= y weder x _ y noch y _ x gilt; die maximale M achtigkeit einer Antikette f ur
(X, _) wird mit (X, _) bezeichnet.
Der Satz von Dilworth [1950] lautet nun
2
Die englische Bezeichnung

Matching hat sich inzwischen auch im Deutschen weitgehend ein-


geb urgert. Alternative Terme wie

Korrespondenz (siehe Jungnickel [1994]) oder

Lattenzaun (in der


ersten Auage dieses Buches) konnten sich nicht durchsetzen.
30 II Der Heiratssatz und seine Verwandten
Satz 2.2 (Satz von Dilworth). Sei (X, _) eine partiell geordnete Menge. Dann ist
die maximale M achtigkeit einer Antikette f ur (X, _) gleich der Minimalzahl von
Ketten, in die X zerlegt werden kann:
(2.2) (X, _) = (X, _).
Wir haben die S atze von K onig und Dilworth damit formuliert, aber nat urlich
noch nicht bewiesen. Im n achsten Unterabschnitt beweisen wir die

Aquivalenzen
Heiratssatz Satz von K onig Satz von Dilworth;
da wir den Heiratssatz bereits bewiesen haben, werden damit auch die S atze von
K onig und Dilworth bewiesen sein.
2.2 Die

Aquivalenz des Heiratssatzes mit den S atzen von K onig und
Dilworth
a) Aus dem Heiratssatz folgt der Satz von K onig
Wir setzen also den Heiratssatz als richtig voraus und legen nun die Situation des
Satzes von K onig zugrunde. Sei also G = (S
.
T, E) ein bipartiter Graph. Ist
M E ein Matching und W V = S T eine uberdeckende Punktemenge
f ur G, so ist {W {s, t ] [ st M] ein disjunktes System von [M[ nichtleeren
Teilmengen von W. Es folgt [M[ [W[, also
(2.3)
/
(G) (G).
Um die umgekehrte Ungleichung zu gewinnen, w ahlen wir eine uberdeckende
Punktemenge W f ur (G) mit [W[ = (G) und setzen
D = W S, H = T,
F(s) = {t T [ st E, t , W] f ur s D.
Wir zeigen nun, da f ur D
0
D mit D
0
,= stets

sD
0
F(s)

[D
0
[ gilt, also
die Partybedingung (P). Angenommen, das w are falsch, d. h., es gibt ein D
0
mit

sD
0
F(s)

< [D
0
[. Dann setzen wir
W
/
= (D D
0
)
_
_
sD
0
F(s)
_
(W T ).
Man stellt sofort fest, da auch W
/
eine uberdeckende Punktemenge ist: Jede Kante
st mit s , WS hat t WT ; und jedes st E mit s WS erf ullt s DD
0
,
II.2 Zum Heiratssatz verwandte S atze 31
t W T oder t F(s) f ur ein s D
0
. Nun gilt aber aufgrund unserer Annahme
[W
/
[ = [D D
0
[

_
sD
0
F(s)

[W T [
< [D[ [D
0
[ [D
0
[ [W T [
= [D[ [W T [ = [W S[ [W T [ = [W[,
im Widerspruch zur Minimalit at von [W[. Somit ist die Partybedingung (P) in der
Tat erf ullt und daher gibt es nach dem Heiratssatz eine Injektion h: W S T
mit h(s) T W und {s, h(s)] E f ur alle s W S.
Eine v ollig analoge Betrachtung liefert eine Injektion i : W T S mit
i(t ) S W und {t, i(t )] E f ur alle t W T . Offenbar ist dann
{{s, h(s)] [ s W S] {{(i(t ), t ] [ t W T ]
ein Matching f ur (G), das aus [W[ Kanten besteht. Also gilt in (2.3) Gleichheit. 2
b) Aus dem Satz von K onig folgt der Heiratssatz
Wir setzen jetzt den Satz von K onig als richtig voraus und legen die Situation des
Heiratssatzes zugrunde. Seien also D, H endliche nichtleere Mengen und jedem
d D eine Menge F(d) H so zugeordnet, da

dD
0
F(d)

[D
0
[ f ur alle
D
0
D gilt. Wir k onnen dabei D und H als disjunkt voraussetzen. Wir setzen
E = {dh [ d D, h F(d)]
und haben damit einen bipartiten Graphen G = (D
.
H, E) vor uns. Wir zeigen
zun achst
(2.4) (G) = [D[.
Dabei gilt , weil D trivialerweise eine uberdeckende Punktemenge ist. Sei nun
W D H eine uberdeckende Punktemenge sowie D
0
:= D (W D). Dann
gilt F(d) W H f ur jedes d D
0
, weil f ur h F(d) (W H) die Kante dh
die uberdeckende Punktemenge W nicht treffen w urde, ein Widerspruch. Es folgt
[D[ [W D[ = [D
0
[

_
dD
0
F(d)

[W H[,
also [D[ [W D[ [W H[ = [W[. Somit gilt (2.4).
Nach dem Satz von K onig gibt es nun ein Matching M f ur G mit [M[ = [D[;
somit gibt es zu jedem d D genau ein h = h(d) H mit dh M, also
h F(d). Weil M ein Matching ist, ist die Abbildung h: D H injektiv. Damit
ist der nichttriviale Teil 2) 1) des Heiratssatzes bewiesen. 2
32 II Der Heiratssatz und seine Verwandten
c) Aus dem Satz von Dilworth folgt der Satz von K onig
Wir setzen den Satz von Dilworth als richtig voraus und legen die Situation des
Satzes von K onig zugrunde. Sei also G = (S
.
T, E) ein bipartiter Graph. Wir
setzen X = S T sowie
_ = {(s, s) [ s S] {(t, t ) [ t T ] {(s, t ) [ st E]
und erhalten eine partiell geordnete Menge (X, _). Ist W ST eine uberdecken-
de Punktemenge f ur G, so ist X W eine Antikette f ur (X, _), und umgekehrt.
Daraus ergibt sich mit dem Satz von Dilworth
(G) = [S[ [T [ (X, _) = [S[ [T [ (X, _).
Wegen (X, _) = [S[ [T [ (G) existiert also eine Zerlegung von X = S T
in [S[ [T [ (G) paarweise disjunkte Ketten. Offenbar gibt es in (X, _) nur ein-
und zweielementige Ketten; es m ogen etwa z
1
eingliedrige und z
2
zweigliedrige
Ketten in unserer Zerlegung vorkommen. Somit gilt
z
1
z
2
= [S[ [T [ (G) sowie z
1
2z
2
= [S[ [T [,
also z
2
= (G). Die zweigliedrigen Ketten liefern nun gerade ein Matching M
f ur G, das aus (G) Kanten besteht. Das beweist bereits den nichttrivialen Teil

/
(G) (G) des Satzes von K onig. 2
d) Aus dem Satz von K onig folgt der Satz von Dilworth
Wir setzen nun den Satz von K onig als richtig voraus und legen die Situation des
Satzes von Dilworth zugrunde. Sei also (X, _) eine endliche partiell geordnete
Menge. Eine Antikette kann mit einer Kette h ochstens ein Element gemeinsam
haben, weshalb
(X, _) (X, _)
gilt. Wir m ussen also nur noch die umgekehrte Ungleichung nachweisen. Als erstes
beschaffen wir uns daf ur ein zu X disjunktes zweites Exemplar X
/
von X, d. h. eine
zu X gleichm achtige Menge X
/
mit X X
/
= und eine Bijektion : X X
/
;
wir schreiben der Einfachheit halber x
/
statt (x). Nun setzen wir
E = {xy
/
[ x, y X, x y]
und erhalten einen bipartiten Graphen G = (X
.
X
/
, E).
Wir zeigen zun achst, da jedes Matching M der M achtigkeit k von G zur
Konstruktion einer Zerlegung von X in n k Ketten verwendet werden kann,
II.2 Zum Heiratssatz verwandte S atze 33
wobei n = [X[ ist. Es sei also {v
i
w
/
i
: i = 1, . . . , k] ein Matching von G.
Dann gilt v
1
w
1
, . . . , v
k
w
k
in X, wobei die Elemente v
1
, . . . , v
k
bzw.
w
1
, . . . , w
k
jeweils paarweise verschieden sind. Dagegen ist v
i
= w
j
m oglich;
in diesem Fall k onnen wir die Ketten v
i
w
i
und v
j
w
j
zu der l angeren Kette
v
j
w
j
= v
i
w
i
zusammensetzen. Indem man so fortf ahrt (also jeweils Ketten
mit ubereinstimmendem Minimum bzw. Maximum zusammensetzt), erh alt man
schlielich etwa c Ketten, deren Punktemengen paarweise disjunkt sind; diese Ket-
ten m ogen die L angen x
1
, . . . , x
c
haben, wobei dann k = (x
1
1) (x
c
1)
gilt. Die ubrigen n (x
1
x
c
) Elemente von X teilen wir in (triviale) Ketten
der L ange 1 ein. Insgesamt ergibt sich auf diese Weise eine Zerlegung von X in
n (x
1
x
c
) c = n k Ketten.
Insbesondere k onnen wir f ur M ein maximales Matching von G w ahlen, also
k =
/
(G). Nach demSatz von K onig gilt
/
(G) = (G); also kann Xin n(G)
Ketten zerlegt werden. Wir m ussen nun nur noch (G) in der partiell geordneten
Menge (X, _) interpretieren. Offenbar induziert jede uberdeckende Punktemenge
W von G eine uberdeckende Teilmenge C X mit [C[ [W[, d. h., C enth alt
f ur jede Kette x y der L ange 2 mindestens eines der beiden Elemente x, y. Es
ist nun unmittelbar klar, da die uberdeckenden Teilmengen von (X, _) genau die
Komplemente der Antiketten sind. Damit erhalten wir sofort die Absch atzung
(X, _) = n min{[C[ [ C uberdeckende Teilmenge von (X, _)]
n min{[W[ [ W uberdeckende Teilmenge von G]
= n (G)
und damit, wie behauptet, (X, _) n (G) (X, _). 2
Der vorstehende Beweis des Satzes von Dilworth geht auf Fulkerson [1956]
zur uck. Damit ist unsere Untersuchung der Zusammenh ange zwischen dem Hei-
ratssatz und den S atzen von Hall bzw. K onig abgeschlossen.
2.3 Verwandte Ergebnisse
In diesem Abschnitt wollen wir noch einige verwandte Ergebnisse vorstellen, ins-
besondere weitere kombinatorische Resultate uber partiell geordnete Mengen. Wir
stellen zun achst direkte Beweise f ur die S atze von K onig und Dilworth vor, die
Rizzi [2000] bzw. Harper und Rota [1971] folgen. Danach beweisen wir dann ein
ber uhmtes Resultat von Sperner [1928a], das die maximalen Antiketten f ur die
bez uglich der Inklusion partiell geordnete Potenzmenge einer Menge bestimmt.
Auerdem geben wir noch einige weitere interessante Ergebnisse als

Ubungen an.
34 II Der Heiratssatz und seine Verwandten
a) Ein direkter Beweis des Satzes von K onig
Wir geben als erstes den kurzen und eleganten Beweis f ur den nichttrivialen Teil

/
(G) (G) des Satzes von K onig an, der k urzlich von Rizzi [2000] gefun-
den wurde. Wir beginnen dazu mit einigen weiteren Standardbegriffen aus der
Graphentheorie, die wir auch noch sp ater mehrfach ben otigen werden. Es sei
(e
1
, . . . , e
n
) eine Folge von Kanten eines Graphen G. Wenn es Punkte v
0
, . . . , v
n
mit e
i
= {v
i1
, v
i
] f ur i = 1, . . . , n gibt, heit die Folge ein Kantenzug; im Fall
v
0
= v
n
spricht man von einem geschlossenen Kantenzug. Wenn die e
i
paarweise
verschieden sind, liegt ein Weg bzw. imgeschlossenen Fall ein Kreis vor. Falls auch
die v
j
paarweise verschieden sind, heit der Weg ein einfacher Weg. Ein Kreis, f ur
den die v
j
paarweise verschieden sind (nat urlich abgesehen von v
0
= v
n
) und f ur
den somit n 3 gilt, ist ein einfacher Kreis. In jedem dieser F alle verwenden wir
auch die Schreibweise
W : v
0
e
1
v
1
e
2
v
2
v
n1
e
n
v
n
und nennen n die L ange von W. Die Punkte v
0
und v
n
heien der Anfangspunkt
bzw. der Endpunkt von W. Zwei Punkte a und b heien verbindbar, wenn es
einen Kantenzug mit Anfangspunkt a und Endpunkt b gibt. Wenn je zwei Punkte
von G verbindbar sind, heit G zusammenh angend. F ur jeden Punkt a sehen wir
(a) als trivialen Kantenzug (der L ange 0) an; jeder Punkt ist also auch mit sich
selbst verbindbar. Die Verbindbarkeit ist offenbar eine

Aquivalenzrelation auf der
Punktemenge V von G; die

Aquivalenzklassen dieser Relation heien die Zusam-
menhangskomponenten von G; somit ist G genau dann zusammenh angend, wenn
ganz V eine Zusammenhangskomponente ist. Weiterhin ist der Grad deg v eines
Punktes v als die Anzahl der zu v adjazenten Punkte erkl art. Ein Graph G heit
r-regul ar, falls alle Punkte denselben Grad r haben. Schlielich bezeichnet man
mit G v den Graphen, den man erh alt, wenn man aus G den Punkt v und alle
mit ihm inzidenten Kanten entfernt; ahnlich ist G e f ur eine Kante e als derjenige
Graph deniert, der aus G durch Weglassen von e entsteht.
Wir verwenden nun ein sehr n utzliches Beweisprinzip in der Diskreten Mathe-
matik, die

Methode des kleinsten Verbrechers. Man nimmt dabei an, da die zu


beweisende Aussage falsch w are und betrachtet ein minimales Gegenbeispiel. F ur
alle kleineren Objekte derselben Art (wie etwa Unterstrukturen oder homomorphe
Bilder) gilt dann die zu beweisende Aussage, und man benutzt diese Tatsache, um
auch f ur das hypothetische Gegenbeispiel die Behauptung nachzuweisen, weswe-
gen diese dann allgemein g ultig sein mu.
In unserem Fall sei also G = (S
.
T, E) ein bipartiter Graph mit der kleinst-
m oglichen Punktezahl, etwa n, f ur den
/
(G) < (G) gelte; weiter sei Gunter allen
m oglichen Gegenbeispielen auf n Punkten auch noch bez uglich seiner Kantenan-
zahl minimal gew ahlt. Man uberzeugt sich leicht davon, da Gzusammenh angend
II.2 Zum Heiratssatz verwandte S atze 35
sein mu und weder ein einfacher Kreis noch ein einfacher Weg sein kann, da bi-
partite Graphen dieser Art offenbar den Satz von K onig erf ullen. Daher gibt es in G
mindestens einen Punkt vom Grad 3; wir w ahlen einen derartigen Punkt u und
einen zu ihmadjazenten Punkt v und betrachten den Graphen Gv. Wegen der Mi-
nimalit at von Gerf ullt Gv den Satz von K onig, es gilt also
/
(Gv) = (Gv).
Falls nun
/
(Gv) <
/
(G) sein sollte, f ugen wir v zu einer uberdeckenden Punk-
temenge W der M achtigkeit
/
(Gv) von Gv hinzu und erhalten denWiderspruch
(G)
/
(G v) 1
/
(G). Also gilt
/
(G v) =
/
(G), weswegen es ein
maximales Matching M von Ggibt, f ur welches keine Kante mit v inzident ist. Wir
w ahlen nun eine nicht in M enthaltene Kante e, die mit u, aber nicht mit v inzident
ist, was wegen deg u 3 m oglich ist. Wegen der Minimalit at von G erf ullt auch
Ge den Satz von K onig, womit wir
/
(G) =
/
(Ge) = (Ge) erhalten. Es sei
nun W
/
eine uberdeckende Punktemenge von Ge der M achtigkeit
/
(G); da keine
Kante von M mit v inzident ist, kann W
/
den Punkt v nicht enthalten. Folglich mu
W
/
den Punkt u enthalten und ist daher sogar eine uberdeckende Punktemenge f ur
G, womit Gdoch den Satz von K onig erf ullt und wir den erw unschten Widerspruch
gefunden haben.

Ubung 2.3. Ein Matching M in einem Graphen G = (V, E) heit ein 1-Faktor
von G, wenn jeder Punkt auf einer Kante in M liegt. Man zeige, da jeder regul are
bipartite Graph einen 1-Faktor und daher mit Induktion auch eine 1-Faktorisierung,
also eine Zerlegung von E in 1-Faktoren, besitzt. Man sagt auch, da die bipartiten
Graphen faktorisierbar sind.
Hinweis: Das folgt aus dem Heiratssatz und stellt im wesentlichen nur eine

Uber-
setzung von

Ubung 1.6 bzw. Korollar 1.7 in graphentheoretische Sprechweise dar.
Wir werden sp ater mit einer ganz anderen Methode zeigen, da auch die
vollst andigen Graphen K
2n
f ur alle n N faktoriserbar sind, siehe

Ubung X.2.18;
dabei ist K
2n
der Graph auf 2n Punkten, f ur den je zwei Punkte adjazent sind.
b) Ein direkter Beweis des Satzes von Dilworth
Sei (X, _) eine partiell geordnete Menge. F ur den Nachweis der nichttrivialen
Ungleichung
(X, _) (X, _)
verwenden wir Induktion nach [X[. Der Fall [X[ = 1 ist dabei klar. Sei nun [X[ > 1
und die Aussage des Satzes von Dilworth stimme f ur alle partiell geordneten Men-
gen (X
/
, _) mit [X
/
[ < [X[. Wir bilden nun zun achst die Menge X der minimalen
36 II Der Heiratssatz und seine Verwandten
sowie die Menge X der maximalen Elemente von X:
X = {x X [ y _ x y = x f ur alle y X]
X = {x X [ x _ y x = y f ur alle y X].
Ein triviales Ab- bzw. Aufstiegsverfahren zeigt: Jedes Element von X besitzt eine
Minorante in X und eine Majorante in X; insbesondere sind X und X nicht leer.
F ur den weiteren Beweisgang unterscheiden wir zwei F alle.
Fall I. Es gibt eine Antikette A mit [A[ = (X, _) =: , die weder X noch X
enth alt. Wir denieren A

als die Menge aller Elemente aus X, die eine Majorante


in A haben, und

A als die Menge aller Elemente mit Minorante in A:
A

= {x X [ es gibt ein a A mit x _ a]

A = {x X [ es gibt ein a A mit a _ x].


Dann gilt:
1) A

A = X. Denn g abe es ein x, das weder eine Minorante noch eine Majorante
in Abesitzt, so w are A{x] eineAntikette und man h atte [A{x][ = [A[1 >
, ein Widerspruch.
2) A


A = A. Denn hat ein x X sowohl eine Minorante a als auch eine
Majorante b in A, so ist a _ x _ b, also a _ b. Weil Aeine Antikette ist, folgt
a = b, also x = a A.
Weiterhin gilt X ,= A

und X ,=

A, da die nach Voraussetzung nichtleeren Men-
gen XAund XAzu

Abzw. A

disjunkt sind. Wir bezeichnen die Einschr ankungen


von _ auf A

und

A ebenfalls mit _ und sehen uns die partiell geordneten Mengen
(A

, _) und (

A, _) an. Wegen [A

[, [

A[ < [X[ k onnen wir die Induktionsannahme


anwenden. Da (X, _) bei Verkleinerung von X allenfalls sinkt,

A und A

aber
beide die Antikette A enthalten, folgt
(A

, _) = (A

, _) = = (

A, _) = (

A, _).
Es gibt also eine Zerlegung von A

in Ketten K

1
, . . . , K

und eine Zerlegung von

A in Ketten

K
1
, . . . ,

K

. Es ist klar, da jede Kette K

j
ihr oberes Ende und jede
Kette

K
j
ihr unteres Ende in A hat. Verschiedene

K
j
haben verschiedene untere
Enden, weil sie disjunkt sind, weswegen jedes Element von Aals unteres Ende einer
Kette

K
j
auftreten mu; entsprechendes gilt f ur die K

j
. Nun brauchen wir nur die
Elemente von A als

Druckkn opfe zu verwenden, um die Ketten eineindeutig zu


verbinden. Es entsteht eine Zerlegung von X in Ketten, und (X, _) = (X, _)
ist bewiesen.
II.2 Zum Heiratssatz verwandte S atze 37
Fall II. F ur jede Antikette A X von maximaler M achtigkeit gilt A X oder
A X. In diesem Fall w ahlen wir ein u X und ein v X mit u _ v, was
mittels eines einfachen Ab- bzw. Aufstiegsverfahrens ohne weiteres m oglich ist.
Wir entfernen die Kette {u, v] aus X und erhalten eine kleinere partiell geordnete
Menge (X
/
, _); trivialerweise gilt (X
/
, _) (X, _). Falls dabei Gleichheit gilt,
gibt es eineAntikette Amaximaler M achtigkeit inX, die weder unochv enth alt, was
im Fall II ausgeschlossen ist. Somit gilt sogar (X
/
, _) < (X, _). Wir wenden
nun die Induktionsannahme auf (X
/
, _) an und erhalten eine Zerlegung von X
/
in
weniger als (X, _) Ketten, was mit der Kette {u, v] zusammen eine Zerlegung
von X in h ochstens (X, _) Ketten ergibt. Also folgt wieder (X, _) (X, _)
und damit die Behauptung.

Ubung 2.4. Man gebe einen direkten Beweis f ur das folgende Resultat von Mirsky
[1971b] an, das als ein

dualer Satz zum Satz von Dilworth angesehen werden


kann: F ur jede partiell geordnete Menge (X, _) ist die maximale M achtigkeit einer
Kette gleich der minimalen Anzahl von Antiketten, in die X zerlegt werden kann.
Hinweis: Man betrachte wieder die Menge X der maximalen Elemente von (X, _).

Ubung 2.5. Es seien r und s nat urliche Zahlen. Dann enth alt jede partiell geordnete
Menge (X, _) mit M achtigkeit [X[ rs 1 eine Kette mit r 1 Elementen oder
eine Antikette mit s 1 Elementen.

Ubung 2.6 (Ahrens und Szekeres [1935]). Es sei (a


1
, . . . , a
n
) eine Folge reeller
Zahlen mit L ange n r
2
1. Dann gibt es eine monotone Teilfolge der L ange
r 1.
c) Ein Resultat von Sperner
Sei M eine n-Menge sowie X = 2
M
die Menge aller Teilmengen von M. Wir
versehen X mit der ublichen partiellen Ordnung . Dann w ahlen wir in X eine
Antikette A = {F
1
, . . . , F

] der maximalen M achtigkeit = (X, ). Eine Kette


in Xheie fein, wenn sie weder Einschub nochVerl angerung gestattet. Man uberlegt
sich sofort, da feine Ketten immer aus n 1 Teilmengen von M bestehen; die
kleinste ist dabei und man steigt von einem Kettenglied F zum n achstgr oeren
auf, indem man ein Element von M zu F hinzunimmt. Die Anzahl aller feinen
Ketten ist also n'. Sei f
j
die Anzahl der feinen Ketten, die F
j
enthalten. Man sieht,
da eine derartige Kette nach absteigt, indem sie festlegt, in welcher Reihenfolge
die [F
j
[ Elemente von F
j
wegzulassen sind; analoges ergibt sich f ur den Aufstieg
nach M und man erh alt
f
j
= [F
j
['(n [F
j
[)'
38 II Der Heiratssatz und seine Verwandten
Keine feine Kette geht durch zwei verschiedene F
j
, weil die F
j
eine Antikette
bilden. Daraus folgt

j=1
f
j
n'
Setzt man
m
= [{j [ [F
j
[ = m][ (f ur m = 0, . . . , n), so ergibt sich
(2.5)
n

m=0

m
m'(n m)' n', also
n

m=0

m
_
n
m
_ 1.
In der Folge
_
n
0
_
, . . . ,
_
n
n
_
sind bekanntlich die beiden mittleren Binomialkoefzi-
enten
_
n
n
0
_
mit n
0
= n/2 und
_
n
n
1
_
mit n
1
= {n/2 am gr oten (wobei f ur gerade
n nat urlich n
0
= n
1
gilt, vgl.

Ubung 2.10). Damit ergibt sich aus (2.5)
(2.6) (X, ) =
n

m=0

m

_
n
n
0
_
=
_
n
n
1
_
=: B.
Hierbei gilt sogar die Gleichheit, da die B Teilmengen der M achtigkeit n
0
sowie
die B Teilmengen der M achtigkeit n
1
jeweils eine Antikette bilden.
Wir wollen noch zeigen, da dies die einzigen maximalenAntiketten von(X, )
sind. Angenommen, es gilt Gleichheit in (2.6) und daher
n

m=0

m
_
n
n
0
_ = 1.
Wegen (2.5) folgt dann
i
= 0 f ur i ,= n
0
, n
1
. F ur gerade nist die Behauptung somit
bereits klar. F ur ungerade n m ussen wir noch die M oglichkeit von

Mischf allen
ausschlieen. Wir schreiben n = 2m1, also n
0
= mund n
1
= m1, sowie kurz
s =
m1
. Zu zeigen ist, da aus s ,= 0 stets
m
= 0 folgt. Dazu betrachten wir den
bipartiten Graphen G = (S
.
T, E) mit S =
_
X
m1
_
Asowie T =
_
X
m
_
A, dessen
Kanten genau die Paare (M, N) S T mit M N seien. Dann liegt jeder der
s Punkte M S auf genau m 1 Kanten (womit G also genau s(m 1) Kanten
enth alt), da ja keine der m1 in M enthaltenen m-Teilmengen zu der Antikette A
geh oren kann. Andererseits besteht T ebenfalls aus genau s Punkten (da ja
_
X
m
_
A
wegen der Maximalit at von AM achtigkeit Bs hat), von denen jeder offenbar auf
h ochstens n m = m 1 Kanten liegen kann. Dies ist nur m oglich, wenn jeder
Punkt von T auf genau m 1 Kanten liegt. Also liegt jede m 1-Teilmenge von
X, die eine nicht in A enthaltene m-Teilmenge umfat, notwendigerweise selbst in
A. Angenommen, es w are
m
,= 0. Dann betrachten wir m1-Teilmengen L / A
und M A und w ahlen unter allen solchen Paaren (L, M) derart, da [L M[
II.2 Zum Heiratssatz verwandte S atze 39
maximal ist. Wegen [L M[ ,= m 1 gibt es x L M und y M L. Dann
gilt M {y] T und somit mu wie zuvor gezeigt M
/
= (M {y]) {x] zur
Antikette A geh oren, was wegen [M
/
L[ = [M L[ 1 der Auswahl von L und
M widerspricht.
Damit haben wir das folgende Ergebnis von Sperner [1928a] bewiesen:
Satz 2.7 (Spernersches Lemma). Sei X eine n-Menge. Dann gilt:
(2.7) (X, ) = (X, ) =
_
n
n/2
_
.
Wenn A eine maximale Antikette f ur (X, ) ist, besteht A entweder aus allen Teil-
mengen von X mit M achtigkeit n/2 oder aus allen Teilmengen der M achtigkeit
{n/2.
Satz 2.7 ist der Ausgangspunkt zahlreicher weiterer Untersuchungen, die man
oft unter dem Namen

Sperner-Theorie zusammenfat, wobei allerdings die Ab-


grenzung etwa zur Transversaltheorie oder zur Kombinatorischen Optimierung ie-
end ist; wir verweisen den interessierten Leser auf die Monographie von Engel
[1997].
2.4 Der Satz von Menger
Als Erg anzung zu den S atzen von K onig bzw. Dilworth und dem Heiratssatz leiten
wir ein graphentheoretisches Resultst ab, das zuerst von Menger [1927] bewiesen
wurde und ebenfalls zu den bereits betrachteten S atzen logisch aquivalent ist, was
wir allerdings nur in einer Richtung zeigen werden; f ur die umgekehrte Richtung
verweisen wir beispielsweise auf Jungnickel [1982]. Danach folgen noch eine Vari-
ante des Mengerschen Satzes sowie eine Anwendung auf Zusammenhangsfragen.
Um den Satz von Menger formulieren zu k onnen, ben otigen wir einige weitere
graphentheoretische Begriffe. Seien p, q zwei verschiedene Punkte eines Graphen
G = (V, E). Eine Menge S V {p, q] heit eine p und q trennende Punkte-
menge, wenn jeder p und q verbindende Weg W mindestens einen Punkt von S
enth alt. Ferner heien zwei p und q verbindende Wege punktedisjunkt, wenn sie
abgesehen von den beiden Endpunkten p und q keinen Punkt gemeinsam haben.
Wir werdem im folgenden die Notation I (W) verwenden, um die Menge der inne-
ren Punkte eines Weges W zu bezeichnen, also aller von den beiden Endpunkten
verschiedenen Punkte von W; zwei p und q verbindende Wege W und W
/
sind also
punktedisjunkt, wenn I (W) I (W
/
) = gilt.
Damit k onnen wir nun den Satz von Menger formulieren. Der hier vorgetragene
Beweis stammt von Tibor Gallai (1912 1992) und ist zugegebenermaen nicht
ganz einfach zu verstehen, weswegen der Leser sich zur Veranschaulichung der
40 II Der Heiratssatz und seine Verwandten
Details einige Zeichnungen anfertigen sollte. Alle uns bekannten Beweise dieses
Satzes erfordern einige M uhe; am leichtesten sicher aber nicht eben kurz ist
vielleicht noch eine Herleitung aus der Flu-Theorie, wie man sie beispielsweise
bei Jungnickel [1994] ndet.
Satz 2.8 (Satz von Menger, Punkteversion). Seienp, q zwei nicht-adjazente Punk-
te eines GraphenG = (V, E). Dannist die Maximalzahl vonpundq verbindenden,
paarweise punktedisjunkten Wegen gleich der minimalen M achtigkeit einer p und
q trennenden Punktemenge.
Beweis. Es seien S eine p und q trennende Punktemenge sowie W
1
, . . . , W
n
paar-
weise punktedisjunkte p und q verbindende Wege, wobei n die Maximalzahl derar-
tiger Wege sei. Dann enth alt jede der paarweise disjunkten Mengen I (W
j
) minde-
stens einen Punkt aus S, woraus bereits n [S[ folgt. Umdie nichttriviale Richtung
des Satzes zu beweisen, nehmen wir die gegebenen Wege o.B.d.A. als einfach an.
Wir z ahlen nun auf jedem Weg W
j
die Endpunkte seiner Kanten von p aus ab und
k onnen somit sagen, was es heit, ein Punkt sei fr uher oder sp ater als ein anderer.
Einen Weg, der einen Punkt auf einem W
j
mit einem Punkt auf einem W
k
(es darf
j = k sein) verbindet und sonst auf keinem W
i
einen Punkt besitzt, heie ein Bo-
gen. Eine Folge b
1
, . . . , b
r
von Bogen heie eine Br ucke (f ur W
1
, . . . , W
n
), wenn
man die Endpunkte von b

f ur alle = 1, . . . , r so als e

, f

benennen kann, da
f ur jedes = 1, . . . , r 1 der Punkt f

auf demselben W
j
liegt wie e
1
, und
zwar nicht fr uher:
e
+1
f

W
j
b
+1
b

Die Anzahl r der Bogen in einer Br ucke heie ihre L ange. Ein Punkt c auf einem
W
j
heie durch die Br ucke b
1
, . . . , b
r
erreichbar, wenn e
1
= p und f
r
= c gilt.
Man beachte, da q wegen der Maximalit at von n sicher nicht durch eine Br ucke
der L ange 1 erreichbar ist, denn der einzige Bogen dieser Br ucke w are ein p und
q verbindender Weg W
n1
mit I (W
n1
) I (W
j
) = f ur k = 1, . . . , n.
Fall I. q ist durch keine Br ucke erreichbar. Dann w ahlen wir auf jedemW
j
einen von
p und q verschiedenen Punkt s
j
folgendermaen: Gibt es auf W
j
einen durch eine
Br ucke erreichbaren Punkt, so sei s
j
der sp ateste derartige Punkt; andernfalls sei
s
j
der auf W
j
unmittelbar hinter p kommende Punkt. Wir setzen S = {s
1
, . . . , s
n
]
und zeigen, da S eine p und q trennende Punktemenge ist. Angenommen, das
ist nicht der Fall; dann gibt es einen p und q verbindenden einfachen Weg W mit
II.2 Zum Heiratssatz verwandte S atze 41
I (W) S = . Durchl auft man nun die Punkte von W (angefangen mit p), so trifft
man irgendwann zum letzten Mal einen Punkt p
/
, der auf einem W
j
liegt und auf
W
j
fr uher ist als s
j
; eventuell handelt es sich dabei um p
/
= p. Geht man auf W
von p
/
an weiter, so trifft man irgendwann einmal zum ersten Mal wieder einen
Weg W
k
; wegen I (W) S = mu dies in einem hinter s
k
gelegenen Punkt p
//
geschehen, wobei der Fall p
//
= q m oglich ist. Geht man erst auf W
j
bis s
j
und
dann auf W von p
/
nach p
//
, so beschreibt man die beiden Bogen einer Br ucke,
durch welche p
//
auf W
k
erreichbar wird. Nun ist aber p
//
ein auf W
k
sp aterer Punkt
als s
k
, womit wir einen Widerspruch erhalten. Also ist S in der Tat eine p und q
trennende Punktemenge der minimal m oglichen M achtigkeit n.
Fall II. q ist durch eine Br ucke erreichbar. Wir w ahlen dann eine k urzeste Br ucke
b
1
, . . . , b
r
, mit der das geht, und haben bereits bemerkt, da r 2 sein mu. Wir
wollen nun zeigen, da man r stets noch verkleinern kann, wenn man eine Ersetzung
der Wege W
1
, . . . , W
n
durch andere paarweise punktedisjunkte Wege W
/
1
, . . . , W
/
n
in Kauf nimmt, weswegen man schlielich einen Widerspruch zur Tatsache r 2
erh alt. Die Minimalit at von r sorgt zun achst f ur I (b

) I (b

) = f ur < ;
denn w are p I (b

) I (b

), so k onnte man einen neuen Bogen bauen, der aus


b

bis p und b

ab p besteht (es ist klar, was hier mit

bis und

ab gemeint ist)
und so die Br uckenl ange r um mindestens 1 herabsetzen.
Wir betrachten nun die Endpunkte e
1
= p und f
1
von b
1
sowie e
2
und f
2
von
b
2
. Dabei liege f
1
etwa auf W
1
, e
2
also ebenfalls, und zwar nicht sp ater als f
1
.
Liegt f
2
auch auf W
1
, so k onnen wir annehmen, da f
2
hinter f
1
kommt, weil
man sonst r durch Weglassen von b
2
verkleinern k onnte. Es kann aber auch f
2
auf einem W
k
mit k ,= 1 liegen. Ferner gibt es auf W
1
zwischen p und f
1
keinen
Anfangs- oder Endpunkt eines der Bogen b
3
, . . . , b
r
, da man sonst wieder q mit
einer Br ucke der L ange < r erreichen k onnte. Wir bilden nun W
/
1
, indem wir auf
b
1
bis f
1
und dann auf W
1
bis q laufen; f ur i = 2, . . . , n setzen wir W
/
i
= W
i
.
Dann gilt I (W
/
i
) I (W
/
1
) = f ur i ,= 1. Schlielich bilden wir b
/
2
, indem wir von
p auf W
1
bis e
2
und dann auf b
2
bis f
2
laufen. Offenbar ist nun b
/
2
, b
3
, . . . , b
r
eine
Br ucke f ur W
/
1
, . . . , W
/
n
, uber welche q erreichbar ist; sie hat aber nur die L ange
r 1. Damit ist alles bewiesen. 2
Bemerkung 2.9. Der Satz von K onig folgt leicht aus dem von Menger. Sei also
ein bipartiter Graph G = (S
.
T, E) gegeben. Wir f ugen zu G zwei neue Punkte
p und q sowie alle Kanten ps mit s S und alle Kanten t q mit t T hinzu; der so
entstehende Graph sei mit H bezeichnet. Dann entsprechen maximale Matchings
in G offenbar maximalen Systemen paarweise punktedisjunkter Wege von p nach
q in H; andererseits ist eine G uberdeckende Punktemenge klarerweise dasselbe
wie eine p und q trennende Punktemenge in H.
42 II Der Heiratssatz und seine Verwandten
Als n achstes beweisen wir ein Analogon von Satz 2.8 f ur Kanten statt Punkte.
Seien wieder p, q zwei verschiedene Punkte eines Graphen G = (V, E). Eine
Menge S E heit eine p und q trennende Kantenmenge, wenn jeder p und q
verbindende Weg W mindestens eine Kante in S enth alt. Ferner heien zwei p und
q verbindende Wege kantendisjunkt, wenn sie keine Kante gemeinsam haben.
Satz 2.10 (Satz von Menger, Kantenversion). Seien p, q zwei verschiedene Punk-
te eines GraphenG = (V, E). Dannist die Maximalzahl vonpundq verbindenden,
paarweise kantendisjunkten Wegen gleich der minimalen M achtigkeit einer p und
q trennenden Kantenmenge.
Beweis. Wir f uhren die Behauptung auf Satz 2.8 zur uck, indem wir aus G einen
neuen Graphen H auf der Punktemenge {p, q] E konstruieren. Kanten von H
seien alle Paare {p, e], f ur die e E mit p inzident ist; alle Paare {q, e], f ur die
e E mit q inzident ist; und alle Paare {e, e
/
], f ur die e, e
/
E einen gemeinsamen
Endpunkt haben. Man sieht unmittelbar, da dann kantendisjunkte Wege von p
nach q bzw. p und q trennende Kantenmengen in Gpunktedisjunkten Wegen bzw.
trennenden Punktemengen in H entsprechen. 2

Ubung 2.11. S und T seien zwei disjunkte Teilmengen der Punktemenge V eines
GraphenG = (V, E). Eine S undT trennende Punktemenge ist eine Menge X V,
f ur die jeder Weg von einem Punkt in S zu einem Punkt in T einen Punkt in X
enthalten mu. Man zeige, da die minimale M achtigkeit einer derartigen Menge
gleich der Maximalzahl von Wegen von S nach T ist, f ur die keine zwei dieser
Wege einen Punkt gemeinsam haben (auch nicht einen der Endpunkte!).
Der Satz von Menger legt die folgende Denition der Zusammenhangszahl
eines Graphen G = (V, E) nahe: Falls Gein vollst andiger Graph ist (wenn also je
zwei Punkte in Gadjazent sind), sei (G) = [V[ 1; anderenfalls sei (G) als die
minimale M achtigkeit einer Punktemenge S V deniert, f ur die der induzierte
Untergraph
G S = (V S, {ab E [ a, b V S])
nicht zusammenh angend ist. G heit nun k-fach zusammenh angend, wenn
(G) k gilt. Dann hat man das folgende Resultat von Whitney [1932]:
Satz 2.12 (Satz von Whitney). Ein Graph G ist genau dann k-fach zusammen-
h angend, wenn je zwei Punkte von G durch mindestens k punktedisjunkte Wege
verbunden sind.
Beweis. Wenn je zwei Punkte von G durch mindestens k punktedisjunkte Wege
verbunden sind, ist G offenbar k-fach zusammenh angend. Sei also G umgekehrt
II.3 Das Schnitt-Flu-Theorem von Ford und Fulkerson 43
k-fach zusammenh angend. Nach demSatz von Menger sind je zwei nicht-adjazente
Punkte von G durch k punktedisjunkte Wege verbunden. Seien schlielich p und
q adjazent; dann betrachten wir den Graphen H = G pq. Man uberlegt sich
leicht, da H noch mindestens (k 1)-fach zusammenh angend ist. Wieder we-
gen des Satzes von Menger sind p und q in H durch k 1 punktedisjunkte
Wege verbunden, zu denen wir in G die Kante pq als k-ten Weg hinzugef ugen
k onnen. 2

Ubung 2.13. G sei ein k-fach zusammenh angender Graph und T eine Menge von
k Punkten von G. Dann gibt es f ur jeden Punkt s T eine Menge von k Wegen
mit Anfangspunkt s und Endpunkt in T , die paarweise nur den Punkt s gemeinsam
haben.
3 Das Schnitt-Flu-Theorem von Ford und Fulkerson
In diesem Abschnitt stellen wir ein grundlegendes Resultat aus der kombinatori-
schen Optimierung vor: das Schnitt-Flu-Theorem von Ford und Fulkerson [1956].
Die wesentlichen in diesem Theorem vorkommenden Begriffe sind
ein Netzwerk mit vorgeschriebenen Flu-Kapazit aten,
ein Flu im Netzwerk im Rahmen der gegebenen Kapazit aten.
Umeine rasche Vorstellung von demzu erhalten, worumes hier geht, sehen wir
uns ein spezielles Netzwerk mit an die Kanten (=Pfeile) geschriebenen Kapazit aten
an:
q
s
Ebenso anschaulich stellt sich ein Flu (von s nach t ) in diesem Netzwerk dar,
bei dem viele Kanten nicht bis an die Grenze ihrer Kapazit at ausgelastet sind; der
Wert (die St arke) dieses Flusses betr agt 4.
44 II Der Heiratssatz und seine Verwandten
q
s
0
0
0
0
0
0
Man kann ihn nun leicht auf den Wert 6 anheben:
q
s
0
0
0
0
und die Frage ist, ob im selben Netzwerk und im Rahmen derselben Kapazit aten
auch ein Flu des Wertes 7 oder 8 m oglich w are.

Uber den Wert 8 kann man of-
fensichtlich nicht hinauskommen, da die aus s hinausf uhrenden Kanten zusammen
nur die Kapazit at 8 haben. All dies sind nat urlich nur intuitive

Uberlegungen am
speziellen anschaulichen Beispiel. Unser Ziel ist die exakte Denition der oben an-
gedeuteten Begriffe und die Gewinnung eines Verfahrens, das uns in endlich vielen,
einzeln relativ leichten Schritten zu einem maximalen Flu f uhrt.
Die Aufgabe des exakten Denierens gibt uns die Gelegenheit, den Begriff des
gerichteten Graphen einzuf uhren. Dieser Begriff formalisiert Vorstellungen wie:
einige Punkte, zwischen denen einige Verbindungspfeile gezeichnet sind,
Stadtpl ane mit lauter Einbahnstraen.
3.1 Gerichtete Graphen und Flu-Netzwerke
Ein gerichteter Graph (oder auch Digraph, kurz f ur

directed graph) ist ein Paar


G = (V, E) aus einer endlichen Menge V und einer Menge E von geordneten
Paaren (a, b) mit a ,= b aus V.
3
Die Elemente von V heien wieder Punkte (oder
auchKnoten bzw. Ecken), die vonEKanten; zur Unterscheidungvomungerichteten
II.3 Das Schnitt-Flu-Theorem von Ford und Fulkerson 45
Fall ist auch die Bezeichnung Bogen statt

Kante ublich. Statt e = (a, b) schreiben


wir wieder kurz e = ab; a heit der Anfangspunkt und b der Endpunkt von e; wir
schreiben auch e

f ur den Anfangspunkt a und e

f ur den Endpunkt b von e.


Wir sagen, das a und b mit e inzident sind. Zwei Kanten der Form ab und ba
heien antiparallel. Wenn wir einen Digraphen zeichnen wollen, gehen wir wie im
ungerichteten Fall vor und deuten die Richtung einer Kante durch einen Pfeil an.
Wenn wir jeden Bogen ab von G durch eine (ungerichtete) Kante der Form
{a, b] ersetzen, erhalten wir aus G den zugeh origen Graphen [G[. Umgekehrt sei
jetzt G = (V, E) ein Graph. Jeder gerichtete Graph H mit [H[ = G heit dann
eine Orientierung von G. Ersetzt man jede Kante {a, b] E durch die beiden
B ogen (a, b) und (b, a), so erh alt man die vollst andige Orientierung

G von G.
Wir k onnen nun die zuvor f ur Graphen eingef uhrten Begriffsbildungen auf
Digraphen ubertragen; dabei treten h aug zwei M oglichkeiten auf. Sei also
G = (V, E) ein Digraph. Eine Folge von Kanten (e
1
, . . . , e
n
) heit dann ein
Weg, wenn die entsprechende Kantenfolge in [G[ ein Weg ist.

Ahnlich geht man f ur
Kantenz uge, einfache Wege, Kreise und einfache Kreise vor. Wenn (v
0
, . . . , v
n
) die
zugeh orige Punktefolge ist, mu also stets v
i1
v
i
oder v
i
v
i1
eine Kante von G
sein. Imersten dieser beiden F alle spricht man von einer Vorw artskante, imzweiten
Fall von einer R uckw artskante. Wenn ein Weg nur aus Vorw artskanten besteht, wird
er ein gerichteter Weg genannt; ahnliches gilt wieder f ur Kantenz uge, Kreise, etc.
Im Unterschied zum ungerichteten Fall k onnen jetzt einfache gerichtete Kreise der
L ange 2 (also Kreise der Form (ab, ba)) auftreten.
Ein Digraph Gheit zusammenh angend, wenn [G[ zusammenh angend ist. Auch
hier bietet sich noch eine weitere Denition an: Ein Punkt b von Gheit von einem
Punkt a aus erreichbar, wenn es einen gerichteten Weg mit Anfangspunkt a und
Endpunkt b gibt. Wie ublich lassen wir Wege der L ange 0 zu; jeder Punkt ist also
von sich selbst aus erreichbar. G heit dann stark zusammenh angend, wenn jeder
Punkt von jedemanderen Punkt aus erreichbar ist. Allgemein heit ein Punkt a, von
dem aus jeder Punkt erreichbar ist, eine Wurzel von G. Ein Digraph ist also genau
dann stark zusammenh angend, wenn jeder Punkt eine Wurzel ist. Man beachte, da
ein zusammenh angender Digraph keineswegs stark zusammenh angend sein mu.
In der Flutheorie untersucht man nun die folgende spezielle Situation:
G = (V, E) sei ein Digraph mit einer Abbildung c: E R

; der Wert c(e)


heit dabei die Kapazit at der Kante e. Ferner seien q und s zwei ausgezeichnete
Punkte von G, f ur die s von q aus erreichbar ist. Dann nennen wir das Quadrupel
N = (G, c, q, s) ein Netzwerk (genauer: ein Flu-Netzwerk) mit Quelle q und
Senke s.
4
3
Mitunter erlaubt man auch den Fall a = b und spricht dann von einer Schleife. Wenn nichts anderes
gesagt ist, sollen bei uns jedoch Schleifen verboten sein.
4
Manche Autoren verlangen zus atzlich, da es in G keine Kanten mit Endpunkt q bzw. mit An-
fangspunkt s gibt, was f ur die Resultate, die wir in diesem Buch behandeln werden, unproblematisch
46 II Der Heiratssatz und seine Verwandten
Ein Flu auf N ist nun eineAbbildung f : E R, die f ur jeden Punkt p ,= q, s
die folgende Fluerhaltungs-Bedingung erf ullt:
(F1)

e

=p
f (e) =

=p
f (e) (

Zuu nach p = Abu aus p).


Die Zahl
|f | =

=q
f (e)

=q
f (e)
wird als der Wert (oder die St arke) des Flusses f bezeichnet. Wenn f auerdem
f ur jede Kante e die Bedingung
(F2) 0 f (e) c(e)
erf ullt, heit f zul assig (f ur die gegebene Kapazit atsfunktion c).

Ubung 3.1. Sei f ein Flu im Netzwerk N = (G, c, q, s). Man beweise
|f | =

=s
f (e)

=s
f (e).
Hinweis: Man betrachte

pV

=p
f (e) und ben utze die Fluerhaltungs-Be-
dingung (F1) f ur p ,= q, s.
Beispiel 3.2. Sind f
/
, f
//
Fl usse im Netzwerk N = (G, c, q, s) und
/
,
//
R,
so ist durch f =
/
f
/

//
f
//
, also f (e) =
/
f
/
(e)
//
f
//
(e) f ur e E, wieder
ein Flu f in N gegeben (man veriziert (F1) f ur p V {q, s] sofort). Falls dabei
f
/
und f
//
zul assig sind und
/
,
//
0 sowie
/

//
1 gelten, so ist auch f
zul assig. Offenbar gilt dann |f | =
/
|f
/
|
//
|f
//
|.
Beispiel 3.3. Sei N = (G, c, q, s) ein Netzwerk und W ein Weg von q nach s.
Dann ist f ur jede Zahl R

durch
f (e) :=
_

_
falls e eine Vorw artskante in W ist
falls e eine R uckw artskante in W ist
0 sonst
w are. Andererseits ist es oft eine interessante Fragestellung, die maximalen Fluwerte von q nach s f ur
alle Punktepaare (q, s) in G zu untersuchen (falls G stark zusammenh angend ist), wof ur man dann die
von uns gew ahlte allgemeinere Denition ben otigt. Wir verweisen f ur dieses Thema beispielsweise auf
Kapitel 10 in Jungnickel [1994].
II.3 Das Schnitt-Flu-Theorem von Ford und Fulkerson 47
ein Flu f vomWert in N gegeben; ein derartiger Flu heit ein elementarer Flu
mit Tr ager W. Man beachte, da f notwendigerweise unzul assig ist, falls in W
R uckw artskanten auftreten; trotzdem werden Fl usse dieser Art eine wichtige Rolle
spielen. Wir bezeichnen f auch genauer als f
W,
.
Als n achstes wollen wir eine obere Schranke f ur den Wert eines zul assigen
Flusses bestimmen, wozu wir einen weiteren Begriff ben otigen. N = (G, c, q, s)
sei also ein Flu-Netzwerk. Ein Schnitt von N ist eine Zerlegung V = Q
.
S der
Punktemenge V von G, f ur die q in Q und s in S liegen. Mit E(Q, S) bezeichnen
wir dann die Menge aller Kanten e von G, f ur die genau einer der beiden mit e
inzidenten Punkte in Q liegt, also
E(Q, S) = {e E [ e

Q, e

S] {e E [ e

S, e

Q].
Die Kantenmenge E(Q, S) heit auch der durch (Q, S) denierte Cokreis. Die
Kapazit at des Schnittes (Q, S) ist nun die Zahl
c(S, T ) =

Q,e

S
c(e),
also die Summe der Kapazit aten aller Kanten e im zugeh origen Cokreis E(Q, S),
die von Q nach S orientiert sind. Ein Schnitt (Q, S) heit minimal, wenn f ur
jeden Schnitt (Q
/
, S
/
) die Bedingung c(Q, S) c(Q
/
, S
/
) erf ullt ist. Das folgende
Lemma zeigt insbesondere, da die minimale Kapazit at eines Schnittes eine obere
Schranke f ur den Wert eines Flusses darstellt.
Lemma 3.4. N = (G, c, q, s) sei ein Netzwerk, (Q, S) ein Schnitt und f ein zu-
l assiger Flu. Dann gilt
(3.1) |f | =

Q,e

S
f (e)

Q,e

S
f (e),
und daher insbesondere |f | c(Q, S). Gleichheit gilt in (3.1) genau dann, wenn
jede Kante e mit e

Q und e

S ges attigt ist (also f (e) = c(e) gilt ) und jede


Kante e mit e

Q und e

S leer ist (also f (e) = 0 gilt ).


Beweis. Durch Addition von Gleichung (F1) uber alle v Q erh alt man
|f | =

vQ
_

e

=v
f (e)

=v
f (e)
_
=

Q,e

Q
f (e)

Q,e

Q
f (e)

Q,e

S
f (e)

Q,e

S
f (e).
48 II Der Heiratssatz und seine Verwandten
Die beiden ersten Terme ergeben 0. Daraus folgt bereits die Behauptung, da f (e)
c(e) f ur alle Kanten e mit e

Q und e

S sowie f (e) 0 f ur alle Kanten e


mit e

Q und e

S gelten mu. 2
3.2 Flumaximierung
Nun stellen wir uns folgende Optimierungsaufgabe f ur ein gegebenes Netzwerk
N = (G, c, q, s): Gesucht wird ein zul assiger Flu f in N, f ur den |f | m oglichst
gro wird. Gesucht ist also der Wert von
(N) = max{|f | [ f zul assiger Flu in N, f c]
sowie ein Verfahren, ein f mit |f | = (N) explizit zu bestimmen; ein derartiges
f heit dann ein maximaler Flu auf N. Dieses Problem der Flumaximierung,
das wir hier als ein rein kombinatorisches Problem formuliert haben, l at sich
auch in die Theorie der linearen Optimierung einordnen, d. h. der Bestimmung
des Maximums einer Linearform auf einem reellen Vektorraum bei in Form von
linearen Gleichungen und Ungleichungen vorgeschriebenen Nebenbedingungen.
In unserem Falle ist der Vektorraum
R
E
= {f = (f (e))
eE
[ f (e) R f ur alle e E],
die Nebenbedingungen lauten

=p
f (e) =

=p
f (e) f ur alle p V {q, s]
0 f (e) c(e) f ur alle e E
und die Linearform ist

e

=q
f (e)

=q
f (e).
Die S atze der Theorie der linearen Optimierung zeigen, da unsere Aufgabe stets
eine L osung besitzt (dies folgt schon daraus, da obige Nebenbedingungen ein
nichtleeres Kompaktum im R
E
beschreiben und jede Linearform stetig ist) und
liefern auch Algorithmen zu ihrer expliziten L osung (insbesondere den Simplex-
Algorithmus). Von Ford und Fulkerson wurde erstmals gezeigt, da f ur das spezielle
Problem der Flumaximierung auch spezielle, besonders effektive kombinatori-
sche Algorithmen zur Verf ugung stehen. Die zugrundeliegenden S atze von Ford
und Fulkerson stellen ahnlich wie der bekannte Satz von Picard-Lindel of in der
Theorie der gew ohnlichen Differentialgleichungen den Idealfall eines Existenz-
satzes dar, da der Beweis zugleich ein L osungsverfahren liefert. Wir werden nun
II.3 Das Schnitt-Flu-Theorem von Ford und Fulkerson 49
diese Ergebnisse vorstellen. F ur eine ausf uhrlichere Behandlung der Flutheorie
und insbesondere neuerer, noch effektiverer Algorithmen verweisen wir auf Ka-
pitel 6 von Jungnickel [1994]. Eine Entwicklung der Flutheorie aus der linearen
Optimierung ndet man beispielsweise bei Papadimitriou und Steiglitz [1982]; zur
linearen Optimierung allgemein seien Chvtal [1983] und Schrijver [1986] emp-
fohlen.
Die Ergebnisse von Ford und Fulkerson [1956] lassen sich ambesten darstellen,
wenn man sie in die folgenden drei grundlegenden S atze aufteilt, von denen der
erste die maximalen Fl usse charakterisiert. Dazu ben otigen wir noch einen weite-
ren Begriff: f sei ein Flu im Netzwerk N = (G, c, q, s). Ein (ungerichteter) Weg
W von q nach s heit ein zunehmender Weg (bez uglich f ), wenn keine Vorw arts-
kante in W ges attigt und keine R uckw artskante in W leer ist, wenn also f ur jede
Vorw artskante e W die Bedingung f (e) < c(e) und f ur jede R uckw artskante
e W die Bedingung f (e) > 0 erf ullt ist.
Satz 3.5 (

augmenting path theorem). Ein zul assiger Flu f auf einem Netzwerk
N ist genau dann maximal, wenn es keinen bez uglich f zunehmenden Weg gibt.
Beweis. Sei f ein maximaler Flu. Falls es einen zunehmenden Weg W gibt, de-
nieren wir als das Minimumaller Zahlen c(e)f (e) (eVorw artskante in W) sowie
f (e) (e R uckw artskante in W). Nach Denition eines zunehmenden Weges ist ei-
ne positive Zahl. Wir bilden nun den elementaren Flu f
W,
wie in Beispiel 3.3 und
betrachten den Flu f
/
:= f f
W,
, vgl. Beispiel 3.2. Aufgrund der Denition von
sieht man unmittelbar, da f
/
zul assig ist. Weiter gilt |f
/
| = |f | > |f |, was
der Maximalit at von f widerspricht. Also kann kein zunehmender Weg bez uglich
f existieren.
Umgekehrt gelte jetzt, da es in N keinen bez uglich f zunehmenden Weg
gibt. Dann k onnen wir einen Schnitt (Q, S) von N wie folgt denieren: Es sei Q
die Menge aller Punkte v, f ur die ein zunehmender Weg von q nach v existiert
(einschlielich q) und S = V Q. Offenbar mu jede Kante e mit e

Q und
e

S ges attigt und jede Kante e mit e

Q und e

S leer sein. Nach


Lemma 3.4 folgt |f | = c(Q, S), weswegen f maximal ist. 2
Der Beweis von Satz 3.5 liefert uns insbesondere die folgende weitere Charak-
terisierung maximaler Fl usse:
Korollar 3.6. Ein zul assiger Flu f auf einem Netzwerk N ist genau dann maxi-
mal, wenn die Menge Q aller von q aus auf einem zunehmenden Weg erreichbaren
Punkte nicht ganz V ist; in diesem Fall gilt |f | = c(Q, S), wobei S = V Q ist.
2
50 II Der Heiratssatz und seine Verwandten
Satz 3.7 (Schnitt-Flu-Theorem,

max-ow min-cut theorem). Der maximale


Wert eines zul assigen Flusses auf einem Flu-Netzwerk N stimmt mit der mini-
malen Kapazit at eines Schnittes in N uberein.
Beweis. Wie bereits in unseren einleitenden Bemerkungen ausgef uhrt, folgt die
Existenz maximaler Fl usse aus einem Kompaktheitsargument im R
E
. Damit gilt
die Behauptung unmittelbar nach Korollar 3.6. 2
Der von uns angegebene Beweis von Satz 3.7 ist nicht konstruktiv. Der dritte
grundlegende Satz, der den besonders wichtigen Fall ganzzahliger Kapazit atsfunk-
tionen betrifft, wird dagegen mit einem konstruktiven Argument bewiesen:
Satz 3.8 (Ganzheitssatz,

integral ow theorem). N = (G, c, q, s) sei ein Netz-


werk, f ur das die Kapazit atsfunktion c ganzzahlig ist. Dann gibt es einen ganzzah-
ligen maximalen Flu auf N.
Beweis. Durch f
0
(e) := 0 f ur alle e wird ein ganzzahliger Flu f
0
vom Wert 0
auf N deniert, der Null-Flu. Wenn dieser triviale Flu nicht maximal ist, gibt es
nach Satz 3.5 einen zunehmenden Weg bez uglich f
0
. Die im Beweis dieses Satzes
auftretende Zahl ist dabei wegen der Ganzzahligkeit von c eine positive ganze
Zahl, weswegen man wie im Beweis von Satz 3.5 beschrieben aus f
0
einen
ganzzahligen Flu f
1
vomWert erh alt. Dieses Verfahren kann man entsprechend
fortsetzen. Da in jedem Schritt der Fluwert um eine positive ganze Zahl erh oht
wird und da die Kapazit at eines (minimalen) Schnittes wegen Lemma 3.4 eine
obere Schranke f ur den Fluwert ist, bricht die Konstruktion nach endlich vielen
Schritten mit einem ganzzahligen Flu f ab, f ur den es keinen zunehmenden Weg
gibt. Nach Satz 3.5 ist dann f ein maximaler Flu. 2
Es sei betont, da auch imFalle einer ganzzahligen Kapazit asfunktion durchaus
nicht alle maximalenFl usse ganzzahligseinm ussen; der Leser m oge sichhierf ur ein
Beispiel uberlegen. Der Fall einer rationalen Kapazit atsfunktion kann durch Mul-
tiplikation mit dem Hauptnenner aller auftretenden Zahlen auf den ganzzahligen
Fall reduziert werden, womit wir auch in diesem Fall einen konstruktiven Beweis
von Satz 3.7 haben. Im Fall reeller Kapazit aten ist ebenfalls ein konstruktiver Be-
weis m oglich, beispielsweise mit der von Edmonds und Karp [1972] angegebenen
Modikation des Algorithmus von Ford und Fulkerson, den wir als n achstes behan-
deln werden. Dieser Algorithmus verl auft grob gesprochen genau wie der Beweis
von Satz 3.8: Man geht vom Null-Flu aus und andert dann den vorliegenden Flu
durch Addition elementarer Fl usse auf zunehmenenden Wegen solange ab, bis das
Verfahren mit einem (maximalen) Flu abbricht. Nat urlich mu man sich hierf ur
noch uberlegen, wie man denn zunehmende Wege ndet; dies erfolgt mit einem
II.3 Das Schnitt-Flu-Theorem von Ford und Fulkerson 51
geeigneten Markierungsproze. Der folgende Algorithmus stammt von Ford und
Fulkerson [1957]:
Algorithmus 3.9 (Markierungs-Algorithmus von Ford und Fulkerson).
Sei N = (G, c, q, s) ein Flu-Netzwerk. Man f uhre die folgenden Schritte aus:
(1) Setze f (e) := 0 f ur alle e E.
(2) Setze d(v) := und bezeichne v als

neu f ur alle v V.
(3) Markiere q mit (, ).
(4) W ahle einen markierten neuen Punkt v. Untersuche alle mit v inzidenten
Kanten e gem a folgenden beiden Regeln:
(a) Falls e = vw und f (e) < c(e) gilt, wobei w nicht markiert ist, setze
man d(w) := min{c(e)f (e), d(v)] und markiere wmit (v, , d(w)).
(b) Falls e = wv und 0 < f (e) gilt, wobei w nicht markiert ist, setze man
d(w) := min{f (e), d(v)] und markiere w mit (v, , d(w)).
(5) Deklariere v nunmehr als

abgearbeitet.
(6) Falls s nicht markiert ist und es noch einen markierten neuen Punkt gibt,
weiter bei (4).
(7) Falls s nicht markiert ist und es keinen markierten neuen Punkt gibt, weiter
bei (10).
(8) (Jetzt ist also s markiert.) Sei d die letzte Komponente der Markierung von
s. Setze w := s und wiederhole die folgenden Schritte, bis w = q gilt:
(a) Bestimme die erste Komponente v der Markierung von w.
(b) Falls die zweite Komponente der Markierung von w gleich ist, setze
f (e) := f (e) d f ur die Kante e = vw und ersetze w durch v.
(c) Falls die zweite Komponente der Markierung von w gleich ist, setze
f (e) := f (e) d f ur die Kante e = wv und ersetze w durch v.
(9) L osche alle Markierungen und gehe zu (2).
(10) Bezeichne die Menge der markierten Punkte mit Q und setze S := V Q.
Der Leser uberzeuge sich davon, da Algorithmus 3.9 im Falle einer ganz-
zahligen (oder rationalen) Kapazit atsfunktion c einen maximalen Flu f und einen
minimalen Schnitt (Q, S) bestimmt; es gilt also |f | = c(Q, S). Dagegen kann das
Verfahren imFall irrationaler Kapazit aten bei ungeschickter Auswahl des Punktes
v im Schritt (4) versagen; ein Beispiel daf ur ndet man bei Ford und Fulkerson
[1962], wo das Verfahren nicht abbricht, sondern gegen einen Wert konvergiert, der
nur 1/4 des maximal m oglichen Fluwertes betr agt. Auerdem ist Algorithmus 3.9
selbst imFalle ganzzahliger Kapazit aten nicht sonderlich effektiv, da dieAnzahl der
vorzunehmenden Ab anderungen des Flusses f nicht nur von [V[ und [E[, sondern
auch von c abh angen kann, wie wir gleich sehen werden.
52 II Der Heiratssatz und seine Verwandten
Beispiel 3.10. Wenn man im Netzwerk
q
s
b c a
f
e
d
n n
n
n
n n
n
n
1
abwechselnd die Wege q a b e f s und q d e b c s als
zunehmende Wege w ahlt (was bei geeigeneter Auswahl der Punkte v in (4) m oglich
ist), so wird der Fluwert in jedem Schritt nur um 1 erh oht und wir ben otigen
insgesamt 2n Iterationen. Nat urlich kann man das durch eine geschicktere Wahl
der Wege vermeiden: mit q a b c s und q d e f s sind nur zwei
Iterationen notwendig!
Das vorhergehende Beispiel legt es nahe, einigeAnmerkungen uber die Qualit at
von Algorithmen zu machen. In der Komplexit atstheorie betrachtet man den Zeit-
und Platzbedarf eines Algorithmus in Abh angigkeit von der

Gr oe der Eingabe-
daten, wodurch man verschiedene Algorithmen f ur dasselbe Problem vergleichen
kann. Wir k onnen die entsprechenden Begriffe hier aus Platzgr unden nicht pr azi-
se einf uhren und verweisen f ur n ahere Einzelheiten beispielsweise auf Garey und
Johnson [1979]. In unserem Zusammenhang k onnen wir als Ma f ur die Gr oe der
Eingabedaten die Punkte- bzw. Kantenzahl der auftretenden Digraphen verwen-
den. Die Komplexit at eines Algorithmus sei dann die Funktion f , f ur die f (n) die
maximale Schrittzahl angibt, die zur L osung eines Einzelfalls mit Eingabedaten
der L ange n ben otigt wird. Dabei rechnen wir die ublichen arithmetischen Ope-
rationen, Zugriffe auf Felder, Vergleichsoperationen etc. jeweils als einen Schritt.
Das ist nur insoweit realistisch, als die auftretenden Zahlen nicht beliebig gro
werden, was aber in der Praxis der Fall ist. (F ur graphentheoretische Zwecke ist
diese Konvention vern unftig, f ur arithmetische Algorithmen w are sie es nicht.) Da
es oft unm oglich ist, die Komplexit at f (n) eines Algorithmus exakt auszurech-
nen, sch atzt man stattdessen seine

Wachstumsrate im folgenden Sinne ab. Man


schreibt
f (n) = O(g(n)), wenn es eine Konstante c > 0 gibt mit
f (n) cg(n) f ur alle hinreichend groen n
und sagt dann, da f Wachstumsrate g(n) habe. In der Praxis w unscht man sich
(auch wenn das leider h aug nicht m oglich ist) polynomiale Algorithmen, also
II.3 Das Schnitt-Flu-Theorem von Ford und Fulkerson 53
Algorithmen der Komplexit at O(n
k
) f ur ein geeignetes k; man nennt derartige
Algorithmen auch efzient.
Wie wir in Beispiel 3.10 gesehen haben, ist der Algorithmus 3.9 von Ford und
Fulkerson [1957] nicht polynomial. Erst 15 Jahre sp ater gelang Edmonds und Karp
[1972] eine Modikation, die es gestattet, eine polynomiale Komplexit at nachzu-
weisen, n amlich von O([V[[E[
2
). Dazu gen ugt es, stets einen zunehmenden Weg
mit m oglichst wenigen Kanten zu verwenden, was man leicht erreichen kann, indem
man in Schritt (4) von Algorithmus 3.9 stets denjenigen neuen Punkt v ausw ahlt,
der zuerst markiert wurde. (Dieses Auswahlprinzip l at sich uberdies leicht imple-
mentieren, indem man die markierten Punkte in einer

Schlange anordnet.) Einen


Beweis hierf ur sowie ein ausf uhrliches Beispiel ndet man in Kapitel 6 von Jung-
nickel [1994], wo dar uber hinaus etliche weitere Algorithmen mit noch besseren
Komplexit aten ausf uhrlich behandelt werden; wir stellen hier tabellarisch einige
Ergebnisse zusammen, wobei wir n = [V[ und m = [E[ schreiben. Es gibt zahl-
reiche weitere Algorithmen f ur die Bestimmung maximaler Fl usse; wir verweisen
auf die umfangreiche Monographie von Ahuja, Magnanti und Orlin [1993] und die
dort sowie bei Jungnickel [1999] zitierte Literatur.
Autoren Komplexit at
Ford und Fulkerson [1957] nicht-polynomial
Dinic [1970] O(n
2
m)
Edmonds und Karp [1972] O(nm
2
)
Malhotra, Kumar und Mahaswari [1978] O(n
3
)
Goldberg und Tarjan [1988] O(n
3
)
Cheriyan und Maheshwari [1989] O(n
2
m
1/2
)
Wir beenden diesen Unterabschnitt mit einigen interessanten

Ubungen.

Ubung 3.11. Der Beweis von Satz 3.8 und Algorithmus 3.9 zeigen, da es einen
maximalen Flu gibt, der die Summe elementarer Fl usse (auf zunehmendenWegen)
ist. Man zeige, da im allgemeinen nicht jeder maximale Flu so darstellbar ist.

Ubung 3.12. N = (G, c, q, s) sei ein Flu-Netzwerk. Man zeige, da es minde-


stens eine Kante in G gibt, deren Entfernung den maximalen Wert eines Flusses
verkleinert, sofern dieser Wert ,= 0 ist.

Ubung 3.13. Gegeben sei ein Flu-Netzwerk N = (G, c, q, s), in dem auch die
Punkte Kapazit atsbeschr ankungen unterliegen: Es ist also eine weitere Abbildung
54 II Der Heiratssatz und seine Verwandten
d : V R

gegeben, und die Fl usse f werden der weiteren Beschr ankung


(F3)

e

=v
f (e) d(v) f ur v ,= q, s
unterworfen. Man reduziere dieses Problem auf die Behandlung eines geeigne-
ten gew ohnlichen Flu-Netzwerks und verallgemeinere Satz 3.7 auf solche Flu-
Netzwerke. Zur Veranschaulichung kann man beispielsweise an ein Bew asserungs-
Netzwerk denken; die Punkte k onnen dann Pumpstationen darstellen, deren Kapa-
zit at beschr ankt ist.
3.3 Fl usse, Matchings und disjunkte Wege
Zur Gruppe der zum Heiratssatz aquivalenten S atze geh ort neben den S atzen von
K onig, DilworthundMenger auchdas Schnitt-Flu-Theorem3.7. Wir werdenhier
wieder nur eine der beiden Richtungen zeigen, indem wir den Satz 2.1 von K onig
aus dem Schnitt-Flu-Theorem herleiten. Dazu konstruieren wir zu einem gegebe-
nen bipartiten Graphen Gein passendes Fluoptimierungsproblem, was dann auch
einen effektiven Algorithmus zur Bestimmung eines maximalen Matchings in G
liefert. Da umgekehrt auch das Schnitt-Flu-Theorem auf dem Umweg uber
die Satzgruppe vom Menger-Typ aus dem Heiratssatz folgt, macht deutlich mehr
M uhe; wir verweisen hierf ur beispielsweise auf Jungnickel [1982].
Sei also G = (U
.
W, E) ein bipartiter Graph. Wir denieren einen Digraphen
H wie folgt: ZuU
.
W werdenzwei neue Punkte q unds hinzugef ugt; Kantenseien
(mit u U und w W) alle qu, alle uw, f ur die {u, w] eine Kante von G ist, und
alle ws. Alle Kanten e von H erhalten die Kapazit at c(e) = 1 zugewiesen, womit
wir ein Flu-Netzwerk N = (H, c, q, s) deniert haben. Die Kanten {u
i
, w
i
] eines
Matchings in G(i = 1, . . . , k) induzieren dann einen ganzzahligen zul assigen Flu
f vomWert k auf N, wenn man f (e) = 1 genau f ur die Kanten e = qu
i
, e = u
i
w
i
und e = w
i
s f ur i = 1, . . . , k setzt (und f (e) = 0 sonst). Umgekehrt liefert jeder
ganzzahlige zul assige Flu vom Wert k auf N ein Matching von G mit k Kanten,
n amlich genau den Kanten {u, w] E, f ur die f (uw) = 1 gilt. Insbesondere
entsprechen sich somit aufgrund des Ganzheitssatzes 3.8 ganzzahlige maximale
Fl usse in N und maximale Matchings in G.
Um den nichttrivialen Teil
/
(G) (G) des Satzes von K onig zu beweisen,
betrachten wir einen minimalen Schnitt (Q, S) in N. Nach Satz 3.7 gilt c(Q, S) =
, wobei = (N) der maximale Wert eines zul assigen Flusses auf N sei. Wie
wir schon gesehen haben, ist dann gleichzeitig die maximale M achtigkeit eines
Matchings in G. Es reicht somit, aus (Q, S) eine uberdeckende Punktemenge T
f ur G mit h ochstens Elementen zu konstruieren. Wie man leicht sieht, gilt
c(Q, S) = [U Q[ [W Q[ [{uw E [ u U Q, w W Q][.
II.3 Das Schnitt-Flu-Theorem von Ford und Fulkerson 55
Wir k onnen daher offenbar
T := (U Q) (W Q) {u U Q [ uw E f ur ein w W Q]
w ahlen. 2
Korollar 3.14. Sei G = (U
.
W, E) ein bipartiter Graph. Dann kann man ein
maximales Matching in G mit Komplexit at O([V[[E[) bestimmen.
Beweis. Wir verwenden die soeben gegebene Herleitung des Satzes von K onig
aus demSchnitt-Flu-Theorem. Dann entsprechen sich also ganzzahlige maximale
Fl usse im dort denierten Netzwerk N und maximale Matchings in G. Ein sol-
cher Flu (und damit wie oben ausgef uhrt ein maximales Matching) kann mit
dem Markierungs-Algorithmus 3.9 bestimmt werden. Man sieht nun unmittelbar
ein, da jede Augmentierung in diesem Algorithmus (also die Suche nach einem
zunehmenden Weg mit anschlieender Flu-Vergr oerung) in O([E[) Schritten
erfolgen kann, da jede Kante nur eine konstante Anzahl von Malen betrachtet wer-
den. Andererseits ist der maximale Fluwert trivialerweise durch min([U[, [W[)
beschr ankt, weswegen nur O([V[) Augmentierungen vorkommen. 2
Wenn man in Korollar 3.14 anstelle von Algorithmus 3.9 den bereits erw ahnten
Algorithmus von Dinic [1970] verwendet, kann man die dort angegebene Komple-
xit atsschranke auf O([V[
1/2
[E[) verbessern, siehe etwa Jungnickel [1994]. Diese
Komplexit at die immer noch zu den besten bekannten Ergebnissen z ahlt wurde
erstmals von Hopcroft und Karp [1973] erreicht, die allerdings ihr Verfahren nicht
in der Sprache der Flutheorie formuliert haben. Dieselbe Komplexit atsschranke
gilt sogar f ur die Bestimmung eines maximalen Matchings in einem beliebigen
Graphen; ein entsprechender Algorithmus wurde erstmals von Micali und Vazirani
[1980] angegeben. Die allgemeine Situation ist aber sehr viel schwieriger als der
bipartite Fall; so gelang erst Vazirani [1994] in einer nahezu 40 Seiten umfassenden
Arbeit ein Korrektheitsbeweis f ur den genannten Algorithmus und seine Komple-
xit at. Ein Grund f ur die im allgemeinen Fall auftretenden Probleme liegt darin, da
es nicht ohne weiteres m oglich ist, Matchings in beliebigen Graphen mit Hilfe der
Flutheorie zu behandeln. Dies erfordert einen betr achtlichenAufwand, wobei man
spezielle Fl usse auf speziellen Netzwerken zu untersuchen hat (

balanced network
ows); diese Fragestellung ist in einer Serie von Arbeiten von Fremuth-Paeger
und Jungnickel [1999a,b,c;2001a,b,c;2002,2003] ausf uhrlich behandelt worden.
Die oben genannte Komplexit atsschranke wurde seither nur unwesentlich verbes-
sert, n amlich auf O(

nmlog(n
2
/m)/ log n), ein Ergebnis von Feder und Motwani
[1995] f ur den bipartiten Fall bzw. von Fremuth-Paeger und Jungnickel [2003] im
allgemeinen Fall. Die entsprechenden, sehr aufwendigen Algorithmen sind jedoch
bisher nur von theoretischer, nicht aber von praktischer Bedeutung.
56 II Der Heiratssatz und seine Verwandten

Ubung 3.15. Man verwende Algorithmus 3.9 zur Bestimmung maximaler Match-
ings in den beiden folgenden bipartiten Graphen.
Als n achstes geben wir zwei Varianten des Satzes von Menger f ur gerichtete
Graphen an, deren Beweise wir dem Leser uberlassen.
Satz 3.16 (Satz von Menger, Kantenversion f ur Digraphen). Seien p und q zwei
verschiedene Punkte eines Digraphen G = (V, E). Dann ist die Maximalzahl von
p und q verbindenden, paarweise kantendisjunkten gerichteten Wegen gleich der
minimalen M achtigkeit einer p und q trennenden Kantenmenge. 2
Satz 3.17 (Satz von Menger, Punkteversion f ur Digraphen). Seien p und q zwei
nicht-adjazente Punkte eines Digraphen G = (V, E). Dann ist die Maximalzahl
von p und q verbindenden, paarweise punktedisjunkten gerichteten Wegen gleich
der minimalen M achtigkeit einer p und q trennenden Punktemenge. 2

Ubung 3.18. Man beweise die S atze 3.16 und 3.17 und uberlege sich einen efzi-
enten Algorithmus f ur die Bestimmung eines maximalen Systems von paarweise
kantendisjunkten gerichteten Wegen, die zwei Punkte p und q verbinden.
Hinweis: F ur Satz 3.16 betrachte man das Netzwerk (G, c, p, q), wobei alle Kanten
die Kapazit at c(e) = 1 haben, und wende Satz 3.8 und seinen Beweis an. (Achtung:
Man mu sich hier explizit mit dem eventuellen Auftreten von R uckw artskanten in
den zunehmenden Wegen auseinandersetzen!) Danach f uhre man Satz 3.17 durch
eine geeignete Transformation auf Satz 3.16 zur uck; man vergleiche dazu nochmals
den Beweis von Satz 2.10. Die algorithmische Behandlung erfolgt dann ahnlich wie
im Beweis von Korollar 3.14.
Es sei abschliessend noch bemerkt, da das Schnitt-Flu-Theorem interessante
Anwendungen auf das Problem der Matrizen und Mae mit vorgegebenen Rand-
verteilungen besitzt (vgl. beispielsweise Jacobs [1978], Anhang).
II.3 Das Schnitt-Flu-Theorem von Ford und Fulkerson 57
3.4 Der Satz von Baranyai
1973 bewies der junge, 1978 tragisch ums Leben gekommene, ungarische Kombi-
natoriker Baranyai (1948 1978, vgl. Katona [1979]) einen tieiegenden Satz, der
unter anderem ein altes Problem von Sylvester l ost und sich aus dem Ganzheitssatz
ableiten l at. Um diesen ziemlich technischen Satz zu formulieren, ben otigen wir
eine vorbereitende Denition; das Hauptinteresse des Satzes liegt dann in der fol-
genden

Ubung 3.20, wo wir die eigentlich interessierendeAnwendung, n amlich den
Beweis der sogenannten SylvesterschenVermutung, kennenlernen werden. Der Satz
von Baranyai ist eine weitreichende Verallgemeinerung, die es gestattet, Induktion
anzuwenden, was f ur den wirklich interssierenden Spezialfall nicht m oglich w are.
Seien n, p, r N;
1
, . . . ,
r
, a
11
, . . . , a
1r
, a
21
, . . . , a
2r
, . . . , a
p1
, . . . , a
pr

N
0
; und X eine n-Menge. Eine doppelt indizierte Familie
(B
i
)
i=1,...,p;=1,...,r
von Teilmengen der Potenzmenge 2
X
von X heit eine zu besagten Daten geh orige
Baranyai-Familie, wenn folgendes gilt:
(a) [B
i
[ = a
i
f ur i = 1, . . . , p und = 1, . . . , r
(b) F ur alle B B
i
gilt B X und [B[ =
i
(i = 1, . . . , p, = 1, . . . , r).
(c) F ur jedes {1, . . . , r] ist

p
i=1
B
i
eine disjunkte Zerlegung von X.
(d) F ur jedes i {1, . . . , p] ist

r
=1
B
i
=
_
X

i
_
.
Der angek undigte Satz lautet nun
Satz 3.19 (Satz von Baranyai). Seien n, p , r N sowie
1
, . . . ,
p
, a
11
, . . . ,
a
pr
N
0
. Dann sind die beiden folgenden Aussagen aquivalent:
(I) Es gibt eine Baranyai-Familie (B
i
)
i=1,...,p
zu diesen Daten.
(II) Die gegebenen Daten erf ullen die Beziehungen
(A)
p

i=1

i
a
i
= n f ur = 1, . . . , r;
(B)
r

=1
a
i
=
_
n

i
_
f ur i = 1, . . . , p.
Beweis. (I) (II) folgt sofort mittels (a) (d) aus der Denition einer Baranyai-
Familie.
Um(II) (I) zu beweisen, f uhren wir Induktion nach ndurch. Sei also zun achst
n = 1. Dann ist im Falle
i
> 1 stets a
i1
= = a
ir
= 0. Streicht man zun achst
58 II Der Heiratssatz und seine Verwandten
alle Daten mit Indizes i, f ur die
i
> 1 gilt, und konstruiert man eine Baranyai-
Familie f ur den Rest, so kann man durch Hinzuf ugen von lauter B
i
= die
zun achst ausgeschiedenen Daten wieder ber ucksichtigen. Es gen ugt also, sich mit
dem Fall ohne ausgeschiedene Daten, also mit dem Fall
i
{0, 1] und
_
n

i
_
= 1
f ur i = 1, . . . , p, zu befassen. Aus (B) folgt dann:
Zu jedemi gibt es genau ein mit a
i
= 1, alle ubrigen a
i
sind = 0. Wir setzen
B
i
=
_

_
{] falls a
i
= 1,
i
= 0
{X] falls a
i
= 1,
i
= 1
sonst
Dann gelten (a)(d) aus obiger Denition, wir haben also eine Baranyai-Familie
zu unseren Daten gefunden.
Wir nehmen nun an, (II) (I) sei bis n1 bewiesen und weisen diese Aussage
f ur n nach. Dabei interessiert nur der Fall
1
, . . . ,
p
> 0 wirklich; denn wenn
man
i
= 0 hat, so ist
_
n

i
_
= 1, also ist unter den a
i1
, . . . , a
ir
genau ein a
i
= 1,
die anderen sind 0, und man hat nur B
i
= {] sowie B
i
= f ur ,=
zu setzen. Also nehmen wir ab jetzt
1
, . . . ,
p
1 an. Wir bilden nun einen
Digraphen G = (V, E) wie folgt: Sei D = {d
1
, . . . , d
p
], H = {h
1
, . . . , h
r
] mit
[D[ = p, [H[ = r, D H = und q, s mit q, s , D H. Wir setzen nun
V = {p] D H {s] und
E = {qd
i
[ i = 1, . . . , p] {d
i
h

[ i = 1, . . . , p, = 1, . . . , r] {h

s [ = 1, . . . , r].
Weiterhin erkl aren wir folgendermaen eine Kapazit atsfunktion c auf E:
c(qd
i
) =
_
n 1

i
1
_
f ur i = 1, . . . , p;
c(d
i
h

) =
_
0 falls a
i
= 0
1 falls a
i
,= 0
f ur i = 1, . . . , p, = 1, . . . , r;
c(h

s) = 1 f ur = 1, . . . , r.
Schlielich denieren wir noch ein f : E R

, das wir sogleich als einen


zul assigen Flu auf N = (G, c, q, s) erkennen werden:
f (qd
i
) =
_
n 1

i
1
_
f ur i = 1, . . . , p;
f (d
i
h

) =

i
a
i
n
f ur i = 1, . . . , p, = 1, . . . , r;
f (h

s) = 1 f ur = 1, . . . , r.
II.3 Das Schnitt-Flu-Theorem von Ford und Fulkerson 59
Dies deniert tats achlich einen Flu: F ur jedes d
i
gilt
Zuu =
_
n 1

i
1
_
=

i
n
_
n

i
_
=
r

=1

i
n
a
i
=Abu
nach (B); und f ur jedes h

gilt
Zuu =
p

i=1

i
a
i
n
= 1 =Abu
nach (A). Wegen

i
a
i
n
1 ist dieser Flu in der Tat zul assig. Die Senke s deniert
einen Schnitt (V {s], {s]), dessen Kapazit at r trivialerweise gleich dem Fluwert
ist, womit unser Flu sogar maximal ist. Da c nur ganzzahlige Werte annimmt,
gibt es nach Satz 3.8 auch einen ganzzahligen maximalen Flu f
/
. Dabei unter-
scheidet sich f
/
von f h ochstens f ur die den Kanten d
i
h

zugeordneten Werte,
die ja f ur f
/
allesamt 0 oder 1 sein m ussen. Wir verwenden nun f
/
, um unsere
Induktionsannahme auszun utzen. Dazu setzen wir
n
/
= n 1, p
/
= 2p, r
/
= r;

/
1
=
1
, . . . ,
/
p
=
p
;
/
p1
=
1
1, . . . ,
/
2p
=
p
1;
a
/
j
=
_
_
_
a
j
f
/
(d
j
h

) f ur j = 1, . . . , p
f
/
(d
jp
h

) f ur j = p 1, . . . , 2p
und w ahlen eine Menge X
/
mit [X
/
[ = n 1. Wegen
1
, . . . ,
p
1 gilt

/
1
, . . . ,
/
2p
0. Wir uberpr ufen (A) und (B) f ur die neuen Daten (unter Ver-
wendung der entsprechenden Formeln f ur die alten Daten sowie der Fluerhal-
tungsbedingung f ur f
/
):
(A)
2p

j=1

/
j
a
/
j
=
p

i=1

i
(a
i
f
/
(d
i
h

))
p

i=1
(
i
1)f
/
(d
i
h

)
=
p

i=1

i
a
i

p

i=1
f
/
(d
i
h

) = n 1
60 II Der Heiratssatz und seine Verwandten
(B)
r

=1
a
/
j
=
_

_
r

=1
(a
j
f
/
(d
j
h

)) =
_
n

j
_

_
n 1

j
1
_
=
_
n 1

j
_
=
_
n 1

/
j
_
(j = 1, . . . , p)
r

=1
f
/
(d
jp
h

) =
_
n 1

jp
1
_
=
_
n 1

/
j
_
(j = p 1, . . . , 2p)
Nachunserer Induktionsannahme gibt es somit zudenneuen(

gestrichenen) Daten
eine Baranyai-Familie (B
/
j
)
i=1,...,2p;=1,...,r
, f ur die also gilt:
(a) [B
/
j
[ = a
/
j
f ur j = 1, . . . , 2p und = 1, . . . , r.
(b) F ur alle B B
/
j
gilt B X
/
und [B[ =
/
j
(f ur j = 1, . . . , 2p und
= 1, . . . , r).
(c) F ur jedes {1, . . . , r] ist

2p
j=1
B
/
j
eine disjunkte Zerlegung von X
/
.
(d)

r
=1
B
/
j
=
_
X
/

/
j
_
f ur j = 1, . . . , 2p.
Diese Baranyai-Familie ben utzen wir nun, um f ur n eine Baranyai-Familie mit den
Daten n, p, r,
1
, . . . ,
p
etc. zu konstruieren. Wir w ahlen ein x
0
, X
/
und setzen
X := {x
0
] X
/
, so da wir [X[ = n erhalten. Wir bilden nun
B
i
:= B
/
i
{{x
0
] M[M B
/
pi,
] f ur i = 1, . . . , p, = 1, . . . , r.
Wegen f
/
(d
i
h

) {0, 1], [B
/
pi,
[ = f
/
(d
i
h

) und

p
i=1
f
/
(d
i
h

) = 1 gibt es
zu jedem genau ein i

mit [B
/
pi

,
[ = 1, etwa B
/
pi

,
= {M

], wobei M

M achtigkeit
i

1 und somit {x
0
] M

M achtigkeit
i

hat. Wir erhalten:


(a) [B
i
[ = [B
/
i
[ [B
/
pi,
[ = a
i
f
/
(d
i
h

) f
/
(d
i
h

) = a
i

(f ur i = 1, . . . , p und = 1, . . . , r)
(b) Jedes B B
i
hat M achtigkeit
i
(f ur i = 1, . . . , p) :
Denn die E B
/
i
haben M achtigkeit
i
und die M B
/
pi,
haben
M achtigkeit
/
pi
=
i1
, so da dann {x
0
] M ebenfalls M achtigkeit

i
hat.
(c) F ur ein festes {1, . . . , r] bilden die E

2p
j=1
B
/
j
eine disjunkte
Zerlegung von X
/
. In allen B
/
pi,p
zusammen steckt nur eine einziges M

;
dieses wird um x
0
vergr oert, so da

p
i=1
B
i
tats achlich eine disjunkte
Zerlegung von X bildet.
II.3 Das Schnitt-Flu-Theorem von Ford und Fulkerson 61
(d) F ur jedes i = 1, . . . , p gilt
r
_
=1
B
i
==
r
_
=1
B
/
i

r
_
=1
{{x
0
] M[M B
/
pi,
].
Hier ist

r
=1
B
/
i
=
_
X
/

i
_
und
r
_
=1
{{x
0
] M[M B
/
pi,
] =
_
X

i
_

_
X
/

i
_
.
so da

r
=1
B
i
=
_
X

i
_
folgt.
Damit ist der Induktionsschritt vollendet und unser Satz bewiesen. 2

Ubung 3.20 (Sylvestersche Vermutung). Seien m, k N. Dann kann man die


Menge aller k-Teilmengen von {1, . . . , mk] disjunkt in Mengensysteme
B
1
, . . . , B
(
mk1
k1
)
zerlegen, die ihrerseits jeweils eine disjunkte Zerlegung von {1, . . . , mk] in m
Mengen der M achtigkeit k sind.
Hinweis: Man verwende den Satz von Baranyai mit n = mk, p = 1,
1
= k,
r =
_
n1
k1
_
=
_
mk1
k1
_
, a
1
= m (f ur = 1, . . . , r).
III Orthogonale lateinische Quadrate
Die orthogonalen lateinischen Quadrate bilden eine der interessantesten Strukturen
inder Kombinatorikundsindeinunentbehrliches Hilfsmittel inder Design-Theorie.
Sie haben ihren Ursprung in einemvon Euler gestellten Problemder Unterhaltungs-
mathematik, besitzen aber selbst auerhalb der Mathematik wichtige Anwendun-
gen, wie etwa in der Versuchsplanung oder der Codierungstheorie. Wir k onnen hier
nur eine ziemlich kurze Einf uhrung geben; f ur ausf uhrlichere Darstellungen sei der
Leser auf die einschl agigen Kapitel bei Beth, Jungnickel und Lenz [1999] sowie
auf die Monographien von Dnes und Keedwell [1974, 1991] und das Buch von
Hedayat, Sloane und Stuffken [1999] verwiesen, in dem die allgemeinere Theorie
der orthogonalen Arrays behandelt wird.
1 Problemstellung und Historisches
Die beiden quadratischen Matrizen
_
_
1 2 3
2 3 1
3 1 2
_
_
und
_
_
a b c
b c a
c a b
_
_
sind lateinische Quadrate der Ordnung 3: in jeder Zeile und in jeder Spalte stehen
die jeweils verwendeten drei Symbole in einer gewissen Anordnung. Die beiden
obigen lateinischen Quadrate sind aquivalent: Sie gehen durch die Umbenennung
1 a, 2 b, 3 c ineinander uber. Die Matrizen
_
_
1 2 3
2 3 1
3 1 2
_
_
und
_
_
1 2 3
3 1 2
2 3 1
_
_
sind zwei lateinische Quadrate der Ordnung 3. Sie sind keineswegs aquivalent,
sondern orthogonal; geht man n amlich die neun Felder in beiden Matrizen gleich-
zeitig durch, so sammelt man gerade alle neun m oglichen geordneten Paare von
Symbolen auf:
III.1 Problemstellung und Historisches 63
1. Zeile: (1, 1), (2, 2), (3, 3)
2. Zeile: (2, 3), (3, 1), (1, 2)
3. Zeile: (3, 2), (1, 3), (2, 1)
All dies ist noch Intuition und keine pr azise Mathematik. Bevor wir uns einer stren-
genTheorie der orthogonalenlateinischenQuadrate widmen, sindeinige historische
Anmerkungen am Platze.
Die Theorie der orthogonalen lateinischen Quadrate beginnt mit der Abhand-
lung von Euler [1782]. Euler hatte, vielleicht um dem Zaren, dem er damals in St.
Petersburg als Akademiemitglied diente, eine Freude zu machen, das Problem der
Orthogonalit at von lateinischen Quadraten f ur die Ordnung 6 als

Problme des
36 ofciers eingekleidet; unter diesem Namen ist es lange Zeit behandelt worden.
Eine modernere Einkleidung lautet wie folgt: Kann man ein quadratisches, in 36
Quadrate unterteiltes Versuchsfeld in zwei Versuchsg angen jedesmal so mit sechs
D ungemitteln d ungen, da bei jedem der beiden Versuche in jeder Zeile und Spalte
eine Permutation der sechs D ungemittel aufritt und auf den 36 Teilfeldern bei den
beidenVersuchen jedes der 36 m oglichen geordneten D ungemittel-Paare genau ein-
mal realisiert wird? Euler auerte aufgrund zahlreicher Beispiel-Untersuchungen
die Vermutung, immer wenn n die Form n = 2 4k habe, gebe es keine zwei
orthogonalen lateinischen Quadrate der Ordnung n. Das w aren also die Ordnungen
6, 10, 14, 18, 22, 26, 30, 34, Um 1900 bewies Tarry [1900,1901] mittels lang-
wieriger Aufz ahlungen, da es keine zwei orthogonalen lateinischen Quadrate der
Ordnung 6 gibt. K urzere Beweise f ur diese Tatsache gaben Fisher undYates [1934]
(die Anwendungen wie die oben skizzierte vor Augen hatten), Betten [1983] sowie
Stinson [1984]; den Beweis von Betten kann man auch in X.13 von Beth, Jung-
nickel und Lenz [1999] nachlesen. 1958/59 wurde schlielich ein Paar orthogonaler
lateinischer Quadrate der Ordnung 10 entdeckt:
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
Aa Eh Bi Hf Cj Jd Ig De Gb Fc
If Bb Fh Ci Ha Dj Je Eg Ac Gd
Jg Ia Cc Gh Di Hb Ej Ff Bd Ae
Fj Jf Ib Dd Ah Ei Hc Ga Ce Bg
Hd Gj Ja Ic Ee Bh Fi Ab Dg Cf
Gi He Aj Jb Id Fg Ch Bc Ef Da
Dh Ai Hg Bj Jc Ie Gf Cg Fa Eb
Be Cg Df Ea Fb Ge Ad Hh Ii Jj
Cb Dc Ed Fe Gg Af Ba Ij Jh Hi
Ec Fd Ge Ag Bf Ca Db Ji Hj Ih
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
_
Wir werden sp ater sehen, wie man derartige Paare orthogonaler lateinischer
Quadrate wesentlich einfacher nden und darstellen kann.
64 III Orthogonale lateinische Quadrate
Bald darauf brach die Eulersche Vermutung auch f ur n = 14 zusammen.

The
end of Euler kam 1959 mit den Abhandlungen von Bose und Shrikhande [1959,
1960] sowie Bose, Shrikhande und Parker [1960], deren Autoren den Beinamen

the Euler spoilers erhielten. Da bei kombinatorischen Problemen indische Ma-


thematiker eine besondere Rolle spielen, ist eine Tatsache, wie die Inder uberhaupt
uber eine jahrtausendealte glanzvolle mathematische Tradition verf ugen.
2 Grundbegriffe und erste Existenzaussagen
Denition 2.1. Seien n N und R, C, S Mengen mit [R[ = [C[ = [S[ = n.
(R wie

rows, C wie

columns, S wie

symbols.)
1. Eine Abbildung L: R C S heit ein lateinisches Quadrat der Ordnung
n, wenn
a) f ur jedes r R die durch c . L(r, c) gegebene Abbildung C S
b) f ur jedes c C die durch r . L(r, c) gegebene Abbildung R S
bijektiv ist.
2. Seien L: R C S und L
/
: R C S
/
zwei lateinische Quadrate der
Ordnung n = [R[ = [C[ = [S[ = [S
/
[. Man sagt, L und L
/
seien orthogonal,
wenn
{(L(r, c), L
/
(r, c)) [ r R, c C] = S S
/
gilt.
3. Eine Menge Mvon lateinischen Quadraten mit denselben Mengen R, C heit
orthogonal, wenn ihre Elemente paarweise orthogonal sind. Wenn M aus n
Quadraten besteht, spricht man auch von n MOLS (f ur mutually orthogonal
Latin squares).
Es ist ganz leicht, mittels zyklischer Vertauschung ein lateinisches Quadrat
L: R C S mit R = C = S = {0, . . . , n 1] herzustellen:
_
_
_
_
_
_
_
_
_
0 1 2 . . . n 1
1 2 3 . . . 0
2 3 4 . . . 1
.
.
.
.
.
.
.
.
.
.
.
.
n 2 n 1 0 . . . n 3
n 1 0 1 . . . n 2
_
_
_
_
_
_
_
_
_
Wir k onnen dieses Quadrat auch als die Cayley-Tafel der zyklischen Gruppe der
Reste modulo n deuten; etwas allgemeiner ist die Cayley-Tafel einer beliebigen
endlichen Gruppe stets ein lateinisches Quadrat. Man kann auch jedes

lateinisch
angefangene Quadrat

lateinisch vollenden, wie der folgende Satz zeigt.


III.2 Grundbegriffe und erste Existenzaussagen 65
Satz 2.2. Sei n N, [R[ = [C[ = [S[ = n, R
0
R, und L
0
: R
0
C S so
beschaffen, da
f ur jedes r R
0
die durch c . L
0
(r, c) gegebene Abbildung C S bijektiv
und
f ur jedes c C die durch r . L
0
(r, c) gegebene Abbildung R S injektiv
ist;
L
0
heit dann ein lateinisches Rechteck. Dann gibt es zu beliebigem r
1
R R
0
eine bijektive Abbildung L : C S derart, da f ur R
1
= R
0
{r
1
] die durch
L
1
(r, c) =
_
L
0
(r, c) f ur r R
0
, c C
L(c) f ur r = r
1
, c C
gegebene Abbildung L
1
: R
1
C S wieder ein lateinisches Rechteck (also im
Falle R
1
= R ein lateinisches Quadrat) ist.
Es ist klar, wie man durch wiederholte Anwendung dieses Satzes lateinische
Quadrate aufbauen kann.
Beweis von Satz 2.2. Wir wenden den Heiratssatz II.1.1 an: C sei die Menge der
Damen, S die Menge der Herren. Ein Freundschaftssystem wird durch
F(c) = S {L
0
(r, c) [ r R
0
] (c C)
gegeben. Inder Tat gilt die Party-Bedingung: Sei ,= C
/
CundS
/
=

cC
/ F(c);
um [S
/
[ [C
/
[ nachzuweisen, bilden wir die Menge
P
/
= {(s, c) [ s S
/
, c C
/
, s F(c)].
Da f ur c C
/
stets {s [ (s, c) P
/
] = F(c) gilt, folgt [P
/
[ = [C
/
[(n [R
0
[).
Andererseits gilt f ur jedes s S
/

{c [ c C
/
, (s, c) P
/
]

{c [ c C
/
, s F(c)]

{c [ c C
/
, s , {L
0
(r, c) [ r R
0
]]

[{c [ c C, s , {L
0
(r, c) [ r R
0
]][
= n [R
0
[
(weil s in genau [R
0
[ Spalten vorkommt), woraus [P
/
[ [S
/
[(n[R
0
[) folgt. Somit
erhalten wir [C
/
[ [S
/
[, wie gew unscht. Es gen ugt nun, L als eine zum besagten
Freundschaftssystem passende Heirat zu w ahlen. 2
Die Essenz eines lateinischen Quadrates liegt nicht in den verwendeten Sym-
bolen, sondern in deren Anordnung. Deshalb treffen wir die
66 III Orthogonale lateinische Quadrate
Denition 2.3. Sei n N, [R[ = [R
/
[ = [C[ = [C
/
[ = [S[ = [S
/
[ = n; seien
: R R
/
, : C C
/
, : S S
/
Bijektionen. Ferner seien L: R C S
sowie L
/
: R
/
C
/
S
/
lateinische Quadrate, und es gelte
L(r, c) =
1
(L
/
((r), (c))) (r R, c C).
Dann heien L und L
/
aquivalent, in Zeichen L L
/
.
Man zeigt leicht, da in jeder Menge von lateinischen Quadraten eine

Aquiva-
lenzrelation ist. Weiterhin gilt das folgende, intuitiv einleuchtende Resultat, dessen
formalen Beweis wir dem Leser als

Ubung uberlassen.
Lemma 2.4. Sei n N, [R[ = [C[ = [S
1
[ = = [S
r
[ = [S
/
1
[ = = [S
/
r
[ = n
und L
j
: R C S
j
sowie L
/
j
: R C S
/
j
(j = 1, . . . , r) lateinische
Quadrate. Falls L
1
L
/
1
, . . . , L
r
L
/
r
gilt, sind folgende Aussagen aquivalent:
(1) {L
1
, . . . , L
r
] ist orthogonal
(2) {L
/
1
, . . . , L
/
r
] ist orthogonal. 2
Lemma 2.4 er offnet betr achtliche Normierungsm oglichkeiten. Sind n amlich
L
1
, . . . , L
r
: RC S paarweise orthogonale lateinische Quadrate der Ordnung
n = [R[ = [C[ = [S[, so darf man per aquivalenter Ab anderung
R = C = S = {1, . . . , n] und L
j
(1, k) = k f ur j = 1, . . . , r; k = 1, . . . , n
annehmen. Alle L
j
haben also, als Matrizen geschrieben, die erste Zeile
_
1 2 3 . . . n
_
.
Werfen wir noch einen Blick auf die Werte L
j
(2, 1) f ur j = 1, . . . , r. Sie sind
s amtlich von 1 verschieden, weil das Symbol 1 in der ersten Spalte schon als
L
j
(1, 1) vorkommt; ferner sind sie paarweise verschieden, weil im Falle j, k
{1, . . . , r], j ,= k aus L
j
(2, 1) = L
k
(2, 1) = s sofort
(L
j
(1, s), L
k
(1, s)) = (s, s) = (L
j
(2, 1), L
k
(2, 1))
folgenw urde, was mit {(L
j
(r, c), L
k
(r, c)) [ r R, c C] = SS nicht vereinbar
ist. Es kann also maximal n 1 orthogonale lateinische Quadrate der Ordnung n
geben. Daher liegt es nahe, die folgende Funktion einzuf uhren:
N(n) = max{r [ es gibt r MOLS der Ordnung n].

Ublicherweise f uhrt man noch die Konvention N(1) = ein. Mit dieser Notation
k onnen wir das eben bewiesene Ergebnis wie folgt festhalten:
III.2 Grundbegriffe und erste Existenzaussagen 67
Satz 2.5. F ur n N {1] gilt N(n) n 1. 2
Diese Absch atzung ist f ur Primzahlpotenzen n scharf, siehe

Ubung 3.11 bzw.
Satz 5.4. Das schon einleitend zitierte Ergebnis von Tarry bedeutet N(6) = 1. Nach
wie vor ist n = 6, abgesehen von Primzalpotenzen n, der einzige Wert von n, f ur
den N(n) exakt bekannt ist. Im ubrigen kennt man nur untere und obere Schranken,
die in den meisten F allen ern uchternd weit auseinanderliegen. Trotz intensiver
Forschungsanstrengungen bleibt das Verhalten der Funktion N(n) weitgehend ein
R atsel!
F ur viele Beweise ist es praktisch, unsere bisherige Darstellung orthogonaler
Mengen von lateinischen Quadraten etwas abzu andern. Dazu dient die folgende
Denition 2.6. Seien k, n N, [K[ = k, [G[ = n
2
, [S[ = n. Eine Abbildung
O : K G S heit ein orthogonales Array der Ordnung n vom Grad k bzw.
kurz ein OA(k, n), wenn f ur beliebige i, j K mit i ,= j
(2.1) {(O(i, g), O(j, g)) [ g G] = S S
gilt.
Wir werden nun alsbald zeigen, da ein orthogonales (k, n)-Array und eine
orthogonale Menge von k 2 lateinischen Quadraten zwei Arten sind, ein und
denselben Sachverhalt auszudr ucken. Vorher uberlegen wir uns aber noch f ur or-
thogonale (k, n)-Arrays gewisse M oglichkeiten der Normierung. Ganz ahnlich wie
f ur lateinische Quadrate f uhrt man auch hier einen

Aquivalenzbegriff ein: Bijektive
Ab anderungen von K, G, S machen aus einem orthogonalen (k, n)-Array wieder
ein orthogonales (k, n)-Array. Dann aber d urfen wir o.B.d.A. K = {1, . . . , k],
G = {1, . . . , n
2
] und S = {1, . . . , n] annehmen und unser orthogonales (k, n)-
Array normieren, also als eine (k n
2
)-Matrix der folgenden Form schreiben:
()
_
_
_
_
1 1 . . . 1 2 2 . . . 2 3 3 . . . 3 . . . n n . . . n
1 2 . . . n 1 2 . . . n 1 2 . . . n . . . 1 2 . . . n
_
_
_
_
.
Wennwir nunmehr eine eineindeutige Beziehungzwischenorthogonalen(k, n)-
Arrays und orthogonalen Mengen von k 2 lateinischen Quadraten der Ordnung
n herstellen, ben utzen wir die obersten beiden Zeilen eines wie oben normierten
orthogonalen Arrays sozusagen zum Indizieren von n-reihigen Matrizen, die den
restlichen k 2 Zeilen entsprechen: Die ersten n Glieder der j-ten Zeile (j > 2)
von O bilden die erste Zeile der Matrix L
j
, die n achsten n die zweite Zeile etc.
68 III Orthogonale lateinische Quadrate
Da die ersten n Glieder der j-ten Zeile von O mit den ersten n Gliedern der ersten
Zeile, also mit n Einsen, alle Paare mit erster Komponente 1 realisieren m ussen,
enth alt die erste Zeile von L
j
eine Permutation von {1, . . . , n]; ebenso schliet man
f ur die zweite Zeile von L
j
etc. Bringt man die zweite Zeile von O analog ins Spiel,
so sieht man, da auch in jeder Spalte von L
j
alle Zahlen 1, . . . , n vorkommen, da
also L
j
ein lateinisches Quadrat der Ordnung n ist. Da je zwei der Quadrate L
j
mit j > 2 orthogonal sind, folgt direkt aus der entsprechenden Eigenschaft von O.
Sind umgekehrt k 2 paarweise orthogonale lateinische Quadrate der Ordnung
n etwa gleich in der fr uher angegebenen Normierung gegeben, so verwandle
man jedes von ihnen in eine Zeile der L ange n
2
, in dem man auf die erste Zeile die
zweite Zeile folgen l at etc. Dann erg anze man die ersten beiden Zeilen so, da
man eine Matrix der Form () erh alt. Man zeigt dann leicht, da auf diese Weise
ein OA(k, n) entsteht.
Der Leser m oge als

Ubung ein exaktes

Aquivalent der soeben gemachten, ab-
sichtlich etwas intuitiv gehaltenen Ausf uhrungen unter expliziter Angabe aller vor-
kommenden Mengen und Abbildungen aufschreiben.
Wir werden sp ater noch die folgende spezielle Klasse von orthogonalen Arrays
ben otigen:
Denition 2.7. Seien k, n N, [K[ = k, [G[ = n
2
, [S[ = n und sei O : K G
S ein orthogonales (k, n)-Array. Man nennt G
0
G eine Parallelklasse (f ur O),
wenn [G
0
[ = n gilt und f ur jedes j K
{O(j, g) [ g G
0
] = S
ist, wenn also die Spalten in G
0
in jeder Zeile jedes Symbol genau einmal enthalten.
Das Array O heit au osbar, wenn es eine disjunkte Zerlegung von Gin (nat urlich
n) Parallelklassen gibt.
Normierungsbetrachtungen, wie sie uns schon gel aug sind, zeigen, da man
ein au osbares orthogonales (k, n)-Array O stets o.B.d.A. in der Form
()
_
_
_
_
1 2 . . . n 1 2 . . . n 1 2 . . . n . . . 1 2 . . . n
1 2 . . . n
1 2 . . . n
1 2 . . . n
_
_
_
_
annehmen kann. Hierbei entsprechen die Bl ocke von je n Spalten der Matrix den
Parallelklassen f ur O.
Wir zeigen nun, da ein au osbares OA(k, n) nur eine andere Blickweise auf ein
OA(k1, n) darstellt. ZumBeweis nehmen wir zun achst an, da uns ein au osbares
OA(k, n) in der Form () gegeben ist. Dann lege man eine nullte Zeile
_
1 1 . . . 1 2 2 . . . 2 3 3 . . . 3 . . . n n . . . n
_
.
III.3 Endliche K orper 69
obenauf. Das Resultat ist ein orthogonales (k 1, n)-Array in der Normierung (),
wie man leicht einsieht. Umgekehrt sei nun ein OA(k 1, n) in der Normierung
() gegeben; man lasse die oberste Zeile fort. Das Resultat ist dann offenbar ein
au osbares OA(k, n).
Wir fassen unsere

Uberlegungen zu orthogonalen Arrays zusammen:
Satz 2.8. Seien k, n N und k 3. Folgende Aussagen sind aquivalent:
(a) Es gibt k 1 orthogonale lateinische Quadrate der Ordnung n.
(b) Es gibt ein orthogonales (k 1, n)-Array.
(c) Es gibt ein au osbares orthogonales (k, n)-Array. 2
Orthogonale Arrays, wie wir sie eben eingef uhrt haben, sind nur ein Spezial-
fall eines wesentlich allgemeineren Begriffs, der in der Design-Theorie intensiv
untersucht wird. Einerseits kann man (2.1) durch die Forderung ersetzen, da die
Elementepaare in zwei verschiedenen Zeilen des Arrays jedes Element von S S
mit einer konstanten H augkeit enthalten, und andererseits kann man statt Paaren
von Zeilen auch t -Tupel von Zeilen mit t 3 betrachten und dann eine konstante
H augkeit f ur die t -Tupel in S
t
fordern; so gelangt man zum Begriff eines ortho-
gonalen Arrays der Ordnung n vom Grad k, der St arke t und dem Index . Wir
verweisen hierf ur auf die bereits zitierten B ucher Beth, Jungnickel und Lenz [1999]
sowie Hedayat, Sloane und Stuffken [1999].
3 Endliche K orper
Die endlichen K orper sind ein unentbehrliches Hilfmittel f ur die Konstruktion
orthogonaler lateinischer Quadrate und werden von uns auch sonst noch h aug
ben otigt werden, beispielsweise beim Studium von Codes, projektiven Ebenen und
Blockpl anen. In diesem kurzen Abschnitt wollen wir f ur Leser, die mit diesen
algebraischen Strukturen nicht so recht vertraut sind eine kurze Zusammenfas-
sung der wichtigsten Resultate sowie einige kleine Beispiele teils als

Ubungen
angeben. Es gibt eine ganze Reihe von Monographien uber endliche K orper; wir
verweisen beispielsweise auf L uneburg [1979], Lidl und Niederreiter [1994,1996]
sowie auf Jungnickel [1993]. Eine besonders elementare Einf uhrung in die Theorie
der endlichen K orper ndet sich im Buch von McEliece [1987].
Es geh ort zur Allgemeinbildung, da man den folgenden Satz kennt:
Satz 3.1. Ist K ein endlicher K orper, so ist [K[ eine Potenz q = p
a
einer Primzahl
p, der Charakteristik von K. Zu jeder Primzahlpotenz q gibt es einen bis auf
Isomorphie eindeutig bestimmten K orper K = GF(q) mit q Elementen. 2
70 III Orthogonale lateinische Quadrate

Ubung 3.2. Man zeige, da in der Menge {a, b] (mit a ,= b) durch die Ver-
kn upfungstafeln
+ a b
a a b
b b a
a b
a a a
b a b
eine Addition + und eine Multiplikation derart erkl art sind, da {a, b] ein K orper
wird.

Ublicher ist es allerdings, die Elemente mit 0, 1 statt a, b zu bezeichnen: 0
ist dann die K orper-Null, 1 die K orper-Eins von GF(2).

Ubung 3.3. Seien a, b, c, d paarweise verschieden. Man zeige: die partiellen Ver-
kn upfungstafeln
+ a b c d
a a b
b b a
c
d
a b c d
a a a
b a b
c
d
lassen sich auf genau eine Weise derart erg anzen, da {a, b, c, d] ein endlicher
K orper wird.
Die beiden vorstehenden

Ubungen machen mit GF(2) bzw. mit GF(2
2
) =
GF(4) bekannt. Wie kann man nun allgemein GF(q) konstruieren? F ur Primzahlen
p kennen wir GF(p) bereits: Hier erhalten wir (wegen der Eindeutigkeit bis auf
Isomorphie) als kanonisches Beispiel den K orper Z
p
der Reste modulo p. F ur
echte Primzahlpotenzen q = p
a
ist Z
q
nat urlich kein K orper, da beispielsweise
das Element p nicht invertierbar, sondern ein Nullteiler ist. In der Algebra lernt
man, da man f ur q = p
a
mit a > 1 den K orper GF(q) als
Z
p
[x]/(f )
konstruieren kann, wobei f ein irreduzibles Polynom vom Grad a uber Z
p
ist.
1
Beweise hierf ur ndet man in den bereits erw ahnten B uchern; wir geben hier als
Beispiel die Konstruktion von GF(8) an.
Beispiel 3.4. Das Polynom f (x) = x
3
x 1 hat uber Z
2
keine Nullstelle und
ist als Polynom vom Grad 3 somit irreduzibel. Daher k onnen wir K = GF(8)

=
1
Eine formale Denition von Polynomen und damit zusammenh angenden Begriffen werden wir in
VIII.5 geben.
III.3 Endliche K orper 71
Z
2
[x]/(f ) konstruieren, indem wir zu Z
2
eine Nullstelle von f adjungieren. Die
Elemente von K sind also 0, 1, ,
2
sowie

3
= 1,

4
=
2
,

5
=
3

2
=
2
1,

6
=
3

2
=
2
1.
Man beachte, da in der Tat
7
=
3
= 1 gilt und da die Potenzen 1 =
0
,
und
2
eine Basis von GF(8) als Vektorraum uber Z
2
bilden.
Allgemeiner gilt folgendes: Wenn man zu Z
p
eine Nullstelle eines irredu-
ziblen Polynoms f vom Grade a adjungiert, so erh alt man K = GF(p
a
); dabei
bilden 1, , . . . ,
a1
eine Basis von K als Vektorraum uber Z
p
. Im allgemei-
nen gilt jedoch nicht, da die Potenzen von s amtliche Elemente von K liefern
m ussen. Jedoch kann man zeigen, da es wie in unserem Beispiel 3.4 stets
ein geeignetes irreduzibles Polynom gibt, f ur welches dies in der Tat der Fall ist.
Derartige irreduzible Polynome heien primitiv; ihre Existenz ist gleichbedeutend
mit dem folgenden grundlegenden Satz uber die Struktur endlicher K orper, wobei
wir GF(q)

= GF(q) {0] schreiben.


Satz 3.5. Die multiplikative Gruppe (GF(q)

, ) eines endlichen K orpers GF(q)


ist stets zyklisch. 2
Jedes erzeugende Element der zyklischen Gruppe GF(q)

heit ein primitives


Element f ur GF(q). Die primitiven Elemente von GF(q) sind f ur q = p
a
gerade
die Nullstellenprimitiver Polynome vomGrada uber Z
p
. Tabellenirreduzibler bzw.
primitiver Polynome f ur kleinere Werte von q ndet man bei Lidl und Niederreiter
[1996].

Ubung 3.6. Man nde (durch Probieren) ein primitives Polynom vom Grad 2
uber Z
3
, konstruiere mit seiner Hilfe den K orper K = GF(9) und gebe s amtli-
che Elemente von K explizit als Potenzen eines primitiven Elementes an. Ebenso
f ur GF(16).
Schlielich geben wir noch zwei weitere grundlegende Strukturs atze an, die die
m oglichen Teilk orper und die Automorphismen endlicher K orper beschreiben. Da-
bei ist ein Automorphismus von K = GF(q) nat urlich eine Bijektion, die Addition
und Multiplikation respektiert. Klar ist auch, da jeder Teilk orper von K dieselbe
Charakteristik p haben mu, wie unmittelbar aus Satz 3.1 folgt.
72 III Orthogonale lateinische Quadrate
Satz 3.7. Der endliche K orper GF(p
a
) enth alt genau dann einen zu GF(p
b
) iso-
morphen Teilk orper, wenn b ein Teiler von a ist. 2
Anders ausgedr uckt bedeutet Satz 3.7, da der Teilk orperverband von GF(q
a
)
zum Teilerverband von a isomorph ist.
Satz 3.8. Die Automorphismengruppe von GF(p
a
) ist zyklisch von der Ordnung
a und wird vom Frobeniusautomorphismus : x . x
p
erzeugt. 2

Ubung 3.9. Insbesondere besagt Satz 3.8, da f ur endliche K orper der Charakte-
ristik p der

Sch ulertraum (a b)
p
= a
p
b
p
Realit at ist. Man beweise diese
Aussage mithilfe des binomischen Satzes I.2.6.

Ubung 3.10. Wir bezeichnen die Menge aller Quadrate x


2
mit x GF(q)

mit
GF(q)
2
. Wie Satz 3.8zeigt, gilt GF(q)
2
= GF(q)

, falls q gerade ist. F ur ungerade


q beweise man, da GF(q)
2
eine Untergruppe der Ordnung (q 1)/2 von GF(q)

ist und da 1 genau dann ein Quadrat ist, wenn q 1 (mod 4) gilt.
Dies schliet unsere kurze Einf uhrung uber endliche K orper ab. Die folgen-
de

Ubung gibt eine erste Anwendung auf lateinische Quadrate; sie zeigt, da die
Absch atzung aus Satz 2.5 f ur Primzahlpotenzen n scharf ist. Im ubern achsten Ab-
schnitt werden wir hierf ur einen Alternativbeweis angeben, siehe Satz 5.4.

Ubung 3.11. Sei q eine Primzahlpotenz und R = C = S = GF(q) der endliche


K orper mit q Elementen. Wir verwenden die multiplikative Gruppe GF(q)

zum
Indizieren und setzen
L
j
(r, c) = rj c (j GF(q)

; r, c GF(q)).
Man zeige, da sich so q 1 paarweise orthogonale lateinische Quadrate der
Ordnung q ergeben.
4 Der Satz von MacNeish
F ur den Nachweis von Existenzaussagen uber orthogonale lateinische Quadrate
bedient man sich einer Mischung von direkten und rekursiven Konstruktionsme-
thoden. In diesem Abschnitt stellen wir die einfachste rekursive Konstruktion vor,
wobei wir uns der Sprache der orthogonalen Arrays bedienen werden. Der Beweis
des folgenden Satzes ist eine einfache

Ubungsaufgabe, die wir dem Leser uberlas-
sen.
III.4 Der Satz von MacNeish 73
Satz 4.1. Seien k, m, n N, [K[ = k, [G[ = m
2
, [H[ = n
2
, [S[ = m, [T [ =
n. Ferner sei P : K G S ein orthogonales Array f ur K, G, S und Q ein
ebensolches f ur K, H, T . Dann ist durch
O(j, (g, h)) = (P(j, g), Q(j, h)) (j K, g G, h H)
ein orthogonales Array O f ur K, GH und S T gegeben. 2
Korollar 4.2. Seien k, m, n N. Gibt es ein orthogonales (k, m)-Array und ein
orthogonales (k, n)-Array, so existiert auch ein orthogonales (k, mn)-Array. 2
Als weitere Folgerung erhalten wir den Satz von MacNeish [1922]:
Satz 4.3 (MacNeish-Schranke). Ist n N, und ist n = p
s
1
1
. . . p
s
m
m
die Primfaktor-
zerlegung von n, so gilt
N(n) min{p
s
1
1
1, . . . , p
s
m
m
1].
Beweis. Nach

Ubung 3.11 bzw. Satz 5.4 gibt es f ur i = 1, . . . , m eine (p
s
i
i
1)-
elementige orthogonale Menge von lateinischen Quadraten der Ordnung p
s
i
i
bzw.
ein orthogonales (p
s
i
i
1, p
s
i
i
)-Array. Aus jedem dieser orthogonalen Arrays darf
man einige Zeilen weglassen und auf dieseWeise f ur k = min{p
s
1
1
1, . . . , p
s
m
m
1]
orthogonale (k, p
s
j
j
)-Arrays (j = 1, . . . , m) herstellen. Nach Korollar 4.2 gibt es
dann auch ein orthogonales (k, p
s
1
1
. . . p
s
m
m
)-Array, also ein orthogonales (k, n)-
Array, d. h. eine orthogonale Menge von k 2 = min{p
s
1
1
1, . . . , p
s
m
m
1]
lateinischen Quadraten. 2
Aus dem Satz von MacNeish folgern wir sofort: Kommt in der Primfaktorzer-
legung n = p
s
1
1
. . . p
s
m
m
von n der Faktor 2 entweder gar nicht oder mindestens in
zweiter Potenz vor, womit also min{p
s
1
1
1, . . . , p
s
m
m
] 2 gilt, so ist N(n) 2.
Es gilt also:
Korollar 4.4. Sei n N. Wenn n nicht von der Form n = 4m 2 ist, gibt es ein
Paar orthogonaler lateinischer Quadrate. 2
F ur die Frage nach der Existenz von Paaren orthogonaler lateinischer Quadrate
sind somit nur die Ordnungen der Form 4m 2, d. h. 6, 10, 14, . . . kritisch, weil
hier der Satz von MacNeish kein Ergebnis liefert. Im Rest dieses Kapitels wird es
also vor allem um diese kritischen F alle gehen.
74 III Orthogonale lateinische Quadrate
5 Differenzmatrizen
In diesemAbschnitt stellen wir einige besonders wichtige Konstruktionen vor, die
sogenannte

Differenzmethoden verwenden. Dazu sei im folgenden G stets ei-


ne endliche, additiv geschriebene Gruppe; der Einfachheit halber setzen wir G
als abelsch voraus, um nicht auf die Additionsreihenfolge achten zu m ussen, ob-
wohl s amtliche Konstruktionen auch auf nicht-abelsche Gruppen ubertragen wer-
den k onnen. In nahezu allen wichtigen Anwendungen die man in groer Zahl
zusammen mit weiteren Varianten der hier vorgestellten Methoden bei Beth, Jung-
nickel und Lenz [1999] ndet ist G in der Tat abelsch. Wir beginnen mit einer
direkten Konstruktion.
Denition 5.1. Sei D = (d
ij
) (i = 1, . . . , k; j = 1, . . . , n) eine Matrix mit
Eintr agenaus einer abelschenGruppe Gder Ordnungn, die die folgende Bedingung
erf ullt:
(5.1) {d
ih
d
jh
[ h = 1, . . . , n] = G (i, j = 1, . . . , k, i ,= j),
d. h., jedes Element von G tritt f ur i ,= j genau einmal als Differenz der Form
d
ih
d
jh
auf. Dann heit D eine (n, k)-Differenzmatrix uber G.
Differenzmatrizen wurden von Bose und Bush [1952] f ur die Konstruktion or-
thogonaler lateinischer Quadrate eingef uhrt; dieser Ansatz ist jedoch zur Konstruk-
tion mittels

Orthomorphismen einer Gruppe, die bereits von Mann [1942,1943]


stammt, aquivalent. Der Term

Differenzmatrix wurde von Jungnickel [1980] ge-


pr agt, der diejenigen Mengen von orthogonalen lateinischen Quadraten, die zu Dif-
ferenzmatrizen geh oren, charakterisiert hat; interessanterweise erf ullt diese Klasse
die Eulersche Vermutung, siehe

Ubung 5.5. Doch zun achst zur Konstruktionsme-
thode:
Satz 5.2. Die Existenz einer (n, k)-Differenzmatrix D uber einer abelschenGruppe
G impliziert N(n) k 1.
Beweis. Wir listen die Elemente von G als g
1
= 0, g
2
, . . . , g
n
auf und denieren
die (k n
2
)-Matrix O wie folgt:
O = ( D D g
2
. . . D g
n
),
wobei die Matrix D g
h
aus D durch Addition von g
h
zu jedem Eintrag von
D hervorgehe. Wir behaupten, da O ein au osbares orthogonales (k, n)-Array
f ur die Symbolmenge G ist. Die Au osbarkeit folgt dabei unmittelbar aus der
III.5 Differenzmatrizen 75
Konstruktion: Da f ur beliebiges x die Elemente x g
1
, . . . , x g
n
die gesamte
Gruppe G durchlaufen, denieren die Mengen
I
h
= {h, n h, . . . , (n 1)n h] (h {1, . . . , n])
von Spaltenindizes offenbar n Parallelklassen f ur O. Nun seien also zwei verschie-
dene Zeilen von O gegeben, etwa die Zeilen i und j. Aufgrund der denierenden
Eigenschaft (5.1) einer Differenzmatrix gibt es dann f ur jedes Symbol g G ge-
nau einen Index h {1, . . . , n] mit d
ih
= d
jh
g. Dann durchlaufen aber die
entsprechenden n Paare in der zu I
h
geh orenden Parallelklasse, n amlich
_
d
jh
g
d
jh
_
,
_
d
jh
g g
2
d
jh
g
2
_
, . . . ,
_
d
jh
g g
n
d
jh
g
n
_
,
gerade alle n Paare in G G der Form
_
g
/
g
g
/
_
. Die Behauptung folgt somit aus
Satz 2.8. 2
Satz 5.2 gestattet uns nun einen einfachen Beweis des bereits in

Ubung 3.11
angegebenen Resultates. Zuvor aber noch zwei konkrete Beispiele:
Beispiel 5.3. Die Matrix
_
_
_
_
_
_
_
_
00 00 00 00 00 00 00 00 00 00 00 00
00 01 02 03 04 05 10 11 12 13 14 15
00 03 10 01 13 15 02 12 05 04 11 14
00 12 01 15 05 13 03 14 02 11 10 04
00 04 15 14 02 11 12 10 13 01 03 05
00 10 12 02 11 01 13 15 04 14 05 03
_
_
_
_
_
_
_
_
ist eine (12,6)-Differenzmatrix uber der Gruppe G = Z
2
Z
6
, wobei wir die
Elemente von Gkurz in der Formxy statt (x, y) geschrieben haben. Das folgt durch
einfaches (wenn auch l angliches) Nachrechnen. Ebenso ist die Matrix
D = ( A A 0) mit
A =
_
_
_
_
_
_
0 0 0 0 0 0 0
1 2 3 4 5 6 7
2 5 7 9 12 4 1
6 3 14 10 7 13 4
10 6 1 11 2 7 12
_
_
_
_
_
_
eine (15,5)-Differenzmatrix uber Z
15
. Diese beiden Beispiele stammen von John-
son, Dulmage und Mendelsohn [1961] bwz. Schellenberg, van Rees und Vanstone
[1978] und zeigen mit Satz 5.2 die folgenden Schranken:
(5.2) N(12) 5, N(15) 4.
76 III Orthogonale lateinische Quadrate
Satz 5.4. F ur jede Primzahlpotenz q gilt
(5.3) N(q) = q 1.
Beweis. Die Multiplikationstafel D = (d
x,z
) mit d
x,z
= x z (x, z GF(q)) des
endlichen K orpers K = GF(q) ist eine (q, q)-Differenzmatrix uber der additiven
Gruppe (K, ), wie unmittelbar aus der G ultigkeit des Distributivgesetzes folgt:
{d
x,z
d
y,z
[ z K] = {xz yz [ z K]) = {(x y)z [ z K]) = K
f ur alle x, y K mit x ,= y. Die Behauptung ergibt sich somit aus den S atzen 5.2
und 2.5. 2
Die folgende

Ubung ist zu einem Spezialfall eines Ergebnisses von Hall und
Paige [1955] aquivalent. In der von uns angegebenen Form ndet man sie bei
Jungnickel [1980].

Ubung 5.5. Man zeige, da es keine (n, 3)-Differenzmatrix geben kann, falls n die
Form n = 4t 2 hat.
Hinweis: Man schreibe die Gruppe G in der Form G = Z
2
H und betrachte die
Verteilung der Elemente (bzw. Differenzen) mit erster Koordinate 0 bzw. 1 in einer
hypothetischen (n, 2)-Differenzmatrix D; dabei kann man annehmen, da die erste
Zeile von D nur Eintr age 0 hat.
Auch die folgendeVerallgemeinerung von Denition 5.1, die auf Wilson [1974]
zur uckgeht, ist sehr n utzlich. Sie wird uns eine rekursive Konstruktionsmethode
gestatten, die ahnlich wie Satz 5.2 funktioniert.
Denition 5.6. Sei D = (d
ij
) (i = 1, . . . , k; j = 1, . . . , n 2u) eine Matrix,
deren Eintr age entweder aus einer abelschen Gruppe G der Ordnung n stammen
oder

leer sind; leere Eintr age werden dabei ublicherweise mit bezeichnet. Dann
heit D eine (n, u; k)-Quasi-Differenzmatrix uber G, wenn die beiden folgenden
Bedingungen erf ullt sind:
(a) Jede Zeile von D enth alt genau u leere Eintr age, und in jeder Spalte von D
gibt es h ochstens einen leeren Eintrag.
(b) Wenn man Differenzen, bei denen ein leerer Eintrag vorkommt, nicht ber uck-
sichtigt, gilt
{d
ih
d
jh
[ h = 1, . . . , n 2u] = G (i, j = 1, . . . , k, i ,= j).
Satz 5.7. Falls es eine (n, u; k)-Quasi-Differenzmatrix D uber einer abelschen
Gruppe G und ein orthogonales (k, u)-Array gibt, gilt N(n u) k 2.
III.5 Differenzmatrizen 77
Beweis. Zun achst ersetzen wir in jeder Zeile von D die u leeren Eintr age so durch
u Symbole
1
, . . . ,
u
, die nicht aus G stammen, da jedes dieser Symbole genau
einmal auftritt. Dann gehen wir analog zum Beweis von Satz 5.2 vor: Wir listen die
Elemente von G als g
1
= 0, g
2
, . . . , g
n
auf und denieren die (k n(n 2u))-
Matrix M wie folgt:
M = ( D D g
2
. . . D g
n
),
wobei die Summe eines Symbols
i
mit einem Gruppenelement g stets wieder

i
sei. Schlielich f ugen wir an M noch die u
2
Spalten eines OA(k, u) auf der
Symbolmenge = {
1
, . . . ,
u
] an. Dann ist die so denierte (k (n u)
2
)-
Matrix O ein orthogonales (k, n u)-Array uber der Symbolmenge G , wie
man analog zum Beweis von Satz 5.2 zeigen kann. Die Einzelheiten seien dem
Leser als

Ubung uberlassen. 2
ImFall u = 1 ist Satz 5.7 nat urlich keine rekursive, sondern eine weitere direkte
Konstruktionsmethode. Die beiden folgenden Beispiele, die Bose, Shrikhande und
Parker [1960] bzw. Todorov [1986] zu verdanken sind, widerlegen zusammen mit
Satz 5.7 die Eulersche Vermutung in zwei F allen. Genauer gesagt zeigen sie
(5.4) N(10) 2, N(14) 3.
Beispiel 5.8. Die Matrix
_
_
_
_
0 1 6 0 2 5 0 3 4 0
0 6 1 0 5 2 0 4 3 0
1 6 0 2 5 0 3 4 0 0
6 1 0 5 2 0 4 3 0 0
_
_
_
_
ist eine (7,3;4)-Quasi-Differenzmatrix uber der Gruppe G = Z
7
; das folgt wieder
durch einfaches Nachrechnen. Ebenso ist die Matrix
_
_
_
_
_
_
0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 1 3 2 4 5 6 7 8 9 10 11 12
0 0 2 12 10 7 9 5 4 1 11 8 3 6
0 1 2 9 5 3 12 7 11 0 4 6 8 10
0 3 12 9 6 2 7 11 1 5 10 0 4 8
_
_
_
_
_
_
.
eine (13,1;5)-Quasi-Differenzmatrix uber Z
13
.
Zahlreiche weitere Beispiele von (Quasi-)Differenzmatrizen sowie einige wei-
tere Konstruktionen mit Differenzmethoden ndet man bei Beth, Jungnickel und
Lenz [1999]. Ausf uhrliche Existenzresultate f ur Differenzmatrizen und orthogonale
78 III Orthogonale lateinische Quadrate
lateinische Quadrate (bis zur Ordnung 10.000) stehen in den entsprechenden Ab-
schnitten des CRC handbook of combinatorial designs, siehe Colbourn und Dinitz
[1996], einer extensiven und extrem n utzlichen Sammlung von Existenzresultaten
(meist in tabellarischer Form) in der Design-Theorie.
6 Widerlegung der Eulerschen Vermutung
F ur die vollst andige Widerlegung der Eulerschen Vermutung wird folgendes Lem-
ma von Dijen Ray-Chaudhuri von entscheidender Bedeutung sein.
Lemma 6.1. Seien k, t, m, u N und u t . Es gebe
(a) ein au osbares orthogonales (k, t )-Array,
(b) ein orthogonales (k, m)-Array,
(c) ein orthogonales (k, m1)-Array,
(d) ein orthogonales (k, u)-Array.
Dann gibt es auch ein orthogonales (k, mt u)-Array.
Beweis. Sei K eine k-Menge. Nach Voraussetzung existieren die folgenden ortho-
gonalen Arrays:
(a) Seien [S
1
[ = t , [G
1
[ = t
2
, sowie O
1
: K G
1
S
1
ein au osbares OA(k, t ).
Ferner sei G
1
= G
1
1
G
t
1
eine disjunkte Zerlegung von G
1
in t Paral-
lelklassen mit [G
1
1
[ = = [G
t
1
[ = t . Wir setzen
G
/
1
= G
u1
1
G
t
1
,
so da [G
/
1
[ = (t u)t gilt.
(b) Seien [S
2
[ = m, [G
2
[ = m
2
und O
2
: K G
2
S
2
ein OA(k, m).
(c) Seien [S
3
[ = m1, [G
3
[ = (m1)
2
und O
3
: KG
3
S
3
ein OA(k, m1).
Dabei k onnen wir o.B.d.A. S
3
= S
2
{] mit einem , S
2
annehmen, ein

/
G
3
w ahlen und G
/
3
= G
3
{
/
] setzen sowie schlielich O
3
(j,
/
) =
f ur alle j K annehmen. Als Matrix interpretiert, kann man O
3
also so
schreiben, da in der letzten Spalte nur Eintr age auftreten. Insbesondere gilt
[G
/
3
[ = m
2
2m.
(d) Seien S
4
= {
1
, . . . ,
u
] mit paarweise verschiedenen
1
, . . . ,
u
, [G
4
[ = u
2
und O
4
: K G
4
S
4
ein OA(k, u).
Bei alledemnehmen wir S
1
, S
3
, S
1
S
2
, S
4
, G
1
, G
2
, G
3
, G
1
G
3
, G
4
als paarweise
disjunkt an. Aus all diesen Daten konstruieren wir nun wie folgt ein OA(k, mt u)
III.6 Widerlegung der Eulerschen Vermutung 79
mit der Symbolmenge S = (S
1
S
2
) S
4
; es gilt dann jedenfalls [S[ = mt u.
Wir setzen
G = (G
/
1
G
2
) G
4

u
_
=1
(G

1
G
/
3
).
Das liefert [G[ = (t u)t m
2
u
2
ut (m
2
2m) = (mt u)
2
, wie ben otigt.
Schlielich setzen wir f ur j K
O(j, g) =
_

_
(O
1
(j, f ), O
2
(j, h)) f ur g = (f, h) G
/
1
G
2
O
4
(j, g) f ur g G
4
(O
1
(j, f ), O
3
(j, h)) f ur g = (f, h)

u
=1
(G

1
G
/
3
)
und O
3
(j, h) ,=

f ur g = (f, h) G

1
G
/
3
und O
3
(j, h) = ( = 1, . . . , u)
Somit ist O eine Abbildung K G S: Es gilt (O
1
(j, g), O
2
(j, h)) S
1
S
2
,
O
4
(j, g) S
4
, (O
1
(j, f ), O
3
(j, h)) S
1
S
2
, solange O
3
(j, h) ,= bleibt;
schlielich ist stets

S
4
. Um zu zeigen, da O ein OA(k, mt u) ist, m ussen
wir nun i, j K mit i ,= j w ahlen und uberpr ufen, da s amtliche Paare aus
S S zustandekommen, wenn man (O(i, g), O(j, g)) f ur alle g G bildet. Dazu
zerlegen wir S S als
S S = [(S
1
S
2
) (S
1
S
2
)] [(S
1
S
2
) S
4
]
[S
4
(S
1
S
2
)] [S
4
S
4
]
und unterscheiden entsprechend vier F alle.
Sei zun achst ((s
1
, s
2
), (s
/
1
, s
/
2
)) (S
1
S
2
)(S
1
S
2
) gegeben. Wir bestimmen
f G
1
und h G
2
derart, da O
1
(i, f ) = s
1
, O
1
(j, f ) = s
/
1
, O
2
(i, h) = s
2
und
O
2
(j, h) = s
/
2
gelten. Es ergeben sich zwei M oglichkeiten:
f G
/
1
; dann w ahlen wir g = (f, h) G
/
1
G
2
und erhalten wie gew unscht
(O(i, g), O(j, g)) = ((s
1
, s
2
), (s
/
1
, s
/
2
)).
f G

1
mit u. Dann ersetzen wir h durch das eindeutig bestimmte
h G
/
3
mit O
3
(i, h) = s
2
und O
3
(j, h) = s
/
2
, setzen g = (f, h) und
erhalten g G

1
G
/
3
(man beachte h ,=
/
wegen O
3
(i,
/
) = ,= s
2
)
sowie (O(i, g), O(j, g)) = ((s
1
, s
2
), (s
/
1
, s
/
2
)), wie gew unscht.
Als n achstes sei ((s
1
, s
2
),

) (S
1
S
2
)S
4
gegeben. Wir bestimmen f G

1
mit O
1
(i, f ) = s
1
(das geht, weil G

1
eine Parallelklasse f ur O
1
ist) und h G
3
mit O
3
(i, h) = s
2
, O
3
(j, h) = . Wegen O
3
(i,
/
) = ist h ,=
/
, also h G
/
3
.
80 III Orthogonale lateinische Quadrate
Wir setzen g = (f, h) und haben dann g G

1
G
/
3
sowie (O(i, g), O(j, g)) =
((s
1
, s
2
),

). Ganz analog argumentiert man auch im Fall (

, (s
/
1
, s
/
2
)) S
4

(S
1
S
2
).
Schlielich sei (

) S
4
S
4
gegeben. Hier w ahlt man g G
4
mit
O
4
(i, g) =

, O
4
(j, g) =

.
Wir haben nun insgesamt
{(O(i, g), O(j, g)) [ g G] S S
nachgewiesen; aus Anzahlgr unden mu dabei Gleichheit gelten, womit O in der
Tat ein orthogonales Array ist. 2
Korollar 6.2. F ur m, t, u N mit u t gilt
N(mt u) min{N(m), N(m1), N(t ) 1, N(u)].
Beweis. Wir nennen die rechte Seite dieser Ungleichung a. Wegen N(t ) a 1
gibt es nach Satz 2.8 ein au osbares OA(a 2, t ). Ferner existieren orthogonale
(a 2, m)-, (a 2, m1)- und (a 2, u)-Arrays. Nach Lemma 6.1 gibt es daher
auch ein OA(a 2, mt u). 2
Es gibt inzwischen etliche Verallgemeinerungen und Verst arkungen von Lem-
ma 6.1 (und entprechende Korollare, die st arker als 6.2 sind), von denen die Kon-
struktionen von Wilson [1974a] und Brouwer und van Rees [1982] besonders wich-
tig sind; das ziemlich komplizierte Resultat von Wilson ndet man auch bei Beth,
Jungnickel und Lenz [1999, Theorem X.3.1]. F ur die Widerlegung der Eulerschen
Vermutung reicht jedoch das von uns angegebene, einfachere Lemma von Ray-
Chaudhuri bzw. sein Korollar 6.2 aus.
Satz 6.3. Ist n N {2, 6], so gilt N(n) 2, d. h., es gibt mindestens ein Paar
von orthogonalen lateinischen Quadraten der Ordnung n.
Beweis. Aufgrund von Korollar 4.4 und (5.4) sind nur noch die F alle n = 24m
18 zu erledigen. F ur n 30, also n {18, 22, 26, 30], verwenden wir Korollar 6.2
gem a der folgenden Tabelle; der Leser m oge sich dabei davon uberzeugen, da
die ben otigten Ingredienzen in der Tat existieren.
m 3 3 3 3
t 5 7 7 9
u 3 1 5 3
n = mt u 18 22 26 30
III.6 Widerlegung der Eulerschen Vermutung 81
Ab jetzt sei also n = 4m 2 34. Unter sechs aufeinanderfolgenden ungeraden
Zahlen gibt es stets mindestens eine, die durch 3, aber nicht durch 9 teilbar ist, wie
sich der Leser als

Ubung klarmachen m oge. Unter den sechs ungeraden Zahlen
n1, n3, . . . , n11 sei nun etwa nu durch 3, aber nicht durch 9 teilbar. Man
kann also n = 3t u mit einem nicht durch 3 teilbaren t und u {1, 3, 5, 7, 9, 11]
schreiben. Da n gerade ist, mu dabei t ungerade sein. Modulo 6 gibt es somit nur
die M oglichkeiten
t 1 mod 6 und t 5 mod 6.
Der kleinste Primteiler von t ist also 5, womit N(t ) 4, also N(t ) 1 3 gilt.
Wegen n 34 folgt noch t > 7. Hier fallen aber die M oglichkeiten t = 8, 9, 10
aus, also ist t 11 u. Nun k onnen wir wieder Korollar 6.2 anwenden und sind
fertig. 2
Chowla, Erd os und Straus [1960] haben gezeigt, da N(n) f ur n
gilt; einen Beweis hierf ur ndet man auch bei Beth, Jungnickel und Lenz [1999,
X.5]. Die beste derzeit bekannte explizite Absch atzung garantiert
(6.1) N(n) n

mit =
1
14,8
f ur alle hinreichend groen Werte von n; sie stammt von Beth [1983].
Aufgrund dieser Ergebnisse kann man n
r
als die gr ote nat urliche Zahl mit
N(n
r
) < r denieren, f ur die N(n) r f ur alle n > n
r
gilt. Derzeit kennt man
die folgenden oberen Schranken f ur die n
r
, die wir Colbourn und Dinitz [1996]
entnommen haben; f ur r 6 sind diese Resultate auch bei Beth, Jungnickel und
Lenz [1999] bewiesen.
r n
r
r n
r
r n
r
r n
r
r n
r
2 6 3 10 4 22 5 62 6 75
7 780 8 2774 9 3678 10 5804 11 7222
12 7286 13 7288 14 7874 15 8360 30 52502
Abschlieend erw ahnen wir noch ein Resultat von Chang [1996], der die fol-
gende allgemeine obere Schranke f ur die Werte n
r
bewiesen hat:
(6.2) n
r
< 2
4r3
(r 1) f ur alle r 2.
82 III Orthogonale lateinische Quadrate
7 Eine Anwendung: Authentikationscodes
Zum Abschlu dieses Kapitels wollen wir eine Anwendung in der Kryptographie
betrachten, n amlich

Authentikationscodes. Die Kryptographie ist diejenige ma-


thematische Disziplin, die sich im weitesten Sinne mit Fragen der Datensi-
cherheit besch aftigt; uber Jahrhunderte bedeutete dies nichts anderes als die gehei-
me

Ubertragung von Nachrichten. Popul are Einf uhrungen in die Kryptographie,
die auch im Alltag immer wichtiger wird (Schlagworte: Electronic Banking und
e-Commerce!), und ihre faszinierende Geschichte ndet man beispielsweise bei
Bauer [1995], Beutelspacher [1987] und Singh [1999]; unter den mathematischen
Darstellungen seien besonders van Tilborg [2000] und Stinson [2001] empfohlen.
Eine sehr empfehlenswerte Sammlung von

Ubersichtsartikeln wurde von Simmons
[1992a] herausgegeben; schlielich sei noch Menezes, van Oorschot und Vanstone
[1997] erw ahnt, eine anwendungsorientierte, enzyklop adische

Ubersicht.
Heutzutage stehen f ur viele Anwendungen insbesondere in der Wirtschaft
andere Aspekte als in der klassischen, milit arisch orientierten Kryptographie
im Vordergrund: H aug geht es nicht darum, Daten geheimzuhalten, sondern ih-
re Authentizit at zu garantieren. Der Empf anger einer Nachricht m ochte sicher sein
k onnen, da die ubertragenen Daten nicht auf demWege vomAbsender zu ihmma-
nipuliert wurden (Datenintegrit at) und da der vorgebliche Absender tats achlich
der Urheber der Nachricht ist (Datenauthentizit at). Daher hat man zwei m ogliche
Angriffe abzuwehren: Ein Angreifer soll weder eigene Daten unter fremdem Na-
men senden k onnen (Impersonation) noch von einemanderenAbsender geschickte
Daten unbemerkt manipulieren k onnen (Substitution). Zu diesem Zweck h angt der
Absender ublicherweise einen

Authentikator an die eigentliche Nachricht an, der


von einem nur ihm und dem Empf anger bekannten gemeinsamen

Schl ussel so-


wie den zu ubermittelnden Daten abh angt; die Integrit at der Nachricht und die
Authentizit at des Urhebers werden genau dann vom Empf anger akzeptiert, wenn
der Authentikator korrekt ist. Diese Idee l at sich wie folgt formalisieren:
Denition 7.1. Ein Authentikationscode (auch kurz MAC f ur

message authen-
tication code) ist ein Quadrupel (S, A, K, E), wobei
S eine endliche Menge m oglicher Datens atze (

source states)
Aeine endliche Menge m oglicher Authentikatoren (

authentication tags)
K eine endliche Menge m oglicher Schl ussel (

keys)
e
K
E f ur jedes K K eine Authentikationsfunktion (

authentication
rule) e
K
: S A
ist.

Ubermittelt werden dann Nachrichten m = (s, a) M = S A, also Da-
tens atze mit einem angeh angten Authentikator. Sender und Empf anger m ussen
III.7 Eine Anwendung: Authentikationscodes 83
sich im Voraus auf einen gemeinsamen (geheimen) Schl ussel K K einigen;
der Empf anger akzeptiert dann die Integrit at der erhaltenen Nachricht m = (s, a)
und die Authentizit at des Absenders, wenn und nur wenn a = e
K
(s) gilt. Jeder
Schl ussel sollte dabei nur einmal verwendet werden.
2
Zur Analyse der Qualit at eines Authentikationscodes f uhren wir noch zwei No-
tationen ein: p
I
bezeichne die Wahrscheinlichkeit f ur einen erfolgreichen Imperso-
nationsangriff und p
S
die Wahrscheinlichkeit f ur eine erfolgreiche Substitutionsat-
tacke. Wir setzen dabei voraus, da alle Schl ussel mit konstanter Wahrscheinlichkeit
1/k gew ahlt werden, wobei k = [K[ sei; dagegen werden keine Annahmen uber
die Wahrscheinlichkeitsverteilung der Datens atze gemacht. Im ubrigen geht man
wie stets in der Kryptographie davon aus, da der Gegner das ben utzte System
kennt, inklusive der Wahrscheinlichkeitsverteilungen (Kerkhoffsches Prinzip); nur
der verwendete Schl ussel (der ja geheimgehalten wird) sei ihm unbekannt.
Es ist nun klar, da ein Angreifer mit einer gewissen Wahrscheinlichkeit er-
folgreich sein wird. So kann er beispielsweise den verwendeten Schl ussel K K
erraten und dann (mit seiner Kenntnis des Systems) zu einem beliebigen Datensatz
s S den Authentikator a = e
K
(s) berechnen. Der Gegner kann also sicher-
lich mindestens mit Wahrscheinlichkeit 1/k betr ugen, da wir ja alle Schl ussel als
gleich wahrscheinlich voraussetzen. Wie der folgende fundamentale Satz von Gil-
bert, MacWilliams und Sloane [1974] zeigt, gibt es allerdings bei vollst andiger
Kenntnis des Systems noch wesentlich vielversprechendere Angriffsstrategien:
Satz 7.2. F ur jeden Authentikationscode (S, A, K, E) mit k gleich wahrscheinli-
chen Schl usseln kann ein Angreifer mindestens mit Wahrscheinlichkeit 1/

k be-
tr ugen; es gilt also
(7.1) max(p
I
, p
S
) 1/

k.
Beweis. Angenommen, die Erfolgswahrscheinlichkeit max(p
I
, p
S
) f ur einen opti-
mal agierenden Angreifer ist 1/

k. Es gen ugt nachzuweisen, da unter dieser


Voraussetzung Gleichheit gelten mu. Sei nun m = (s, a) M; wir bezeichnen
mit k
m
die Anzahl aller Schl ussel k K, unter denen m g ultig ist, f ur die also
a = e
K
(s) gilt. Dann ist die Wahrscheinlichkeit, da m bei einem Impersonations-
angriff (also beim Einspielen durch den Angreifer) akzeptiert wird, offenbar k
m
/k.
Nach unserer Annahme gilt
k
m
k
p
I

1

k
, also k
m

k.
2
Wir k onnen hier nicht auf die Frage eingehen, wie man gemeinsame Schl ussel erzeugt und aus-
tauscht. Dies ist eines der Kernprobleme der Kryptographie; wir verweisen daf ur auf die bereits zitierte
Literatur, insbesondere Stinson [2001].
84 III Orthogonale lateinische Quadrate
Wir zeigen nun, da die Wahrscheinlichkeit p
S
f ur eine erfolgreiche Substitutions-
attacke 1/

k ist, womit wir dann fertig sind. Der Angreifer beobachtet also eine
Nachricht m = (s, a) und will sie durch eine eigene Nachricht (zu einem ande-
ren Datensatz s
/
) ersetzen. Nach Voraussetzung ist jeder der k
m
Schl ussel, unter
denen m g ultig ist, gleich wahrscheinlich; der Angreifer w ahlt nun (er hat ja kom-
plette Kenntnis uber das System)
3
einen dieser Schl ussel, etwa K, und ersetzt m
durch m
/
= (s
/
, e
K
(s
/
)). Dann ist m
/
eine g ultige Nachricht, die vom Empf anger
mit Wahrscheinlichkeit k
m,m
/ /k
m
akzeptiert wird, wobei k
m,m
/ die Anzahl aller
Schl ussel bezeichnet, unter denen sowohl m als auch m
/
g ultig ist. Nach Wahl von
K ist jedenfalls K ein derartiger Schl ussel, es gilt also k
m,m
/ 1. Damit erhalten
wir die gew unschte Schranke:
p
S

k
m,m
/
k
m

1
k
m

k
.
2
Der Beweis von Satz 7.2 zeigt, da max(p
I
, p
S
) = 1/

k genau dann gilt,


wenn man stets k
m
=

k und k
m,m
/ = 1 hat. Damit erhalten wir f ur deartige Au-
thentikationscodes (die man perfekt nennt) das folgende Ergebnis; die Einzelheiten
seien dem Leser als

Ubung uberlassen.
Korollar 7.3. F ur jeden perfekten Authentikationscode (S, A, K, E) mit k gleich
wahrscheinlichen Schl usseln gilt:
(a) k = n
2
f ur eine nat urliche Zahl n.
(b) Jede Nachricht (s, a) ist unter genau n Schl usseln g ultig.
(c) Es gilt [A[ = n.
(d) Zu je zwei Nachrichten zu verschiedenen Datens atzen gibt es genau einen
Schl ussel, unter dem beide Nachrichten g ultig sind. 2
Gibt es uberhaupt perfekte Authenticationscodes? Wenn ja, wie ndet man sie?
Die eher verbl uffende Antwort lautet: Mit orthogonalen Arrays! Das ist der Inhalt
des folgenden Satzes von Stinson [1990], der in aquivalenter (geometrischer) Form
auch von de Soete, Vedder und Walker [1990] bewiesen wurde.
Satz 7.4. Ein perfekter Authentikationscode (S, A, K, E) mit n
2
Schl usseln und r
Datens atzen existiert genau dann, wenn es ein orthogonales Array OA(r, n) gibt.
3
Man beachte, da wir damit dem Angreifer unbegrenzte Rechenleistung zugestehen, womit der
Satz besonders aussagekr aftig ist. Sehr h aug mu man sich in der Kryptographie leider damit ab-
nden, Systeme einzusetzen, die nach dem Stand der Technik zwar nicht in akzeptabler Rechenzeit
gebrochen werden k onnen, wo man aber keine theoretischen Aussagen uber ihre Sicherheit beweisen
kann (

computational security).
III.7 Eine Anwendung: Authentikationscodes 85
Beweis. Sei zun achst ein perfekter Authentikationscode (S, A, K, E) mit n
2
Schl usseln und r Datens atzen gegeben. Wir denieren nun die Authentikations-
matrix
A = (A(s, K))
sS, KK
= (e
K
(s))
sS, KK
und zeigen, da A : SK Aein OA(r, n) ist; dabei sind die Parameter klar. Die
denierende Eigenschaft eines orthogonalenArrays folgt direkt aus Eigenschaft (d)
in Korollar 7.3: Zwei verschiedene Zeilen von A entsprechen zwei verschiedenen
Datens atzen s und s
/
; sind nun (s, a) und (s
/
, a
/
) zwei beliebige zugeh orige Nach-
richten, so gibt es genau einen Schl ussel K mit a = e
K
(s) und a
/
= e
K
(s
/
), also
genau eine Spalte K K mit A(s, K) = a und A(s
/
, K) = a
/
.
Umgekehrt sei A: S K A ein OA(r, n). Man deniert dann einen Au-
thentikationscode (S, A, K, E) durch e
K
(s) = A(s, K) f ur k K und s S. Die
denierende Eigenschaft eines orthogonalen Arrays ubersetzt sich dann in der
Notation des Beweises von Satz 7.2 in k
m,m
/ = 1 f ur je zwei Nachrichten m, m
/
zu verschiedenen Datens atzen. Da in jeder Zeile des OA(r, n) jedes Symbol a A
genau n-mal vorkommt, gilt auch k
m
= n =

k f ur jede Nachricht m, womit wir
p
I
= p
S
=

k im Beweis von Satz 7.2 erhalten und unseren Authentikationscode
als perfekt erkannt haben. 2
Aufgrund der S atze 2.5 und 2.8 kann man mit einem perfekten Authentikati-
onscode mit n
2
Schl usseln und n Authentikatoren maximal r = n 1 Datens atze
authentizieren; f ur Primzahlpotenzen nwird diese Schranke nach Satz 5.4 auch an-
genommen. Trotzdemstellt sich nat urlich die Frage, was man f ur den Fall r > n1
erreichen kann. Dazu werden wir n = [A[ xieren, r = [S[ beliebig zulassen und
versuchen, die Erfolgswahrscheinlichkeit f ur einen Angriff zu minimieren. Man
erh alt dann einen Zusammenhang zu den am Ende von 2 erw ahnten orthogonalen
Arrays mit Index , wie der folgende Satz von Stinson [1992a] zeigt; f ur den recht
komplizierten Beweis verweisen wir auf die Originalarbeit oder auf Stinson [2001].
Satz 7.5. Sei (S, A, K, E) ein Authentikationscode mit [A[ = n und [S[ = r.
Dann gilt:
(7.2) p
I
1/n und p
S
1/n;
falls in (7.2) Gleichheit vorliegt, hat man
(7.3) k = [K[ r(n 1) 1.
Ein Authentikationscode mit Gleichheit in (7.2) und (7.3) existiert genau dann,
wenn es ein OA

(r, n) mit = [r(n 1) 1]/n


2
gibt; in diesem Fall sind die
86 III Orthogonale lateinische Quadrate
Schl ussel notwendigerweise gleichverteilt mit Wahrscheinlichkeit
(7.4) p(K) =
1
k
=
1
r(n 1) 1
=
1
n
2

,
weswegen dann insbesondere k = n
2
gilt. 2
Ein Satz von Plackett und Burman [1945] besagt, da ein OA

(r, n) nur f ur
r (n
2
1)/(n 1) existieren kann;

optimale Authentikationscodes gibt es


also genau dann, wenn diese Schranke angenommen wird. Wie im Fall = 1 ist
dies jedenfalls immer dann der Fall, wenn n eine Primzahlpotenz und eine Potenz
von n ist. Beweise f ur diese Aussagen ndet man in geometrischer Sprache (f ur die
zu orthogonalen Arrays aquivalenten

Netze bzw.

afnen 1-Designs) auch bei


Beth, Jungnickel und Lenz [1999], siehe Theorem II.8.8 und Examples II.8.9.
IV Der Satz vom Diktator
Der Satz vomDiktator, auch Arrowsches Paradoxon genannt, stammt aus der Theo-
rie der sozialen (z.B. okonomischen) Entscheidungen. Diese Theorie ist kombina-
torischer Natur und hat eine lange Tradition, die bis in die Zeit der Aufkl arung
zur uckreicht (vgl. Black [1958]). Einen ersten Einblick in die typische Problema-
tik dieser Untersuchungen vermittelt die Situation, die entsteht, wenn ein Komitee,
das um einen runden Tisch arrangiert ist, einen Vorsitzenden w ahlen soll und jeder
f ur seinen linken Nebenmann stimmt.
Kenneth Joseph Arrow (geboren 1921, Nobelpreis f ur

Okonomie 1972) pu-
blizierte sein Paradoxon zuerst 1950. Seither ist eine umfangreiche Literatur zu
diesem Thema entstanden; vgl. die zusammenfassenden Darstellungen von Ar-
row [1951], Kelly [1978], Pattanaik [1978], Peleg [1984], Sen [1970,1986], Saari
[1994,1995,2001].
Der Satz vom Diktator befat sich mit Situationen, f ur die folgendes Beispiel
typisch ist: In einem Omnibus sitzen n Personen; mSt adte sollen nacheinander be-
sucht werden; die Frage ist, in welcher Reihenfolge dies geschehen soll. Der Omni-
busbesitzer hat eine Elektronik einbauen lassen, in die jeder Fahrgast seine liebste
Reihenfolge einf uttern kann; der Apparat liefert dann die de facto einzuhaltende
Reihenfolge, der sich alle zu f ugen haben. Fahrgast Meier kennt das Arrowsche
Paradoxon und sagt zum Besitzer: Wenn Ihr Computer einerlei wie er im Detail
gebaut ist gewissen allgemeinen Bedingungen gen ugt, kann er auch nicht mehr
liefern als die Reihenfolge, f ur die sich Fahrgast Nr. 21 (etwa) entschieden hat;
Sie h atten sich die teure Anschaffung sparen k onnen; machen Sie Fahrgast 21 zum
Diktator, das ist das ganze Geheimnis.
1 Problemstellung
Abstrakt gesprochen hat man eine Menge P von n 1 Elementen (

Personen)
und eine Menge A von m 1 Elementen (

Alternativen). Die Elemente der


Menge perm(A) aller Totalordnungen in A oder Permutationen von A werden
als geordnete m-Tupel uber A aufgefat und in der Sprache der mathematischen

Okonomie als Pr aferenzordnungen (in A) bezeichnet. Eine Pr aferenzordnung legt


88 IV Der Satz vom Diktator
fest, welche Alternative welchen anderen vorgezogen wird. Dabei gilt bekanntlich
[ perm(A)[ = m' (Korollar 2.4). Eine Abbildung
M: P perm(A)
bedeutet, da jede Person ihre Pr aferenzordnung in A kundgetan hat, und wird
als ein Meinungsmuster bezeichnet. Die Menge perm(A)
P
aller Meinungsmuster
hat dann (m')
n
Elemente, siehe Satz 2.2. Im minimalen interessanten Fall n = 2,
m = 2 (

ein Ehepaar vor zwei Alternativen) sind das 4, im n achstkomplizierten


Fall n = 2, m = 3(

einEhepaar vor drei Alternativen) gibt es bereits 36Meinungs-


muster. Es geht nun darum, aus jedem Meinungsmuster auf m oglichst vern unftige
Weise eine einzige Pr aferenzordnung herauszudestillieren, d. h.

vern unftige Ab-


bildungen d : perm(A)
P
perm(A) zu konstruieren.
Die folgende Denition sagt, was in der Arrowschen Theorie als vern unftig
gilt; dazu werden zwei Forderungen aufgestellt, die in der Tat intuitiv als vern unf-
tig erscheinen, die

Einstimmigkeitsregel und die

Unabh angigkeitsregel. Man


kann sich den Inhalt dieser beiden Regeln anschaulich an den beiden angebenen
Bildern klarmachen, in denen Meinungsmuster als Tafeln dargestellt sind, mit den
Pr aferenzordnungen der Personen als Spalten.
Denition 1.1. Seien [P[ = n 1, [A[ = m 1. Eine Abbildung
d : perm(A)
P
perm(A)
heit eine soziale Entscheidungsfunktion (SEF), wenn gilt:
(a) Ist M perm(A)
P
, M = (M
p
)
pP
, sind ferner a, b zwei verschiedene Al-
ternativen, und wird Alternative a der Alternative b bei allen Pr aferenzord-
nungen M
p
(p P) vorgezogen, so gilt dies auch bei der Pr aferenzordnung
d(M) (Einstimmigkeitsregel).
a
a a
a
a
b
b b b
b
M d(M)
(b) Sind M, M
/
perm(A)
P
, a, b A, a ,= b und ist die Menge der Personen,
die a uber b stellen, bei M und M
/
dieselbe, so steht a genau dann bei d(M)
uber b, wenn dies bei d(M
/
) der Fall ist (Unabh angigkeitsregel).
IV.2 M achtige Familien 89
M
d(M )
a
b
M

d (M)
a
a
a
a
a a
b
b
b
b
b
b
b
b
b
b
a
a
a
a
a
b
Beispiel 1.2. Seien P, A, perm(A)
P
wie vorhin. Sei p
0
P. Dann ist durch
d
p
0
: M = (M
p
)
pP
M
p
0
(M perm(A)
P
)
eine SEF gegeben; sie heit

Person p
0
ist Diktator. Da d
p
0
in der Tat eine SEF
ist, ist offensichtlich:
(a) Einstimmigkeitsregel: Wenn alle Personen uber a, b A einer Meinung
sind, sind sie insbesondere mit Person p
0
einer Meinung.
(b) Unabh angigkeitsregel: Wenn beim

Ubergang von M zu M
/
keine Person ihre
Meinung uber a, b andert, andert auch der Diktator p
0
seine Meinung nicht.
Arrows Ergebnis besagt nun einfach, da diese Beispiele imFalle n 2, m 3
ersch opfend sind. Andere Beispiele gibt es dann nicht, die einzige

vern unftige
Form der Entscheidungsndung ist also die Einf uhrung einer Diktatur!
Satz 1.3 (Arrowsches Paradoxon, Diktator-Theorem). Sei [P[ = n 2, [A[ =
m 3 und d : perm(A)
P
perm(A) eine SEF. Dann gibt es genau einen Dikta-
tor, d. h. eine Person p
0
P derart, da d = d
p
0
gilt.
Man sagt auch kurz: jede SEF ist diktatorisch. Wir werden aber sp ater noch
sehen, da die Mathematik damit keineswegs das Todesurteil uber die Demokratie
gef allt hat.
2 M achtige Familien
Unser Beweis des Diktator-Theorems ben utzt den Begriff der

m achtigen Familie.
Dazu ben otigen wir zun achst eine vorbereitende Denition.
90 IV Der Satz vom Diktator
Denition 2.1. Seien [P[ = n 2, [A[ = m 3, (a, b) A A und d :
perm(A)
P
perm(A) eine SEF. Man sagt, die Teilmenge C P sei f ur d bei
(a, b) stark, wenn folgende Bedingung gilt:
() Ziehen bei einem M perm(A)
P
alle p C das a dem b und alle p P C
das b dem a vor, so wird a dem b bei d(M) vorgezogen.
= d (M)
M
a
b
C P
a
a
a
a
a
b b
b
b
b
C
Man beachte, da diese Denition nur sinnvoll ist, weil d die Unabh angigkeits-
regel erf ullt, und da es auf die Reihenfolge von a und b ankommt.
Lemma 2.2. Sei [P[ = n 2, [A[ = m 3 und d : perm(A)
P
perm(A) eine
SEF, sowie C P. Wenn dann C bei einem Paar (a, b) A A f ur d stark ist,
ist C sogar bei jedem Paar in A A f ur d stark.
Beweis. Seien a, b, c A paarweise verschieden; das geht wegen m 3. Wir
behaupten zun achst, da C dann auch f ur das Paar (a, c) A A stark ist. Dazu
sei also ein M perm(A) gegeben, bei dem alle p C das a dem c und alle
p P C das c dema vorziehen; zu zeigen ist, da a demc bei d(M) vorgezogen
wird. Da uns nur die relative Anordnung von a und c bei d interessiert, k onnen
wir aufgrund der Unabh angigkeitsregel o.B.d.A. annehmen, da alle eventuellen
weiteren Alternativen bei allen Personen in M unterhalb der Alternativen a, b, c
stehen und da die Alternative b f ur jede Person in C zwischen a und c und f ur jede
andere Person uber c und a steht. M hat also o.B.d.A. die folgende Bauart, wobei
wir uns einer Veranschaulichung f ur Meinungsmuster M perm(A)
P
bedienen,
die sicher unmittelbar einleuchtet:
M
a b
b c
c a
.
.
.
.
.
.
C P C
Was kann man nun uber d(M) sagen? Die Einstimmigkeitsregel liefert

b uber
c. Weil C bei (a, b) stark ist, gilt auch

a uber b. Damit haben wir aber bereits

a uber c nachgewiesen.
IV.2 M achtige Familien 91
Ganz analog zeigt man nun, da C f ur d auch bei (c, b) stark ist. Wir haben
damit folgende Austausch-Aussage bewiesen: Die Menge
S = {(x, y) [ x, y A, C ist stark f ur d bei (x, y)]
erf ullt
(x, y) S, x ,= z ,= y = (x, z), (z, y) S.
Da es in Amindestens drei verschiedene Elemente gibt, kann man nun durch Kom-
ponentenaustausch von jedem Paar in AAzu jedem anderen gelangen (Beispiel:
(x, y) (z, y) (z, x) (y, x)), so da in der Tat S = A A folgt. 2
Wegen Lemma 2.2 ist folgende Denition sinnvoll:
Denition 2.3. Seien [P[ = n 2, [A[ = m 3; d : perm(A)
P
perm(A) eine
SEF. Eine Teilmenge C von P heit eine m achtige Familie f ur d, wenn C f ur alle
Paare (a, b) A A stark ist, also die Bedingung () stets erf ullt ist.
Wir erinnern nun an einen aus der Topologie vertrauten Begriff:
Denition 2.4. Seien P ,= und F eine Menge von nichtleeren Teilmengen von
P. Es gelte
(1) C F , C D P D F ;
(2) C, D F C D F .
Dann heit F ein Filter in P. Gilt auerdem
(3) C P C F oder P C F ,
so heit der Filter F ein Ultralter.
Ebenfalls bekannt sollte folgender Satz sein:
Satz 2.5. Ist P eine nichtleere endliche Menge, so gibt es zu jedem Ultralter F
in P genau ein p
0
P mit
F = {C [ p
0
C P].
Beweis. Sei F ein Ultralter in P. Da P endlich ist, ist auch F endlich. Wendet
man die obige Bedingung (2) wiederholt an, so folgt, da die Menge
C
0
=
_
CF
C
92 IV Der Satz vom Diktator
zu F geh ort und somit insbesondere nicht leer ist. Angenommen, C
0
enth alt zwei
verschiedene Elemente p, q P. Dann bilde man C = {p]. Nach (3) ist entweder
C F , woraus C
0
= {p] folgt, oder P C F , woraus p , C
0
folgt; in jedem
Falle ergibt sich ein Widerspruch. Die Menge C
0
besteht also aus genau einem
Element von P. 2
Man sieht nun unmittelbar ein, da der folgende Satz den Beweis des Diktator-
Theorems vollendet.
Satz 2.6. Seien [P[ = n 2, [A[ = m 3; d : perm(A)
P
perm(A) eine SEF.
Dann bildet das System F aller f ur d m achtigen Familien einen Ultralter in P.
Beweis. Wir zeigen zuerst, da die leere Menge keine m achtige Familie bildet.
Dazu w ahlen wir zwei verschiedene Alternativen a, b A beliebig und bilden ein
Meinungsmuster M, bei dem alle p P = P das b uber a stellen. Aufgrund
der Einstimmigkeitsregel steht dann auch in d(M) das b uber a, also kann nicht
stark bei (a, b) sein.
F ur den Nachweis der Bedingung (1) f ur einen Ultralter sei C eine m achtige
Familie sowie D P eine Obermenge von C. Umauch Dals m achtig zu erkennen,
reicht es nach Lemma 2.2, ein beliebiges Paar (a, c) A A als stark f ur d
nachzuweisen. Dazu m ussen wir ein Meinungsmuster M perm(A) betrachten,
bei dem alle p D das a dem c und alle p P D das c dem a vorziehen;
zu zeigen ist, da a dem c in d(M) vorgezogen wird. Wir w ahlen nun ein von
a und c verschiedenes Element b. Aufgrund der Unabh angigkeitsregel kann man
dann o.B.d.A. annehmen, da M wie in der folgenden unmittelbar verst andlichen
Abbildung aussieht; dies folgt ahnlich wie im Beweis von Lemma 2.2.
P
C
C D
D
a
b
c
.
.
.
.
.
.
.
.
a
a
b
b
c
c
.
Weil C m achtig ist, steht in d(M) das a uber b. Nach der Einstimmigkeitsregel
steht in d(M) das b uber c. Also steht in d(M) auch a uber c, wie zu zeigen war.
IV.3 Auswege 93
Zum Nachweis der Bedingung (2) seien nun C, D F .

Ahnlich wie zuvor
reduziert man die Behauptung auf die Betrachtung eines der folgenden Abbildung
entsprechenden Meinungsmusters M:
.
.
.
.
.
.
.
.
.
.
.
.
P
D
D
D
D C
C
C
C
b
b
b
b
c
c
c
c
a
a
a
a
( )
Weil C bei (a, b) stark ist, steht in d(M) das a uber b. Weil D bei (b, c) stark ist,
steht in d(M) das b uber c. Also steht in d(M) auch a uber c. Dies zeigt wieder,
da C D bei (a, c) stark f ur d und daher nach Lemma 2.2 eine m achtige Familie
ist. Somit gilt in der Tat C D F .
Es bleibt nochzu zeigen, daF Bedingung (3) erf ullt. Sei dazuC P. Diesmal
reduziert man die Behauptung auf die Betrachtung eines Meinungsmusters M der
folgenden Art:
P
a
a
b
b
C
C
.
.
.
.
.
.
Steht in d(M) das a uber b, so ist P C stark bei (a, b), also P C F . Steht in
d(M) das b uber a, so ist C stark bei (b, a), also C F . 2
3 Auswege
Das nunmehr voll bewiesene Diktator-Theorem scheint zun achst geeignet, jeden
Demokraten zur Verzweiung zu bringen. Selbst im Minimalfall n = 2, m = 3
(

ein Ehepaar vor drei Alternativen) scheint die Diktatur unvermeidlich.


94 IV Der Satz vom Diktator
Man sollte sich aber zun achst vor Augen f uhren, da s amtliche F alle mit m = 2
Alternativen (

Ja-Nein-Situationen) nicht unter das Arrowsche Paradoxon fallen.


In der Tat hat man hier bew ahrte diktatorfreie Entscheidungsmechanismen: Mehr-
heitsentscheidung mit Stichentscheid durch einen Vorsitzenden. Ist n 3, so ist
der Vorsitzende uberstimmbar, also kein Diktator. Die praktische Demokratie lebt
in der Tat von Ja-Nein-Entscheidungen.

Ubung 3.1. Man gebe eine formale Beschreibung der oben skizzierten Mehrheits-
entscheidung mit Stichentscheid und veriziere, da die Regeln aus Denition 1.1
in der Tat erf ullt sind. Woran liegt es, da f ur [A[ = 2 nicht-diktatorische SEFs
existieren? Man beschreibe f ur diesen Fall alle m oglichen SEFs und bestimme ih-
re Anzahl in Abh angigkeit von [P[. Die meisten dieser Funktionen sind allerdings
intuitiv nicht

vern unftig; man uberlege sich eine Zusatzforderung, die man hier
stellen sollte, und vergleiche mit dem Fall [A[ 3.
Man kann aber auch versuchen, den Diktator-Satz innerhalb seiner Dom ane
n 2, m 3 anzugreifen. Nat urlich bleibt der Satz richtig, denn wir haben
ihn ja bewiesen. Aber es k onnte doch sein, da es intuitiv vern unftige Abbildun-
gen perm(A)
P
perm(A) gibt, die eben nicht den Arrowschen Voraussetzungen
gen ugen und diktatorfrei sind. Bei der Suche nach solchen Abbildungen man
beschr ankte sich bald auf den Fall perm(A)
P
A (nur die h ochste soziale Pr afe-
renz wird ermittelt) erlebte man zun achst eine Entt auschung: Es kam nochmals
ein Diktator-Satz heraus, das sogenannte Gibbard-Satterthwaite-Theorem(Gibbard
[1972], Satterthwaite [1975]). 1978 publizierte jedoch der Jerusalemer Mathema-
tiker Peleg ein Entscheidungsverfahren, dessen Quintessenz man etwa so beschrei-
ben kann: Wenn alle Personen sich damit abnden, zwar nicht ihre W unsche erf ullt
zu sehen, aber doch keine zu herben Entt auschungen zu erleben, dann kann man
diktatorfrei entscheiden; siehe Peleg [1978].
Ein besonders interessanter Ansatz f ur einen Ausweg besteht in einer Ab-
schw achung der Unabh angigkeitsregel, wobei die resultierende SEF nun nicht nur
die relative Anordnung zweier Alternativen in den individuellen Pr aferenzordnun-
gen aller beteiligten Personen, sondern auch jeweils die Zahl der Alternativen zwi-
schen den beiden gegebenen Alternativen ber ucksichtigt (

intensity of irrelevant
alternatives). Ein Verfahren, das dem Rechnung tr agt, ist das Verfahren von Borda
[1781] (

Borda count), bei dem der j-ten Alternative auf der Pr aferenzliste jeder
Person jeweils n j Punkte gutgeschrieben und dann die Alternativen gem a ih-
rer Gesamtpunktzahl angeordnet werden.
1
Man mache sich klar, da bei diesem
1
Interessanterweise ist das Borda-Verfahren bereits viel fr uher eingef uhrt worden, n amlich von
dem ber uhmten Philosophen und Theologen Nikolaus von Kues (1401 1464). Fast zwei Jahrhunderte
vorher wurden bereits in drei Schriften des katalanischen Philosophen Ramon Llull (1232 1316) Wahl-
verfahren vorgeschlagen, die auf paarweisen Vergleichen der Kandidaten beruhen. N aheres zu diesem
IV.3 Auswege 95
Vorgehen die Einstimmigkeitsregel weiterhin gilt. Dar uberhinaus hat das Borda-
Verfahren weitere interessante Eigenschaften; wenn beispielsweise alle Personen
ihre Pr aferenz hinsichtlich zweier gegebener Alternativen andern, so dreht sich
die Reihenfolge dieser Alternativen auch in der entstehenden SEF um. Wir ver-
zichten hier auf weitere Details und verweisen auf die Aufs atze und B ucher von
Saari [1994,1995,1998,1999,2000a,2000b], der die Theorie der sozialen Entschei-
dungsfunktionen und die Analyse von Paradoxien bei Wahlverfahren entscheidend
vorangebracht hat.
Zusammenfassende Darstellungen des hier angerissenen Problemkreises geben
Kelly [1978], Pattanaik [1978], Peleg [1984], Sen [1970,1986], Saari [1994,1995,
2001].

Uber dieVorgeschichte seit ca. 1800 informiert Black [1958]. Der Ultralter-
Gesichtspunkt durchzieht einen Groteil der Literatur seit Arrow[1951] und wurde
von Kirman und Sondermann [1971] besonders klar herausgearbeitet. In der neue-
renLiteratur spielenvor allemauchgeometrische Methodeneine wesentliche Rolle,
insbesondere bei Saari. Eine Sammlung interessanter

Ubersichtsartikel zu unserem
und verwandten Problemen ndet man imdemvonYoung [1985] herausgegebenen
Band

Fair Allocation.
Themenkreis ndet man in den Aufs atzen von H agele und Pukelsheim [2001] sowie von Pukelsheim
[2002,2003].
V Fastperiodische 0-1-Folgen
In diesem Kapitel betrachten wir eine Klasse von 0-1-Folgen, die in der Theorie
der topologischen Dynamik auftreten (siehe etwa Gottschalk und Hedlund [1955]),
n amlich die sogenannten fastperiodischen Folgen. Das Standardbeispiel hierf ur ist
die ber uhmte, wohl vonAxel Thue (1863 1922) zuerst gebildete Folge, siehe Thue
[1906], die sp ater von Marston Morse (1892 1977) wiederentdeckt wurde, siehe
Morse [1921], und heutzutage meist als Morse-Thue-Folge (manchmal auch nur als
Morse-Folge) bezeichnet wird. Diese Folge wird denn auch imMittelpunkt unserer

Uberlegungen stehen.
1 Die Morse-Thue-Folge
Die Morse-Thue-Folge ist eine Folge von Symbolen 0, 1, also eine Abbildung
N {0, 1], oder, wenn man will, eine F arbung von N mit den beiden Farben 0
und 1. In kommafreier Schreibweise lautet sie
x = 0110100110010110 . . .
Das dabei befolgte Bildungsgesetz l at sich folgendermaen beschreiben: Als
das Gegenteil von 0 sehe man 1 an, als das Gegenteil von 1 das Symbol 0; das
Gegenteil B einer endlichen 0-1-Folge B (eines sogenannten 0-1-Blocks) entsteht,
wenn man in ihm jedes Symbol durch sein Gegenteil ersetzt. Man schreibe nun
zun achst 0 hin, dann daneben das Gegenteil 1, dann daneben das Gegenteil 10 des
Blocks 01, den man schon hat, dann daneben das Gegenteil des soeben entstandenen
0-1-Blocks 0110 usw. Damit ist die Morse-Thue-Folge rekursiv als unendliche
0-1-Folge deniert (vgl. auch Keane [1968] und Jacobs [1969]).

Ubung 1.1. Man weise nach, da das n-te Glied x


n
einer Morse-Thue-Folge
x = (x
0
, x
1
, . . . ) explizit auch wie folgt deniert werden kann. Es sei
n
die
Anzahl der Ziffern 1 in der Bin ardarstellung der nat urlichen Zahl n; dann ist x
n
durch die Parit at von
n
gegeben:
x
n

n
mod 2.
V.1 Die Morse-Thue-Folge 97
Die Morse-Thue-Folge besitzt bemerkenswerte innere Symmetrien. Als Bei-
spiel geben wir die folgende Symmetrie-Eigenschaft an, die uns bald sehr n utzen
wird.
Beispiel 1.2. Nach Denition l at sich die Morse-Thue-Folge als Folge von Zwei-
erbl ocken 01 und 10 schreiben. Ersetzt man dann 01 durch 0 und 10 durch 1, so
entsteht wieder die Morse-Thue-Folge, wie sich unmittelbar aus der rekursiven
Denition der Folge ergibt. Man kann das so hinschreiben:
x = 01[10[10[01[10[01[01[10[ . . .
0 1 1 0 1 0 0 1 . . . = x.
Dagegen ist die Morse-Thue-Folge nicht periodisch, wie der folgende, st arkere
Satz von Hedlund und Morse [1944] zeigt.
Satz 1.3. Ist B = b
1
. . . b
r
ein 0-1-Block, so kommt der Block BBb
1
in der
Morse-Thue-Folge x = x
0
x
1
. . . nirgends vor; es gibt also keinen Index n mit
x
n
= b
1
, . . . , x
nr1
= b
r
, x
nr
= b
1
, . . . , x
n2r1
= b
r
, x
n2r
= b
1
.
Beweis. Wir f uhren den Beweis zun achst im Falle einer ungeraden Blockl ange r
und beginnen mit r = 1. Ist b
1
= 0, so ist BBb
1
= b
1
b
1
b
1
= 000. Da x aus
Bl ocken 01 und 10 aufgebaut ist, kommt 000 in x nicht vor. Analog erledigt man
den Fall b
1
= 1.
Sei nun r 3 ungerade. Jetzt hat BBb
1
eine L ange 7. Kommt BBb
1
in x vor,
so enth alt BBb
1
einen der Bl ocke 0110, 1001, aus denen sich x ja offensichtlich
zusammensetzt. Im ersteren Fall enth alt BBb
1
den Zweierblock 11; kommt 11
bereits in B vor, so mu 11 zweimal, mit ungerader Differenz der Anfangstellen,
vorkommen. Dasselbe m ute dann bei x der Fall sein. Dies geht nicht, weil x sich
aus Bl ocken 01 und 10 aufbaut. Dasselbe Argument greift, wenn 11 zwar nicht in
B, aber an der Nahtstelle von BB auftritt: b
r
= 1 = b
1
. Analog f uhrt man das
Auftreten von 1001 in BBb
1
zum Widerspruch.
Nun erledigen wir den Fall, da r gerade ist, und zwar durch Induktion uber
r = 2, 4, 6, . . .
r = 2. Die F alle B = 00 und B = 11 kommen nicht in Frage, da x weder 000
noch 111 enth alt. Sei nun B = 01, also BBb
1
= 01010, d. h. irgendwo in x kommt
01010 vor. Wird dieser Block bei seinem Auftreten in x von der Zweierblock-
Zerschneidung
x = 01[10[10[01[[10[01[01[10[ . . .
so getroffen: 0[10[10[, so hat man links 1 zu erg anzen, womit in x der Block
[10[10[10[ und somit nach Beispiel 1.2 der Dreierblock 111 vorkommt, was nicht
geht. Sieht die Zweierblock-Zerschneidung dagegen so aus: [01[01[0, so hat man
98 V Fastperiodische 0-1-Folgen
rechts mit 1 fortzufahren, kommt auf 000 in x und erh alt abermals einen Wider-
spruch. Der verbleibende Fall B = 10 wird analog behandelt.
r 4. Wir nehmen an, da alle F alle mit Blockl angen r 2 von B bereits
erledigt seien, und unterscheiden zwei F alle, je nachdem, wie BBb
1
bei seinem
Auftreten in x von der Zweierblock-Zerschneidung von x getroffen wird.
Fall I. BBb
1
wird in der Form
b
1
b
2
[ . . . [b
r1
b
r
[b
1
b
2
[ . . . [b
r1
b
r
[b
1
getroffen. Dann hat man im Falle b
1
= 0 rechts mit 1 in x fortzufahren, womit sich
b
2
= 1 ergibt; also enth alt x das Teilst uck
01[ . . . [b
r1
b
r
[01[ . . . [b
r1
b
r
[01[.
Nach Ersetzung von 01 durch 0 und von 10 durch 1 ndet man in x einen Block
a
1
. . . a
s
a
1
. . . a
s
a
1
mit a
1
= 1 und s =
r
2
. Ist s ungerade, so ergibt sich ein
Widerspruch zum ersten Teil des Beweises; und ist s gerade, so ergibt sich ein
Widerspruch zur Induktionsannahme. Der Fall b
1
= 1 wird entsprechend erledigt.
Fall II. BBb
1
wird in der Form
b
1
[b
2
b
3
[ . . . [b
r
b
1
[b
2
b
3
[ . . . [b
r
b
1
[
getroffen. Dann hat man im Falle b
1
= 0 auf b
r
= 1 zu schlieen und links in x
mit 1 fortzufahren, womit x den Block
10[b
2
b
3
[ . . . [10[b
2
b
3
[ . . . [10[
enth alt. Durch die Ersetzung 01 0, 10 1 erh alt man diesmal in x einen Block
a
1
. . . a
s
a
1
. . . a
s
a
1
mit a
1
= 1 und s =
r
2
. Wie vorhin erh alt man einen Wider-
spruch, sei es zur Induktionsannahme, sei es zumFalle einer ungeraden Blockl ange.
Der Fall b
1
= 1 wird genauso behandelt. 2
Zu diesem Satz gibt es eine Art von Umkehrung, die von Gottschalk [1964]
stammt. Um sie zu formulieren, m ussen wir von der

einseitigen Morse-Thue-
Folge 0110(einer 0-1-F arbung von N
0
) zu

zweiseitigen 0-1-Folgen (also 0-1-


F arbungen von Z) ubergehen und zwei weitere Begriffe einf uhren.
Denition 1.4. Sei z = . . . z
1
z
0
z
1
. . . eine doppelt unendliche 0-1-Folge, d. h.
eine F arbung von Z mit den Farben 0 und 1.
1) Man sagt, z habe die Eigenschaft M, wenn es keinen 0-1-Block B = b
1
. . . b
r
gibt, f ur den der Block BBb
1
in z vorkommt; es darf also kein s Z mit
z
s
= b
1
, . . . , z
sr1
= b
r
, z
sr
= b
1
, . . . , z
s2r1
= b
r
, z
s2r
= b
1
geben.
2) Man sagt, z sei eine Morse-Thue-Tochter, wenn jeder 0-1-Block, der in z
vorkommt, auch in der Morse-Thue-Folge vorkommt.
V.1 Die Morse-Thue-Folge 99

Ubung 1.5. Man beweise, da jede Morse-Thue-Tochter die Eigenschaft M hat.

Ubung 1.6. Man gebe eine Morse-Thue-Tochter an, die ab 0 mit der Morse-Thue-
Folge x ubereinstimmt: z
0
= x
0
, z
1
= x
1
, z
2
= x
2
, . . .
Satz 1.7. Sei z = . . . z
1
z
0
z
1
. . . eine 0-1-F arbung von Z. Genau dann hat z die
Eigenschaft M, wenn z eine Morse-Thue-Tochter ist.
Beweis. Nach

Ubung 1.5 hat jede Morse-Thue-Tochter die Eigenschaft M. Umge-
kehrt habe nunz die Eigenschaft M. Umzuzeigen, daM eine Morse-Thue-Tochter
ist, gehen wir in mehreren Schritten vor.
Schritt 1: z enth alt die Zweierbl ocke 00 und 11.
Angenommen, z enth alt 00 nicht. Dann kommt in z irgendwo das Symbol 1 vor,
wegen der Eigenschaft M aber auch 0, also irgendwo 101. Die n achsten zwei
Symbole von z rechts hiervon k onnen
nicht 11 sein: weil sonst 111 entst unde, was wegen M nicht geht;
nicht 00 sein: wegen unserer momentanen Annahme;
nicht 01 sein: weil sonst 10101 enst unde, im Widerspruch zu M.
Also geht es rechts von 101 mit 10 weiter und in z kommt der Block 10110 vor. Wie
k onnen nun die in z links von 10110 stehenden n achsten zwei Symbole aussehen?
Sie k onnen
nicht 11 sein: weil sonst 111 entst unde;
nicht 00 sein: nach unserer Annahme;
nicht 10 sein: weil sonst 10101 entst unde, im Widerspruch zu M.
Somit geht es links von 10110 mit 01 weiter und es entsteht der Block 0110110;
auch dies widerspricht M. Also enth alt z doch den Zweierblock 00. Genauso zeigt
man, da z den Zweierblock 11 enth alt.
Schritt 2: z l at sich als doppelt unendliche Folge von Zweierbl ocken 01 und 10
schreiben.
Da in z irgendwo 00 steckt, 000 aber wegen M nicht in z vorkommen kann, enth alt
z den Vierer-Block 1001. Analog enth alt z auch den Vierer-Block 0110. Ein in z
vorkommender Vierer-Block 1001 kann nun in z nach rechts weder mit 11 fortge-
setzt werden (da 111 verboten ist) noch mit 00 (weil sonst 100100 und sodann, weil
000 verboten ist, notwendigerweise 1001001 entst unde, wieder imWiderspruch zu
M). Also setzt sich ein in z vorkommender Block 1001 nach rechts in z mit 01
oder 10 fort; analog zeigt man, da auch nach links nur wieder 01 oder 10 in Frage
100 V Fastperiodische 0-1-Folgen
kommen. Entsprechend behandelt man auch Fortsetzungen von 0110, 1010 und
0101. Offenbar ist Schritt 2 damit erledigt.
Schritt 3: Schreibt man z als doppelt unendliche Folge von Bl ocken 01 und 10
und ersetzt dann 01 durch 0 und 10 durch 1, so entsteht eine doppelt unendliche
0-1-Folge z
/
, die sich ebenfalls als doppelt unendliche Folge von Bl ocken 01 und
10 schreiben l at.
Man beachte, da eineVerletzung von M in z
/
sofort eineVerletzung von M in z
nach sich ziehen w urde. Also hat z
/
die Eigenschaft M; damit ist aber das Ergebnis
von Schritt 2 auf z
/
anwendbar.
Nun k onnen wir den Beweis abschlieen. Der 0-1-Block A
n
bestehe aus den
ersten 2
n
Symbolen der Morse-Thue-Folge x, der Block B
n
aus den darauf folgen-
den 2
n
Symbolen; B
n
entsteht also aus A
n
, indem man jede 0 durch eine 1 und jede
1 durch eine 0 ersetzt. Iteriert man Schritt 3 n-mal, so ndet man: z l at sich als
Folge von Bl ocken A
n
B
n
und B
n
A
n
schreiben. Ist B ein in z vorkommender Block
einer L ange m und sorgt man f ur 2m 2
n
, so l at sich B als vorderer, hinterer
oder innerer Abschnitt von A
n
B
n
oder B
n
A
n
schreiben. Da diese beiden Bl ocke in
x vorkommen, kommt B in x vor. Also ist z in der Tat eine Morse-Thue-Tochter.
2

Ubung 1.8. Man fasse die Morse-Thue-Folge x als F arbung von N


0
auf und gebe
in N
0
monochrome arithmetische Progressionen beliebiger L angen explizit an, und
zwar f ur beide Farben; man vergleiche dazu Denition VII.1.1.
2 Fastperiodizit at
Wir haben gesehen, da weder die Morse-Thue-Folge 01101001 noch eine ihrer
T ochter periodisch ist (S atze 1.3 und 1.7). Trotzdem besitzt die Morse-Thue-Folge
eine Wiederkehr-Eigenschaft, die der Periodizit at sehr nahekommt; sie ist n amlich

fastperiodisch.
Denition 2.1. Eine 0-1-Folge x = x
0
x
1
x
2
. . . oder x = . . . x
1
x
0
x
1
. . . heit
fastperiodisch, wenn jeder 0-1-Block in ihr entweder gar nicht oder mit beschr ank-
ten L ucken vorkommt. Genauer: Sei x eine F arbung von N
0
oder Z mit den Farben
0 und 1 und B = b
1
. . . b
r
ein 0-1-Block. Wir bezeichnen mit T
B
die (leere, endliche
oder unendliche) Menge aller derjenigen Zahlen t N
0
bzw. t Z, f ur die
x
t
= b
1
, x
t 1
= b
2
, . . . , x
t r1
= b
r
gilt. Dann heit x fastperiodisch, wenn f ur jeden 0-1-Block B entweder T
B
=
gilt oder aber ein L > 0 mit {t, t 1, . . . , t L] T
B
,= f ur alle t N
0
bzw.
t Z existiert.
V.2 Fastperiodizit at 101
Satz 2.2. Die Morse-Thue-Folge x = 01101001 . . . ist fastperiodisch.
Beweis. Sei B ein in x auftretender 0-1-Block. Wir bestimmen einen Anfangsblock
D von x, in dem B bereits komplett enthalten ist und der eine L ange der Form
2
n
besitzt. Dann l at sich x als eine Folge von Bl ocken DD und DD schreiben,
wobei D wie ublich das Gegenteil von D bezeichnet. Man sieht nun, da man etwa
L = 2
n2
w ahlen kann. 2

Ubung 2.3. Man beweise allgemeiner, da jede Morse-Thue-Tochter fastperio-


disch ist.
Denition 2.4. Wir verallgemeinern jetzt den Tochter-Begriff. Seien dazu x und z
zwei 0-1-F arbungen von N
0
oder Z. Man sagt, z sei eine Tochter von x, wenn jeder
0-1-Block, der in z vorkommt, auch in x vorkommt.

Ubung 2.5. Man beweise: T ochter von fastperiodischen 0-1-F arbungen sind wie-
der fastperiodisch.

Ubung 2.6. Man beweise: Ist z eine Tochter von x und u eine Tochter von z, so ist
u auch eine Tochter von x.
Mittels eines Diagonal-Arguments beweisen wir nun das
Lemma 2.7. Sei B
(1)
, B
(2)
, . . . eine Folge von 0-1-Bl ocken mit gegen streben-
den L angen. Dann gibt es
(a) eine 0-1-F arbung x = x
0
x
1
x
2
. . . von N
0
, f ur die jeder in x vorkommende
Block in unendlich vielen der Bl ocke B
(1)
, B
(2)
, . . . enthalten ist.
(b) eine 0-1-F arbung z von Z, f ur die jeder in z vorkommende Block in unendlich
vielen der Bl ocke B
(1)
, B
(2)
, . . . enthalten ist.
Beweis. Zum Beweis der Aussage (a) schreiben wir die gegebenen Bl ocke in der
Form
B
(n)
= b
(n)
0
. . . b
(n)
r
n
(n N),
wobei wir (nach

Ubergang zu einer passenden Teilfolge) noch r
0
< r
1
< r
2
< . . .
annehmen k onnen. Mindestens eines der beiden Symbole 0, 1 kommt unendlich
oft als b
(n)
0
vor. Seien etwa n
0,1
< n
0,2
< . . . so bestimmt, da b
(n
0,1
)
0
= b
(n
0,2
)
0
=
= x
0
{0, 1] gilt. Mindestens eines der beiden Symbole 0, 1 kommt nun
unendlich oft als b
(n
0,k
)
1
vor. Seien etwa n
1,1
< n
1,2
< . . . als Teilfolge von
n
0,1
, n
0,2
, . . . so bestimmt, da b
(n
1,1
)
1
= b
(n
1,2
)
1
= = x
1
{0, 1] gilt usw. Wir
102 V Fastperiodische 0-1-Folgen
setzen nun x = x
0
x
1
x
2
. . . Sei B ein in x vorkommender 0-1-Block. Wir k onnen
o.B.d.A. B = x
0
. . . x
r
annehmen. Dann gilt offensichtlich nach Konstruktion
b
(n
t,t
)
0
= x
0
, . . . , b
(n
t,t
)
r
= x
r
f ur t = r, r 1, . . .
Damit ist (a) bewiesen. Behauptung (b) beweist man analog, indemman die Bl ocke
B
(n)
anders indiziert:
B
(n)
= b
r
n
b
r
n
1
. . . b
s
n
mit r
n
0 s
n
2
Wir k onnen nun den folgenden fundamentalen Satz beweisen:
Satz 2.8. Jede 0-1-F arbung (von N
0
oder Z) besitzt mindestens eine fastperiodi-
sche Tochter (nach Belieben auf N
0
oder auf Z).
Beweis. Sei etwa x = x
0
x
1
x
2
. . . eine 0-1-F arbungvonN. Ferner denkenwir uns die
s amtlichen 0-1-Bl ocke aller L angen durchnumeriert: D
(1)
, D
(2)
, . . . (etwa in der
Anordnung 0, 1, 00, 01, 10, 11, ). Wir konstruieren nun eine Folge x
(1)
, x
(2)
, . . .
von 0-1-F arbungen von N mit folgenden Eigenschaften: x
(n1)
ist stets Tochter
von x
(n)
und auch von x; D
(n)
kommt in x
(n)
entweder uberhaupt nicht oder mit
beschr ankten L ucken vor. Ist diese Konstruktion gelungen, so schlieen wir wie
folgt zu Ende. Der 0-1-Block B
(n)
bestehe aus den ersten 2n 1 Symbolen von
x
(n)
; gem a Lemma 2.7 gewinnen wir, nach Belieben auf N
0
oder auf Z, eine
0-1-F arbung z, f ur die jeder 0-1-Block, der in z vorkommt, in unendlich vielen
x
(n)
vorkommt, damit in allen x
(n)
vorkommt, und damit auch in x; also ist z
eine Tochter von x. Ist D
(n)
nun ein 0-1-Block, der in z zwar vorkommt, aber mit
unbeschr ankten L ucken, so treten in z Bl ocke A auf, in denen D
(n)
auer vorn und
hinten nicht vorkommt, wobei Abeliebig lang gew ahlt werden kann. Diese Bl ocke
treten auch in x
(n)
auf, d. h. D
(n)
kommt in x
(n)
vor, aber mit unbeschr ankten
L ucken, im Widerspruch zur Wahl der x
(n)
.
Nun m ussen wir noch die Konstruktion der x
(n)
durchf uhren. Es wird gen ugen,
die Konstruktion von x
(1)
zu beschreiben. Tritt D
(1)
in x gar nicht oder mit be-
schr ankten L ucken auf, so setzen wir x
(1)
= x. Tritt D
(1)
in x zwar auf, aber
mit unbeschr ankten L ucken, so nden wir in x eine Folge B
(1)
, B
(2)
, . . . von
0-1-Bl ocken mit gegen gehenden L angen, die den Block D
(1)
nicht enthalten.
Nach Lemma 2.7 gewinnen wir eine 0-1-Folge x
(1)
, f ur die jeder in x
(1)
vorkom-
mende Block in einemB
(n)
und damit in x vorkommt, womit x
(1)
eine Tochter von
x ist. Der Block D
(1)
kommt in x
(1)
nicht mehr vor, denn dazu m ute er in einem
B
(n)
vorkommen, was nach Konstruktion nicht geht. 2
V.2 Fastperiodizit at 103

Ubung 2.9. Man beweise, da f ur jede 0-1-Folge x die folgenden beidenAussagen


aquivalent sind:
(a) x ist fastperiodisch.
(b) x ist Tochter jeder Tochter von x.
VI Der Satz von Ramsey
Der ber uhmte Satz von Ramsey [1930] ist eine Verallgemeinerung des klassi-
schen Schubfachprinzips. Das Schubfachprinzip von Gustav Peter Lejeune Dirich-
let (1805 1859) (die Angelsachsen nennen es

pigeon hole principle) besagt:


Verteilt man n 1 oder mehr Gegenst ande in n Schubladen, so enth alt mindestens
eine Schublade mindestens zwei Gegenst ande. In einer Firma mit mehr als 366
Angestellten haben also mindestens zwei Angestellte am selben Tage Geburtstag,
und in einer Folge von 13 Halbt onen sind mindestens zwei gleich oder nur um
Oktaven unterschieden. Julius Wilhelm Richard Dedekind (1831 1916) hat in sei-
nem ber uhmten B uchlein Was sind und was sollen die Zahlen (Dedekind [1888])
das Schubfachprinzip zur Denition der endlichen Menge gemacht: Eine Menge
M heit nach Dedekind endlich, wenn sie sich nicht bijektiv auf eine ihrer echten
Teilmengen abbilden l at. Wir benden uns also mit dem Schubfachprinzip an den
Fundamenten der Mathematik.
Eine quantitative Versch arfung des Schubfachprinzips lautet: Verteilt man
mn 1 Gegenst ande auf m Schubladen, so liegen in mindestens einer Schub-
lade mindestens n 1 Gegenst ande. Noch etwas allgemeiner (und etwas formaler
geschrieben) gilt: Sind q
1
, . . . , q
t
N und ist M eine Menge mit mindestens
q
1
q
t
1 Elementen, so gibt es zu jeder Zerlegung M = M
1
M
t
mindestens einen Index s mit [M
s
[ > q
s
.
Von hier f uhrt eine rafnierte Verallgemeinerung zu dem nach Frank Plumpton
Ramsey (1903 1930) benannten Satz, den wir in diesem Kapitel kennenlernen
wollen. Ramsey war ein h ochst interessanter Mathematiker, demman auch Beitr age
zur mathematischen

Okonomie verdankt. Er bewies seinen Satz, um ein Problem
der Logik zu l osen; vgl. auch Skolem [1933].
Eine systematische Darstellung der Ramsey-Theorie ndet man bei Graham,
Rothschild und Spencer [1990]; historische Anmerkungen stehen bei Spencer
[1983]. Heutzutage versteht man unter

Ramsey-Theorie einen ganzen Zweig der


Kombinatorik, der sich mit Aussagen ahnlichen Typs f ur eine Vielzahl von Struktu-
ren besch aftigt; man vergleiche dazu auch das Buch von Erd os, Hajnal, Mate und
Rado [1984]. Als konkretes Beispiel erw ahnen wir die

Nullsummen-Ramsey-
Theorie von Bialostocki und Dierker [1990]: In der klassischen Ramsey-Theorie
sucht man, wie wir sehen werden, nach monochromen Kongurationen; in der
VI.1 Die nite Version des Satzes von Ramsey 105
Nullsummen-Ramsey-Theorie werden die Farben durch Elemente einer Gruppe
ersetzt und man sucht nach Kongurationen, deren Elemente sich zu Null summie-
ren.
1 Die nite Version des Satzes von Ramsey
Wir betrachten zun achst die klassische, nite Version des Satzes von Ramsey
[1930]; im n achsten Abschnitt folgt dann eine unendliche Variante.
Satz 1.1 (Satz von Ramsey). Zu beliebigen nat urlichen Zahlen r, q
1
, . . . , q
t
mit
r q
1
, . . . , q
t
gibt es eine nat urliche Zahl N
0
mit folgender Eigenschaft: Ist
N N
0
, M eine N-Menge, und ist eine Zerlegung von
_
M
r
_
in t Teilmengen gegeben,
etwa
_
M
r
_
= P
1
P
t
, so existieren ein Index s {1, . . . , t ] und eine Teilmenge
M
/
von M mit
[M
/
[ = q
s
und
_
M
/
r
_
P
s
.
Wir schicken dem Beweis des Satzes von Ramsey einige

Uberlegungen voraus,
die das Verst andnis des Satzes f ordern m ogen. Insbesondere betrachten wir zwei
Spezialf alle.
(a) F ur r = 1 kann man die 1-Teilmengen von M mit den entsprechenden Ele-
menten identizieren, also
_
M
1
_
durch M ersetzen. Der Satz von Ramsey besagt
dann, da es zu beliebigen nat urlichen Zahlen q
1
, . . . , q
t
ein N
0
mit folgender
Eigenschaft gibt: Ist [M[ N
0
und M = M
1
M
t
, so gibt es min-
destens ein s {1, . . . , t ] mit [M
s
[ q
s
. Diese Aussage ist eine Form des
verallgemeinerten Schubfachprinzips; der Satz von Ramsey ist also eine noch
weitergehende Verallgemeinerung des Schubfachprinzips.
(b) F ur r = 2 kann man die 2-Teilmengen von M mit den Kanten des vollst andigen
Graphen K
M
auf der Punktemenge M identizieren. Eine Zerlegung von
_
M
2
_
in t Teile l at sich dann anschaulich als eine Kantenf arbung des K
M
mit t
Farben interpretieren. Der Satz von Ramsey besagt dann, da es zu beliebigen
nat urlichen Zahlen q
1
, . . . , q
t
ein N
0
mit folgender Eigenschaft gibt: Ist [M[
N
0
, so gibt es f ur jede Kantenf arbung des K
M
mit den t Farben 1, . . . , t eine
Farbe s sowie eine q
s
-Teilmenge M
/
von M, so da s amtliche Kanten mit
beiden Endpunkten in M
/
mit s gef arbt sind. Der Satz von Ramsey stellt hier
also die Existenz groer monochromer Teilgraphen sicher, vgl.

Ubung 1.2.
Ganz analog kann man den Satz von Ramsey auch f ur r 3 als eine Aussage
uber die Existenz groer monochromer Teil-Kongurationen deuten.
106 VI Der Satz von Ramsey
(c) Ist der Satz von Ramsey richtig, so gibt es zu beliebigen nat urlichen Zahlen
r, q
1
, . . . , q
t
mit r q
1
, . . . , q
t
nat urlich auch ein minimales N
0
mit der be-
sagten Eigenschaft. Man schreibt dann N
0
= R(q
1
, . . . , q
t
; r) und nennt dies
die Ramsey-Zahl zu r und q
1
, . . . , q
t
. Das verallgemeinerte Schubfachprinzip
liefert beispielsweise
R(q
1
, . . . , q
t
; 1) = (q
1
1) (q
t
1) 1.
Man kann sagen, da Satz 1.1 die Existenz der Ramsey-Zahlen zumInhalt hat.
Man sieht leicht, da stets R(q
1
, . . . , q
t
; r) max{q
1
, . . . , q
t
] gilt.
(d) Seien beliebige nat urliche Zahlen r, q
1
, . . . , q
t
mit r q
1
, . . . , q
t
gege-
ben. Wir setzen q = max{q
1
, . . . , q
t
]; dann besitzt R(q, . . . , q, t ) die f ur
r, q
1
, . . . , q
t
geforderten Eigenschaften, es gilt also
R(q
1
, . . . , q
t
; r) R(q, . . . , q; r).
Daher w urde es gen ugen, Satz 1.1 im Falle q
1
= = q
t
zu beweisen.

Ubung 1.2. Man zeige, da jede Kantenf arbung des vollst andigen Graphen K
6
auf 6 Punkten mit zwei Farben ein monochromes Dreieck enth alt, und beweise
R(3, 3; 2) = 6. Diese Tatsache wird gern wie folgt eingekleidet: Unter je sechs
Personen auf einer Party nden sich drei, die sich gegenseitig kennen, oder drei,
die sich gegenseitig nicht kennen.
Beweis des Satzes von Ramsey. F ur t = 1 ist die Behauptung trivial: Es gilt offenbar
R(q
1
; r) = q
1
.
Als n achstes zeigen wir mit Induktion uber t , da es gen ugt, den Satz f ur t = 2
zu beweisen. Sei also t 3, und der Satz sei f ur 2, . . . , t 1 bereits gezeigt. F ur
gegebene nat urliche Zahlen r und q
1
, . . . , q
t
mit r q
1
, . . . , q
t
betrachten wir den
folgenden Fall mit t 1 Zahlen:
q
/
1
= q
1
, . . . , q
/
t 2
= q
t 2
sowie q
/
t 1
= R(q
t 1
, q
t
; r);
wegen R(q
t 1
, q
t
; r) max{q
t 1
, q
t
] r gilt dabei r q
/
1
, . . . , q
/
t 1
. Wir
behaupten, da wir N
0
= R(q
/
1
, . . . , q
/
t 2
, q
/
t 1
; r) w ahlen k onnen. Seien also
[M[ N
0
und
_
M
r
_
= P
1
P
t 1
P
t
eine Zerlegung. Wir setzen nun
P
/
1
= P
1
, . . . , P
/
t 2
= P
t 2
sowie P
/
t 1
= P
t 1
P
t
und erhalten
_
M
r
_
= P
/
1
P
/
t 2
P
/
t 1
. Nach Induktionsannahme gibt es ein
M
/
M sowie einen Index s {1, . . . , t 1] mit [M
/
[ = q
/
s
und
_
M
/
r
_
P
/
s
. Ist
VI.1 Die nite Version des Satzes von Ramsey 107
dabei s < t 1, so ist [M
/
[ = q
s
,
_
M
/
r
_
P
s
, und wir sind fertig. Sei nun s = t 1,
also [M
/
[ = R(q
t 1
, q
t
; r) sowie
_
M
/
r
_
P
t 1
P
t
. Indem wir den zu P
t 1

_
M
/
r
_
und P
t

_
M
/
r
_
geh orenden Zweier-Fall betrachten, nden wir ein M
//
M
/
M
sowie einen Index s {t 1, t ] mit [M
//
[ = q
s
und
_
M
//
r
_
P
s
, womit wir auch in
diesem Falle fertig sind.
Es bleibt also nur noch die Existenz der Ramsey-Zahlen R(q
1
, q
2
; r) nachzu-
weisen, was mit Induktion uber r erfolgen wird. Der Induktionsanfang r = 1 folgt
dabei wie wir bereits gesehen haben aus demverallgemeinerten Schubfachprin-
zip:
R(q
1
, q
2
; 1) = q
1
q
2
1.
Sei also r > 1, und die Behauptung gelte bereits f ur 1, . . . , r 1. Wir verwenden
nun eine weitere Induktion, und zwar uber q := q
1
q
2
. Der Induktionsanfang ist
also der Fall q = 2r; wir zeigen gleich etwas allgemeiner:
(1.1) R(q
1
, r; r) = q
1
und R(r, q
2
; r) = q
2
.
Aus Symmetriegr unden gen ugt es, die Behauptung f ur R(q
1
, r; r) nachzuweisen;
seien also [M[ q
1
und
_
M
r
_
= P
1
P
2
eine Zerlegung. Ist P
2
,= , so w ahlt man
M
/
P
2
, erh alt [M
/
[ = r sowie
_
M
/
r
_
= {M
/
] P
2
und ist fertig. Ist P
2
= , so
ist
_
M
r
_
= P
1
, und man kann M
/
als eine beliebige q
1
-Teilmenge von M w ahlen.
Das eben Bewiesene erlaubt f ur den Induktionsschritt eine Beschr ankung auf
den Fall r < q
1
, q
2
. Die Induktionsannahme stellt dann die Existenz der Ramsey-
Zahlen R(q
1
1, q
2
; r) =: p
1
und R(q
1
, q
2
1; r) =: p
2
sicher; zu zeigen ist,
da auch die Ramsey-Zahl R(q
1
, q
2
; r) existiert. Wir beweisen sogar eine etwas
st arkere Aussage, n amlich die Ungleichung
(1.2) R(q
1
, q
2
; r) R(p
1
, p
2
; r 1) 1.
Sei also M eine N-Menge mit N R(p
1
, p
2
; r 1) 1; ferner sei eine Zerlegung
_
M
r
_
= P
1
P
2
gegeben. Wir w ahlen nun x
0
M und setzen M
0
= M {x
0
].
Hieraus leiten wir eine Zerlegung
_
M
0
r1
_
= Q
1
Q
2
wie folgt ab:
Q
1
= {A [ A M
0
, [A[ = r 1, A {x
0
] P
1
]
Q
2
= {A [ A M
0
, [A[ = r 1, A {x
0
] P
2
].
Da M
0
mindestens R(p
1
, p
2
; r 1) Elemente hat, gibt es ein M
/
0
M
0
und ein
k {1, 2] mit [M
/
0
[ = p
k
und
_
M
/
0
r1
_
Q
k
. Sei etwa k = 1; der Fall k = 2
folgt analog. Es gilt also [M
/
0
[ = p
1
= R(q
1
1, q
2
; r) sowie
_
M
/
0
r1
_
Q
1
. Nach
Induktionsannahme tritt einer der beiden folgenden F alle ein:
108 VI Der Satz von Ramsey
Fall I. Es gibt ein M
//
0
M
/
0
mit [M
//
0
[ = q
1
1 und
_
M
//
0
r
_
P
1
. Wir setzen nun
M
/
= M
//
0
{x
0
]. Dann ist [M
/
[ = q
1
. Ist A M
/
, [A[ = r und sogar A M
//
0
, so
ist A P
1
. Gilt dagegen x
0
A, so ist A
0
= A {x
0
] eine (r 1)-Untermenge
von M
/
0
, also in Q
1
, woraus ebenfalls A = A
0
{x
0
] P
1
folgt.
Fall II. Es gibt ein M
/
M
/
0
mit [M
/
[ = q
2
und
_
M
/
0
r
_
P
2
. Dann sind wir bereits
fertig.
Damit ist der Satz von Ramsey vollst andig bewiesen. 2
Bemerkung 1.3. Trotz intensiver Bem uhungenkonntenabgesehenvondenschon
angegebenen trivialen F allen r = 1, t = 1 und (1.1) bislang nur wenige Ramsey-
Zahlen bestimmt werden. Das einzige bekannte Resultat f ur r 3 ist wohl immer
noch R(4, 4; 3) = 13, siehe McKay und Radziszowski [1991]. F ur r = 2 ist es
ublich, statt R(q
1
, q
2
; 2) kurz R(q
1
, q
2
) zu schreiben; hier kennt man die folgenden
Werte, vgl. West [1996]:
R(3, 3) = 6 R(3, 4) = 9 R(3, 5) = 14
R(3, 6) = 18 R(3, 7) = 23 R(3, 8) = 28
R(3, 9) = 36 R(4, 4) = 18 R(4, 5) = 25
F ur t 3 ist noch R(3, 3, 3; 2) = 17 bekannt.

Ubung 1.4. Man verwende (1.2) und Induktion uber n := p q, um die folgende
Absch atzung f ur die Ramsey-Zahlen mit r = 2 zu beweisen:
(1.3) R(p, q)
_
p q 2
p 1
_
.

Ubung 1.5. Man zeige R(3, 4) = 9.


Hinweis: Man betrachte F arbungen des vollst andigen Graphen K
n
auf n Punkten
mit den Farben rot und blau. F ur n = 8 w ahle man als Punktemenge Z
8
und f arbe
die Kante {i, j] genau dann rot, wenn i j R = {3, 4, 5] gilt; man zeige, da
dann weder ein rotes Dreieck noch ein blauer K
4
existiert. F ur n = 9 nehme man
an, da kein rotes Dreieck existiert und f uhre eine Fallunterscheidung hinsichtlich
der Anzahl der roten Kanten durch, die mit einem gegebenen Punkt v inzidieren,
um dann einen blauen K
4
zu nden.

Ubung 1.6 (Erd os und Szekeres [1935]). Seien n Punkte in der Ebene gegeben.
Man sagt, die Punkte sind in allgemeiner Lage, wenn von ihnen keine drei auf einer
Geraden liegen, und in konvexer Lage, wenn sie die Ecken eines konvexen n-Ecks
bilden. Man beweise:
VI.2 Die unendliche Version des Satzes von Ramsey 109
(a) Unter f unf Punkten (der Ebene) in allgemeiner Lage gibt es stets vier in
konvexer Lage. Hinweis:
(b) Zu jedem n 1 gibt es ein N 1 mit folgender Eigenschaft: Unter je N
Punkten der Ebene in allgemeiner Lage gibt es stets n in konvexer Lage.
Hinweis: Es gen ugt, n Punkte zu nden, von denen je vier in konvexer Lage
sind, wie die folgende Figur andeutet:

Ubung 1.7 (nach Halder und Heise [1976]). Ein Komponist, versehen mit einer
endlichen Menge K von Kl angen, teilt die daraus gebildeten Dreikl ange irgendwie
in euphone (= wohlklingende) und kakophone (= ubelklingende) ein. Man zeige,
da es zu jedem n {1, 2, . . . ] ein N > 0 mit der folgenden Eigenschaft gibt:
Falls [K[ N ist, kann der Komponist in einer passenden Klangmenge K
0
K
mit [K
0
[ n entweder total euphon oder total kakophon komponieren.
2 Die unendliche Version des Satzes von Ramsey
Sowohl das klassische Schubfachprinzip als auch der Satz von Ramsey haben Vari-
anten, die mit unendlichen Mengen arbeiten. ImFalle des Schubfachprinzips bedarf
diese Variante keiner weiteren Erl auterung; mit ihrer Hilfe gewinnt man dann die
unendliche Version des Satzes von Ramsey.
Satz 2.1 (Unendliches Schubfachprinzip). Jede endliche Partition einer unendli-
chen Menge enth alt mindestens einen unendlichen Bestandteil.
Satz 2.2 (Unendliche Version des Satzes von Ramsey). Es sei X eine unendliche
Menge; ferner sei eine Zerlegung
_
M
r
_
= P
1
P
t
von
_
M
r
_
gegeben. Dann
gibt es einen Index s {1, . . . , t ] und eine unendliche Teilmenge X
0
von X mit
_
X
0
r
_
P
s
.
110 VI Der Satz von Ramsey
Beweis. Wir verwenden vollst andige Induktion nach r; dabei gilt der Induktionsan-
fang r = 1 nach Satz 2.1. Angenommen, der Fall r 1 2 sei bereits erledigt. Wir
betrachten nunmehr den Fall r und konstruieren eine geeignete Folge von Paaren
(S
j
, x
j
) (j = 1, 2, . . . ). Dabei w ahlen wir S
1
als beliebige abz ahlbar unendliche
Teilmenge von X sowie ein beliebiges x
1
S
1
. Wir setzen nun
T
1s
= {A [ A S
1
{x
1
], [A[ = r 1, {x
1
] A P
s
] (s = 1, . . . , t ).
Offenbar gilt dann
_
S
1
{x
1
]
r1
_
= T
11
T
1t
. Nach Induktionsannahme gibt es
ein s {1, . . . , t ] und eine unendliche Menge S
2
S
1
{x
1
] mit
_
S
2
r1
_
T
1s
.
Eine solche w ahlen wir als S
2
; in S
2
w ahlen wir ein beliebiges x
2
. Es ist klar, wie
man jetzt sukzessive unendliche Teilmengen S
1
, S
2
, . . . und paarweise verschie-
dene Elemente x
1
S
1
, x
2
S
2
, . . . mit S
j1
S
j
{x
j
] (j = 1, 2, . . . ) zu
konstruieren hat. Es gibt dann zu jedem j N einen Index s {1, . . . , t ] mit
A S
j1
, [A[ = r 1 = {x
j
] A P
s
.
Nach dem unendlichen Schubfachprinzip gibt es ein s {1, . . . , t ] und eine Folge
j
1
< j
2
< . . . mit {x
j

1
, . . . , x
j
r
] P
s
f ur
1
< <
r
. Somit erf ullt die
unendliche Teilmenge X
0
= {x
j
1
, x
j
2
, . . . ] von X wie gew unscht
_
X
0
r
_
P
s
. 2
Man kann Satz 2.2 und ein Diagonal-Argument f ur einen alternativen Beweis
von Satz 1.1 verwenden; dieses Vorgehen entspricht ungef ahr der urspr unglichen
Abhandlung von Ramsey [1930]. Wir verzichten hier darauf, dies durchzuf uhren,
und verweisen stattdessen auf Graham, Rothschild und Spencer [1990].

Ubung 2.3. Sei (X, _) eine partiell geordnete Menge. Man beweise die folgende
unendliche Version von

Ubung II.2.5: Wenn X unendlich ist, existiert eine unend-
liche Kette oder eine unendliche Antikette.
Einen

Uberblick uber einen Groteil der Ramsey-Literatur gibt das bereits
mehrfach erw ahnte Buch von Graham, Rothschild und Spencer [1990]. Besonders
interessant sind Verallgemeinungen, die zus atzliche Strukturen in die betrachteten
endlichen Mengen einf uhren. Ber uhmt ist folgendes Ergebnis von Graham, Leeb
und Rothschild [1972], das von Rota vermutet wurde und das wir hier ohne Beweis
angeben.
Satz 2.4. Sei q eine Primzahlpotenz, und seien r, n
1
, . . . , n
t
nat urliche Zahlen mit
n
1
, . . . , n
t
r. Dann gibt es eine nat urliche Zahl N derart, da folgendes gilt: Ist
H ein mindestens N-dimensionaler GF(q)-Vektorraum und ist
G
r
(H) = G
1
G
t
VI.2 Die unendliche Version des Satzes von Ramsey 111
eine beliebige Zerlegung der Menge G
r
(H) aller r-dimensionalen Teilr aume von
H, so gibt es einen Index s {1, . . . , t ] und einen n
s
-dimensionalen Teil-Vektor-
raum H
0
von H mit G
r
(H
0
) G
s
.
F ur einen vereinfachten Beweis sei wieder auf Graham, Rothschild und Spencer
[1990] verwiesen, wo man auch andere Resultate dieser Art ndet. Schlielich
erw ahnen wir noch ein Buch uber ergodische Ramsey-Theorie, n amlich McCut-
cheon [1999].
VII Der Satz von van der Waerden
In diesem Kapitel beweisen wir den ber uhmten Satz von van der Waerden [1926]
uber arithmetische Progressionen (an deren Denition wir bald erinnern werden),
nach dem f ur jede Zerlegung der nat urlichen Zahlen in endlich viele Teile
mindestens einer der auftretenden Teile arithmetische Progressionen beliebiger
L ange enthalten mu. Dieser Satz des jungen Bartel Leendert van der Waerden
(1903 1996) stellt eine der groen mathematischen Leistungen des 20. Jahrhun-
derts dar und hat seither immer wieder neue Forschungen h ochsten Ranges an-
geregt; einige dieser Entwicklungen werden wir ebenfalls n aher diskutieren. Wir
werden den Satz von van der Waerden auf eine endliche Variante zur uckf uhren, die
man zweckm aig als ein F arbungsproblem interpretiert und die an die Ramsey-
Theorie des vorigen Kapitels erinnert. In dieser Formulierung hat der Satz eine
weittragende Verallgemeinerung, n amlich den Satz von Hales und Jewett [1963],
den wir am Ende dieses Kapitels ebenfalls beweisen werden.
1 Arithmetische Progressionen
Denition 1.1. Eine Menge P Z heit eine arithmetische Progression der
L ange t, wenn es Zahlen a Z und d N mit
P = {a, a d, . . . , a (t 1)d]
gibt. Man nennt a das Anfangsglied und d die Schrittweite der arithmetischen
Progression P. Eine Menge der Form
P = {a, a d, a 2d, . . . ] bzw. P = {. . . , a 2d, a d, a, a d, a 2d, . . . ]
heit eine unendliche arithmetische Progression.
Die L ange t einer (endlichen) arithmetischen Progression P ist also nichts
weiter als die Anzahl ihrer Elemente: t = [P[. Je zwei verschiedene ganze Zahlen
a, b bilden trivialerweise eine arithmetische Progression P = {a, b] der L ange 2.
Erst von der L ange 3 an werden arithmetische Progressionen interessant.
Arithmetische Progressionen werden seit langemintensiv studiert. Wir erinnern
hier an einen klassischen Satz der Zahlentheorie, dessen (anspruchsvoller) Beweis
VII.1 Arithmetische Progressionen 113
nat urlich nicht in das Thema dieses Buches pat, der aber zweifellos zur mathema-
tischen Allgemeinbildung geh ort; ein Beweis ndet sich in vielen Lehrb uchern der
Zahlentheorie, etwa bei Dirichlet [1894], der diesen Satz 1837 bewiesen hat, oder
bei Hua [1982].
Satz 1.2 (Dirichletscher Primzahlsatz). Sei P = {a, a d, a 2d, . . . ] eine un-
endliche arithmetische Progression, f ur die die Schrittweite d und das Anfangsglied
a teilerfremd sind. Dann enth alt P unendlich viele Primzahlen.
Arithmetische Progressionen sind besonders regelm aig gebaute Mengen von
ganzen Zahlen. Wir nennen nun Mengen

sch on, wenn sie mit dieser Art von


Regelm aigkeit reichlich ausgestattet sind:
Denition 1.3. Eine Menge M Z heie sch on, wenn sie arithmetische Progres-
sionen beliebiger L ange enth alt.
Es ist leicht, Beispiele von sch onen Mengen anzugeben; trivialerweise sind N
und Z sowie unendliche arithmetische Progressionen sch on. Ein weniger triviales
Beispiel ist
{a, a d
1
, a d
2
, a 2d
2
, a d
3
, a 2d
3
, a 3d
3
, . . . ]
mit a Z, d
1
, d
2
, N, 0 < d
1
< d
2
<
Auch

h aliche Mengen sind leicht zu nden, etwa {0, 10, 10


2
, 10
3
, 10
4
, . . . ]. Ei-
ne einfache Idee zur Konstruktion derartiger Mengen besteht darin, in eine Menge
M auf geschickte Weise immer gr oere L ucken einzubauen, um lange arithmeti-
sche Progressionen in M zu verhindern. Man bemerkt jedoch, da man hierbei das
Komplement M der Menge M reichlich mit arithmetischen Progressionen ausstat-
tet, da die L ucken von M arithmetische Progressionen der Schrittweite 1 in M sind.
Der Satz von van der Waerden [1926] zeigt, da dies unumg anglich ist, da also das
Komplement einer h alichen Menge notwendigerweise sch on ist. Nat urlich k onnen
aber auch sch one Mengen ein sch ones Komplement haben; das gilt beispielsweise
f ur unendliche arithmetische Progressionen.
Satz 1.4 (Satz von van der Waerden). Sei r N und sei N = M
1
M
r
eine
Zerlegung von N. Dann ist mindestens eine der Mengen M
1
, . . . , M
r
sch on.
Zur Entdeckungsgeschichte des Beweises f ur Satz 1.4 vergleiche man van der
Waerden [1953/54]; man lese ferner Chintschin [1951] sowie Graham und Roth-
schild [1974]. Den Beweis von Satz 1.4 werden wir auf einigen Umwegen im
n achsten Abschnitt liefern.
114 VII Der Satz von van der Waerden
2 Beweis des Satzes von van der Waerden
Man kann Satz 1.4 leicht auf die folgende endliche Variante zur uckf uhren, was
dem Leser als

Ubung uberlassen sei. Die

Ahnlichkeit zu den Fragestellungen der
Ramsey-Theorie ist in dieser Formulierung offenkundig.
Satz 2.1 (Satz von van der Waerden, Finite Form). Zubeliebigennat urlichenZah-
len r und t gibt es ein N(r, t ) Nmit folgender Eigenschaft: F ur alle N N(r, t )
und jede Zerlegung {1, . . . , N] = B
1
B
r
enth alt mindestens eine der Mengen
B
1
, . . . , B
r
eine arithmetische Progression der L ange t .
Der Rest dieses Abschnitts ist dem Beweis von Satz 2.1 gewidmet. Zun achst
wollen wir die Situation des Satzes als ein F arbungsproblem interpretieren. Eine
Menge M in r disjunkte Bestandteile B
1
, . . . , B
r
zu zerlegen bedeutet, da man
von jedem Element von M sagt, zu welchem B

es geh ort; man ordnet also jedem


Element eine der Nummern 1, . . . , r zu. Interpretiert man nun die Nummern als

Farben, so bedeutet eine solche Zuordnung eine F arbung von M mit r Farben.
Da eine Teilmenge P von M ganz in einemB

enthalten ist, bedeutet dann einfach,


da alle Elemente von P dieselbe Farbe tragen. In exakter Sprechweise:
Denition 2.2. Sei M eine Menge und F eine weitere Menge, deren Elemente wir
Farben nennen. Eine Abbildung : M F heit dann auch eine F-F arbung von
M (oder eine F arbung mit [F[ Farben). Eine Teilmenge P von M wird monochrom
genannt, wenn die F arbung auf P konstant ist.

Ubung 2.3. a) Auf wieviele Arten kann man eine N-elementige Menge mit r Far-
ben f arben?
b) Man zeige: Ist N t r 1, und ist eine N-elementige Menge mit r Farben
gef arbt, so besitzt sie mindestens eine monochrome Teilmenge mit t 1 Elementen.
In der eben eingef uhrten Sprechweise ubersetzt sich Satz 2.1 unmittelbar in die
folgende Aussage:
Satz 2.4 (Satz von van der Waerden, Chromatische Version). Zu r, t N gibt es
stets ein N(r, t ) N mit folgender Eigenschaft: Ist N N(r, t ) und ist M =
{1, . . . , N] mit r Farben gef ahrt, so enth alt M mindestens eine monochrome arith-
metische Progression der L ange t .
Wir werden Satz 2.4 als Spezialfall einer allgemeineren Aussage erhalten, die
besser geeignet ist, um einen Induktionsbeweis anzusetzen. Dazu betrachten wir
den m-dimensionalen W urfel W
m
t 1
uber der Kante W
t 1
= {0, 1, . . . , t ]:
W
m
t 1
= {(x
1
, . . . , x
m
) [ x
j
{0, . . . , t ] f ur j = 1, . . . , m];
VII.2 Beweis des Satzes von van der Waerden 115
es handelt sich also um die Gitterpunkte in einem normalen m-dimensionalen
W urfel der Kantenl ange t . Weiter ben otigen wir die folgenden Teilmengen:
C
m
t 1
(0) = {(x
1
, . . . , x
m
) [ x
j
{0, . . . , t 1] f ur j = 1, . . . , m];
C
m
t 1
(1) = {(x
1
, . . . , x
m1
, t ) [ x
j
{0, . . . , t 1] f ur j = 1, . . . , m1];
C
m
t 1
(2) = {(x
1
, . . . , x
m2
, t, t ) [ x
j
{0, . . . , t 1] f ur j = 1, . . . , m2];
.
.
.
C
m
t 1
(m1) = {(x, t, . . . , t ) [ x = 0, . . . , t 1];
C
m
t 1
(m) = {(t, t, . . . , t )].
Diese sogenannten Klassen in W
m
t 1
sind paarweise disjunkt, sch opfen aber W
m
t 1
im allgemeinen nicht aus. F ur jede Wahl von a, d
1
, . . . , d
m
N denieren wir nun
eine Abbildung : W
m
t 1
N wie folgt:
(2.1) (x
1
, . . . , x
m
) = a x
1
d
1
x
m
d
m
.
Dann ist das Bild von C
m
t 1
(m 1) unter einer der Abbildungen gerade eine
arithmetische Progression der L ange t , da
(x, t, . . . , t ) = a xd
1
t d
2
t d
m
= a
/
xd
1
mit a
/
= at (d
2
d
m
) gilt (f ur x = 0, . . . , t 1). Mit diesen Bezeichnungen
k onnen wir jetzt die folgende Aussage S(t, m) formulieren:
Zu jedemr Ngibt es ein N(t, m, r) Nmit folgender Eigenschaft:
Ist N N(t, m, r) und f arbt man {1, . . . , N] mit r Farben, so gibt es
nat urliche Zahlen a, d
1
, . . . , d
m
, f ur die jede der Klassen C
m
t 1
(u) (u =
0, . . . , m) unter der gem a (2.1) deniertenAbbildung : W
m
t 1
N
ein monochromes, in M enthaltenes Bild hat.
Man sieht unmittelbar, da Satz 2.4 aus der G ultigkeit von S(t, 1) f ur t = 1, 2, . . .
folgt. In W
1
t 1
gibt es nur die Klassen C
1
t 1
(0) und C
1
t 1
(1); Bilder von C
1
t 1
unter
Abbildungen der Form(2.1) sind aber arithmetische Progressionen der L ange t , wie
wir schon bemerkt haben. Da es unter diesen Bildern monochrome gibt, bedeutet
also gerade die Existenz monochromer arithmetischer Progressionen der L ange t .
Wir werden nun den folgenden, st arkeren Satz (und damit implizit alle Versionen
des Satzes von van der Waerden) mit vollst andiger Induktion beweisen:
Satz 2.5. F ur beliebige t, m N gilt die Aussage S(t, m).
116 VII Der Satz von van der Waerden
Beweis. Der Induktionsanfang S(1, 1) ist trivial. Unser Induktionsplan sieht fol-
gendermaen aus:
S(t, 1), . . . , S(t, m) = S(t, m1); (2.2)
S(t, 1), S(t, 2), . . . = S(t 1, 1). (2.3)
Offensichtlich funktioniert die Induktion, wenn man (2.2) und (2.3) bewiesen
hat: Mittels (2.2) gewinnt man aus S(1, 1) nacheinander die Aussagen S(1, 2),
S(1, 3), . . . Nimmt man diese alle zusammen, so ergibt sich S(2, 1) mittels (2.3).
Dann verwendet man wieder (2.2) und gewinnt die Aussagen S(2, 2), S(2, 3), . . . ,
danach mittels (2.3) auch S(3, 1) usw.
Wir beweisen zun achst (2.2). Dazu setzen wir also die G ultigkeit der Aussagen
S(t, 1), . . . , S(t, m) voraus und w ahlen r N. Uns stehen dann insbesondere
N(t, m, r) und N(t, 1, r
p
) zur Verf ugung; wir setzen
p = N(t, m, r) sowie q = N(t, 1, r
p
)
und leiten die Schlufolgerung S(t, m1) f ur N = pq her. Offensichtlich haben
wir dann S(t, m1) mit
N(t, m1, r) = pq = N(t, m, r) N
_
t, 1, r
N(t,m,r)
_
gewonnen, da sich gr oere N stets auf kleinere, bei denen die Sache schon geklappt
hat, zur uckf uhren lassen (

Ubung!). Sei also N = pq. Wir f arben {1, . . . , N] mit


r Farben, w ahlen also : {1, . . . , N] {1, . . . , r]. Nun teilen wir {1, . . . , N] =
{1, . . . , pq] in q Bl ocke B
1
, . . . , B
q
mit je p Elementen auf:
B
1
= {1, . . . , p], B
2
= {p 1, . . . , 2p], . . . , B
q
= {(q 1)p 1, . . . , qp]
und setzen
(B
1
) = ((1), . . . , (p)), . . . , (B
q
) = (((q 1)p 1), . . . , (qp)).
Schreibt man (k) statt (B
k
) und fat {1, . . . , r]
p
als neue Farbenmenge auf, so
ist damit {1, . . . , q] mit r
p
Farben gef arbt. Die neuen Farben sind also p-Tupel von
altenFarben. Wegenq = N(t, 1, r
p
) gibt es in{1, . . . , q] eine (indenneuenFarben)
monochrome arithmetische Progression der L ange t . Sieht man sich die Entstehung
von an, so heit dies: In {1, . . . , pq] liegen t Bl ocke mit je p = N(t, m, r)
Elementen; diese Bl ocke liegen

in arithmetischer Progression und tragen allesamt


bei das n amliche Farbmuster. Wer uber gen ugend Intuition verf ugt, sieht hier
schon das Ende des gegenw artigen Beweisschrittes vor sich; jetzt mu man das
Ergebnis nur noch anst andig aufschreiben.
VII.2 Beweis des Satzes von van der Waerden 117
Es gibt also a
/
, d
/
Nmit (a
/
) = (a
/
d
/
) = = (a
/
(t 1)d
/
). Dies
bedeutet
((a
/
1)p 1) = ((a
/
d
/
1)p 1) = = ((a
/
(t 1)d
/
1)p 1)
.
.
.
((a
/
p) = ((a
/
d
/
)p) = = ((a
/
(t 1)d
/
)p)
In diesemmit einigen Gleichheitszeichen durchsetzten Schema vonpq alten Farben
{1, . . . , r] steht als erste Spalte die F arbung eines Blocks der L ange p. Man kann
dies als eine F arbung von {1, . . . , p] lesen. Wegen p = N(t, m, r) gibt es nat urliche
Zahlen a
//
, d
1
, . . . , d
m
, f ur die die Bilder der Klassen C
m
t 1
(0), . . . , C
m
t 1
(m) unter
der zugeh origen -Abbildung s amtlich monochrom sind. Die Monochromie des
-Bilds von C
m
t 1
(u) bedeutet dabei, da die Farbwerte
((a
/
1)p a
//
x
1
d
1
x
mu
d
mu
t (d
mu1
d
m
))
f ur alle x
1
, . . . , x
mu
{0, . . . , t 1] ubereinstimmen. Somit d urfen wir imobigen
Schema weitere Gleichheitszeichen eintragen: Die Farbwerte
((a
/
xd
/
1)p a
//
x
1
d
1
x
mu
d
mu
t (d
mu1
d
m
))
stimmen f ur alle x, x
1
, . . . , x
mu
{0, . . . , t 1] uberein. Setzt man nun a =
(a
/
1)pa
//
undd
0
= pd
/
, sosieht manabgesehenvoneiner Index-Numerierung
da s amtliche Klassen C
m1
t 1
(0), . . . , C
m1
t 1
(m) f ur die zugeh origeAbbildung der
Form (2.1) monochrome Bilder haben. Die Monochromie des Bildes der einele-
mentigen Klasse C
m1
t 1
(m 1) ist trivial. Man sieht auerdem leicht ein, da die
Abbildung nicht uber {1, . . . , N] hinausschiet. Damit ist der Beweis von (2.2)
geleistet.
Wir beweisen nun (2.3). Wir setzen also s amtliche S(t, m) mit m Nals richtig
voraus, w ahlen ein r Nund beweisen S(t 1, 1), d. h. die Existenz monochromer
arithmetischer Progressionen der L ange t 1. Wir zeigen, da wir N(t 1, 1, r) =
N(t, r, r) setzen d urfen und w ahlen somit eine Zahl n N(t, r, r). Dann f arben
wir {1, . . . , n] mit r Farben. Wegen n N(t, r, r) gibt es a, d
1
, . . . , d
r
N, derart,
da die r 1 Klassen C
r
t 1
(0), . . . , C
r
t 1
(r) jeweils monochrome Bilder unter der
Abbildungaus (2.1) bekommen. Da hier r1Klassen, aber nur r Farbenauftreten,
bekommen die -Bilder von zwei verschiedenen Klassen dieselbe Farbe. Es gibt
also Indizes u und v mit 0 u < v r, f ur die die folgende Menge monochrom
ist:
{a x
1
d
1
x
u
d
u
t (d
u1
d
r
) [ x
1
, . . . , x
u
{0, . . . , t 1]]
{a x
1
d
1
x
v
d
v
t (d
v1
d
r
) [ x
1
, . . . , x
v
{0, . . . , t 1]].
118 VII Der Satz von van der Waerden
Diese monochrome Menge M enth alt nun eine arithmetische Progression der L ange
t 1, n amlich
{a x(d
u1
d
v
) t (d
v1
d
r
) [ x = 0, . . . , t ],
wobei die ersten t Glieder (x = 0, . . . , t 1) dem zweiten und das (t 1)-te
Glied dem ersten Bestandteil von M entstammen. Damit ist auch der Schlu von
S(t, 1), S(t, 2), . . . auf S(t 1, 1) vollzogen und der Beweis von Satz 2.5 vollendet.
2
Insbesondere haben wir somit den Satz von van der Waerden vollst andig bewie-
sen. In den n achsten beiden Paragraphen die man als historische Bemerkungen
auffassen mag diskutieren wir einige mit diesem Satz zusammenh angende Fra-
gestellungen, ohne allerdings Beweise zu geben.
3 Der Satz von Szemerdi
Der Satz von van der Waerden gibt keine Auskunft dar uber, welche der Mengen
M
1
, . . . , M
r
in einer Zerlegung
(3.1) N = M
1
M
r
denn nun wirklich sch on sind. Er sagt nur: Mindestens eine von ihnen ist sch on.
Erd os und Turn [1936] sprachen die folgende Vermutung aus: Ist M N und gilt
limsup
n
1
n
[M {1, . . . , n][ > 0
man nennt diesen limsup die obere Dichte d(M) von M so ist M sch on.
Hieraus w urde sich der Satz von van der Waerden sofort ergeben, denn aus (3.1)
folgt unmittelbar, da mindestens eine der oberen Dichten d(M
1
), . . . , d(M
r
) strikt
positiv ist.
Erd os und Turn gaben ihrer Vermutung eine genauere quantitative Form, f ur
deren Formulierung wir die folgende Schreibweise einf uhren. Es sei r
t
(n) die ma-
ximale M achtigkeit einer Teilmenge B {1, . . . , n], die keine arithmetische Pro-
gression der L ange t enth alt. Man veriziert sofort
(3.2) r
t
(mn) r
t
(m) r
t
(n),
was sich der Leser klarmachen sollte. Somit gen ugt r
t
stets der Voraussetzung des
folgenden bekannten Lemmas, dessen Beweis demLeser als

Ubung uberlassen sei.
VII.3 Der Satz von Szemerdi 119
Lemma 3.1. Falls r : N R

f ur alle m, n N die Ungleichung


r(mn) r(m) r(n)
erf ullt, so existiert lim
n
r(n)
n
und hat einen endlichen Wert. 2
Die quantitative Version der Vermutung von Erd os und Turn (die inzwischen
der Satz von Szemerdi ist) lautet nun:
Satz 3.2 (Satz von Szemerdi). Es gilt
(3.3) r
t
:= lim
n
1
n
r
t
(n) = 0 f ur alle t N.

Ubung 3.3. Man beweise: Falls r


t
= 0 gilt, enth alt jede Menge M N mit strikt
positiver oberer Dichte mindestens eine arithmetische Progression der L ange t .
Insbesondere folgt aus (3.3), da jede Menge M N mit strikt positiver oberer
Dichte sch on ist.
Roth [1952] bewies 1952 r
3
= 0, vgl. auch Roth [1953,1954,1967]. Erd os setz-
te f ur den Beweis von (3.3) einen Privat-Preis von 1000 $ aus. 1973 fand Szemerdi
(publiziert in Szemerdi [1975]) einen Beweis f ur (3.3) und holte sich damit die
1000 $; dieser Beweis ist eines der rafniertesten und schwierigsten Probest ucke
mathematischen Denkens. Furstenberg [1977] gab einen Beweis von Satz 3.2 un-
ter Ausn utzung tieiegender, zum Teil von ihm neu entwickelter Methoden der
Ergodentheorie, vgl. die Monographie Furstenberg [1981].
Furstenberg undWeiss [1978] bewiesen den Satz von van der Waerden mit Tech-
niken aus der topologischen Dynamik im sogenannten Shift-Raum; einen winzig
kleinen Einblick in derartige Techniken gew ahrt Kap. V 2 dieses Buches. Erd os
hat auch 3000 $ f ur den Beweis folgender Vermutung ausgesetzt:
(3.4) Jede Teilmenge M von N mit

nM
1
n
= ist sch on.
Da

p Primzahl
1
p
= gilt, w urde (3.4) insbesondere die Existenz beliebig langer
arithmetischer Progressionen von Primzahlen implizieren, ein Resultat, das der
Leser mit demDirischletschenPrimzahlsatz 1.2vergleichensollte. Erd os soll gesagt
haben, er k onne f ur den Beweis von (3.4) ruhig auch 10
6
$ aussetzen, die er gar
nicht besitze, denn er glaube nicht, da er einen solchen Beweis erleben werde
(womit er, der 1996 gestorben ist, recht behielt). Man sieht hier noch einmal, da
historisch gesehen das uralte Primzahl-Thema st andig imHintergrund aller der von
uns referierten Untersuchungen steht. In den gegenw artigen Zusammenhang geh ort
auch Hindman [1974].
120 VII Der Satz von van der Waerden
4 Ergebnisse von Schur, Rado und Deuber
Wir beginnen mit einer chromatischen Formulierung des Satzes von van der Waer-
den im unendlichen Fall; man macht sich leicht klar, da es sich in der Tat um eine
aquivalente Umformulierung von Satz 1.4 handelt.
Satz 4.1. Ist r N und f arbt man N mit r Farben, so gibt es monochrome arith-
metische Progressionen beliebiger L ange. 2
Dieser Satz hat eine Art Vorl aufer, der von Schur [1916] stammt. Schur zeigte
n amlich, da es bei jeder F arbung von Nmit r Farben monochrome Tripel {x, y, z]
mit x y = z gibt; man beachte, da dies nicht aus dem Satz von van der Waerden
folgt. Als Motiv stand hinter Schurs Untersuchung das Fermat-Problem. In der Tat
bewies Schur mit Hilfe der soeben zitierten Aussage:
Satz 4.2. Sei m N. Dann gibt es ein p
0
> 0, derart, da f ur jede Primzahl
p p
0
drei nicht durch p teilbare Zahlen x, y, z mit x
m
y
m
= z
m
mod p
existieren.
Der Satz von van der Waerden wurde in der Dissertation von Rado [1933a]
weitergef uhrt, vgl. auch Rado [1933b]. Rado betrachtete ganzzahlige Matrizen
A = (a
jk
)
j=1,...,m; k=1,...,n
und fragte nach ganzzahligen L osungen x = (x
1
, . . . , x
n
) Z
n
des Gleichungs-
systems Ax
T
= 0. Er nannte die Matrix A partitionsregul ar, wenn dieses Glei-
chungssystemf ur jedes r und jede F arbung von Nmit r Farben eine monochrome
L osung x = (x
1
, . . . , x
n
) N
n
besitzt, also (x
0
) = = (x
n
) gilt. Rado be-
wies dann die folgende Aussage:
Satz 4.3. Die ganzzahlige Matrix A = (a
jk
)
j=1,...,m; k=1,...,n
ist genau dann parti-
tionsregul ar, wenn es eine Zerlegung {1, . . . , n] = D
0
D
1
D
s
der Menge der
Spaltenindizes gibt, so da f ur die Spaltenvektoren a
k
= (a
jk
)
j=1,...,m
folgendes
gilt:

kD
0
a
k
= (0, . . . , 0)
T
und f ur jedes = 1, . . . , s ist

kD

a
k
eine rationale Linearkombination der a
i
mit i D
0
D
1
.
VII.4 Ergebnisse von Schur, Rado und Deuber 121
Man sagt dann, da die Matrix A die Spaltenbedingung erf ullt. Aus Satz 4.3
folgt der Satz von van der Waerden, indem man f ur die spezielle Matrix
(4.1)
_
_
_
_
_
_
_
1 1 0 . . . 0 0 1
0 1 1 . . . 0 0 1
0 0 1 . . . 0 0 1
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
0 0 0 . . . 1 1 1
_
_
_
_
_
_
_
die Spaltenbedingung nachweist, was wir demLeser als

Ubungsaufgabe empfehlen.
Danach schreibt man hin, was Ax
T
= 0 bedeutet:
x
2
x
1
= x
n
x
3
x
2
= x
n
.
.
.
x
n1
x
n2
= x
n
,
womit {x
1
, . . . , x
n1
] eine arithmetische Progression der L ange n 1 und der
Schrittweite x
n
ist. Jede monochrome L osung von Ax
T
= 0 liefert also eine mo-
nochrome arithmetische Progression der L ange n.
Rados Ergebnis besagt also etwas mehr als der Satz von van der Waerden, da
er die Existenz beliebig langer arithmetischer Progressionen liefert, die zusammen
mit ihrer Schrittweite monochrome Mengen bilden. Insbesondere umfat Satz 4.3
im Gegensatz zu Satz 4.1 auch das oben zitierte Ergebnis von Schur [1916].
Die Arbeiten von Deuber gehen von folgender Beobachtung aus, die leicht aus
Satz 4.3 folgt:
Korollar 4.4. Ist r N und N = M
1
M
r
eine Zerlegung von N, so gibt es
mindestens ein {1, . . . , r], f ur welches jede partitionsregul are Matrix A uber
Z
(m,n)
eine L osung x = (x
1
, . . . , x
n
) von Ax
T
= 0 mit x
1
, . . . , x
n
M

besitzt
(f ur beliebige m, n).
Beweis. Angenommen, es gibt zu jedem {1, . . . , r] ein A
()
Z
(m

,n)
, das
die Spaltenbedingung erf ullt, aber keine L osung von A
()
x
T
= 0 mit x M
n

gestattet. Dann erf ullt


A =
_
_
_
_
_
A
(1)
0
A
(2)
.
.
.
0 A
(r)
_
_
_
_
_
122 VII Der Satz von van der Waerden
ebenfalls die Spaltenbedingung und gestattet in keinem M
n
1
n
r

eine L osung
von Ax
T
= 0 (

Ubung!). Dies ist ein Widerspruch zu der durch Satz 4.3 gesicherten
Partitionsregularit at von A. 2
Aufgrund von Korollar 4.4 ist es sinnvoll, eine Menge M Zpartitionsregul ar
zu nennen, wenn f ur jede partitionsregul are Matrix A Z
(m,n)
die Gleichung
Ax
T
= 0 eine L osung x M
n
besitzt. Nach 4.4 ist also f ur jede Zerlegung
N = M
1
M
r
mindestens eine der Mengen M
1
, . . . , M
r
partitionsregul ar.
Es gilt nun die folgende beachtliche Verst arkung dieses Ergebnisses:
Satz 4.5. Ist M N partitionsregul ar und M = M
/
1
M
/
s
eine Zerlegung
von M, so ist mindestens eine der Mengen M
/
1
, . . . , M
/
s
partitionsregul ar.
Satz 4.5 ist das Hauptresultat von Deuber [1973], der seine hierbei gefundenen
Ans atze noch betr achtlich weiter verfolgt hat, siehe Deuber [1975a,b,c]. Weiterhin
seien die

Ubersichtsartikel von Deuber [1989] und Leader [2003] erw ahnt.
5 Der Satz von Hales und Jewett
In diesemAbschnitt formulieren und beweisen wir ein weiteres ber uhmtes Resultat
vom van-der-Waerden-Typ, das von Hales und Jewett [1963] stammt und, wie wir
sehen werden, ebenfalls den Satz von van der Waerden als Spezialfall enth alt. Es sei
bemerkt, da man auch den Satz von Hales und Jewett wie den von van der Waer-
den mit Methoden der topologischen Dynamik beweisen kann, siehe Furstenberg
und Weiss [1978]. Wir werden dagegen rein kombinatorisch vorgehen und eine
Erweiterung der beim Satz von van der Waerden angewendeten Beweismethode
ben utzen. Weiterf uhrende Untersuchungen sind im Buch von Graham, Rothschild
und Spencer [1990] dargestellt.
Wie schon beim Beweis des Satzes von van der Waerden betrachten wir
die W urfel {0, . . . , t ]
m
= W
m
t 1
(m, t N) und darin die Klassen C
m
t 1
(0), . . . ,
C
m
t 1
(m).
Ist k < m, so kann man W
k
t 1
auf folgende Weise injektiv in W
m
t 1
abbil-
den. Zun achst zerlegt man die Indexmenge {1, . . . , m] disjunkt in k 1 Mengen
B
0
, B
1
, . . . , B
k
,= und xiert x
j
f ur j B
0
jeweils beliebig; dann ordnet man
jedem (y
1
, . . . , y
k
) W
k
t 1
sein Bild (x
1
, . . . , x
m
) W
m
t 1
zu, indem man f ur x
j
mit j B
0
die vorher xierten Werte verwendet und auf B
i
mit i > 0 konstant
x
j
= y
i
setzt. Man ben utzt also die y
1
, . . . , y
k
, um auf den B
1
, . . . , B
k
entspre-
chende konstante Abbildungen vorzuschreiben.
Teilmengen von W
m
t 1
, die in dieser Weise als Bilder von W
k
t 1
zustandekom-
men, nennt man k-dimensionale Unterr aume U von W
m
t 1
. Die Bilder der Klassen
VII.5 Der Satz von Hales und Jewett 123
C
k
t 1
(0), . . . , C
k
t 1
(k) bezeichnen wir mit C
U
t 1
(0), . . . , C
U
t 1
(k) und nennen sie
die Klassen von U.
1-dimensionale Unterr aume heien auch Geraden. Geraden U in W
m
t 1
entstehen also, indem man Komponenten in einem B
0
xiert und in B
1
=
{1, . . . , m] B
0
,= nacheinander die Komponenten-Tupel 0 . . . 0; 1 . . . 1; ;
t . . . t vorschreibt.
Wir sehen uns dies einmal in einem Beispiel an. Sei t = 1, k = 2, m = 7,
B
0
= {1, 2, 7], B
1
= {3, 6], B
2
= {4, 5], x
1
= x
7
= 0 und x
2
= 1. Dann erhalten
wir
U = {0100000, 0101100, 0110010, 0111110],
C
U
t 1
(0) = {0100000], C
U
t 1
(1) = {0101100], C
U
t 1
(2) = {0111110].
Nach diesenVorbereitungen k onnen wir nun das Ergebnis von Hales und Jewett
[1963] formulieren:
Satz 5.1 (Satz von Hales und Jewett). Zu beliebigen r, t N gibt es ein M(r, t )
N, derart, da f ur m M(r, t ) stets folgendes gilt: F arbt man W
m
t
mit r Farben,
so gibt es in W
m
t
eine monochrome Gerade.
Vor dem Beweis von Satz 5.1 geben wir zun achst noch zwei Beispiele an, die
zum Verst andnis des Satzes beitragen sollten.
Beispiel 5.2. Wir zeigen M(r, 2) r. Der W urfel W
m
2
besteht aus allen m-Tupeln
von Nullen und Einsen; wir betrachten nun m1 von ihnen, und zwar
(11 . . . 111), (11 . . . 110), (11 . . . 100), . . . , (10 . . . 000), (00 . . . 000).
F ur m r gibt es unter diesen m-Tupeln bei gegebener F arbung von W
m
2
mit r
Farben mindestens zwei gleichfarbige, etwa
(1 . . . 1 1 . . . 1 0 . . . 0) und (1 . . . 1 0 . . . 0 0 . . . 0).
Offenbar bilden diese beiden m-Tupel zusammen eine monochrome Gerade in W
m
2
,
wie verlangt.
Beispiel 5.3. Wir leiten die chromatische Version des Satzes von der Waerden
(Satz 2.4) aus Satz 5.1 ab. Hierzu w ahlen wir r, t, m N mit m M(r, t ) und
bilden M = {0, . . . , t
m
1] t -adisch bijektiv auf W
m
t
ab:
n (x
1
, . . . , x
m
) n = x
1
x
2
t x
3
t
2
x
m
t
m1
.
Eine F arbung von M mit r Farben ubersetzt sich dann in eine F arbung von W
m
t
mit r Farben; jede monochrome Gerade U W
m
t
liefert dabei eine arithmetische
124 VII Der Satz von van der Waerden
Progression in M, wie wir uns jetzt uberlegen. U wird ja durch eine Zerlegung
{1, . . . , m] = B
0
B
1
mit B
1
,= und eine Auswahl von Elementen x
j
(j B
0
)
deniert. Wir setzen
a =

jB
0
x
j
t
j1
sowie d =

jB
1
t
j1
und erhalten als t -adisches Bild von U in M die arithmetische Progression
{a, a d, . . . , a t d] der L ange t 1 mit Anfangsglied a und Schrittweite d.
Der Satz von Hales und Jewett impliziert also den Satz von van der Waerden,
aber mit einer erheblichen Versch arfung, da nun die Schrittweite der sich ergeben-
den arithmetischen Progression eine Summe von lauter verschiedenen t -Potenzen
ist.
Beweis des Satzes von Hales und Jewett. Wir werden den Beweis durch vollst andige
Induktion f uhren und dabei die nachstehenden beiden Aussagen A(t ) und B(t )
(t = 1, 2, . . . ) verwenden.
Aussage A(t ). Zu beliebigem r N gibt es ein M(r, t ) N, so da f ur
m M(r, t ) folgendes gilt: F arbt man W
m
t
mit r Farben, so gibt es in W
m
t
eine monochrome Gerade.
Aussage B(t ). Zu beliebigen r, k N gibt es ein L(r, t, k) N , so da f ur
m L(r, t, k) folgendes gilt: F arbt man W
m
t 1
mit r Farben, so enth alt W
m
t 1
einen
k-dimensionalenUnterraumU, dessenKlassenC
U
t 1
(0), . . . , C
U
t 1
(m) monochrom
(aber eventuell mit verschiedenen Farben) sind.
Wir werden nun j ur jedes t N
A(t ) = B(t ) sowie B(t ) = A(t 1)
beweisen. Da A(1) trivial ist (weil W
m
1
immer nur aus einem Punkt besteht), folgt
die G ultigkeit von A(1), A(2), . . . , also Satz 5.1. Man kann die dann ebenfalls
bewiesene G ultigkeit von B(1), B(2), . . . als eine Variante des Satzes von Hales
und Jewett ansehen.
Wir setzen zun achst A(t ) f ur t 1 als richtig voraus und beweisen B(t ) durch
Induktion nach k.
k = 1: Wir setzen, um es genau zu sagen, voraus, da es zu beliebigem r N
ein M(r, t ) N gibt, derart, da f ur m M(r, t ) und eine beliebige F arbung von
W
m
t
mit r Farben eine monochrome Gerade U in W
m
t
existiert. Nunmehr w ahlen
wir r N beliebig und setzen L(r, t, 1) := M(r, t ). Sei m M(r, t ). Wir f arben
W
m
t 1
mit r Farben. Wegen W
m
t
W
m
t 1
ist dann auch W
m
t
mit r Farben gef arbt,
und wegen m M(r, t ) enth alt W
m
t
eine monochrome Gerade. Diese Gerade bildet
die Klasse C
U
t 1
(0) einer Geraden in W
m
t 1
(

Ubung!). Da C
U
t 1
(1) nur aus einem
VII.5 Der Satz von Hales und Jewett 125
Punkt besteht und somit automatisch monochrom ist, enth alt W
m
t 1
eine Gerade U
mit monochromen Klassen C
U
t 1
(0), C
U
t 1
(1).
{1, . . . , k] k 1: Wir nehmen also an, da es zu jedem r N und zu jedem
k
/
N mit k
/
k ein L(r, t, k
/
) N gibt, derart, da f ur jedes m
/
L(r, t, k
/
)
und jede F arbung von W
m
/
t 1
mit r Farben ein k
/
-dimensionaler Unterraum U
/
von
W
m
/
t 1
existiert, dessen Klassen C
U
/
t 1
(u) (u = 0, . . . , k
/
) monochrom sind.
Nunmehr w ahlen wir ein r N und setzen
m = L(r, t, k) sowie s = r
(t 1)
m
;
s ist also die Anzahl aller m oglichen F arbungen von W
m
t 1
mit r Farben. Wir setzen
m
/
= L(s, t, 1) und zeigen, da wir
L(r, t, k 1) = m
/
m = L
_
r
(t 1)
L(r,t,k)
, k, 1
_
L(r, t, k)
setzen d urfen. Sei also eine F arbung von W
m
/
m
t 1
mit r Farben; es gen ugt, in
W
m
/
m
t 1
einen (k 1)-dimensionalen Unterraum mit monochromen Klassen zu
nden; denn w urde man m
/
m durch eine gr oere Zahl ersetzen, so h atte man
lediglich m
/
entsprechend zu vergr oern und die nun folgenden Schl usse ablaufen
zu lassen (

Ubung!).
Wir identizieren W
m
/
m
t 1
mit dem cartesischen Produkt
W
m
/
t 1
W
m
t 1
= {xy [ x W
m
/
t 1
, y W
m
t 1
],
wobei wir statt (x, y) einfach xy schreiben. Wir f arben W
m
/
t 1
mit s = r
(t 1)
m
Farben, indem wir

/
(x) = ((xy))
yW
m
t 1
setzen; die Werte von
/
sind also Muster von

alten (bei verwendeten) Farben


auf W
m
/
t 1
. Wegen m
/
= L(s, t, 1) gibt es in W
m
/
t 1
eine Gerade U
/
mit bez uglich
/
monochromer Klasse C
U
/
t 1
(0) (die andere Klasse C
U
/
t 1
(1) besteht nur aus einem
Element und ist daher trivialerweise monochrom):

/
(x) = ((xy))
yW
m
t 1
ist also f ur alle x C
U
/
t 1
(0) dasselbe Muster von

alten Farben auf W


m
t 1
. Dieses
Muster, d. h. diese F arbung von W
m
t 1
mit den r

alten Farben, nennen wir .


Wegen m = L(r, t, k) gibt es in W
m
t 1
einen k-dimensionalen Unterraum U mit
bez uglich monochromen Klassen C
U
t 1
(0), . . . , C
U
t 1
(k). Wir bilden jetzt
U = U
/
U W
m
/
t 1
W
m
t 1
= W
m
/
m
t 1
126 VII Der Satz von van der Waerden
und zeigen, da die Klassen C
U
t 1
(0), . . . , C
U
t 1
(k 1) monochrom f ur die ur-
spr ungliche F arbung sind. Hierzu bemerken wir
C
U
t 1
(0) = C
U
/
t 1
(0) C
U
t 1
(0)
C
t 1
(1) = C
U
/
t 1
(0) C
U
t 1
(1)
.
.
.
C
U
t 1
(k) = C
U
/
t 1
(0) C
U
t 1
(k)
C
U
t 1
(k 1) = C
U
/
t 1
(1) C
U
t 1
(k).
Nach der Denition von und U sind dabei die ersten k 1 Klassen monochrom.
Die (k 2)-te besteht aber nur aus einem Element und ist deshalb automatisch
monochrom.
Wir betonen noch nachtr aglich, da die Denition der Klassen in einem et-
wa (k 1)-dimensionalen Unterraum von der gew ahlten Numerierung der Be-
standteile B
1
, . . . , B
k1
der zugeh origen Zerlegung der Indexmenge abh angt (hier
{1, 2, . . . , m
/
m]); nat urlich ist das obige Gleichungssystem nur bei einer ganz
bestimmten Numerierung richtig, die zu erraten und exakt aufzuschreiben wir dem
Leser anheimstellen.
Schlielich setzen wir B(t ) voraus und beweisen A(t 1). Also geben wir
r N vor; wir w ahlen dann m = L(r, t, r) und f arben W
m
t 1
mit r Farben. Wegen
B(t ) gibt es einen r-dimensionalen Unterraum U
/
von W
m
t 1
mit monochromen
Klassen C
U
/
t 1
(0), . . . , C
U
/
t 1
(r). Wir stellen U
/
als Bild von W
r
t 1
dar, ubertragen
die F arbung von U
/
nach W
r
t 1
und betrachten die r 1 in diesemW urfel liegenden
r-Tupel
(0, 0, . . . , 0, 0), (0, 0, . . . , 0, t ) , . . . , (0, t, . . . , t, t ), (t, t, . . . , t, t ).
Dann haben zwei dieser r-Tupel dieselbe Farbe. Wir schreiben diese beiden r-Tupel
kurz so:
(5.1)
(0 . . . 0 0 . . . 0 t . . . t )
(0 . . . 0 t . . . t t . . . t ).
Die r-Tupel
(5.2)
(0 . . . 0 1 . . . 1 t . . . t )
.
.
.
(0 . . . 0 t 1 . . . t 1 t . . . t )
VII.5 Der Satz von Hales und Jewett 127
haben ebenfalls diese Farbe, weil ihre Bilder mit dem Bild von
(0 . . . 0 0 . . . 0 t . . . t )
in derselben Klasse von U
/
liegen und diese Klasse monochrom ist. Die Bilder der
in (5.1) und (5.2) aufgelisteten r-Tupel bilden daher in W
m
t 1
eine monochrome
Gerade, womit A(t 1) nachgewiesen und der Beweis beendet ist. 2
VIII Codes
Unter einem Code versteht man in der Umgangssprache eine Verschl usselungs-
vorschrift. Man bildet beispielsweise Nachrichten, die in verst andlicher Sprache
formuliert sind, injektiv man m ochte schlielich keine Information verlieren in
Abracadabra-Folgen von Symbolen ab und hofft dann etwa, da

der Gegner die


Abbildung nicht kennt und somit nicht imstande ist, den

Code zu knacken. Die-


se Art von

Codes (die man besser und exakter als

Chiffren bezeichnen sollte)


sind aber nicht der Gegenstand der Codierungstheorie; sie geh oren vielmehr in die
bereits amAnfang von III.7 diskutierte Kryptographie.
Beispiele aus der Kryptographie t auschen leicht dar uber hinweg, da das Ver-
schl usseln (

Codieren) von Informationen etwa zum Zwecke fehlerfreier



Uber-
mittlungeinallt aglicherVorganginNatur undTechnikist. Das Ziffernblatt unserer
Uhren codiert Zust ande unseres Sonnensystems, unsere Schrift codiert Gedanken.
In jedemComputer werden Unmengen von Codierungen get atigt, in jeder lebenden
Zelle ist der genetische Code amWerk. Bei einer digitalen Tonaufnahme werden die
Kl ange in Symbolfolgen codiert, bei einer klassischen in Magnetisierungen eines
Speichers. Danach folgt die erneute Codierung in die mechanische Wellenstruktur
der Schallplatten-Rille bzw. das Muster von

pits und

lands auf einer CD. In


der Tat stellt der CD-Spieler einen der groartigsten Anwendungserfolge der al-
gebraischen Codierungstheorie dar; auch die

Ubertragung von gestochen scharfen
Satellitenbildern w are ohne diese Theorie nicht denkbar.
Mit den Worten von Claude Shannon (1916 2001), der die sogenannte In-
formationstheorie begr undet hat (und, nebenbei gesagt, mit seiner Arbeit Shannon
[1949] auch der Begr under der mathematischen Kryptographie ist und zweifellos
eines der gr oten Genies des vorigen Jahrhunderts war):
The fundamental problem of communication is that of reproducing at
one point either exactly or approximately a message selected at another
point.
Die Informationstheorie hat seit dem Erscheinen der grundlegenden Arbeit von
Shannon [1948] (siehe auch Shannon und Weaver [1949]) eine groe Entwicklung
durchgemacht, die zu einer Aufteilung der Theorie in einen stochastischen und
einen algebraischen Teil f uhrte, wenn es auch oft dieselben Forscher sind, denen
VIII.1 Sofort bzw. eindeutig entzifferbare Codes 129
beide Teile wichtige Impulse verdanken. Die stochastische Informationstheorie hat
sich, teilweise fern aller industriellen Praxis, zu auerordentlicher innerer Voll-
kommenheit entwickelt; zusammenfassende Darstellungen geben Chintschin et al.
[1957], Wolfowitz [1964] und Feinstein [1978]. Den algebraischen Aspekt behan-
deln beispielsweise Peterson [1973], Peterson und Weldon [1972], Ash [1965],
MacWilliams und Sloane [1977], Blahut [1983], Jungnickel [1995], Betten et al.
[1998] sowie van Lint [1999]. Beide Aspekte der Informationstheorie nden bei
Gallager [1968], Berlekamp [1984], McEliece [1984], Heise und Quattrochi [1989]
und Schulz [1991] Ber ucksichtigung. Besonderes Verdienst umden Br uckenschlag
zwischen stochastischer und algebraischer Informationstheorie hat sich die Mono-
graphie von Cziszr und K orner [1981] erworben.
Im vorliegenden Kapitel geben wir vier typische Kostproben aus der kombina-
torisch-algebraischen Informationstheorie:
Entzifferbarkeit von Codes
Pr ufziffersysteme
Fehlerkorrigierende Codes
Algebraische Codierungs-Theorie.
Beim letzteren Thema stoen wir unter Ben utzung einiger fundamentaler Hilfs-
mittel aus der Algebra der endlichen K orper, wie wir sie bereits in III.3 zusam-
mengestellt haben uber lineare und zyklische Codes bis zu den sogenannten
BCH-Codes vor. Hinter dieser Grenze erwartet den tiefer Eindringenden eine F ulle
faszinierenden Materials. Die algebraische Codierungstheorie ist heute mit zahl-
reichen anderen kombinatorischen Teildisziplinen eng verwoben; ein Juwel an sol-
cher Verwobenheit stellen die sogenannten Golay-Codes dar, die wir immerhin
denieren werden. In einer Einf uhrung in die Kombinatorik ist f ur die ausf uhrliche
Behandlung dieser Materialf ulle nicht gen ugend Platz. Interessierte seien insbe-
sondere auf die Darstellungen der Codierungstheorie bei van Lint [1999] oder auch
Jungnickel [1995] verwiesen sowie auf die Monographien von van der Geer und
van Lint [1988], Cameron und van Lint [1991] sowie Assmus und Key [1993], die
speziell den Verbindungen der Codierungstheorie zu Designs, Graphen, endlichen
Geometrien und der algebraischen Geometrie ( uber endlichen K orpern) gewidmet
sind. Von groem praktischen Interesse sind auch die sogenannten Faltungscodes,
auf die wir hier gar nicht eingehen k onnen; wir verweisen f ur dieses Thema auf die
B ucher von Piret [1988] sowie Johannesson und Zigangirov [1999].
1 Sofort bzw. eindeutig entzifferbare Codes
In diesemAbschnitt wollen wir einen ersten, relativ einfachen Einblick in die kom-
binatorische Theorie der Codierungen gewinnen.
130 VIII Codes
Denition 1.1. Seien A, B endliche nichtleere Mengen. B

bezeichne die Menge


{]

n=1
B
n
der endlichen Folgen von Elementen von B; die Elemente von B

werden auch B-W orter genannt, das Symbol bezeichnet dabei das sogenannte
leereWort. Es ist klar, was man unter der L ange eines Wortes versteht. Eine injektive
Abbildung c : A B

{] wird auch als ein A-B-Code bezeichnet; die dabei


auftretenden Bilder c(j) von Elementen von A werden auch als die Codew orter
von c bezeichnet. Man hat damit einen A-B-Code als eine mit A numerierte Liste
von nichtleeren Codew ortern aus B

deniert.
Aus B-W ortern w
(1)
, . . . , w
(r)
wird durch schlichtes Aneinanderh angen ein
neues B-Wort w
(1)
. . . w
(r)
. Man kann c auf nat urliche Weise zu einer Abbildung
c

: A

erweitern:
c

() =
c

(x
1
. . . x
n
) = c(x
1
) . . . c(x
n
) (x
1
, . . . , x
n
A).
Denition 1.2. Ein A-B-Code c : A B

{] heit sofort entzifferbar, wenn


bei ihm kein Codewort als Anfangsabschnitt eines anderen Codewortes auftritt.
Dieser Begriff ist eine Antwort auf das Problem der Entzifferung:
Ist c

injektiv? Wenn ja, wie sieht man einemWort aus B

an, ob es ein
c

-Bild ist, und wie ndet man gegebenenfalls das zugeh orige Urbild
in A

?
Wurde ein sofort entzifferbarer Code verwendet, so liest man ein Wort w aus B

von links, bis ein Codewort vollendet ist und notiert dessen Urbild, ein Element
von A; dann wiederholt man diesen Vorgang mit dem Rest von w. Die Eigenschaft,
da kein Codewort Anfang eines anderen ist, garantiert, da man so das eindeutig
bestimmte c

-Urbild von w bekommt oder aber feststellt, da es ein solches nicht


gibt wenn das Verfahren n amlich nicht

aufgeht.
Sind alle Codew orter gleich lang, so hat man nat urlich einen sofort entzifferba-
ren Code vor sich. Ein Beispiel mit variablen Codewort-L angen ist f ur A = {1, 2, 3]
und B = {a, b] durch
c(1) = aa, c(2) = ab, c(3) = b
gegeben. Hier das Beispiel einer Entzifferung:
aa[ab[ab[aa[b[ab[aa = c

(1221321).
Satz 1.3. Seien A, B endliche nichtleere Mengen, [A[ = a, [B[ = b und n
j
N
(j A). Dann sind folgende Aussagen aquivalent:
VIII.1 Sofort bzw. eindeutig entzifferbare Codes 131
(i) Es gibt einen sofort entzifferbaren A-B-Code c, bei dem das Codewort c(j)
gerade die L ange n
j
besitzt.
(ii) Es gilt die Kraftsche Ungleichung (Kraft [1949])
(1.1)

jA
1
b
n
j
1.
Beweis. (i) (ii): Sei n = max{n
j
[ j A]. JedemCodewort w = c(j) in B
m
mit
m n < ordnen wir die Menge C(w) aller Verl angerungen von w zu W ortern
aus B
n
zu; hat w die L ange m, so besteht C(w) aus b
nm
W ortern der L ange n.
Weil c sofort entzifferbar ist, sind die C(c(j)) paarweise disjunkt. Es folgt
[B
n
[ = b
n

jA
[C(c(j))[ =

jA
b
nn
j
.
Division durch b
n
ergibt die Kraftsche Ungleichung.
(ii) (i) Wir uberlegen uns zun achst allgemein: Ist m n, so bildet die Familie
(C(w))
wB
m eine disjunkte Zerlegung von B
n
. Ist m m
/
n, so ist jedes C(w)
mit w B
m
die disjunkte Vereinigung derjenigen C(w
/
) mit w
/
B
m
/
, f ur welche
w
/
eine Verl angerung von w ist. Es gelte nun die Kraftsche Ungleichung
b
nn
1
b
nn
2
b
nn
a
b
n
;
wir d urfen dabei n
1
n
2
n
a
= n annehmen. Wir w ahlen nun w
(1)
B
n
1
beliebig; dann hat man [C(w
(1)
[ = b
nn
1
und es folgt
b
nn
2
b
nn
a
b
n
b
nn
1
= [B
n
C(w
(1)
)[.
Insbesondere ist im Falle a > 1 die Menge B
n
C(w
(1)
) nichtleer und l at sich als
disjunkte Vereinigung gewisser C(w
/
) mit w
/
B
n
2
darstellen. Wir w ahlen eines
dieser w
/
als w
(2)
. Es folgt
b
nn
3
b
nn
a
b
n
b
nn
1
b
nn
2
= [B
n
(C(w
(1)
) C(w
(2)
))[.
Es ist nun klar, wie man weiterarbeitet, bis man auch w
(a)
B
nn
a
gew ahlt hat.
Die zugeh origen C(w
(j)
) sind paarweise disjunkt, also ist kein w
(i)
Verl angerung
eines anderen w
(j)
, und wir haben einen sofort entzifferbaren Code mit Wortl angen
w
(1)
, . . . , w
(a)
konstruiert. 2
Denition 1.4. Ein A-B-Code c : A B

{] heit eindeutig entzifferbar,


wenn die zugeh orige Abbildung c

: A

injektiv ist.
132 VIII Codes
Sofort entzifferbare Codes sind auch eindeutig entzifferbar, wie wir fr uher gese-
hen haben. Es gibt aber eindeutig entzifferbare Codes, die nicht sofort entzifferbar
sind. Dies zeigt das folgende
Beispiel 1.5. Sei A = {1, 2, 3] und B = {0, 1]. Dann ist der Code c mit
c(1) = 0, c(2) = 01, c(3) = 11
nicht sofort entzifferbar. Trotzdemist c

injektiv; sei n amlich ein w B


n
vorgelegt.
Enth alt w keine 1, so ist w das c

-Bild eines Worts der Bauart 111. Wenn in


w Eintr age 1 auftreten, betrachtet man maximale Teilw orter, die nur Eintr age 1
enthalten; in der englischsprachigen Literatur wird ein solches Teilwort meist als
ein run (aus Einsen) bezeichnet. Ein Run gerader L ange kann dabei nur das c

-Bild
eines Worts der Bauart 333 sein, w ahrend ein Run ungerader L ange auf einen
Eintrag 0 folgen mu insbesondere also nicht amAnfang von w auftreten kann
und das c

-Bild eines Worts vom Typ 2 33 ist. Die dann noch ubriggebliebenen
Folgen aus Eintr agen 0 sind wieder c

-Bilder von Worten der Bauart 111.


Satz 1.6. Ist c : A B

{] ein eindeutig entzifferbarer A-B-Code mit den


Codewort-L angen n
1
, . . . , n
a
(a = [A[), so gilt die Kraftsche Ungleichung (1.1).
Beweis. Seien n
1
, . . . , n
a
die Codewort-L angen eines eindeutig entzifferbaren
A-B-Codes. Wir setzen n = max{n
1
, . . . , n
a
] sowie a
i
= [{j [ n
j
= i][ f ur
i = 1, . . . , n. Damit lautet die linke Seite der Kraftschen Ungleichung
a

j=1
1
b
n
j
=
n

i=1
a
i
b
i
.
Wir w ahlen nun r N und potenzieren:
_
n

i=1
a
i
b
i
_
r
=
rn

k=1
d
rk
b
k
mit
d
rk
=

k
1
k
r
=k
a
k
1
. . . a
k
r
.
Hierbei ist a
k
1
. . . a
k
r
dieAnzahl aller Folgen von r Codew ortern, deren i-tes jeweils
aus k
i
Symbolen besteht (f ur i = 1, . . . , r). Weil unser Code eindeutig entzifferbar
ist, ergeben diese Ketten nach Zusammenf ugung lauter verschiedene c

-Bilder; es
gilt also d
rk
b
k
f ur k = 1, . . . , rn. Somit folgt
_
n

i=1
a
i
b
i
_
r

rn

k=1
b
k
b
k
= rn
VIII.2 Pr ufziffersysteme 133
und daher f ur alle r N
a

j=1
1
b
n
j
=
n

i=1
a
i
b
i
(rn)
1/r
.
F ur r gilt aber bekanntlich (rn)
1/r
1, so da die Kraftsche Ungleichung
folgt. 2
Aus Satz 1.6 folgt zusammen mit Satz 1.3 sofort der
Satz 1.7. Zu jedem eindeutig entzifferbaren A-B-Code c gibt es einen sofort ent-
zifferbaren A-B-Code mit derselben Folge n
1
, . . . , n
a
von Codewort-L angen. 2
Wie dieser Satz zeigt, sind eindeutig, aber nicht sofort entzifferbare Codes in
der Praxis uninteressant. Sofort entzifferbare Codes die, informatisch gesprochen,
von deterministischen endlichen Automaten erkannt werden sind dagegen f ur die
Datenkompression von praktischem Interesse.
2 Pr ufziffersysteme
ImgesamtenRest dieses Kapitels besch aftigenwir uns mit demThema

Codierung
unter einem anderen Aspekt: Bei jeder Daten ubertragung bzw. Datenverarbeitung
kommen Fehler vor. Nun gibt es eine mathematische Theorie, die sich mit dem
Problem der Entdeckung und Korrektur solcher Fehler besch aftigt; auch hier spielt
ein Code-Begriff eine zentrale Rolle, der sich allerdings etwas von dem im 1
gebrauchten unterscheidet.
Das Problemder

Ubertragungsfehler ist jedemTelephonierer bekannt: Das Rau-
schen in der Leitung zwingt zumBuchstabieren, notfalls mit Codew ortern wie

An-
ton,

Berta, usw. Ein anderer Anwendungsfall ist das Problem der Druckfehler,
und ein bekanntes Gesellschaftsspiel sch opft Lustgewinn aus der

Uberlagerung von

Ubertragungsfehlern beim Weiter ustern komplizierter Worte.


In diesem Abschnitt wollen wir einige konkrete Anwendungen kennenlernen,
bei denen es nur um die Erkennung (nicht aber die Korrektur) von Fehlern bei der
Eingabe von Daten geht; wenn dann ein Fehler aufgetreten ist, wird die Daten-
eingabe einfach wiederholt. Man erreicht dies durch das Hinzuf ugen von Pr ufzei-
chen; derartige Systeme k onnen also immer dann verwendet werden, wenn die
Eingabe leicht wiederholt werden kann. Als Beispiele seien ISBN-Nummern, EAN-
Nummern (

Strichcode) und Kontonummern genannt.


Laut Verhoeff [1969] ist die bei weitem h augste Fehlerquelle bei der Eingabe
eines Codeworts ein Einzelfehler (a b), bei dem also genau ein Symbol falsch
134 VIII Codes
eingegeben wird; dies liefert 79% aller uberhaupt auftretenden Fehler. Hier seine

Ubersicht uber die relative H augkeit von Eingabefehlern:


Fehlertyp Symbol H augkeit
Einzelfehler (Verwechslung einer
Ziffer)
a b 79,0%
Nachbartranspositionen (Vertau-
schung benachbarter Ziffern)
ab ba 10,2%
Sprungtranspositionen (Vertau-
schung einer Ziffer mit der
ubern achsten)
abc cba 0,8%
Zwillingsfehler aa bb 0,6%
phonetische Fehler (z.B.: dreiig
dreizehn)
a0 1a (a = 3, . . . , 9) 0,5%
Sprung-Zwilling-Fehler aca bcb 0,3%
ubrige Fehler (zuf allige Fehler) 8,6%
Die meisten praktisch benutzten Pr ufziffersysteme lassen sich in das folgende
Schema einordnen:
Denition 2.1. Sei A ein Alphabet und G = (A, ) eine (multiplikativ geschrie-
bene) Gruppe auf A. Ein Pr ufziffersystem (oder auch eine Pr ufzeichen-Codierung)
uber G besteht aus n Permutationen
1
, . . . ,
n
in der symmetrischen Gruppe S
A
sowie einemElement c A. Dabei wird einWort a
1
. . . a
n1
so umein Pr ufzeichen
a
n
erweitert, da die folgende Kontrollgleichung erf ullt ist:
(2.1)
1
(a
1
) . . .
n
(a
n
) = c.
Es ist klar, da a
n
f ur gegebene a
1
, . . . , a
n1
durch (2.1) eindeutig bestimmt ist.
Es gilt nun der folgende leichte, aber fundamentale
Satz 2.2. Jedes Pr ufziffersystem uber einer Gruppe erkennt alle Einzelfehler.
Beweis. Angenommen, der Eintrag a
i
ist durch a
/
i
,= a
i
ersetzt worden (aber die
restlichen Eintr age sind korrekt). Wir m ussen zeigen, da dann die Kontrollglei-
chung (2.1) verletzt ist. F ur den korrekten Eintrag a
i
gilt wegen (2.1)

i
(a
i
) =
i1
(a
i1
)
1
. . .
1
(a
1
)
1
c
n
(a
n
)
1
. . .
i1
(a
i1
)
1
.
Da
i
eine Permutation ist, ist
i
(a
i
) ,=
i
(a
/
i
), womit a
1
. . . a
i1
a
/
i
a
i1
. . . a
n
nicht ebenfalls (2.1) erf ullen kann. 2
VIII.2 Pr ufziffersysteme 135
Ein besonders naheliegender Spezialfall von Denition 2.1 ist die Pr ufziffer-
codierung modulo m:
Denition 2.3. Sei A das Alphabet A = {0, . . . , m 1]. Wir w ahlen G = Z
m
(additiv geschrieben!) sowie n Zahlen w
1
, . . . , w
n
mit ggT(w
i
, n) = 1. Dann ist

i
= x . w
i
x f ur i = 1, . . . , n eine Permutation von A. Mit c = 0 und w
n
:= 1
wird aus der Kontrollgleichung (2.1) die Bedingung
(2.2) a
n

n1

i=1
w
i
a
i
(mod m).
Wir geben nun zwei konkrete Anwendungsbeispiele an.
Beispiel 2.4 (ISBN-Nummern). Jedem Buch ist bekanntlich eine ISBN-Nummer
zugeordnet. Zum Beispiel hat das vorliegende Buch die Nummer 3-110-16727-1.
Dabei gibt 3 das Land an (Deutschland), 110 den Verlag (de Gruyter) und 16727
das Buch. Die letzte Ziffer ist eine Pr ufziffer, die hier (mit m = 11) gem a
a
10

9

i=1
ia
i
(mod 11)
gebildet wird. Im Beispiel gilt in der Tat 1 3 2 1 9 7 1 (mod 11).
Noch eine Bemerkung: Falls sich die Pr ufziffer a
10
= 10 ergibt, verwendet man
daf ur das Symbol X.
Beispiel 2.5. Eine europ aischeArtikel-Nummer (EAN) besteht aus 13 Ziffern. Da-
bei bedeutet die erste Ziffer das Ursprungsland; die letzte Ziffer ist eine Pr ufziffer
und wird gem a
a
13
: (a
1
3a
2
a
3
3a
4
a
11
3a
12
) (mod 10)
gebildet. Man arbeitet hier also mit n = 13 und w
i
=
_
1 f ur i ungerade
3 f ur i gerade.
Zur Verwendung von opto-elektronischen Leseger aten werden allerdings nicht
nur die Ziffern gedruckt, sondern die Zahl wird auch als Strichcode angegeben,
wie in der folgenden Abbildung. Der Strichcode ist durch Rand- und Mittelstriche
unterteilt; jedes a
i
(i ,= 1) wird durch eine Folge von 7

ausgef ullten ( = 1) oder

leeren ( = 0) Balken codiert.


Zur Codierung der Ziffern werden vier Codes verwendet, die wir wie folgt
tabellarisch zusammenfassen:
136 VIII Codes
0006381 4 213370
Zeichen Code A Code C Code B Code D
0 0001101 1110010 0100111 AAAAAA
1 0011001 1100110 0110011 AABABB
2 0010011 1101100 0011011 AAABAB
3 0111101 1000010 0100001 AABBAB
4 0100011 1011100 0011101 ABAABB
5 0110001 1001110 0111001 ABBAAB
6 0101111 1010000 0000101 ABBBAA
7 0111011 1000100 0010001 ABABAB
8 0110111 1001000 0001001 ABABBA
9 0001011 1110100 0010111 ABBABA
Die Ziffern a
2
, . . . , a
7
werden nun jeweils nach Code Aoder B und die Ziffern
a
8
, . . . , a
13
nach Code C verschl usselt. Man beachte, da C aus A durch Vertau-
schen von 0 und 1 entsteht und da B aus C durch Umkehrung der Reihenfolge
der 7 Komponenten hervorgeht. Schlielich ist die erste Ziffer a
1
, die nicht explizit
durch Striche dargestellt wird, durch die Kombination der Auswahlen der Codes
A und B f ur die Ziffern a
2
, . . . , a
7
festgelegt, was durch Code D in der Tabelle
geregelt wird. Man uberzeugt sich davon, da dies eindeutig erkennbar ist, da kein
Codewort sowohl in A wie in B vorkommt.
Aufgrund der eingangs erw ahnten Ergebnisse vonVerhoeff m ochte man zumin-
dest noch Nachbartranspositionen erkennen k onnen. Hier gilt:
Satz 2.6. Ein Pr ufziffersystem wie in Denition 2.1 gestattet es genau dann, jede
Nachbartransposition zu erkennen, wenn die folgende Bedingung f ur alle x, y G
mit x ,= y und jedes i = 1, . . . , n 1 erf ullt ist:
(2.3) x
i1
_

1
i
(y)
_
,= y
i1
_

1
i
(x)
_
.
VIII.2 Pr ufziffersysteme 137
Beweis. Wegen der Kontrollgleichung

i
(a
i
) = c wird die Transposition
a
i
a
i1
a
i1
a
i
genau dann erkannt, wenn

i
(a
i
)
i1
(a
i1
) ,=
i
(a
i1
)
i1
(a
i
)
gilt. Setzt man x =
i
(a
i
) und y =
i
(a
i1
), so erh alt man die angegebene
Bedingung. 2
Denition 2.7. Im folgenden betrachten wir zun achst den Spezialfall abelscher
Gruppen. Dann l at sich die Bedingung (2.3) zu
(2.4) x
1

i
(x) ,= y
1

i
(y) f ur alle x, y G mit x ,= y
umformen, wobei wir
i
=
i1

1
i
gesetzt haben. Eine Permutation
i
mit dieser
Eigenschaft heit ein Orthomorphismus der Gruppe G. Ein Orthomorphismus ist
also eine Permutation
i
, f ur die x . x
1

i
(x) wieder eine Permutation ist.
In der Literatur wird auch oft die Bedingung betrachtet, da x . x(x) wie-
der eine Permutation ist. Derartige Abbildungen heien vollst andige Abbildungen.
Beide Begriffe sind im wesentlichen aquivalent: Wenn ein Orthomorphismus
ist, ist x . x
1
(x) eine vollst andige Abbildung; und wenn eine vollst andige
Abbildung ist, ist x . x(x) ein Orthomorphismus.
Orthomorphismen h angen eng mit den in III.5 eingef uhrten Differenzmatrizen
zusammen: Eine Permutation einer (additiv geschriebenen) abelschen Gruppe G
ist offenbar genau dann ein Orthomorphismus, wenn die Matrix
A =
_
_
0 0 . . . 0
g
1
g
2
. . . g
m
(g
1
) (g
2
) . . . (g
m
)
_
_
eine Differenzmatrix uber G ist, wobei {g
1
, . . . , g
m
] eine Auistung der Elemente
von G sei. Wir zeigen nun den folgenden
Satz 2.8. Sei G eine endliche abelsche Gruppe. Genau dann existiert ein Pr uf-
ziffersystem uber G, das jede Nachbartransposition erkennt, wenn es einen Ortho-
morphismus f ur G gibt.
Beweis. Wie wir uns bereits uberlegt haben, ist jedes
i
=
i1

1
i
ein Ortho-
morphismus f ur G, falls alle Nachbartranspositionen erkannt werden. Umgekehrt
138 VIII Codes
sei nun ein Orthomorphismus f ur G. Wir w ahlen
i
:=
i
. Damit ergibt sich (f ur
jedes i)

i
=
i1

1
i
=
i1

i
= ,
weswegen die Codierung gem a der Kontrollgleichung
n

i=1

i
(x
i
) = c
die gew unschte Eigenschaft hat. 2
Beispiel 2.9. Das bei den ISBN-Nummern verwendete Pr ufziffersystem uber Z
11
(siehe Beispiel 2.4) kann Nachbartranspositionen korrigieren. Mit

i
: x . ix (mod 11) (i = 1, . . . , 10)
erhalten wir

i
=
i1

1
i
= [x . (i 1)i
1
x],
was in der Tat ein Orthomorphismus von Z
11
ist:
(i 1)i
1
x x = (i 1)i
1
y y (i 1)i
1
(x y) = x y.
Wenn x ,= y ist, k onnte das nur f ur (i 1)i
1
1 (mod 11) gehen, was aber
absurd ist.
Wir kl aren nun die Struktur derjenigen abelschen Gruppen, die Orthomorphis-
men besitzen. Hierf ur wird etwas (eher elementare) Gruppentheorie ben otigt; der
Leser kann diesen Satz (und seinen Beweis) gegebenenfalls uberschlagen, da er im
folgenden nicht mehr ben otigt wird.
Satz 2.10. Sei G eine endliche abelsche Gruppe der Ordnung m. Genau dann be-
sitzt G einen Orthomorphismus, wenn m ungerade ist oder wenn G mindestens
zwei verschiedene Involutionen enth alt (also die 2-Sylowgruppe von G nicht zy-
klisch ist ).
Beweis. Zun achst sei mungerade. Dann ist dieAbbildung : x . x
2
eine Permuta-
tion; wegen x
1
(x) = x ist sogar ein Orthomorphismus. Sei nun m gerade. Wir
k onnen G = S H schreiben, wobei [S[ = 2
c
gilt und [H[ ungerade ist. Zu zeigen
ist also, da G genau dann einen Orthomorphismus besitzt, wenn S nicht zyklisch
ist. Wir nehmen zun achst an, da S zyklisch sei, etwa S

= Z
2
c . Dann gibt es also
VIII.2 Pr ufziffersysteme 139
einen surjektiven Homomorphismus : G Z
2
c . Wenn ein Orthomorphismus
f ur G ist, so folgt

gG
(g)

gG

_
g
1
(g)
. ,, .
Permutation von G
_

gG
_
(g
1
) ( (g)
.,,.
Permutation von G
)
_

gG
((g) (g)) 0 (mod 2
c
).
Andererseits gilt (mit [H[ = k) auch

gG
(g) = k
2
c
1

i=0
i = k
2
c
(2
c
1)
2
, 0 (mod 2
c
),
da k ungerade ist. Widerspruch! F ur die umgekehrte Richtung ist ein konstruktiver
Beweis m oglich, aber ziemlich lang. Wir verweisen hierf ur etwa auf 1.5 von Evans
[1992]. 2
Orthomorphismen k onnen auch f ur nicht-abelsche Gruppen betrachtet werden;
diese Fragestellung interessiert in der Design-Theorie, nicht aber imgegenw artigen
Zusammenhang. Eine ausf uhrliche Darstellung ndet man in der Monographie von
Evans [1992]. Wir halten noch eine interessante Folgerung aus den S atzen 2.8 und
2.10 fest:
Korollar 2.11. F ur eine abelsche Gruppe G der Ordnung [G[ 2 (mod 4) kann
kein Pr ufziffersystem uber G alle Nachbartranspositionen erkennen. 2
Insbesondere eignet sich also die bei den EAN-Nummern verwendete zyklische
Gruppe der Ordnung 10 (vgl. Beispiel 2.5) grunds atzlich nicht besonders als Tr ager
eines Pr ufziffersystems. Nun gibt es aber noch eine (nicht-abelsche) Gruppe der
Ordnung 10, n amlich die Diedergruppe D
5
. Es gibt zwar keinen Orthomorphismus
von D
5
, wohl aber eine Abbildung, die die Bedingung
(2.5) x(y) ,= y(x) f ur alle x, y mit x ,= y
erf ullt. Analog zum Beweis von Satz 2.8 setzt man dann wieder
i
:=
i
. Zur
Erinnerung: Die Diedergruppe D
5
kann durch
D
5
= a, b : a
5
= b
2
= 1, bab = a
1
)
140 VIII Codes
deniert werden. Geometrisch l at sich dies bekanntlich als die Gruppe der Spie-
gelungen und Drehungen eines regelm aigen F unfeckes deuten. Codiert man die
Elemente von D
5
mit den Ziffern 0, . . . , 9 gem a
a
j
. j und a
j
b . j 5 (j = 0, . . . , 4),
so erh alt man die folgende Multiplikationstafel f ur D
5
:
i j 0 1 2 3 4 5 6 7 8 9
0 0 1 2 3 4 5 6 7 8 9
1 1 2 3 4 0 6 7 8 9 5
2 2 3 4 0 1 7 8 9 5 6
3 3 4 0 1 2 8 9 5 6 7
4 4 0 1 2 3 9 5 6 7 8
5 5 9 8 7 5 0 4 3 2 1
6 6 5 9 8 6 1 0 4 3 2
7 7 6 5 9 8 2 1 0 4 3
8 8 7 6 5 9 3 2 1 0 4
9 9 8 7 6 5 4 3 2 1 0
Man kann nun nachrechnen, da die von Verhoeff [1969] angegebene Permu-
tation
(2.6) =
_
0 1 2 3 4 5 6 7 8 9
1 5 7 6 2 8 3 0 9 4
_
der Ordnung 9 die Bedingung 2.5 erf ullt. Wie das folgende Beispiel zeigt, wurde
dieses etwas esoterisch anmutende Pr ufziffersystem tats achlich verwendet.
Beispiel 2.12. Die Kennzeichnung der deutschen Banknoten (ab 1990) erfolgte
durch 11 Zeichen, die demAlphabet
{0, . . . , 9, A, D, G, K, L, N, S, U, Y, Z]
entnommen wurden, beispielsweise AD6913433K8. Ersetzt man die Buchstaben
gem a der Tabelle
A D G K L N S U Y Z
0 1 2 3 4 5 6 7 8 9
durch Ziffern, so erh alt man Folgen der L ange 11 uber D
5
, im Beispiel also
01691343338. Jede solche Folge gen ugt der Pr ufgleichung
(2.7) (a
1
) . . .
10
(a
10
)a
11
= 0,
VIII.3 Fehlerkorrigierende Codes 141
wobei die in (2.6) angegebene Permutation ist. Damit k onnen also auch fast
alle Nachbartranspositionen erkannt werden; eine Ausnahme besteht hier lediglich
f ur die letzten beiden Ziffern. Diese Schw ache des Systems h atte nat urlich leicht
vermieden werden k onnen, wenn man in (2.7) statt a
11
denTerm
11
(a
11
) verwendet
h atte. Warum dies nicht geschah, ist unklar.

Ubung 2.13. Man beweise den folgenden Satz von Ecker und Poch [1986]: Es sei
G = D
m
= a, b : a
m
= b
2
= 1, bab = a
1
) die Diedergruppe der Ordnung 2m,
m 3 ungerade. Dann erf ullt die durch
(a
j
) = a
m1j
und (a
j
b) = a
j
b (j = 0, . . . , m1),
denierte Permutation die Bedingung (2.5). Somit liefert
i
:=
i
(i = 1, . . . , n)
eine Pr ufzeichencodierung uber D
m
, die Einzelfehler und alle Nachbartransposi-
tionen erkennt.

Ubung 2.14. Man gebe (in Analogie zu Satz 2.6) eine algebraische Bedingung an,
die das Erkennen von Sprungtranspositionen erlaubt.
Mehr uber Pr ufziffersysteme ndet man bei Schulz [1991,1996] und in der
dort zitierten Literatur. Insbesondere kann man anstelle von Gruppen auch Qua-
sigruppen verwenden; hierbei handelt es sich um algebraische Strukturen, die den
Gruppenbegriff verallgemeinern. Man verzichtet auf die G ultigkeit des Assoziativ-
gesetzes und verlangt die eindeutige L osbarkeit von Gleichungen der Formax = b
und xa = b. Quasigruppen h angen eng mit lateinischen Quadraten zusammen; der
interessierte Leser sei auf Bruck [1958] sowie Dnes und Keedwell [1974,1991]
verwiesen.
3 Fehlerkorrigierende Codes
In diesemAbschnitt stellen wir einige allgemeine Grundbegriffe uber fehlererken-
nende und fehlerkorrigierende Codes zusammen. Dazu f uhren wir zun achst den
folgendenAbstandsbegriff f ur W orter derselben L ange uber einemAlphabet B ein.
Denition 3.1. Sei B ,= eine endliche Menge. Der durch
d(x, y) = [{j [ x
j
,= y
j
][ (x = (x
1
, . . . , x
n
), y = (y
1
, . . . , y
n
) B
n
)
erkl arteAbstand wird als der Hamming-Abstand auf B
n
bezeichnet. Ist d(x, y) = e,
so sagt man, y gehe aus x durch e Ab anderungen oder Fehler hervor; man nennt
E = {j [ x
j
,= y
j
] (mit [E[ = e) dann das Fehler-Muster bei dieser Ab anderung.
Im f ur die Praxis besonders wichtigen Fall [B[ = 2 kann man aus y und dem
Fehler-Muster e das Wort x eindeutig rekonstruieren.
142 VIII Codes
Wir bemerken sogleich, da der Hamming-Abstand auf B
n
die sogenannte
diskrete Topologie deniert; er erf ullt offenbar die bekannten Abstands-Axiome
(a) d(x, y) = 0 x = y;
(b) d(x, z) d(x, y) d(y, z) (Dreiecksungleichung).
Wir betrachten jetzt A-B-Codes mit konstanter Codewort-L ange n N. Der Code
ist also durch eine Menge C B
n
von a = [A[ = [C[ Codew ortern beschreibbar.
Aus diesen Grunde nennt man auch solche Mengen einfach

Codes.
Denition 3.2. Seien B ,= endlich und n N. Teilmengen C von B
n
werden
auch als Codes der L ange n bezeichnet. Sei d der Hamming-Abstand auf B
n
und
C B
n
ein Code. Man nennt C e-fehlerentdeckend, wenn
x, y C, x ,= y = d(x, y) 2e
gilt, und e-fehlerkorrigierend, wenn die folgende Bedingung erf ullt ist:
x, y C, x ,= y = d(x, y) 2e 1.
Wir wollen kurz die Motive f ur diese Bezeichnungen erl autern. Zu diesem
Zweck betrachten wir die Kugeln
(3.1) K
e
(x) = {z [ z B
n
, d(x, z) e] (0 e Z, x B
n
).
Bei gegebenem x B
n
besteht K
e
(x) aus all denjenigen z B
n
, die aus x durch
h ochstens e Fehler hervorgehen. F ur d(x, y) 2e 1 gilt K
e
(x) K
e
(y) =; ist
also C ein e-fehlerkorrigierender Code, so sind die zu den Codew ortern geh ori-
gen Kugeln K
e
(c) paarweise disjunkt. Man stelle sich nun vor, da man in einen

Ubertragungskanal ausschlielich W orter c C einf uttert und da der Kanal ein


eingef uttertes c in h ochstens e Komponenten ver andert. Dann ist die Vereinigung
K =

cC
K
e
(c) die Menge aller z, die am Ende des Kanals austreten k onnen,
und weil besagte Vereinigung eine disjunkte ist, kann man von jedemz K sofort
sagen, aus welchem c C es hervorgegangen ist; man korrigiert dadurch also bis
zu e Fehler.
Ist dagegen C nur ein e-fehlererkennender Code und produziert der Kanal ma-
ximal e Fehler, so kann man aus z
_
cC
K
e
(c)
_
C zwar schlieen, da Fehler
gemacht wurden, es kann aber i. a. z K
e
(c) K
e
(d) f ur c, d C mit c ,= d vor-
kommen, d. h. man wei nicht, aus welchem Codewort z durch Einbau von Fehlern
hervorgegangen ist. Da dies tats achlich vorkommt, zeigt das folgende einfache
Beispiel 3.3. B = {0, 1], n = 8, c = 00000000, c
/
= 11111111, e = 4, z =
00001111; man hat d(c, z) = 4 = d(c
/
, z); z kann ebenso gut aus c wie aus c
/
durch vier Fehler hervorgegangen sein.
VIII.3 Fehlerkorrigierende Codes 143
Man beachte, da die im vorigen Abschnitt behandelten Pr ufziffersysteme spe-
zielle 1-fehlererkennde Codes sind. Die vorstehenden

Uberlegungen motivieren die
Einf uhrung einiger wichtiger Parameter:
Denition 3.4. Seien B eine endliche Menge der M achtigkeit q ,= 0 und n, M,
d N. Eine Menge C K
n
heit ein (n, M, d, q)-Code, wenn [C[ = M gilt
sowie
min{d(x, y) [ x, y C, x ,= y] = d.
Die Zahl d heit der Minimalabstand von C.
Bei gleichemMinimalabstand werden wir von zwei Codes den mit der gr oeren
M achtigkeit als besser ansehen, da er es erlaubt, bei gleichen Fehlerkorrekturei-
genschaften mehr Nachrichten zu versenden. Daher ist es von Interesse, nach der
maximalen M achtigkeit A(n, d, q) zu fragen, f ur die ein (n, M, d, q)-Code exi-
stiert. Wir wollen hierf ur exemplarisch drei Schranken herleiten. Allgemein gilt die
Bestimmung der A(n, d, q) bzw. die Herleitung guter (asymptotischer) Schranken
als das zentrale Problem der kombinatorischen Codierungstheorie. Wir beginnen
mit einem einfachen Hilfssatz.
Lemma 3.5. Es gilt A(n, d, q) A(n 1, d 1; q) f ur d 2.
Beweis. Gegeben sei ein (n, M, d, q)-Code C uber B. Aus C erh alt man einen Code
C
i
, indem man aus jedem Codewort in C die i-te Koordinate wegl at. Wenn d 2
ist, ist C
i
offenbar ein (n 1, M, d 1, q)-Code, falls man f ur i eine Koordinate
w ahlt, in der sich zwei Codew orter vomAbstand d unterscheiden. 2
Man sagt, da der Code C
i
im Beweis von Lemma 3.5 durch Punktieren aus
C konstruiert ist. Indem man dieses Verfahren (d 1)-mal anwendet, ergibt sich
ein (d 1)-fach punktierter Code, n amlich ein (n d 1, M, 1, q)-Code, also
eine Teilmenge der M achtigkeit M von B
nd1
. Somit erhalten wir das folgende
Resultat, vgl. Singleton [1964]:
Satz 3.6 (Singleton-Schranke). Es gilt A(n, d, q) q
nd1
. 2
Denition 3.7. Ein Code, der die Singleton-Schranke mit Gleichheit erf ullt, heit
ein MDS-Code (f ur

maximum distance separable). Beispiele hierf ur werden wir


in Satz 6.9 kennenlernen. MDS-Codes sind sowohl theoretisch wie auch praktisch
besonders interessant, da sie eng mit endlichen projektiven Geometrien zusam-
menh angen (siehe dazu Satz IX.6.14) und beispielsweise bei der Fehlerkorrektur
f ur den CD-Spieler eingesetzt werden; vgl. dazuVanstone und van Oorschot [1989]
oder Jungnickel [1995].
144 VIII Codes
Unsere zweite Schranke geht auf Hamming [1950] zur uck.
Satz 3.8 (Kugelpackungsschranke). Es gilt
(3.2) A(n, 2e 1, q)
q
n

e
k=0
_
n
k
_
(q 1)
k
.
Beweis. Wir betrachten die in (3.1) eingef uhrten Kugeln K
e
(c) mit c C. Da C
ein (n, M, 2e 1, q)-Code ist, sind die K
e
(c) paarweise disjunkt. Nun gilt
[K
e
(x)[ = 1
_
n
1
_
(q 1)
_
n
2
_
(q 1)
2

_
n
e
_
(q 1)
e
,
da
_
n
i
_
(q 1)
i
offenbar die Anzahl aller W orter x mit d(x, c) = i ist. Damit folgt
sofort
M
e

k=0
_
n
k
_
(q 1)
k
[B
n
[ = q
n
. 2
Denition 3.9. Ein Code C, der die Kugelpackungsschranke (3.2) mit Gleichheit
erf ullt, heit perfekt; derartige Codes sind von besonderem theoretischem Inter-
esse. Wir werden im n achsten Abschnitt eine unendliche Serie von Beispielen mit
e = 1 kennenlernen; zwei weitere Beispiele folgen sp ater, n amlich die sogenannten
Golay-Codes, siehe 6.6 und 6.7. Die m oglichen Parameter perfekter Codes sind f ur
Alphabete, deren M achtigkeit eine Primzahlpotenz q ist, in einer Reihe von Arbei-
ten von Tiet avainen und van Lint bestimmt worden (

perfect code theorem). Der


interessierte Leser sei hierf ur auf MacWilliams und Sloane [1977] sowie van Lint
[1975] verwiesen, wo man auch Referenzen f ur die Originalarbeiten ndet.
Unsere dritte Schranke stammt von Plotkin [1960]:
Satz 3.10 (Plotkin-Schranke). Es sei =
q1
q
. Falls d > n ist, gilt
(3.3) A(n, d, q)
d
d n
und somit insbesondere
(3.4) A(n, d, 2)
2d
2d n
f ur n < 2d.
VIII.3 Fehlerkorrigierende Codes 145
Beweis. Wir sch atzen den durchschnittlichen Abstand zweier Codew orter in einem
(n, M, d, q)-Code ab. Dazu schreiben wir die M Codew orter als die Zeilen einer
(M n)-Matrix. Sei S eine Spalte dieser Matrix; in S komme das Symbol s B
genau m
s
-mal vor. Wir wollen die Summe aller Abst ande von je zwei Codew ortern
absch atzen. Nach Denition ist diese Summe mindestens M(M1)d. Der Beitrag
von S zu der betrachteten Summe ist nun

sB
m
s
(M m
s
) = M

sB
m
s

sB
m
2
s
M
2

1
q
_

sB
m
s
_
2
()
= M
2
mit = (q 1)q. Dabei gilt die Absch atzung () wegen der Ungleichung
q

i=1
a
2
i

1
q
_
q

i=1
a
i
_
2
,
die leicht aus

(a
i
a)
2
0 folgt, wobei a =
1
q

a
i
das arithmetische Mittel
der a
i
bezeichnet. Summiert man nun diese Ungleichungen uber alle Spalten S,
erh alt man M(M 1)d nM
2
, woraus sich die Behauptung unmittelbar ergibt.
2
Dem Beweis entnimmt man, da Gleichheit in Satz 3.10 nur dann m oglich ist,
wenn je zwei Codew orter tats achlich genau den Abstand d haben. Derartige Codes
heien aquidistant.
F ur den besonders wichtigen Fall q = 2 ist das folgende Lemma sehr n utzlich:
Lemma 3.11. Es gilt A(n, 2e 1, 2) = A(n 1, 2e, 2).
Beweis. Sei C ein (n, M, 2e 1, 2)-Code, wobei wir als zugrunde liegendes
Alphabet B = {0, 1] annehmen k onnen. Wir erhalten einen neuen Code C
/
, den
erweiterten Code zu C, indem wir an jeden Vektor (x
1
, . . . , x
n
) C eine weitere
Koordinate
x
n1
x
1
x
n
(mod 2)
anf ugen; da dann stets x
1
x
n1
0 (mod 2) gilt, wird C
/
als parity check
extension von C und x
n1
wie in 2 als Pr ufbit bezeichnet. Falls also f ur x, y C
die Bedingung d(x, y) = 2e 1 gilt, folgt
(x
1
y
1
) (x
n
y
n
) 1 (mod 2),
146 VIII Codes
also x
n1
,= y
n1
und daher d(x
/
, y
/
) = 2e f ur die erweiterten W orter in C
/
. Somit
ist C
/
in der Tat ein (n1, M, 2e, 2)-Code. Die Umkehrung folgt durch Punktieren
nach Lemma 3.5. 2

Ubung 3.12. F ur q = 2 kann man die Plotkin-Schranke (3.4) etwas verst arken.
Man zeige n amlich:
(a) A(n, d, 2) 2
_
d
2dn
_
, falls n < 2d ist.
Hinweis: Man unterscheide die F alle M gerade und M ungerade.
(b) A(n, d, 2) 2
_
d1
2d1n
_
f ur n 2d, falls d ungerade ist.
(c) A(2d 1, d, 2) 4d 4, falls d ungerade ist.
Die beste bekannte allgemeine untere Schranke f ur A(n, d, q) wurde unab-
h angig voneinander von Gilbert [1952] und Varshamov [1957] entdeckt. Sie ist
leider recht schwach, daf ur ist der Beweis aber nahezu trivial.
Satz 3.13 (Gilbert-Varshamov-Schranke). Es gilt
(3.5) A(n, d; q)
q
n

d1
i=0
_
n
i
_
(q 1)
i
.
Beweis. Es sei C ein maximaler (n, M, d, q)-Code uber B. Dann gibt es also keinen
Vektor in B
n
, der zu jedemc C Abstand d hat. Mit anderen Worten: Zu jedem
x B
n
gibt es ein c C mit d(x, c) d 1. Die Kugeln K
d1
(c) mit c C
uberdecken also B
n
; die Behauptung folgt nun wie in Satz 3.8. 2
4 Lineare Codes
Die kombinatorische Codierungstheorie, mit derenAnfangsgr unden wir uns imvo-
rigen Abschnitt besch aftigt haben, hat besondere Fortschritte dadurch erzielt, da
sie die Theorie der endlichen Gruppen und K orper in ihren Dienst stellte und da-
durch zur algebraischen Codierungstheorie wurde. Dieser Vorgang ist eines der
eindrucksvollsten Beispiele daf ur, wie

Spinnereien der reinen Mathematik un-


vermutet praktische Bedeutung erlangen k onnen. Im Rest dieses Kapitels wollen
wir nun die Grundlagen der algebraischen Codierungstheorie systematisch darstel-
len. Zum weiteren Studium seien insbesondere MacWilliams und Sloane [1977],
Blahut [1983], Jungnickel [1995] sowie van Lint [1999] empfohlen.
Die algebraische Theorie der Codes verwendet die Algebra der endlichen K or-
per, deren wichtigste Grundergebnisse wir ja bereits in III.3 zusammengestellt
VIII.4 Lineare Codes 147
haben. In diesemAbschnitt f uhren wir einige allgemeine Grundbegriffe uber linea-
re Codes ein, also uber Codes, die einen Unterraum eines endlichen Vetorraums
GF(q)
n
bilden.
Denition 4.1. Seien q = p
r
eine Primzahlpotenz, K = GF(q) und n, k, d
nat urliche Zahlen. Ein k-dimensionaler Unterraum C des K
n
heit ein linearer
[n, k, d, q]-Code, wenn gilt:
d = min{d(x, y) [ x, y C, x ,= y].
Dabei bezeichnet d(., .) wieder den Hamming-Abstand. Wir nennen die Menge
Tr(x) = {j [ x
j
,= 0]
f ur ein beliebiges x K
n
den Tr ager von x und die M achtigkeit w(x) = [ Tr(x)[
das Gewicht von x. Man kann f ur lineare Codes also kurz
d(x, y) = w(x y) (x, y K
n
)
schreiben. Insbesondere ist der minimale Abstand zweier Codew orter in C gleich
dem Minimalgewicht
min{w(c) : c C {0]].
Bekanntlich deniert man f ur x, y K
n
, x = (x
1
, . . . , x
n
), y = (y
1
, . . . , y
n
),
xy :
n

j=1
x
j
y
j
= 0
und setzt f ur beliebiges D K
n
D

= {y [ xy f ur alle x D].
D

ist stets ein linearer Unterraum von K


n
. Ist D ein k-dimensionaler linearer
Unterraum von K
n
, so hat D

die Dimension (n k), wie man aus der linearen


Algebra wei.
Denition 4.2. Ist C ein linearer [n, k, d, q]-Code uber K = GF(q) , so nennt man
den linearen Code C

den zu C dualen Code. Gilt C

= C, so heit C selbst-dual.
Es gilt nat urlich (C

= C f ur jeden linearen Code C.


Es gibt zwei aus der linearen Algebra bekannte Methoden, einen linearen Code
zu denieren: Entweder gibt man eine Basis f ur C oder man gibt eine Basis f ur
C

an. In beiden F allen kann man die Vektoren der jeweiligen Basis zu den Zeilen
148 VIII Codes
einer Matrix machen; diese ist im ersten Falle eine (k n)-Matrix G, im zweiten
Falle eine ((n k) n)-Matrix H. Es gilt
(4.1) C = {uG [ u K
k
] = {c [ c K
n
, Hc
T
= 0],
wobei x
T
den zu x transponierten (Spalten-)Vektor bezeichnet. Man nennt G eine
Erzeugermatrix (oder auch Generatormatrix) von C und H eine Kontrollmatrix von
C. Weil es im Falle q = 2 immer nur um

gerade oder ungerade geht, sagt man


statt

Kontrollmatrix auch

parity check matrix. Erzeuger- und Kontrollmatrizen


f ur einen Code gibt es also (bis auf Zeilenpermutationen) genau so viele, wie es
Basen f ur C bzw. C

gibt.
1
Man kann das Studium linearer Codes also auch als Teil der linearen Alge-
bra uber endlichen K orpern ansehen. Nur handelt es sich hier um basisabh angige
lineare Algebra, da das Minimalgewicht keine Invariante unter linearen Abbildun-
gen ist. W ahrend man in der linearen Algebra die Basis im allgemeinen m oglichst
einfach w ahlt (so wird beispielsweise die Basis eines Unterraums gerne zu einer
Basis des gesamten Raumes fortgesetzt), geht man hier eher umgekehrt vor: Damit
das Minimalgewicht gro wird, mu der Code C m oglichst

schief bez uglich der


nat urlichen Basis des GF(q)
n
liegen.

Ubung 4.3. Man zeige: Besitzt ein linearer ([n, k, w, q]-Code eine systematische
Erzeugermatrix, also eine Erzeugermatrix der Form
G =
_
_
_
1 0
.
.
.
0 1

A
_
_
_
_

_
k
so ist
H =
_
_
A
T
. ,, .
k

1 0
.
.
.
0 1
. ,, .
nk
_
_
eine Kontrollmatrix von C. Zwischen aquivalenten Codes, die durch eine Permu-
tation der Koordinaten auseinander hervorgehen, wird in der Codierungstheorie
ublicherweise nicht unterschieden; in diesem Sinne hat dann jeder lineare Code
Erzeuger- und Kontrollmatrizen der eben angegebenen Form.
1
Sp ater werden wir im Kontext zyklischer Codes etwas allgemeiner Erzeugersysteme (statt
Basen) von C bzw. C

verwenden, um Matrizen G und H mit (4.1) zu erkl aren; dann m ussen also
Erzeuger- und Kontrollmatrizen nicht mehr vollen Rang haben.
VIII.4 Lineare Codes 149
Wenn man lineare Codes durch dieAngabe von Kontrollmatrizen deniert, kann
man die Parameter leicht bestimmen. Es gilt n amlich der
Satz 4.4. Sei H die Kontrollmatrix eines linearen [n, k, d, q]-Codes der L ange n
uber GF(q). Dann gilt:
(a) k = dimC = n Rang H.
(b) Das Minimalgewicht von C ist die kleinste Zahl d, f ur die es d linear abh angi-
ge Spalten in H gibt.
Beweis. Klarerweise gilt dimC = n dimC

= n Rang H. Es gibt genau dann


ein Codewort x mit w(x) = w, wenn Hx
T
= 0 f ur einen Vektor vom Gewicht w
gilt, also genau dann, wenn w geeignete Spalten von H linear abh angig sind. 2
Als Beispiel f ur die Anwendung von Satz 4.4 konstruieren wir die sogenann-
ten Hamming-Codes, die unab angig voneinander von Golay [1949] und Hamming
[1950] gefunden wurden.
Satz 4.5. Sei q eine Primzahlpotenz, k N und n =
q
k
1
q1
. Dann existiert ein
linearer [n, n k, 3, q]-Code, der (n, n k)-Hamming-Code.
Beweis. Sei K = GF(q). Dann zerf allt K
k
{0] disjunkt in die des Nullvektors
0 K
k
beraubten 1-dimensionalen Unterr aume, also in Mengen der M achtigkeit
q 1. Somit ist n =
q
k
1
q1
gerade die Anzahl der 1-dimensionalen Unterr aume
von K
k
. Man w ahle aus jedem von diesen einen Vektor ,= und mache die so
erhaltenen n Vektoren aus K
k
zu den Spalten einer (n k)-Matrix H, in der somit
je zwei Spalten linear unabbh angig sind. Nach Satz 4.4 ist H die Kontrollmatrix
eines linearen Codes mit den in der Behauptung angegebenen Parametern. 2
Beispiel 4.6. Die sieben Vektoren (1, 1, 1), (1, 1, 0), (1, 0, 1), (0, 1, 1), (1, 0, 0),
(0, 1, 0) und (0, 0, 1) bilden ein Repr asentantensystem f ur die 1-dimensionalen
Unterr aume von GF(2)
3
. F ur den (7, 4)-Hamming-Code erh alt man somit bei-
spielsweise
G =
_
_
_
_
1 0 0 0 0 1 1
0 1 0 0 1 0 1
0 0 1 0 1 1 0
0 0 0 1 1 1 1
_
_
_
_
und
H =
_
_
0 1 1 1 1 0 0
1 0 1 1 0 1 0
1 1 0 1 0 0 1
_
_
150 VIII Codes
als Erzeuger- bzw. Kontrollmatrix, wobei wir

Ubung 4.3 verwendet haben.
Satz 4.7. Jeder Hamming-Code ist perfekt.
Beweis. Hier ist e = 1, also [K
e
(c)[ = n(q 1) 1 = q
k
. Somit gilt

_
cC
K
e
(c)

= [C[ q
k
= q
nk
q
k
= q
n
,
woraus sofort die Behauptung folgt. 2
Das analoge Problem zur Bestimmung der Zahlen A(n, d, q) ist die Frage nach
der maximalen Dimension k eines [n, k, d, q]-Codes. Die im vorigen Abschnitt
angegebenen oberen Schranken f ur die Zahlen A(n, d, q) liefern unmittelbar der-
artige Schranken. So ergibt beispielsweise die Singleton-Schranke aus Satz 3.6 die
Bedingung
(4.2) k n d 1.
Ein linearer MDS-Code ist also ein [n, k, d, q]-Code mit d = n k 1, vgl.
Denition 3.7. Wir verwenden jetzt Satz 4.4, um zu beweisen, da dann auch der
duale Code ein MDS-Code ist:
Satz 4.8. Es sei C ein linearer [n, k, n k 1, q]-MDS-Code. Dann ist C

ein
[n, n k, k 1, q]-Code, also ebenfalls ein MDS-Code.
Beweis. Trivialerweise hat C

Dimension n k. Wegen (4.2) gen ugt es zu zeigen,


da jedes Codewort h C

mit h ,= 0 Gewicht w(h) k 1 hat. Angenommen,


das w are falsch; dann hat h in mindestens n k Komponenten Eintrag 0. Da h zu
einer Basis von C

erg anzt werden kann, gibt es eine Kontrollmatrix H der Gr oe


(n k) n von C, die h als Zeile enth alt. Es sei H
/
eine Untermatrix von H, die
aus nk Spalten gebildet wird, in denen h Eintrag 0 hat; dann enth alt H
/
also eine
Nullzeile. Daher sind die n k Spalten von H
/
linear abh angig, weswegen nach
Satz 4.4 das Minimalgewicht von C h ochstens n k betragen kann. Widerspruch!
2
Das Existenzproblem f ur lineare MDS-Codes ist zu einem Problem uber end-
liche projektive R aume aquivalent, wie wir in IX.6 sehen werden; dieser Zusam-
menhang hat zu wesentlichen Fortschritten gef uhrt, wie wir dort erl autern werden.
Eine groe Klasse von Beispielen werden wir aber bereits in Satz 6.9 erhalten.
Wir wollen nun eine Schranke herleiten, die speziell f ur lineare Codes gilt und
die Singleton-Schranke (3.6) verst arkt. Dazu folgende Notation: Der kleinste Wert
VIII.4 Lineare Codes 151
von n, f ur den es einen [n, k, d, q]-Code gibt, wird mit N(k, d, q) bezeichnet; in
dieser Notation lautet die Singleton-Schranke also N(k, d, q) k d 1. Die
folgende Verst arkung stammt von Griesmer [1960]:
Satz 4.9 (Griesmer-Schranke). Es gilt
(4.3) N(k, d, q) d
_
d
q
_

_
d
q
k1
_
.
Beweis. Wir zeigen zun achst die folgende rekursive Absch atzung:
(4.4) N(k, d, q) d N
_
k 1,
_
d
q
_
, q
_
.
Dazu sei C ein [N(k, d, q), k, d, q]-Code mit einer k-zeiligen Erzeugermatrix G.
Nach einer geeigneten Permutation der Zeilen und Spalten sowie Multiplikation
von Spalten mit geeigneten Skalaren ,= 0 (wodurch wir zwar den Code C ver andern,
nicht aber seine Parameter), k onnen wir annehmen, da G die folgende Form hat:
G =
_
_
_
0 . . . 0
d
, .. ,
1 . . . 1
G
1
G
2
_
_
_
,
wobei also G
1
eine (k 1) (N(k, d, q) d))-Matrix ist. Wir behaupten
nun, da die Zeilen von G
1
linear unabh angig sind. W are dies nicht der Fall, so
k onnten wir die erste Zeile von G
1
zu 0 . . . 0 machen. Das entsprechende Code-
Wort x = (0, . . . , 0, x
1
, . . . , x
d
) mit x
1
, . . . , x
d
,= 0 in C w urde dann aber zu
einemWort vom Gewicht < d in C f uhren, n amlich zu x x
1
(0, . . . , 0, 1, . . . , 1);
man beachte dabei, da nicht x
1
= = x
d
gelten kann, da sonst die Zeilen
von Glinear abh angig w aren. Widerspruch! Somit ist G
1
die Erzeugermatrix eines
[N(k, d, q) d, k 1, d
/
, q]-Codes C
1
.
Wir m ussen noch d
/
absch atzen. Dazu sei u C
1
ein Vektor vom Gewicht
d
/
, also eine Linearkombination der Zeilen von G
1
; wenn v die entsprechende
Linearkombination der Zeilen von G
2
ist, gilt also (u [ v) C. Sei x GF(q)
beliebig. Da (u [ v) vom Codewort (0 . . . 0 [ x . . . x) mindestens Abstand d hat,
mu v mindestens d d
/
Eintr age ,= x enthalten. Jedes x GF(q) kommt also
h ochstens d
/
-mal in v vor. Es folgt qd
/
d, also d
/

_
d
q
_
, was sofort (4.4) liefert.
Iterative Anwendung von (4.4) ergibt dann die gew unschte Schranke (4.3). 2
Schlielich zeigen wir ein lineares Analogon der Schranke aus Satz 3.13:
152 VIII Codes
Satz 4.10 (Gilbert-Varshamov-Schranke). Wenn
d2

i=0
_
n 1
i
_
(q 1)
i
< q
nk
ist, dann gibt es einen [n, k, d, q]-Code.
Beweis. Nach Satz 4.4 haben wir eine ((n k) n)-Matrix H uber GF(q) zu
konstruieren, f ur die je d 1 Spalten linear unabh angig sind. Als erste Spalte
k onnen wir jeden Vektor ,= 0 in V = GF(q)
nk
w ahlen. Angenommen, wir haben
bereits m Spalten von H konstruiert, von denen je d 1 linear unabh angig sind.
Offensichtlich kann man aus diesen m Spalten h ochstens
f (m) = 1 (q 1)
_
m
1
_
(q 1)
2
_
m
2
_
(q 1)
d2
_
m
d 2
_
verschiedene Linearkombinationen bilden, die sich aus h ochstens d 2 Spalten
kombinierenlassen. Wennf (m) < q
nk
ist, kannmaneinenvondenbeschriebenen
Linearkombinationen verschiedenenVektor v V ausw ahlen; man sieht leicht, da
v als weitere Spalte von H gew ahlt werden kann. Aufgrund unserer Voraussetzung
gilt aber f (m) < q
nk
f ur alle m n1, weswegen wir schlielich die gew unschte
Matrix H erhalten. 2
5 Zyklische Codes und Polynomideale
Im Laufe der Zeit hat sich eine vielleicht erstaunliche Tatsache herauskristallisiert:
Codes sind in der Praxis um so besser einsetzbar, je mehr algebraische Struktur sie
besitzen. Von zentraler Bedeutung sind insbesondere die zyklischen Codes, die wir
in diesemAbschnitt einf uhren wollen.
Denition 5.1. Sei q eine Primzahlpotenz und K = GF(q) sowie n N. Ein
Code C K
n
heit zyklisch, wenn gilt:
(c
1
, . . . , c
n
) C = (c
n
, c
1
, . . . , c
n1
) C.
Beispiel 5.2. Offenbar ist ein linearer Code zyklisch, wenn man f ur ihn eine
n-zeilige zyklische Erzeugermatrix angeben kann; deren Zeilen sind dann nat urlich
nicht mehr linear unabh angig, auer in Trivialf allen. Wir wollen das nun f ur einen
VIII.5 Zyklische Codes und Polynomideale 153
zum (7, 4)-Hamming-Code aus Beispiel 4.6 aquivalenten Code tun. Zun achst per-
mutieren wir die Spalten S
0
, , S
6
der Matrix G aus 4.6 in die Reihenfolge
(S
0
, S
6
, S
4
, S
5
, S
1
, S
2
, S
3
) und erhalten die Matrix
G
/
=
_
_
_
_
_
1 1 0 1 0 0 0
0 1 1 0 1 0 0
0 0 1 1 0 1 0
0 1 1 1 0 0 1
_
_
_
_
_
.
Wir bezeichnen nun die Zeilen von G
/
mit Z
/
i
und setzen Z
//
i
= Z
/
i
f ur i = 1, 2, 3
sowie
Z
//
4
= Z
/
2
Z
/
4
(mod 2)
Z
//
5
= Z
/
1
Z
/
2
Z
/
3
(mod 2)
Z
//
6
= Z
/
3
Z
/
4
(mod 2)
Z
//
7
= Z
/
1
Z
/
4
(mod 2).
Auf diese Weise ergibt sich eine zyklische Generatormatrix G
//
, n amlich
G
//
=
_
_
_
_
_
_
_
_
_
_
_
_
_
1 1 0 1 0 0 0
0 1 1 0 1 0 0
0 0 1 1 0 1 0
0 0 0 1 1 0 1
1 0 0 0 1 1 0
0 1 0 0 0 1 1
1 0 1 0 0 0 1
_
_
_
_
_
_
_
_
_
_
_
_
_
.
Wie das vorhergehende Beispiel zeigt, ist es keineswegs trivial, einem linearen
Code anzusehen, ob er zyklisch ist. Wir brauchen also eine geschicktere Beschrei-
bung. Hierzu ist es n otig, den Polynomring uber einem (endlichen) K orper K zu
verwenden. Wir wollen hier zun achst an die Konstruktion dieses Ringes erinnern.
Man setzt
K[x] = {p = (p
0
, p
1
, . . . ) [ p
0
, p
1
, K, p
j
,= 0 nur f ur endlich viele j]
und nennt K[x] den Polynomring (in einer Variablen x) uber K. Dahinter steckt
Folgendes: Deniert man f ur p = (p
0
, p
1
, . . . ) und q = (q
0
, q
1
, . . . ) aus K[x]
die Addition durch
p q = (p
0
q
0
, p
1
q
1
, . . . )
154 VIII Codes
und die Multiplikation durch
pq =
_
p
0
q
0
, p
0
q
1
p
1
q
0
, . . . ,

jk=n
p
j
q
k
, . . .
_
so wird K[x] das, was man in der Algebra einen Ring nennt: K[x] ist bez uglich
der Addition eine abelsche Gruppe mit der Null 0 = (0, 0, . . . ) und bez uglich der
Multiplikation eine abelsche Halbgruppe mit der Eins 1 = (1, 0, 0, . . . ), und es
gilt das Distributivgesetz p(q r) = pq pr f ur p, q, r K[x]. Durch die
Identikation a (a, 0, 0, . . . ) wird der K orper K in K[x] eingebettet.
Setzt man nun
x = (0, 1, 0, 0, . . . ),
so ergibt sich
x
2
= (0, 0, 1, 0, . . . ), x
3
= (0, 0, 0, 1, 0, . . . ), usw.
Nat urlich setzt man noch x
0
= 1 = (1, 0, 0, . . . ). Damit erh alt man dann allgemein
p = (p
0
, p
1
, . . . ) =
n

k=0
p
k
x
k
,
wobei n so gew ahlt ist, da p
n1
= p
n2
= = 0 gilt. W ahlt man n minimal
mit dieser Eigenschaft (also p
n
,= 0, auer f ur p = 0), so heit n der Grad
des Polynoms p und p
n
sein Leitkoefzient; Polynome mit Leitkoefzient 1 heien
monisch oder normiert. Wir haben somit denAnschlu an die ubliche Schreibweise
f ur Polynome erhalten; nur hat man bei dieser Denition den Vorteil, zu wissen,
was ein Polynom und was die Unbestimmte oder Variable x ist, Dinge, die fr uher
meist unklar blieben. Ob einem dieser formal korrekte, aber wenig intuitive Ansatz
allerdings gef allt, ist wohl eher Geschmacksache. Wie dem auch sei, wir k onnen
ab jetzt wieder ganz unbek ummert mit Polynomen umgehen und dabei unserer
Intuition folgen.
Man kann nun auch, wie ublich, ein Element K (oder allgemeiner aus
einem K umfassenden kommutativen Ring R, insbesondere aus einem Erweite-
rungsk orper von K) in die Polynome p K[x]

einsetzen: Die Auswertung an
der Stelle ist die durch
p =
n

k=0
p
k
x
k
. p() =
n

k=0
p
k

k
denierteAbbildung von K[x] nach K. Es handelt sich dabei sogar umeinen Homo-
morphismus, da dieAuswertung an der Stelle mit der Addition und Multiplikation
VIII.5 Zyklische Codes und Polynomideale 155
in K[x] vertr aglich ist, wie man ohne groe M uhe nachrechnet. Dabei heit eine
Nullstelle des Polynoms p, wenn p() = 0 gilt; in der Algebra lernt man, da
die Anzahl der Nullstellen von p in einem beliebigen Erweiterungsk orper L von K
h ochstens so gro wie der Grad von p ist und da es stets einen Erweiterungsk orper
Z von K gibt, uber demp in Linearfaktoren, also in Polynome vomGrad 1, zerf allt:
p =
n

k=0
p
k
x
k
=
n

j=1
(x
j
)
mit
1
, . . . ,
n
Z. Man nennt einen solchen Erweiterungsk orper Z den Zerf al-
lungsk orper von p, wenn dabei noch Z so klein wie m oglich gew ahlt ist (also von
K zusammen mit den
j
erzeugt wird), da Z dann bis auf Isomorphie eindeutig
durch p und K bestimmt ist, was wir aber nicht ben otigen werden.
Ein Polynom p heit irreduzibel, wenn es keine Zerlegung als Produkt zweier
Polynome kleineren Grades besitzt. Insbesondere sind also lineare Polynome stets
irreduzibel. Man lernt in der Algebra, da es uber jedem endlichen K orper GF(q)
irreduzible Polynome mit beliebigempositiven Grad gibt; wir haben diese Tatsache
bereits in III.3 erw ahnt.
Eine additive Untergruppe I von K[x] heit ein Ideal in K[x], wenn
p K[x], q I = pq I
gilt. Man sieht sofort: I K[x] ist genau dann ein Ideal, wenn lineares Kombi-
nieren mit Koefzienten aus K sowie Multiplikation mit x nicht aus I herausf uhrt.
Man zeigt mit Hilfe des sogenannten Divisionsalgorithmus f ur Polynome, da jedes
Ideal I in K[x] ein Hauptideal ist, also die Form I = I (m) = {pm [ p K[x]]
f ur ein m K[x] hat. F ur I ,= {0] kann man dabei m als das Minimalpolynom
von I w ahlen, also als das monische Polynom kleinsten Grades in I.
Ist I ein Ideal in K[x], nennt man p, q K[x] aquivalent modulo I im Falle
p q I, und rechnet man mit den

Aquivalenzklassen repr asentantenweise, so
wird die Menge K[x]/I dieser

Aquivalenzklassen selbst ein Ring, der Restklas-
senring von K[x] modulo I. Ist I = I (m), so sagt man auch

modulo m statt

modulo I und schreibt K[x]/(m) statt K[x]/I (m).


Dieses aus der Algebra gel augeVorgehen interessiert in der Codierungstheorie
nun speziell f ur den Fall m = x
n
1. Das Ideal I (x
n
1) besteht aus allen
Polynomen der Form p (x
n
1). W ahlt man speziell p = x
j
(f ur beliebiges
j = 0, 1, . . . ), sieht man, da die Ab anderung eines Polynoms modulo x
n
1
nichts anderes bedeutet als beliebige Monome der Formx
nj
durch x
j
zu ersetzen
und umgekehrt. Insbesondere gibt es zu jedemPolynomp genau ein modulo x
n
1
aquivalentes vom Grade n 1; die Polynome vom Grad n 1 sind also ein
Repr asentantensystemf ur die

Aquivalenzklassen, aus denen K[x]/(x
n
1) besteht.
156 VIII Codes
Mit der naheliegenden Identizierung
p
0
p
1
x p
n1
x
n1
(p
0
, p
1
, . . . , p
n1
)
bilden diese Polynome aber gerade den Vektorraum K
n
. Damit k onnen wir die-
sen Vektorraum, in dem ja die Codes der L ange n uber K liegen, mit dem Ring
K[x]/(x
n
1) identiziert. Wir wollen dies nun ausn utzen und uns fragen, was die
Multiplikation mit der Restklasse x modulo (x
n
1) in K
n
bedeutet. Das Polynom
p
0
p
1
x p
n1
x
n1
geht durch Multiplikation mit x in
p
0
x p
1
x
2
p
n2
x
n1
p
n1
x
n
uber, also modulo x
n
1 in p
n1
p
0
x p
n2
x
n1
. Die Multiplikation mit
x bedeutet also gerade die zyklische Vertauschung der Komponenten. Wir haben
damit den
Satz 5.3. Sei q eine Primzahlpotenz, n N und C K
n
ein linearer Code. Dann
ist C zyklisch, wenn und nur wenn die C in K[x]/(x
n
1) entsprechende Menge
ein Ideal in diesem Ring ist. 2
Man wird nun versuchen, die Ideale in R = GF(q)[x]/(x
n
1) vollst andig
zu bestimmen. Im folgenden werden wir stets die

Aquivalenzklassen in R mit
ihren Repr asentanten vom Grad n 1 identizieren, ohne dieses besonders zu
erw ahnen. Wir beweisen nun den folgendem fundamentalen
Satz 5.4. Sei C ,= 0 ein Ideal in R = GF(q)[x]/(x
n
1). Dann gelten:
(a) C ist ein Hauptideal und wird von dem eindeutig bestimmten Polynom g mit
minimalem Grad und Leitkoefzient 1 in C erzeugt.
(b) g teilt x
n
1 in GF(q)[x], also etwa x
n
1 = gh.
(c) Setze r := deg g ,= 0. Jedes c C hat eine eindeutige Darstellung c = fg
mit deg f n r 1.
(d) dimC = k = n r.
Beweis. Sei c C. Wir k onnen c in GF(q)[x] mit Rest durch g teilen und erhalten
etwa
c = ag b mit b = 0 oder deg b < deg g.
Da C ein Ideal ist, zeigt diese Gleichung (in R betrachtet) b C; wegen der
Minimalit at von r = deg g gilt daher b = 0. Dies zeigt (a). F ur (b) sei
x
n
1 = gh d in GF(q)[x] mit d = 0 oder deg d < deg g.
VIII.5 Zyklische Codes und Polynomideale 157
Es folgt d = gh modulo (x
n
1), also d C und daher, wie behauptet, d = 0.
Nach (a) hat jedes c C die Form c = ag. In GF(q)[x] gilt daher f ur ein
geeignetes Polynom e
c = ag e(x
n
1) = (a eh)g = fg,
wobei h wie in (b) und f = a eh sei. Da diese Gleichung in GF(q)[x] gilt und
deg c n 1 ist, folgt deg f n r 1. Die Eindeutigkeit von f ist klar, womit
auch (c) gezeigt ist. Die W orter in C sind also genau die fg mit deg f nr 1.
Offenbar ist dann g, xg, x
2
g, . . . , x
nr1
g eine Basis f ur C und (d) folgt. 2
Die zyklischen Codes der L ange n uber GF(q) entsprechen also bijektiv den
Teilern von x
n
1 uber GF(q), weswegen die Bestimmung aller zyklischen Codes
in GF(q)
n
auf die Bestimmung aller Teiler von x
n
1 in GF(q)[x] hinausl auft.
Diese bestimmt man nun, indem man x
n
1 uber GF(q) in irreduzible Faktoren
zerlegt:
x
n
1 = p
1
(x) . . . p
r
(x)
mit irreduziblen p
1
, . . . , p
r
liefert genau 2
r
Teiler von x
n
1, also 2
r
zyklische
Codes der L ange n. Die tats achliche Faktorisierung von x
n
1 ist nicht ganz
einfach, wir verweisen daf ur auf B ucher zu endlichen K orpern, siehe etwa Lidl und
Niederreiter [1983] oder Jungnickel [1993], oder zur Codierungstheorie. Satz 5.4
hat einige wichtige Konsequenzen, die wir nun angeben wollen.
Korollar 5.5. Mit den Bezeichnungen aus Satz 5.4 schreiben wir
g = g
0
g
1
x g
r
x
r
und h = h
0
h
1
x h
k
x
k
,
wobei k = n r sei. Dann ist
G =
_
_
_
_
_
_
_
_
g
0
g
1
. . . g
r
0 . . . . . . 0
0 g
0
g
1
. . . g
r
0 . . . 0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
0
0 . . . . . . 0 g
0
g
1
. . . g
r
_
_
_
_
_
_
_
_
=
_
_
_
_
_
g(x)
xg(x)
.
.
.
x
nr1
g(x)
_
_
_
_
_
158 VIII Codes
eine Erzeugermatrix f ur C. Ferner gilt f ur jedes c C die Gleichung hc = 0 in R
und die Matrix
H =
_
_
_
_
_
_
_
_
0 . . . 0 h
k
. . . h
1
h
0
0 . . . 0 h
k
. . . h
1
h
0
0
.
.
.
.
.
.
0
.
.
.
h
k
. . . h
1
h
0
0 . . . 0
_
_
_
_
_
_
_
_
=
_
_
_
_
_
_
_

h(x)
x

h(x)

x
nk1

h(x)
_
_
_
_
_
_
_
ist eine Kontrollmatrix f ur C. Dabei bedeutet die Notation

h(x), da die Koefzi-
enten von h(x) in umgekehrter Reihenfolge in die Matrix eingetragen werden.
Beweis. Die Aussage uber G folgt direkt aus Satz 5.4. Da jedes c C die Form
c = fg hat, folgt mit gh = x
n
1 = 0 also ch = fgh = f (x
n
1) = 0 in R.
Schreibt man c = c
0
c
1
x c
n1
x
n1
, so ist ch = 0 aquivalent zu den
Gleichungen
n1

i=0
c
i
h
ji
= 0 f ur j = 0, . . . , n 1,
wobei die Indizes modulo n betrachtet werden und h
k1
= = h
n1
= 0 gesetzt
wird. Somit ist H eine Kontrollmatrix f ur C, da die nk = r = ndimC Zeilen
von H offenbar linear unabh angig sind. 2
Wegen Korollar 5.5 heit g das Erzeugerpolynom und h das Kontrollpolynom
des Codes C. Wir betonen, da h nicht den dualen Code C

, sondern nur einen


aquivalenten Code erzeugt. Hierzu die folgende

Ubung 5.6. Das Polynom


h

(x) = x
k
h(x
1
) = h
k
h
k1
x h
0
x
k
heit das reziproke Polynomzuh. Manzeige, dadas vonh

erzeugte Ideal der duale


Code C

ist, der somit aquivalent zum zyklischen Code (h) mit h = (x


n
1)/g
ist.
VIII.6 BCH-Codes 159
Beispiel 5.7. Es sei C der (7, 4)-Hamming-Code. Nach Beispiel 5.2 ist C zy-
klisch und hat das Erzeugerpolynom g = 1 x x
3
sowie das Kontrollpolynom
h = (x
7
1)/g = 1 x x
2
x
4
.

Ubung 5.8. Es sei q = 2, n ungerade und C ein zyklischer Code der L ange n uber
GF(2). Man zeige die

Aquivalenz der folgenden Aussagen:
(a) (1 . . . 1) C.
(b) C enth alt ein Wort ungeraden Gewichts.
(c) g(1) ,= 0, wobei g das Generatorpolynom von C sei.
(d) h(1) = 0, wobei h das Kontrollpolynom von C sei.
6 BCH-Codes
In diesem Abschnitt wollen wir eine groe Klasse von zyklischen Codes gewin-
nen, die nach ihren Entdeckern (unabh angig voneinander Bose und Ray-Chaudhuri
[1960] sowie Hocquenghem [1959]) BCH-Codes genannt werden. Zur Herleitung
der Parameter dieser Codes werden wir eine Methode ben otigen, die es uns erlaubt,
das Minimalgewicht eines zyklischen Codes abzusch atzen. Wir beginnen mit der
Untersuchung dieses Problems und w ahlen einen verh altnism aig ungew ohnlichen
Ansatz, der auf van Lint und Wilson [1986] zur uckgeht. Dazu die folgende
Denition 6.1. Es sei S eine Teilmenge von GF(q). Mit U
S
bezeichnen wir die-
jenige Teilmenge der Potenzmenge von GF(q), die durch die folgenden Regeln
rekursiv erkl art ist:
(a) U
S
;
(b) A U
S
, A S, b , S = A {b] U
S
;
(c) A U
S
, c GF(q)

= cA U
S
.
Man sagt auch, da die Menge U
S
unabh angig bez uglich S ist.
Wir erkl aren das Gewicht eines Polynoms c = c
0
c
1
x c
n1
x
n1
uber GF(q) als die Anzahl der Koefzienten c
i
,= 0; wenn wir c als Codewort
in einem zyklischen Code uber GF(q) interpretieren, erhalten wir also gerade den
ublichen Gewichtsbegriff. Die Bedeutung von Denition 6.1 erkl art sich nun aus
dem folgenden Resultat:
160 VIII Codes
Lemma 6.2. Sei f ein Polynom uber GF(q) und S die Menge der Nullstellen von
f in einem (beliebigen) Erweiterungsk orper GF(q
m
). Dann hat f mindestens das
Gewicht
w(f ) max {[A[ [ A U
S
] .
Beweis. Wir schreiben f in der Form f (x) = f
1
x
i
1
f
k
x
i
k
mit f
i
,= 0 f ur
i = 1, . . . , k. F ur jede Teilmenge Avon GF(q
m
) denieren wir eine Teilmenge V
A
von GF(q
m
)
k
wie folgt:
V
A
= {(a
i
1
, . . . , a
i
k
) [ a A].
Wir zeigen nun mit Induktion, da V
A
f ur A U
S
stets linear unabh angig ist, womit
dann sofort
[A[ k = w(f (x))
folgt. Der Induktionsanfang A = ist klar. Wir f uhren nun den Induktionsschritt
durch; die Behauptung gelte also bereits f ur ein A U
S
. Zun achst betrachten wir
eine Anwendung der Regel (b) in Denition 6.1; es sei also hier A S. Durch
Hinzuf ugen eines Elements b , S erh alt man die Menge A
/
= A {b]. Es gilt
V
A
/ = V
A
{(b
i
1
, . . . , b
i
k
)], und es ist zu zeigen, da V
A
/ linear unabh angig ist.
Da V
A
nach Induktionsannahme bereits linear unabh angig ist, nehmen wir also an,
da (b
i
1
, . . . , b
i
k
) sich als eine Linearkombination von Vektoren in V
A
darstellen
l at. Dann folgt aus der Bedingung
f
1
a
i
1
f
k
a
i
k
= f (a) = 0 f ur alle a A
leicht f (b) = 0, imWiderspruch zu b / S. Es bleibt, eineAnwendung der Regel (c)
in Denition 6.1 zu untersuchen. Sei also A
/
= cA mit A U
S
und c GF(q
m
)

.
Dann gilt
V
A
/ = V
cA
= {(c
i
1
a
i
1
, . . . , c
i
k
a
i
k
) [ a A].
Daher sind dieVektoren in V
A
/ die Bilder der Vektoren in V
A
unter der durch die Ma-
trix diag(c
i
1
, . . . , c
i
k
) denierten bijektiven linearen Abbildung des Vektorraums
GF(q
m
)
k
. Somit sind auch die Vektoren in V
A
/ linear unabh angig. 2
Wir setzen ab jetzt stets voraus, da q und n teilerfremd sind; dann gibt es
nat urliche Zahlen m mit q
m
1 (mod n). F ur jedes solche m enth alt nun die nach
Satz III.3.5 zyklische multiplikative Gruppe GF(q
m
)

eine eindeutig bestimmte


Untergruppe der Ordnung n: W ahlen wir in GF(q
m
)

ein erzeugendes Element


und setzen dann =
n
/
, wobei q
m
1 = nn
/
gelte, so bilden 1, ,
2
, . . . ,
n1
die gew unschte Untergruppe. Man nennt eine primitive n-te Einheitswurzel
uber GF(q). Falls wir bei diesen

Uberlegungen noch m minimal w ahlen, also
VIII.6 BCH-Codes 161
q
l
, 1 (mod n) f ur l < m verlangen, so ist GF(q
m
) gerade der Zerf allungsk orper
des Polynoms x
n
1 uber GF(q).
Als Anwendung von Lemma 6.2 beweisen wir nun den folgenden fundamenta-
len Satz, der unabh angig voneinander von Bose und Ray-Chaudhuri [1960] sowie
von Hocquenghem [1959] gefunden wurde.
Satz 6.3 (BCH-Schranke). Sei C ein zyklischer Code der L ange n uber GF(q) mit
Erzeugerpolynom g, wobei q und n teilerfremd sind. Ferner sei eine primitive
n-te Einheitswurzel uber GF(q). Falls es b 0 und 2 mit
g(
b
) = g(
b1
) = = g(
b2
) = 0
gibt (man sagt dann auch, da die Menge der Nullstellen von C eine l uckenlose
Teilmenge von Potenzen von der L ange 1 enth alt ), hat C Minimalgewicht
d .
Beweis. Sei GF(q
m
) der Zerf allungsk orper von x
n
1 uber GF(q). Nach Vor-
aussetzung enth alt die Menge der Nullstellen von g und daher auch die Menge
S der Nullstellen eines beliebigen Codepolynoms c = fg C die Teilmenge
{
b
,
b1
, . . . ,
b2
]. Wir k onnen o.B.d.A.
b1
, S annehmen. Nach Lem-
ma 6.2 gen ugt es nun, {
b
,
b1
, . . . ,
b1
] U
S
zu zeigen:
U
S
,
b1
, S =
b1
U
S
= {
b2
] U
S
= {
b2
,
b1
] U
S
= {
b3
,
b2
] U
S
= {
b3
,
b2
,
b1
] U
S
.
.
.
= {
b
,
b1
, . . . ,
b1
] U
S
,
wobei wir abwechselnd die Regeln (b) und (c) aus Denition 6.1 verwendet haben.
2
Wir werden bald sehen, da die BCH-Schranke im allgemeinen nicht das wirk-
liche Minimalgewicht liefert, sondern tats achlich nur eine untere Schranke. Aus
Satz 6.3 folgt f ur jedes n die Existenz eines zyklischen Codes der L ange n
mit Minimalabstand d uber GF(q); nat urlich wird sa erst dann interessant,
wenn man auch eine vern unftige Absch atzung f ur die Dimension solcher Codes
angeben kann. F ur die formale Denition der sogenannten BCH-Codes sei nun
162 VIII Codes
wieder eine primitive n-te Einheitswurzel uber GF(q). In GF(q)[x] gibt es dann
f ur i = 1, . . . , n 1 stets ein monisches Polynom m
i
minimalen Grades, f ur wel-
ches m
i
(
i
) = 0 gilt, das Minimalpolynom von
i
. Da jedes
i
eine Nullstelle
von x
n
1 ist, sind s amtliche m
i
(i = 1, . . . , n 1) Teiler des Polynoms x
n
1;
dasselbe gilt dann f ur das kleinste gemeinsame Vielfache g einer Teilmenge der
m
i
. Jedes solche Polynom g deniert daher ein Ideal I (g) GF(q)[x]/(x
n
1),
also einen zyklischen Code C GF(q). Mit dieser Beobachtung k onnen wir nun
die BCH-Codes denieren:
Denition 6.4. Sei eine primitive n-te Einheitswurzel uber GF(q) und sei g das
kleinste gemeinsame Vielfache der Polynome m
b
, m
b1
, . . . , m
b2
. Der Code
C mit Erzeugerpolynom g wird auch als
C = C(
b
,
b1
, . . . ,
b2
)
bezeichnet, da das Erzeugerpolynom von C gerade das monische Polynom klein-
sten Grades mit Nullstellen
b
,
b1
, . . . ,
b2
ist; er heit ein BCH-Code zum
Abstand (

of designed distance ). Im Fall b = 1 spricht man auch von einem


BCH-Code im engeren Sinn.
Satz 6.5. Sei GF(q
m
) der Zerf allungsk orper von x
n
1 uber GF(q). Jeder BCH-
Code C der L ange n uber GF(q) zumAbstand ist ein zyklischer [n, k, d, q]-Code
mit
d und k n m( 1).
F ur q = 2 gibt es sogar einen e-fehlerkorrigierenden BCH-Code im engeren Sinn
mit k n me.
Beweis. Sei eine primitive n-te Einheitswurzel uber GF(q) und m
i
das Minimal-
polynom von
i
. Nach Denition hat C die Form
C = C(
b
,
b1
, . . . ,
b2
) = I (g)
mit g = kgV(m
b
, m
b1
, . . . , m
b2
). Die Behauptung uber den Minimalabstand
von C folgt unmittelbar aus Satz 6.3. Da die n-ten Einheitswurzeln
i
in GF(q
m
)
enthalten sind, hat jedes m
i
h ochstens den Grad m. Also gilt deg g m( 1),
und die Behauptung folgt wegen
k = dimC = n deg g n m( 1).
Im Fall q = 2 uberlegt man sich noch m
2i
= m
i
f ur alle i, da mit
i
auch

2i
eine Nullstelle von m
i
ist; das folgt aus der Tatsache, da Quadrieren ein
VIII.6 BCH-Codes 163
Automorphismus von GF(2
m
) ist, siehe Satz III.3.8. Damit ergibt sich f ur b = 1
und = 2e 1
kgV(m
1
, . . . , m
2e
) = kgV(m
1
, m
3
, . . . , m
2e1
)
und dann ahnlich wie zuvor die Behauptung. 2
Beispiel 6.6. Das Polynom x
23
1 hat uber GF(2) die Zerlegung
x
23
1 = (x1)(1xx
5
x
6
x
7
x
9
x
11
)(1x
2
x
4
x
5
x
6
x
10
x
11
).
Sei nun C der zyklische Code mit Erzeugerpolynom
g(x) = 1 x x
5
x
6
x
7
x
9
x
11
und eine Nullstelle von g, also eine primitive 23ste Einheitswurzel. Da mit
stets auch
2
eine Nullstelle von g ist, hat g genau die Nullstellenmenge
S = {,
2
,
4
,
8
,
16
,
9
,
18
,
13
,
3
,
6
,
12
];
nebenbei gesagt beweist dies auch, da g in der Tat irreduzibel ist. Der Code C hat
also Dimension 12 und aufgrund der BCH-Schranke 6.3 Minimalgewicht d 5, da
S die l uckenlose Teilmenge ,
2
,
3
,
4
der L ange 4 enth alt. Wir wollen zeigen,
da jedes Codepolynom, dessen Nullstellenmenge S umfat, Gewicht 7 haben
mu und somit sogar d 7 gilt; dazu werden wir Satz 6.2 zweimal anwenden.
Falls ein Codepolynomc noch eine weitere Nullstelle ,= 1 auerhalb von S hat,
folgt sofort c = 0 oder c = 1 x x
2
x
22
, also w(c) = 23. Wir k onnen
daher annehmen, da c ein Codepolynom ist, dessen Nullstellenmenge genau S
oder S
/
= S {1] ist. Wir zeigen zun achst d 6. Nach Satz 6.2 gen ugt es, eine
unabh angige Menge U der M achtigkeit 6 in U
T
zu nden, wobei also T = S bzw.
T = S
/
sei. Das geht rekursiv wie folgt, wenn wir den Zerf allungsk orper GF(2
11
)
von g als Erweiterungsk orper w ahlen:
U
T
{
4
] U
T

5
, T {
4
,
5
] U
T
{,
2
] U
T

5
, T {,
2
,
5
] U
T
{
8
,
9
,
12
] U
T

14
, T {
8
,
9
,
12
,
14
] U
T
{
12
,
13
,
16
,
18
] U
T

5
, T {
12
,
13
,
16
,
18
,
5
] U
T
{
2
,
3
,
6
,
8
,
18
] U
T

5
, T {
2
,
3
,
5
,
6
,
8
,
18
] U
T
.
Wir betrachten nun den Teilcode C
0
von C, der aus den Vektoren geraden Ge-
wichts gebildet wird und nach

Ubung 5.8 Erzeugerpolynomg
0
= (x 1)g hat. Wir
164 VIII Codes
wenden nun Satz 6.2 auf die Nullstellenmenge S
/
= S {1] von C
0
an und erhalten
dann aus {
2
,
3
,
5
,
6
,
8
,
18
] U
S
/ zun achst {1,
1
,
3
,
4
,
6
,
16
] U
S
/
und dann mit {
5
] , U
S
/ die unabh angige Menge {1,
1
,
3
,
4
,
5
,
6
,
16
] der
M achtigkeit 7; damit folgt d
0
7, also sogar d
0
8. Insbesondere kann also C
kein Codewort vom Gewicht 6 enthalten, womit in der Tat d 7 gilt. Der Le-
ser kann leicht nachpr ufen, da (f ur e = 3) die Kugelpackungsschranke 3.2 mit
Gleichheit erf ullt ist, womit der Code C also ein perfekter, 3-fehlerkorrigierender
[23, 12, 7; 2]-Code ist; C ist der von Golay [1949] gefundene bin are Golay-Code.
Bemerkung 6.7. Golay [1949] hat auch einen perfekten 2-fehlerkorrigierenden
Code gefunden, n amlich einen [11, 6, 5, 3]-Code, den tern aren Golay-Code. Dieser
Code kann durch das Erzeugerpolynomx
5
x
3
x
2
x 1 uber GF(3) deniert
werden; da seine Behandlung deutlich schwieriger ist, k onnen wir hier nicht darauf
eingehen und verweisen auf MacWilliams und Sloane [1977], Jungnickel [1995]
oder van Lint [1999]. Da es neben den beiden Golay-Codes und den Hamming-
Codes aus Satz 4.5 keine weiteren perfekten linearen Codes gibt, ist ein tieiegendes
Resultat von van Lint und Tiet av ainen, f ur dessen Beweis auch auf van Lint [1975]
und MacWilliams und Sloane [1977] verwiesen sei.
Schlielich wollen wir noch eine spezielle Klasse von BCH-Codes betrachten,
die (auf andere Weise) von Reed und Solomon [1960] eingef uhrt wurden und uns
Beispiele f ur MDS-Codes liefern werden.
Denition 6.8. Ein BCH-Code der L ange n = q 1 uber GF(q) heit ein Reed-
Solomon-Code. Da die (q 1)-ten Einheitswurzeln gerade die Elemente von
GF(q)

sind, sind die Erzeugerpolynome der Reed-Solomon-Codes leicht zu be-


schreiben. Dazu sei ein primitives Element vonGF(q)

. Ein Reed-Solomon-Code
zumAbstand hat dann Erzeugerpolynom
g(x) =
_
x
b
__
x
b1
_
. . .
_
x
b2
_
,
da ja x
i
das Minimalpolynom von
i
ist. Meist wird dabei b = 1 gew ahlt; man
spricht dann von einem Reed-Solomon-Code im engeren Sinn.
Satz 6.9. Jeder Reed-Solomon-Code C zumAbstand = q k uber GF(q) ist ein
zyklischer [q 1, k, q k, q]-Code, also ein MDS-Code. Falls dabei C ein Reed-
Solomon-Code imengeren Sinn ist, kann man C zu einem[q, k, q k 1, q]-Code
C
/
erweitern, der dann ebenfalls ein MDS-Code ist.
Beweis. Sei das Erzeugerpolynomg von C wie in 6.8 deniert. Dann gilt dimC = k
mit n k = deg g = 1. Aufgrund der BCH-Schranke 6.3 hat man d =
VIII.7 Bemerkungen zur Implementierung 165
nk1. Andererseits besagt die Singleton-Schranke (4.2) d nk1, weswegen
d = und damit die angegebenen Parameter folgen.
Wir denieren nun in Analogie zum bin aren Fall im Beweis von Lem-
ma 3.11 f ur c C das zugeh orige Wort in C
/
als
(c
0
, . . . , c
q
) mit c
q
= c
0
c
q1
.
Da c = ag f ur ein geeignetes Polynom a ist, gilt also c
q
= c(1) = a(1)g(1);
nach Denition ist dabei g(1) ,= 0. Falls a(1) = 0 ist, ist c ein Vielfaches von
(x1)g und hat nach der BCH-Schranke 6.3 Gewicht d 1; anderenfalls ist aber
c
q
,= 0, womit c dann ebenfalls Gewicht d 1 hat. Daher hat C
/
Minimalgewicht
d 1, und mit der Singleton-Schranke folgt wie zuvor die Behauptung. 2
F ur die Fehlerkorrektur beim CD-Spieler wird ein Reed-Solomon-Code der
L ange 255 mit Minimalgewicht d = 5 verwendet, der also uber GF(2
8
) deniert
ist; f ur n ahere Einzelheiten verweisen wir auf Vanstone und van Oorschot [1989]
oder Jungnickel [1995].

Ubung 6.10. Sei eine primitive n-te Einheitswurzel uber GF(q) und C ein zy-
klischer Code der L ange n mit Erzeugerpolynomg. Ferner seien , , . . . ,
k1
Nullstellen von g, wobei und beliebige Elemente von GF(q)

sind und min-


destens Ordnung k hat. Man leite aus Satz 6.2 ab, da dann f ur jedes Codepolynom
c C gilt:
w(c) k 1 oder c(
i
) = 0 f ur alle i 0.

Ubung 6.11. Sei eine primitive 35ste Einheitswurzel uber GF(2) und C der
zyklische Code mit Generatorpolynom g = m
5
m
7
. Man verwende

Ubung 6.10,
um d 4 zu beweisen. (Die BCH-Schranke liefert hier nur d 3.)
7 Bemerkungen zur Implementierung
Im letzten Abschnitt dieses Kapitels wollen wir noch einige Bemerkungen zur
Implementierung von Codes machen; die Existenz guter Codes allein ist f ur ihre
praktische Anwendbarkeit ja noch nicht ausreichend! Das Codieren ist bei einem
linearen Code unproblematisch. Wenn C die Dimension k hat, kann man eine k-
zeilige Generatormatrix w ahlen. Das Gausche Reduktionsverfahren zeigt, da I
k
als Teilmatrix angenommen werden kann. Nach eventueller Spaltenpermutation
(also

Ubergang zu einem aquivalenten Code) kann man also o.B.d.A. eine Erzeu-
germatrix der FormG = (I
k
[ A) annehmen. Das hat folgenden Vorteil: Man erh alt
166 VIII Codes
einen Code, in dem der Vektor (x
1
, . . . , x
k
) in einen Vektor der Form
(x
1
, . . . , x
k
. ,, .
k
, x
k1
, . . . , x
n
. ,, .
nk
)
codiert wird. Dabei sind die ersten k Symbole jedes Codeworts also die Informati-
onssymbole, der Rest Kontrollsymbole.

Uberdies ist das zu x geh orende Codewort
einfach xG. Das Codieren l at sich also leicht implementieren.
In diesem Zusammenhang sei ein interessantes Faktum uber linerare MDS-
Codes als

Ubung erw ahnt, deren L osung man beispielsweise bei Jungnickel [1995,
Satz 3.4.11] nachlesen kann:

Ubung 7.1. Es sei C ein linearer [n, k, n k 1, q]-MDS-Code. Man zeige, da


man beliebige k der Koordinaten als Informationssymbole und die ubrigen n k
Koordinaten als Kontrollsymbole w ahlen kann (was den Term

separable in MDS
erkl art) und da es f ur je d = n k 1 Koordinaten ein Codewort gibt, das genau
in diesen Koordinaten Eintr age ,= 0 hat.
Zum Decodieren linearer Codes kann man im Prinzip wie folgt vorgehen.
Wenn x gesendet und y empfangen wurde, heit e := x y der Fehlervektor
und s := Hy
T
das Syndrom. Dabei ist H eine Kontrollmatrix f ur C; wenn G be-
kannt ist, ist auch H bekannt, siehe

Ubung 4.3. Das Syndrom s h angt nur von e,
nicht aber von y ab, da
s = Hy
T
= H(x e)
T
= He
T
gilt. Also l at sich s ohne Schwierigkeiten berechnen.
Wenn man s kennt, bilden die L osungen von s = He
T
also eine Nebenklasse
des k-dimensionalen Vektorraums C in GF(q)
n
. Das Decodieren erfordert nun
(gem a der Pr amisse, da weniger Fehler wahrscheinlicher sind als mehr Fehler),
aus den q
k
Elementen dieser Nebenklasse dasjenige e mit minimalem Gewicht
zu bestimmen (den sogenannten coset leader). Das ist in der Praxis jedenfalls
f ur groe Codes ein Problem. Wenn die Dimension k verh altnism aig gro (die
Anzahl der Nebenklassen also verh altnism aig klein) ist, kann man die Bijektion
s [coset leader f ur die zugeh orige Nebenklasse]
vorausberechnen und einfach abspeichern; dann ist das Decodieren schnell. Wenn
k sehr klein ist, kann man jeweils alle L osungen von s = He
T
bestimmen und den
coset leader durch Inspektion ausw ahlen. Bei groen Codes sind beide Verfahren
nicht praktikabel. Wenn auch die Syndrombestimmung die Anzahl der Kandidaten
f ur e von q
n
auf q
k
vermindert (ein Vorteil imVergleich mit nicht-linearen Codes),
VIII.7 Bemerkungen zur Implementierung 167
so bleibt es trotzdem sehr schwierig, einen beliebig vorgegebenen linearen Code
zu decodieren.
In der Tat ist bislang kein Verfahren bekannt, das einen beliebigen linearen
Code in polynomialer Zeit decodiert, und man vermutet, da ein solches Verfahren
auch gar nicht existieren kann. Wie Berlekamp, McEliece und van Tilborg [1978]
gezeigt haben, ist n amlich das betrachtete Problem NP-schwer.
2
F ur bestimmte Klassen linearer Codes gibt es jedoch sehr gute Decodierungs-
Algorithmen, beispielsweise f ur die zyklischen BCH-Codes, die wir im vorigen
Abschnitt beschrieben haben. Allerdings w urde die Darstellung eines entsprechen-
den Verfahrens den Rahmen dieses Buches sprengen; wir verweisen beispielsweise
auf MacWilliams und Sloane [1977], Blahut [1983] oder Jungnickel [1995].
Trotzdem wollen wir noch einige einfache Bemerkungen uber die Implemen-
tierung zyklischer Codes machen, und zwar zum Codieren. Die Erzeugermatrix
aus Korollar 5.5 ist nat urlich nicht mehr systematisch; trotzdem kann man wieder
dimC = k der Koordinaten als Informations- und die restlichen nk Koordinaten
als Kontrollsymbole verwenden. Dazu teilt man die Codew orter c wie folgt auf:
c = c
0
c
1
. . . c
nk1
. ,, .
Kontrollsymbole
c
nk
. . . c
n1
. ,, .
Informationssymbole
Wenn c
nk
, . . . , c
n1
gegeben sind, mu man also c
0
, . . . , c
nk1
so bestimmen,
da c im Code liegt. Daf ur gibt es zwei verschiedene Methoden. In Polynom-
schreibweise dividiert man c = c
nk
x
nk
c
n1
x
n1
in GF(q)[x] durch
das Erzeugerpolynom g und erh alt einen Rest
r = r
0
r
1
x r
nk1
x
nk1
;
man setzt nun c := c r, also c
i
= r
i
f ur i = 0, . . . , n k 1. Dann ist c durch
g teilbar, also ein Codewort.
Alternativ hierzu kann man auch die Kontrollmatrix H aus Korollar 5.5 ver-
wenden. Ausf uhrlich geschrieben liefert die Bedingung Hc
T
= 0 f ur c C das
folgende Gleichungssystem:
h
k
c
nk1
h
k1
c
nk
h
1
c
n2
h
0
c
n1
= 0
h
k
c
nk2
h
k1
c
nk1
h
0
c
n2
= 0
.
.
.
h
k
c
0
h
k1
c
1
h
0
c
k
= 0.
2
Eine erste Einf uhrung in die Komplexit atstheorie, in der insbesondere die Begriffe NP-vollst andig
und NP-schwer erl autert werden, ndet man beispielsweise in Kapitel 2 von Jungnickel [1994]; f ur eine
ausf uhrliche Darstellung verweisen wir auf Garey und Johnson [1979] oder Papadimitriou [1994].
168 VIII Codes
Wegen deg h = k ist h
k
,= 0, weswegen die c
nk1
, . . . , c
1
, c
0
sukzessive leicht
berechnet werden k onnen.
Zumindest im bin aren Fall lassen sich beide Methoden mit Hilfe von linearen
Schieberegistern gut implementieren; Beispiele und Literaturhinweise dazu ndet
man bei MacWilliams und Sloane [1977].
Abschlieend gehen wir noch kurz auf eine Anwendung zyklischer Codes bei
Computer-Netzwerken ein. Imallgemeinen arbeitet man dort bei der Daten ubertra-
gung nicht mit fehlerkorrigierenden, sondern lediglich mit fehlererkennenden Co-
des; wenn Fehler aufgetreten sind, mu der entsprechende Datenblock nochmals
ubertragen werden. Dazu werden die sogenannten CRC-Codes (f ur

cyclic redun-
dancy check code) eingesetzt. Wir k onnen hier nicht auf Computer-Netzwerke
und ihre Realisierung eingehen; daf ur verweisen wir auf das Standardwerk von
Tanenbaum [1988]. Die Grundidee f ur die Verwendung bin arer zyklischer Codes
zur Fehlererkennung ist aber denkbar einfach:
Algorithmus 7.2 (CRC-Codierung). Wir verwenden k Informations- und n k
Kontrollbits; die eigentlichen Daten werden also als bin are Polynome m(x) vom
Grad k angesehen. Ferner sei ein Erzeugerpolynomg(x) GF(2)[x] vom Grad
r = n k gegeben.
(1) Multipliziere m(x) mit x
nk
; das Ergebnis sei
x
nk
m(x) = c
nk
x
nk
c
n1
x
n1
.
(2) Dividiere x
nk
m(x) in GF(2)[x] durch g(x); der Rest sei
r(x) = c
0
c
1
x c
r1
x
r1
.
(3) Setze
c(x) = x
nk
m(x) r(x) = c
0
c
1
x c
n1
x
n1
.
Im CRC-Algorithmus 7.2 wird also die Nachricht m(x) genau so in ein Code-
polynom c(x) codiert, wie wir es bereits oben beschrieben haben. Da wir jetzt nur
Fehler erkennen, nicht aber korrigieren wollen, ist auch die

Decodierung sehr
einfach:
Algorithmus 7.3 (CRC-Decodierung). Nach

Ubertragung von c(x) sei das Poly-
nom d(x) empfangen worden.
(1) Dividiere d(x) in GF(2)[x] durch g(x); der Rest sei r(x).
(2) Falls r(x) ,= 0, melde Fehler und verlange nochmalige

Ubertragung.
VIII.7 Bemerkungen zur Implementierung 169
(3) Sei also r(x) = 0 und d(x) = c
0
c
1
x c
n1
x
n1
. Setze
m(x) = c
nk
c
nk1
x c
n1
x
k1
.
Wie wir bereits erw ahnt haben, l at sich dies sehr gut in Hardware durch Schie-
beregister implementieren; siehe auch Peterson und Brown [1961]. Es bleibt die
Aufgabe, passende Generatorpolynome g(x) auszuw ahlen, also dar uber nachzu-
denken, wie gut die Fehlererkennung bei gegebenemg(x) aussieht. Dazu zun achst
ein weiterer Begriff, n amlich der des Fehlerb undels (

burst error). Viele



Ubertra-
gungskan ale sind n amlich nicht

ged achtnislos: In Telefonleitungen, Magnetb an-


dern oder bei CDs treten Fehler eher in B undeln auf; wenn in einer Komponente ein
Fehler auftritt, so mit gr oerer Wahrscheinlichkeit auch in den Nachbarkomponen-
ten. Formal deniert man ein Fehlerb undel der L ange b als einen Fehlervektor, des-
sen Eintr age ,= 0 alle in b (zyklisch) aufeinanderfolgenden Komponenten enthalten
sind. Beispielsweise sind also (00001001000) und (100000000101) Fehlerb undel
der L ange 4.
Es ist nun klar, da man bei der CRC-Codierung uber ein Polynom g(x) vom
Grad r = n k jedes Fehlerb undel der L ange b r entdecken kann, da ja kein
Polynom vom Grad r 1 durch g teilbar ist. Wenn man darauf besteht, da g
den Faktor x 1 enth alt, kann g sogar alle Fehlerb undel von ungeradem Gewicht
erkennen; wenn n amlich der Rest r(x) ungerades Gewicht hat, gilt ja r(1) = 1,
weswegen r(x) nicht durch x 1 teilbar ist. Wie die folgende

Ubung zeigt, kann
man auch l angere Fehlerb undel mit hoher Wahrscheinlichkeit erkennen.

Ubung 7.4. Es sei C ein CRC-Code mit Generatorpolynom g(x) vom Grad r,
wobei g(0) = 1 sei. Man zeige unter der Annahme, da alle Fehlerb undel der
L ange b mit gleicher Wahrscheinlichkeit auftreten:
(a) F ur b = r 1 ist die Wahrscheinlichkeit, da die aufgetretenen Fehler nicht
erkannt werden, 2
r1
.
(b) F ur b r 2 ist die Wahrscheinlichkeit, da die aufgetretenen Fehler nicht
erkannt werden, 2
r
.
Beispiel 7.5. In der Praxis sind die folgenden Polynome verwendet worden:
(a) CRC-12: x
12
x
4
x
3
x
2
x 1
(b) CRC-16: x
16
x
15
x
2
1
(c) CRC-CCITT: x
16
x
12
x
5
1
(d) CRC-32: x
32
x
26
x
23
x
22
x
16
x
12
x
11
x
10
x
8
x
7
x
5

x
4
x
2
x 1
170 VIII Codes
Dabei kommt CRC-12 zum Zuge, falls die Symbole des zugrundeliegendenAlpha-
bets als 6-bit-Vektoren dargestellt werden und CRC-16 bzw. CRC-CCITT im Fall
von 8-bit-Vektoren. Schlielich wird CRC-32 gem a des ANSI/IEEE Standards
802.12 f ur die Daten ubertragung in LANs und MANs (local and metropolitan
area networks) eingesetzt.
Wir betrachten das Beispiel (b) noch etwas genauer: CRC-16 hat die Zerlegung
(x1)(x
15
x1); der zweite Faktor ist ein primitives Polynom, das x
2
15
1
1 =
x
32767
1 teilt. Somit ist g ein Erzeugerpolynnom f ur einen zyklischen Code der
L ange n = 32767; man kann also Nachrichten der L ange k nr = 32751 damit
codieren und auf Fehler testen, wie beschrieben. Dabei kann man alle einfachen
Fehler ungeraden Gewichts, alle Fehlerb undel der L ange b 16 sowie 99, 997%
aller Fehlerb undel der L ange b 18 erkennen.
IX Endliche projektive Ebenen und R aume
Jeder Mathematikstudent lernt irgendwann einmal etwas projektive Geometrie und
begegnet dabei jener herrlichen inneren Symmetrie dieser Theorie, die sich in dem
auf den franz osischen Mathematiker Joseph Diaz Gergonne (1771 1859) zur uck-
gehenden

Dualit atsprinzip ausdr uckt. Ferner lernt man meist auch etwas uber das
geometrische Rechnen mit Doppelverh altnissen und den Widerschein von Rechen-
gesetzen in sogenannten geometrischen Schlieungss atzen, unter denen der Satz
vonDesargues der einfachste ist. Manlernt bei dieser Gelegenheit auch, dader Satz
von Desargues in projektiven R aumen einer Dimension 3 fast trivial ist, in pro-
jektiven Ebenen (Dimension 2) dagegen verletzt sein kann (

nicht-desarguessche
Ebenen). Auf jeden Fall spielen die projektiven Ebenen eine Sonderrolle, und es
sind ihnen ganze Monographien gewidmet worden.
Die Theorie der endlichen projektiven Geometrien ist zugleich eines der sch on-
sten Kapitel der Kombinatorik; in diesemAbschnitt wollen wir typische Einblicke
in diese Theorie gewinnen. Wir lernen zun achst einige allgemeine Eigenschaften
endlicher projektiver Ebenen und R aume kennen und diskutieren Existenzfragen.
Im Anschlu daran beweisen wir einen Satz uber Polarit aten; damit bereiten wir
uns auch auf eine interessante Anwendung vor, n amlich das Freundschaftstheo-
rem von Erd os, Rnyi und Ss [1966]. Danach konstruieren wir besonders sch one
Kollineationsgruppen projektiver Geometrien, die sogenannten Singergruppen. Als
n achstes betrachten wir dann einige interessante kombinatorische Unterstrukturen
in projektiven Geometrien, n amlich einerseits die sogenannten B ogen, die in engem
Zusammenhang zu den im vorigen Kapitel eingef uhrten MDS-Codes stehen, und
andererseits Unterebenen und Blockademengen. Schlielich werden wir noch eine
Anwendung der projektiven Geometrie in der Kryptographie darstellen und kurz
auf afne Ebenen und R aume eingehen.
Trotzdem k onnen wir nur einige Kostproben aus einem sehr umfangreichen
Gebiet geben, die hoffentlich beim Leser den Appetit auf weiterf uhrende Lekt ure
anregen werden. Allgemeine Darstellungen der projektiven Geometrie ndet man
beispielsweise bei Veblen und Young [1916], Lenz [1965], Coxeter [1987] oder
Beutelspacher und Rosenbaum [1992]. Speziell f ur projektive Ebenen seien die
Monographien von Dembowski [1968], Pickert [1975], L uneburg [1980], Kallaher
[1981] sowie Hughes und Piper [1982] genannt. Das Studiumendlicher projektiver
172 IX Endliche projektive Ebenen und R aume
R aume und klassischer projektiver Ebenen ist ebenfalls ein bl uhendes Gebiet, das
auch als

Galois-Geometrie bezeichnet wird; hier empfehlen wir die drei Stan-


dardwerke von Hirschfeld [1985,1998] bzw. Hirschfeld und Thas [1991].
1 Grundlagen
Wir beginnen mit einer sehr allgemeinen (und in dieser Allgemeinheit nicht son-
derlich spannenden) Denition, von der wir dann im Laufe der Zeit verschiedene
interessante Spezialf alle kennenlernen werden.
Denition 1.1. Es seien P und B zwei zueinander disjunkte, endliche nichtleere
Mengen sowie I P B eine Relation. Die Elemente von P werden Punkte, die
Elemente von B Bl ocke genannt. Ist p P, B B, (p, B) I, so verwendet
man gerne eine geometrisch motivierte Sprechweise; beispielsweise sagt man, der
Punkt p liege auf oder inzidiere mit dem Block B oder der Block B gehe durch oder
inzidiere mit dem Punkt p und ahnliches mehr. Das Tripel (P, B, I) heit eine
endliche Inzidenzstruktur.
Denition 1.2. Sei = (P, G, I) eine endliche Inzidenzstruktur, wobei wir statt
von Bl ocken von Geraden sprechen wollen. heit eine endliche projektive Ebene,
wenn folgendes gilt:
(a) Sind p, q P, p ,= q, so gibt es genau ein G G mit (p, G), (q, G) I.
Durch zwei verschiedene Punkte p, q geht also genau eine Gerade G, die
wir mit G = pq bezeichnen.
(b) Sind G, H G, G ,= H, so gibt es genau ein p P mit (p, G), (p, H) I.
Zwei verschiedene Geraden G, H schneiden sich also in genau einem Punkt
p, den wir mit p = G H bezeichnen.
(c) Es gibt ein Viereck, also vier Punkte, von denen keine drei auf einer Geraden
liegen.
Dabei ist Bedingung (c) ein Reichhaltigkeitsaxiom, das dazu dient, Trivialf alle
auszuschliessen. Wir geben gleich ein erstes Beispiel an:
Beispiel 1.3. Wir w ahlen P = {0, . . . , 6] und
G = {{0, 1, 3], {1, 2, 4], {2, 3, 5], {3, 4, 6], {4, 5, 0], {5, 6, 1], {6, 0, 2]].
Dann ist (P, G, ) eine projektive Ebene, die man wie folgt veranschaulichen kann:
IX.1 Grundlagen 173
.
.
.
.
. .
.
1
2
3
4
5 6
0
Man lasse sich dabei nicht davon irritieren, da eine der Geraden als ein Kreis
gezeichnet ist; man kann zeigen, da es unm oglich ist, alle sieben Geraden unse-
rer abstrakt gegebenen projektiven Ebene in der Anschauungsebene als Geraden
darzustellen. Dem Leser sei geraten, sich viele der folgenden

Uberlegungen mit
Zeichnungen zu veranschaulichen, auch wenn man die gewohnte geometrische In-
tuition im Endlichen nur mit einer gewissen Vorsicht verwenden sollte.
Man kann sich nun leicht uberlegen, da die Ebene aus Beispiel 1.3, die so-
genannte Fano-Ebene, das kleinstm ogliche Beispiel einer endlichen projektiven
Ebene ist. Beginnt man n amlich etwa mit dem Viereck {0, 2, 3, 4], so denieren
die drei Geradenpaare {03, 24], {04, 23] und {02, 34] nachAxiom(b) jeweils einen
weiteren Punkt, o.B.d.A. die Punkte 1, 5 und 6; je zwei dieser Punkte m ussen
dann nach Axiom (a) eine Verbindungsgerade haben; das kleinstm ogliche Beispiel
entsteht also, wenn die drei Punkte 3, 4 und 6 selbst eine Gerade bilden.
Die Fano-Ebene besitzt eine bemerkenswerte kombinatorische Regularit at: Jede
Gerade enth alt drei Punkte und jeder Punkt liegt auf drei Geraden. Wie wir bald
sehen werden, ist dies kein Zufall.
Zun achst aber noch einige Worte zu einer anderen bemerkenswerten Eigen-
schaft, dem Dualit atsprinzip. Die Axiome (a) und (b) sind im folgenden Sinn dual
zueinander: Vertauscht man die Rollen von Punkten und Geraden, so gehen sie
auseinander hervor. Das Axiom (c) ist zwar nicht direkt zu sich selbst dual, doch
folgt die dualeAussage leicht: Wenn a, b, c, d einViereck bilden, so sind ab, ac, bd
und cd offenbar vier Geraden, von denen keine drei durch denselben Punkt gehen,
bilden also ein Vierseit.
174 IX Endliche projektive Ebenen und R aume
Lemma 1.4. Zu je zwei verschiedenen Geraden Gund H in einer projektiven Ebe-
ne gibt es einen Punkt, der weder auf Gnoch auf H liegt. Zu je zwei verschiedenen
Punkten p und q in gibt es eine Gerade, die weder durch p noch durch q geht.
Beweis. Nach Axiom (c) gibt es ein Viereck a, b, c, d in . Wenn einer dieser vier
Punkte weder auf Gnoch auf H liegt, haben wir den gesuchten Punkt. Anderenfalls
gilt etwa G = ab und H = cd. Wir setzen ac = Gund bd = H. Dann gilt G ,= H,
weil keine drei der Punkte a, b, c, d auf einer Geraden liegen. Der Schnittpunkt s
von Gund H ist aus demselben Grund von a, b, c, d verschieden. Er liegt nicht auf
G, weil sonst G = Gw are, also c auf G, also a, b, c auf Gl agen, und aus analogen
Gr unden auch nicht auf H. Die zweite Aussage ist dual zu der eben bewiesenen
und folgt somit aufgrund des Dualit atsprinzips. 2

Ubung 1.5. Man f uhre den Beweis der zweiten Aussage in Lemma 1.4 explizit
durch, indem man den Beweis der ersten Aussage Schritt f ur Schritt dualisiert.
Satz 1.6. Sei = (P, G, I) eine endliche projektive Ebene. Dann gibt es eine
nat urliche Zahl n, die Ordnung von , so da folgendes gilt:
(1) Auf jeder Geraden G G liegen genau n 1 Punkte.
(2) Durch jeden Punkt p P gehen genau n 1 Geraden.
(3) [P[ = [G[ = n
2
n 1.
Beweis. Seien Gund H zwei beliebige Geraden mit G ,= H und p ihr Schnittpunkt.
Nach Lemma 1.4 gibt es einen Punkt q, der weder auf G noch auf H liegt. Nun
sei [G] die Menge der auf G und [H] die Menge der auf H liegenden Punkte.
Wir denieren : [G] [H] folgendermaen: Ist u [G], so sei (u) der
Schnittpunkt der Geraden F = uq mit H; man beachte dabei q ,= u wegen
q , [G] und F ,= H wegen q , [H]. Man veriziert leicht, da eine Bijektion
ist. Die Anzahl der auf einer Geraden G liegenden Punkte h angt also nicht von der
Wahl von G ab und werde ab jetzt mit n 1 bezeichnet.
Sei nun p ein beliebiger Punkt und G eine nicht durch p gehenden Gerade;
eine solche gibt es nach Lemma 1.4. Jeder Geraden durch p ordne man ihren
Schnittpunkt mit G zu. Man sieht leicht, da diese Abbildung bijektiv ist. Also
gehen durch p genau n 1 verschiedene Geraden.
Als n achstes zeigen wir [P[ = n
2
n 1. Sei dazu p P beliebig. Sind G
und H Geraden durch p, G ,= H, so sind die Mengen [G] {p] und [H] {p]
disjunkt. Also zerf allt P {p] in n 1 disjunkte n-Mengen: [P[ 1 = (n 1)n.
DieAussage [G[ = n
2
n1 folgt nun aus demDualit atsprinzip. Da P einViereck
enth alt, ist schlielich n 1. 2
IX.1 Grundlagen 175
Beispiel 1.7. Sei GF(q) der K orper mit q Elementen und P die Menge aller
1-dimensionalen sowie G die Menge aller zweidimensionalen Teilr aume des drei-
dimensionalen Vektorraums V = GF(q)
3
. Aufgrund der Dimensionsformel der
linearen Algebra sieht man leicht, da = (P, G, ) die Axiome (a) und (b)
einer endlichen projektiven Ebene erf ullt. Beispielsweise m ussen sich ja je zwei
verschiedene zweidimensionale Teilr aume nach dieser Formel in einem eindimen-
sionalen Teilraumschneiden. Weiterhin bilden die von den vier Vektoren (1, 0, 0)
T
,
(0, 1, 0)
T
, (0, 0, 1)
T
und (1, 1, 1, )
T
erzeugten Punkte ein Viereck in . Da es ge-
nau (q
3
1)/(q 1) = q
2
q 1 eindimensionale Teilr aume von V gibt, ist
eine projektive Ebene der Ordnung q. Diese Ebene wird mit PG(2, q) bezeichnet
und die desarguessche (oder auch die klassische) projektive Ebene der Ordnung q
genannt.

Ubung 1.8. Man gebe eine formale Denition des Begriffs der Isomorphie zweier
projektiver Ebenen und zeige explizit, da PG(2, 2) zur Fano-Ebene aus Beispiel
1.3 isomorph ist.
Wir verallgemeinern nun Beispiel 1.7 und f uhren die h oher-dimensionalen pro-
jektiven R aume ein:
Denition 1.9. Sei GF(q) der K orper mit q Elementen und PG(n, q) die durch die
Inklusion partiell geordnete Menge aller Teilr aume U des (n 1)-dimensionalen
Vektorraums V = GF(q)
n1
. Man nennt PG(n, q) die n-dimensionale projektive
Geometrie uber GF(q); f ur n 3 spricht man auch von einem projektiven Raum.
Die 1-dimensionalen Teilr aume heien wieder Punkte und die zweidimensiona-
len Teilr aume Geraden; die dreidimensionalen Teilr aume heien Ebenen und die
n-dimensionalen Teilr aume Hyperebenen.
1
Zwei nichtleere, echte Unterr aume U
und W (etwa ein Punkt und eine Gerade) werden inzident genannt, wenn U W
oder W U gilt; man schreibt daf ur U I W und verwendet wieder die ubliche
geometrische Sprechweise (wie etwa

U liegt auf W f ur U W).

Ubung 1.10. Man zeige, da jeder projektive Raum PG(n, q) mit n 3 die fol-
genden Veblen-Young-Axiome erf ullt:
(a) Je zwei verschiedene Punkte p und q liegen auf genau einer Geraden, die
wieder mit pq bezeichnet wird.
(b) Wenn p, q, r, s vier verschiedene Punkte sind, f ur die die beiden Geraden
pq und rs verschieden sind und sich schneiden, so schneiden sich auch die
Geraden pr und qs.
1
Aus offensichtlichen Gr unden nimmt man die (d 1)-dimensionalen linearen Teilr aume von V
auch d-dimensionale Unterr aume von PG(n, q).
176 IX Endliche projektive Ebenen und R aume
p
q
r
s
!
(c) Auf jeder Geraden liegen mindestens drei Punkte.
(d) Es gibt zwei Geraden, die sich nicht schneiden.
Hierbei dient das Axiom (b) zur Einf uhrung eines Ebenenbegriffs und das Axiom
(d) stellt sicher, da es windschiefe Geraden gibt, also nicht s amtliche Punkte in
einer Ebene liegen.
Die Bedeutung dieser Axiome liegt nun im folgenden klassischen Satz von
Veblen und Young [1916], den wir ohne Beweis angeben; siehe auch Lenz [1965]
oder Beutelspacher und Rosenbaum [1992].
Satz 1.11 (Erster Hauptsatz der projektiven Geometrie). Jede endliche Inzidenz-
struktur (P, G, I), die den Veblen-Young-Axiomen aus

Ubung 1.10 gen ugt, ist
isomorph zu der Geometrie, die von den Punkten und Geraden eines projektiven
Raumes PG(n, q) gebildet wird. 2
2 Existenzfragen
In diesem Abschnitt wollen wir einige Bemerkungen zum Existenzproblem f ur
endliche projektive Ebenen machen. Nach Beispiel 1.7 existiert eine Ebene der
Ordnung q jedenfalls immer dann, wenn q eine Primzahlpotenz ist. Bislang haben
alle bekannten endlichen projektiven Ebenen Primzahlpotenzordnung, auch wenn
es Myriaden von Beispielen gibt, die nicht zu einer klassischen Ebene isomorph
sind. In der Tat wird h aug die Vermutung ge auert, da dies so sein m usse. Viel
Evidenz f ur diese Primzahlpotenzvermutung gibt es nicht, lediglich einen ber uhm-
ten Nichtexistenzatz von Bruck und Ryser [1949], den wir in diesem Abschnitt
diskutieren und in Kap. X in allgemeinerer Form beweisen werden, sowie einen
Computer-Beweis f ur die Nichtexistenz einer Ebene der Ordnung 10 von Lam,
Thiel und Swiercz [1989]; siehe auch Lam[1991] f ur eine Beschreibung der h ochst
interessanten Geschichte dieses auerst aufwendigen Beweises. Wir wagen es je-
denfalls nicht, eine Prognose uber die G ultigkeit dieser Vermutung abzugeben, zu
der wir sp ater unter geeigneten Zusatzvoraussetzungen noch mehr zu sagen
haben werden.
IX.2 Existenzfragen 177
Zun achst wollenwir jedocherst einmal denBezugzwischenprojektivenEbenen
und den in Kap. III untersuchten orthogonalen lateinischen Quadraten herstellen.
Satz 2.1. Eine projektive Ebene der Ordnung n existiert genau dann, wenn
N(n) = n1 gilt (wenn es also n1 paarweise orthogonale lateinische Quadrate
der Ordnung n gibt).
Beweis. Sei zun achst = (P, G, I) eine projektive Ebene der Ordnung n. Nach
Satz III.2.8 gen ugt es, ein orthogonales (n1, n)-Array anzugeben. Hierzu w ahlen
wir eine Gerade G
0
G und setzen
K = [G
0
], G = P K und S = {1, . . . , n].
Nach Satz 1.6 gilt also:
[K[ = n 1, [G[ = n
2
und [S[ = n.
F ur jeden der n 1 Punkte p K w ahlen wir eine Bijektion
p
zwischen der
Menge der von G
0
verschiedenen durch p gehenden Geraden und der Menge S.
Sodann setzen wir
O(p, q) =
p
(pq) f ur p K, q G;
zu zeigen ist, da K G S ein orthogonales Array f ur K, G, S ist. Seien also
p, p
/
K mit p ,= p
/
sowie m, m
/
S gegeben; wir m ussen ein q G mit
O(p, q) = m und O(p
/
, q) = m
/
nden. Sei dazu H die eindeutig bestimmte
Gerade durch p mit
p
(H) = m und analog H
/
die eindeutig bestimmte Gerade
durch p
/
mit
p
/ (H
/
) = m
/
sowie q der Schnittpunkt von H und H
/
. Dann gilt in
der Tat O(p, q) = m und O(p
/
, q) = m
/
.
Umgekehrt sei jetzt N(n) = n 1. Nach Satz III.2.8 gibt es ein orthogonales
(n 1, n)-Array O, etwa f ur K, G, S mit [K[ = n 1, [G[ = n
2
, [S[ = n. Wir
d urfen KG = annehmen und bilden nun P = KG. Dann ist [P[ = n
2
n1,
wie es sich f ur die Menge der Punkte einer projektiven Ebene der Ordnung n geh ort.
Sei G
0
= K; f ur j K, h S bilden wir
G
jh
= {j] {l [ l G, O(j, l) = h].
Wir setzen G = {G
0
] {G
jh
[ j K, h S] und erhalten [G[ = n
2
n 1,
wie es sich f ur die Menge aller Geraden einer projektiven Ebene der Ordnung
n geh ort. Als Inzidenzrelation verwenden wir nat urlich die Elementbeziehung .
Nun ist nachzuweisen, da wir tats achlich eine projektive Ebene der Ordnung n
konstruiert haben. Man sieht sofort, da jeder Punkt auf genau n 1 Geraden
178 IX Endliche projektive Ebenen und R aume
liegt und jede Gerade genau n 1 Punkte hat. Die Gerade G
0
= K schneidet
jede andere Gerade G
jh
in genau einem Punkt, n amlich in j. Zwei verschiedene
Geraden G
ih
, G
jk
schneiden sich im Falle i = j, h ,= k nur in i K, im Falle
i ,= j in dem einzigen Punkt l G, f ur den O(i, l) = h und O(j, l) = k gilt.
Als n achstes konstruieren wir ein Viereck. Wir w ahlen i, j G
0
= K mit
i ,= j und zwei Geraden G
ih
und G
jk
, deren Schnittpunkt wir mit p bezeichnen;
man beachte p / K. Durch p gibt es nun noch mindestens eine weitere Gerade
und auf dieser einen Punkt q / K; von den vier Punkten i, j, p, q liegen dann
tats achlich keine drei auf einer Geraden, wie man leicht nachpr uft. Nun schlieen
wir endlich auf die Existenz und Eindeutigkeit der Verbindungsgeraden von zwei
verschiedenen Punkten. Liegt einer der Punkte auf G
0
, so ist dies schon bekannt;
handelt es sich um l, m G, so sehe man sich die n 1 Geraden durch l an. Auf
jeder dieser Geraden liegen n Punkte ,= l; das liefert eine disjunkte

Uberdeckung
von P {l], bei der also m genau einmal getroffen wird. 2
Korollar 2.2. Wenn es keine projektive Ebene der Ordnung n gibt, so gilt
N(n) < n 1. 2
Denition 2.3. Sei = (P, G, I) eine endliche projektive Ebene der Ordnung n.
Wir setzen N = n
2
n1 und denieren eine (NN)-Matrix A = (a
jk
)
j,k=1,...,N
,
indem wir P und G beliebig numerieren, etwa als
P = {p
1
, . . . , p
N
] und G = {G
1
, . . . , G
N
],
und
a
jk
=
_
1 f ur p
j
auf G
k
0 sonst
setzen. Dann heit A eine Inzidenzmatrix von .
Lemma 2.4. Sei A eine Inzidenzmatrix einer endlichen projektive Ebene der Ord-
nung n. Dann gilt
(2.1) AA
T
= nI J,
wobei J die (NN)-Matrix (N = n
2
n1) bezeichnet, deren Eintr age s amtlich
= 1 sind.
Beweis. Sei M = AA
T
. Wegen m
ij
=

N
k=1
a
ik
a
jk
z ahlt m
ij
, wie oft die Punkte
p
i
und p
j
auf einer Geraden G
k
liegen. F ur i ,= j ist dies aber genau einmal und
f ur i = j genau (n 1)-mal der Fall. 2
IX.2 Existenzfragen 179
Imn achstenAbschnitt werden wir die Eigenwerte der Matrix in (2.1) ben otigen,
die man leicht explizit angeben kann:

Ubung 2.5. Man zeige: Die Matrix nI J aus Lemma 2.4 hat den Eigenvektor
j = (1, 1, . . . , 1)
T
zum Eigenwert (n 1)
2
sowie die N 1 linear unabh angigen
Eigenvektoren
v
(1)
=
_
_
_
_
_
_
_
1
1
0
.
.
.
0
_
_
_
_
_
_
_
, v
(2)
=
_
_
_
_
_
_
_
_
_
0
1
1
0
.
.
.
0
_
_
_
_
_
_
_
_
_
, . . . , v
(N1)
=
_
_
_
_
_
_
_
0
.
.
.
0
1
1
_
_
_
_
_
_
_
zum Eigenwert n. Insbesondere sind die Matrizen M und daher auch A uber Q
invertierbar.
Wir interpretieren nun die Bedeutung der Gleichung (2.1) in der Sprache der
Linearen Algebra: AIA
T
= nI J besagt gerade, da die (N N)-Matrizen I
und nI J aquivalent sind, also bis auf die durch die Matrix A beschriebene Ba-
sistransformation dieselbe symmetrische Bilinearform darstellen. Man kann diese
Tatsache verwenden, um den folgenden Nichtexistenzsatz von Bruck und Ryser
[1949] zu beweisen:
Satz 2.6 (Satz von Bruck und Ryser). Sei n N mit n 1 (mod 4) oder n
2 (mod 4). Wenn der quadratfreie Teil von n einen Primteiler p 3 (mod 4) hat,
gibt es keine projektive Ebene der Ordnung n.
Dabei ist der quadratfreie Teil einer nat urlichen Zahl n als das Produkt der-
jenigen Primzahlen deniert, die in der Primzahlpotenzzerlegung von n zu einer
ungeraden Potenz erscheinen.
Wir werden Satz 2.6 zun achst unbewiesen lassen, da wir in XI.2 eineVerallge-
meinerung auf sogenannte symmetrische Blockpl ane zeigen wollen. Ein bekannter
Satz der Zahlentheorie besagt, da eine nat urliche Zahl n genau dann als Summe
zweier Quadrate geschrieben werden kann, wenn der quadratfreie Teil von n nur
Primteiler q 1 (mod 4) hat; einen Beweis hierf ur ndet man beispielsweise bei
Hardy und Wright [1938] oder bei Ireland und Rosen [1990]. Satz 2.6 kann daher
auch wie folgt formuliert werden:
Satz 2.7 (Satz von Bruck und Ryser). Sei n N eine nat urliche Zahl mit n
1 (mod 4) oder n 2 (mod 4). Wenn es eine projektive Ebene der Ordnung n gibt,
ist n die Summe zweier Quadrate.
180 IX Endliche projektive Ebenen und R aume

Ubung 2.8. Man zeige: Ist n 6 (mod 8), so gibt es keine projektive Ebene der
Ordnung n.
Aus Korollar 2.2 folgt insbesondere, da f ur alle in Satz 2.6 beschriebenen
Zahlen n die Ungleichung N(n) < n1 gilt. Nun besagt ein tieiegendes Ergebnis
von Bruck [1963], das sp ater von Metsch [1991] noch deutlich verst arkt werden
konnte, da N(n) = n 1 gelten mu, falls der Wert von N(n) eine Schranke
f (n), die nahe genug bei n 1 ist, uberschreitet; dabei bedeutet

nahe genug
nach Metsch grob gesprochen, da N(n) f (n) nur in der Gr oenordnung von
3

n liegt. F ur eine genaue Formulierung und den sehr aufwendigen Beweis sei der
Leser auf X.7 von Beth, Jungnickel und Lenz [1999] verwiesen. Wir wollen hier
lediglich zur Illustration einige konkrete Schranken angeben, die man auf diesem
Wege erhalten kann:
N(n) n 4 f ur n = 6, 10, 14, 21, 22;
N(n) n 5 f ur n = 30, 33, 38, 42, 46, 54, 57, 62, 66, 69, 70, 77, 78;
N(n) n 6 f ur n = 86, 93, 94, etc.
Die eben skizzierte Beweismethode liefert nach wie vor die einzigen bekannten
nichttrivialen oberen Schranken f ur die Werte N(n).
3 Polarit aten
Wir wollen nun einen Satz kennenlernen, der die innere Symmetrie projektiver
Ebenen tiefer ausleuchtet und eine interessante Anwendung hat, n amlich das so-
genannte

Freundschaftstheorem. Zur Vereinfachung der Schreibweise werden


wir (bei abstrakten projektiven Ebenen) ab jetzt Geraden meist als Punktmengen
auffassen, also o.B.d.A. I = w ahlen.
Denition 3.1. Sei = (P, G, ) eine endliche projektive Ebene. Eine bijektive
Abbildung : P G heit eine Polarit at von , wenn gilt:
(3.1) p (q) q (p) f ur alle p, q P.
Die Gerade G = (p) heit die Polare des Punktes p, der auch der Pol von G
genannt wird; p und G = (p) heien absolut, wenn p auf G liegt.
Beispiel 3.2. Sei = PG(2, q) eine klassische projektive Ebene wie in Beispiel
1.7. Geraden sind somit zweidimensionale Unterr aume des Vektorraums V =
GF(q)
3
, also bekanntlich gerade die Kerne von nichttrivialen Linearformen, die
ja die Form
x . u
T
x f ur ein u V {0]
IX.3 Polarit aten 181
haben, wobei u nat urlich nur bis auf einen Skalar ,= 0 bestimmt ist. Wir k onnen
also sowohl Punkte wie Geraden jeweils durch von Null verschiedene, nur bis
auf einen Skalar bestimmte Vektoren x bzw. u darstellen; man spricht hier von
den homogenen Koordinaten von Punkten und Geraden. Um Miverst andnisse
auszuschlieen, werden wir die homogenen Koordinaten von Geraden in eckige
Klammern setzen, also [u] statt einfach nur u schreiben. Man sieht dann sofort, da
die Abbildung x . [x] eine Polarit at von deniert. Etwas allgemeiner induziert
jede invertierbare symmetrische (3 3)-Matrix A uber GF(q) gem a
(3.2)
A
: x . [Ax] f ur x V {0]
eine Polarit at von :
xI[Ay] (Ay)
T
x = 0 (Ax)
T
y = 0 yI[Ax],
wobei wir die Symmetrie vonAverwendet haben. Die Menge aller absolutenPunkte
der Polarit at
A
aus 3.2 ist also in homogenen Koordinaten durch die quadratische
Gleichung
(3.3) x
T
Ax = 0
gegeben; die entsprechende Punktemenge in ist dann ein Kegelschnitt.
Wir wollen nun einen interessanten Satz von Baer [1946a] beweisen, demzu-
folge jede Polarit at einer Ebene der Ordnung n mindestens n 1 absolute Punkte
hat. Dazu ben otigen wir noch das folgende
Lemma 3.3. Sei = (P, G, ) eine endliche projektive Ebene der Ordnung n und
: P G eine Polarit at von . Dann enth alt jede absolute Gerade genau einen
absoluten Punkt, und jeder absolute Punkt liegt auf genau einer absoluten Geraden.
Ferner ist die Anzahl der absoluten Punkte auf einer nicht-absoluten Gerade von
stets n 1 (mod 2).
Beweis. Sei G eine absolute Gerade, also etwa G = (p) mit p G. Falls es
noch einen weiteren absoluten Punkt q ,= p auf G gibt, folgt p (q) nach (3.1);
aus der Annahme q (q) ergibt sich nun (q) = pq = G im Widerspruch zu
G = (p). Somit enth alt jede absolute Gerade genau einen absoluten Punkt; dual
folgt auch, da jeder absolute Punkt auf genau einer absoluten Geraden liegt.
Sei nun H eine nicht-absolute Gerade. Wir denieren eine Abbildung auf H
durch (p) = H (p) f ur p H; diese Denition ist sinnvoll, weil H nicht
absolut ist. Da (p) = p genau dann gilt, wenn der Punkt p absolut ist, und da
offensichtlich eine Involution ist, folgt auch die zweite Behauptung. 2
182 IX Endliche projektive Ebenen und R aume
Satz 3.4. Sei = (P, G, ) eine endliche projektive Ebene der Ordnung n und
: P G eine Polarit at von . Dann hat mindestens n 1 absolute Punkte;
falls n kein Quadrat ist, hat sogar genau n 1 absolute Punkte.
Beweis. Wir werden eine symmetrische InzidenzmatrixA = (a
ij
) f ur verwenden,
die wir mithilfe der Polarit at wie folgt konstruieren k onnen. Wir numerieren
wieder die Punkte beliebig, etwa als P = {p
1
, . . . , p
N
] mit N = n
2
n 1, und
dann die Geraden in der durch induzierten Anordnung, also G = {G
1
, . . . , G
N
]
mit G
j
= (p
j
) f ur j = 1, . . . , N. Somit gilt
a
jk
=
_
1 f ur p
j
(p
k
)
0 sonst,
weswegen A nach (3.1) in der Tat symmetrisch ist. Die Anzahl x der absoluten
Punkte von ist nun genau die Summe der Diagonaleintr age von A, also die Spur
von A, die wir daher berechnen bzw. absch atzen wollen.
Als symmetrische reelle Matrixl at sichAreell diagonalisieren; es gibt alsoeine
reelle orthogonale Matrix U mit U
T
AU = diag(
1
, . . . ,
N
), wobei
1
, . . . ,
N
die Eigenwerte von A bezeichnen. Da die ahnlichen Matrizen A und U
1
AU =
U
T
AU dieselbe Spur haben (was man entweder aus der linearen Algebra kennt
oder aber leicht direkt nachrechnet), kann x = Spur A somit auch als die Summe
der Eigenwerte von A berechnet werden.
Wir wollen nun die Ergebnisse aus

Ubung 2.5 verwenden. Da A symmetrisch
ist, wird die Gleichung (2.1) zu
(3.4) A
2
= nI J;
wie wir in 2.5 gesehen haben, hat A
2
den Eigenvektor j = (1, 1, . . . , 1)
T
zum
Eigenwert (n1)
2
sowie N1linear unabh angige EigenvektorenzumEigenwert n.
Nun diagonalisiert U auch A
2
, weswegen wir o.B.d.A.

2
1
= =
2
N1
= n,
2
N
= (n 1)
2
annehmen k onnen. Um auf
1
, . . . ,
N
zu kommen, haben wir noch Vorzeichen
beimWurzelziehen festzulegen. Zun achst sieht man sofort, da n1 ein Eigenwert
von A zum Eigenvektor j sein mu, da ja A eine Inzidenzmatrix f ur ist. Die
weiteren Eigenwerte von A sind dann s amtlich

n, wobei etwa r-mal das Plus-


und s-mal das Minuszeichen vorkommen m oge (mit r s = n
2
n), womit sich
(3.5) x = Spur A = n 1 (r s)

n
ergibt. Ist n nicht das Quadrat einer ganzen Zahl, so ist (3.5) nur f ur r = s m oglich,
da ja x eine ganze Zahl ist; damit folgt sofort x = n 1, und wir sind fertig.
IX.4 Das Freundschaftstheorem 183
Ab jetzt sei also n ein Quadrat, etwa n = m
2
. Dann ergibt sich aus (3.5), da
x 1 (mod m) ist, womit mindestens einen absoluten Punkt p besitzt. Wir
verwenden nun, da die Anzahl der absoluten Punkte auf einer nicht-absoluten
Geraden von nach Lemma 3.3 stets n 1 (mod 2) ist. Falls n ungerade
ist, besitzt also jede der n nicht-absoluten Geraden G durch p wenigstens einen
weiteren absoluten Punkt, womit bereits x n1 folgt. Falls schlielich n gerade
ist, z ahlen wir die Anzahl t aller Paare (q, G), f ur die q ein absoluter Punkt auf
einer beliebigen Geraden Gist, und erhalten t = x(n1). Nach Lemma 3.3 enth alt
jetzt jede Gerade mindestens einen absoluten Punkt. Also gilt t n
2
n 1 und
somit wiederum x n 1, da ja x eine ganze Zahl ist. 2
4 Das Freundschaftstheorem
In diesem Abschnitt wollen wir eine verbl uffende Anwendung von Satz 3.4 ken-
nenlernen. Bekanntlich ist Freundschaft eine bin are, nicht-reexive, symmetrische,
aber nicht notwendig transitive Relation.
2
Wir erfassen das Ph anomen formal mit
der folgenden
Denition 4.1. Sei P eine endliche nichtleere Menge und R P P eine bin are
Relation mit folgenden Eigenschaften:
(a) (p, q) R = p ,= q;
(b) (p, q) R = (q, p) R.
Dann nennen wir (P, R) ein Freundschaftssystem. Wir schreiben im Folgenden
p q statt (p, q) R und (P, ) statt (P, R). Man sagt, das Freundschaftssystem
(P, ) erf ulle die Bedingung vom gemeinsamen Freund (kurz: BGF), wenn es zu
jedem (p, q) P P mit p ,= q genau ein r P mit p r und q r gibt; man
nennt r den gemeinsamen Freund von p und q.
Ein Freundschaftssystem (P, ), das die BGF erf ullt, liefert also verm oge
F(p, q) = r p r, q r (p, q P, p ,= q)
eine Abbildung F : {(p, q) [ p, q P, p ,= q] P mit der Eigenschaft
F(p, q) = F(q, p) f ur alle p, q P mit p ,= q.
2
Man kann sich zwar auch selbst m ogen, aber von Freundschaft spricht man dann sicherlich nicht.
Etwas problematischer ist die Symmetrieforderung, einseitige Zuneigung kommt im Leben ja durchaus
vor. Wir nehmen es also mit in die Denition des Begriffs Freundschaft, da sie auf Gegenseitigkeit zu
beruhen habe.
184 IX Endliche projektive Ebenen und R aume
Wir wollen die Elemente von P zur Veranschaulichung auch als Punkte in der
Ebene zeichnen und zwei verschiedene Punkte p und q genau dann durch einen
Strich verbinden, wenn p q gilt. Aus der BGF folgt f ur die entstehende Figur das
Vierecksverbot: Sind p, q, r, s P paarweise verschieden, so kommt p q r
s p nicht vor. Weiterhin zieht die BGF beispielsweise F(F(p, q), F(p, r)) = p
f ur alle p, q, r P mit p ,= q, r und F(p, q) ,= F(p, r) nach sich. Diese beiden
Sachverhalte lassen sich wie folgt veranschaulichen:
p
r
q
p
s
r
q
F ( p , r )
F ( p , q )
verboten!
Beispiel 4.2. Wir erkl aren ein Freundschaftssystem auf einer Menge P ungerader
M achtigkeit, etwa P = {p
0
, p
1
, . . . , p
2n
]. Dabei sei p q f ur p, q P mit
p ,= q genau dann, wenn
p
0
{p, q] oder {p, q] = {p
2k1
, p
2k
] f ur ein k {1, . . . , n]
gilt. Offenbar erf ullt (P, ) die BGF. Wir nennen jedes derartige Freundschaftssy-
stem eine Sterngur mit Zentrum p
0
, da man es wie folgt veranschaulichen kann:
p
2n5
p
2n4
p
2n3
p
2n2
p
2n1
p
2n
p
1
p
2
p
0
Zwei Dinge sind nun erstaunlich, n amlich das folgende Resultat von Erd os,
Renyi und Szs [1966] an sich sowie auch die Tatsache, da man es auf Satz 3.4
zur uckf uhren kann; einen anderen Beweis haben Longyear und Pearsons [1972]
gegeben.
Satz 4.3 (Freundschaftstheorem). Erf ullt ein Freundschaftssystem (P, ) mit
[P[ > 1 die Bedingung vom gemeinsamen Freund, so ist es eine Sterngur.
IX.4 Das Freundschaftstheorem 185
Beweis. Wir konstruieren unter der Annahme, unser Satz sei falsch, eine Menge
G 2
P
derart, da = (P, G, ) eine endliche projektive Ebene wird. Dazu
ordnen wir jedem p P die Menge
(p) := {q [ q P, p q]
aller

Freunde von p zu und setzen G = {(p) [ p P]. Wenn es uns gelingt zu


beweisen, da in der Tat eine projektive Ebene und : P G eine Polarit at
ist, so brauchen wir nur noch Satz 3.4 anzuwenden, um ein p mit p (p), also
p p zu erhalten, im Widerspruch zu Bedingung (b) in Denition 4.1, womit wir
dann fertig sind.
Die ersten beidenAxiome f ur eine projektive Ebene sind nun leicht nachzuwei-
sen.
(a) Sind p, q P, p ,= q, so bestimme man r = F(p, q); nat urlich gilt
dann p, q (r). Dies ist die einzige Verbindungsgerade von p und q: Ist
n amlich G G, p, q G, etwa G = (s), so gilt s p und s q, also
s = F(p, q) = r.
(b) Sind G, H G, G ,= H, so sei etwa G = (q), H = (r). Setzt man
p = F(q, r), so gilt p q und p r, also p G H. Jeder Punkt aus
GH ist aber ein gemeinsamer Freund von q und r, also nach BGF eindeutig
bestimmt.
Jetzt geht es nur noch um das Reichhaltigkeitsaxiom (c), also die Existenz eines
Vierecks in. Der Beweis dieserAussage ist ziemlichlangwierigundmacht vonder
bisher noch nicht verwendeten Annahme Gebrauch, unser Satz sei falsch. Genauer
gesagt verwenden wir die folgende Annahme:
() Es gibt kein Zentrum, f ur jedes p P ist also (p) ,= P {p].
Sowie man n amlich ein Zentrum p
0
hat, ist der Beweis der restlichen Aussagen
unseres Satzes ein Kinderspiel: Durch f (p) := F(p, p
0
) ist dann eine Abbildung
f : P {p
0
] P {p
0
] deniert, die xpunktfrei ist (weil niemand sein eigener
Freund ist) und f f = id erf ullt, womit man die zu einer Sterngur geh orige Zer-
legung von P {p
0
] in zweielementige Teilmengen hat. Wir verwenden also (), um
in einigen Schritten vier Punkte in zu konstruieren, von denen keine drei auf einer
Geraden liegen; dabei bedienen wir uns der oben eingef uhrten Veranschaulichung.
(1) Jeder Freundschafts-Strich kommt in genau einem Dreieck vor, wie direkt
aus BGF folgt.
(2) F ur jedes p P ist [(p)[ eine gerade Zahl v(p), und p kommt in genau
v(p)/2 Dreiecken vor. Man sieht dies, indem man ahnlich wie oben gem a
f (q) := F(p, q) eine Abbildung f : (p) (p) mit f f = id kon-
struiert.
186 IX Endliche projektive Ebenen und R aume
(3) Es ist [P[ 4. Dazu w ahle man p P beliebig. Dann ist p , (p), aber
(p) enth alt, weil es in P noch einen zweiten Punkt q gibt, mindestens den
einen Punkt F(p, q), also nach (2) mindestens zwei Punkte, die nat urlich
von p verschieden sind. Nach () ist {p] (p) ,= P, also gibt es in P noch
mindestens einen vierten Punkt.
(4) Enth alt jedes G G genau zwei Punkte, sind wir nach (3) trivialerweise
fertig. Wir d urfen also ab jetzt davon ausgehen, da es mindestens ein G =
(p) G mit [G[ 3 gibt; wegen (2) gilt dann sogar [G[ 4.
(5) Wir w ahlen zun achst eine Gerade G = (p), die mindestens drei Punkte
enth alt. Wegen () gibt es einen Punkt q, der nicht auf G liegt. Dann enth alt
G die voneinander verschiedenen Punkte r = F(p, q) und s = F(p, r).
Nach Wahl von G liegt aber auf G noch mindestens ein weiterer Punkt, den
wir t nennen. Damit erhalten wir die untenstehende Figur. Es gilt also t
p r q. Keine drei von diesen vier Punkten haben einen gemeinsamen
Freund auerhalb {t, p, r, q] (wegen des Vierecksverbotes f ur (P, )). Es
haben aber auch keine drei von ihnen den vierten zum gemeinsamen Freund:
r , t und p , q, weil s der gemeinsame Freund von p und r ist.
Somit haben wir in der Tat vier Punkte in gefunden, von denen keine drei auf
einer Geraden liegen. Es bleibt nur noch zu bemerken, da wegen (2) dieAbbildung
bijektiv, also wirklich eine Polarit at ist. 2
p
q
t s r
G (p) =
.
5 Kollineationen und der Satz von Singer
In diesemAbschnitt betrachten wir Automorphismen endlicher projektiver Geome-
trien (die meist als

Kollineationen bezeichnet werden) und beweisen die Existenz


besonder

sch oner Symmetriegruppen.


IX.5 Kollineationen und der Satz von Singer 187
Denition 5.1. Sei eine endliche projektive Geometrie auf der Punktemenge
P mit Geradenmenge G, also entweder eine projektive Ebene (P, G, I) oder ein
projektiver Raum wie in Denition 1.9. Eine bijektive Abbildung : P P heit
eine Kollineation von , wenn
(5.1) (G) := {(p) [ p G] G f ur alle G G
gilt, wenn also Geraden auf Geraden abbildet und somit wegen der Endlichkeit
von die Geradenmenge permutiert.

Ubung 5.2. Man zeige, da eine unter der Multiplikation mit Skalaren abgeschlos-
sene Teilmenge W eines (n1)-dimensionalen Vektorraums V uber GF(q) genau
dann ein Unterraum von V ist, wenn U mit zwei verschiedenen Punkten U
1
und
U
2
von PG(n, q) (also mit zwei 1-dimensionalen Teilr aumen von V) stets auch
ihre Verbindungsgerade (also U
1
U
2
) enth alt, und folgere daraus, da jede Kol-
lineation eines projektiven Raumes k-dimensionale Teilr aume auf k-dimensionale
Teilr aume abbildet.
Beispiel 5.3. Sei = PG(n, q), n 2. Dann induziert jede bijektive lineare
Abbildung desVektorraums GF(q)
n1
inoffensichtlicher Weise eine Kollineation
von , die der Einfachheit halber schlampigerweise wieder mit bezeichnet sei.
Nach

Ubung 5.2 bildet auch k-dimensionale Teilr aume von auf k-dimensionale
Teilr aume ab, insbesondere also Hyperebenen auf Hyperebenen.
In homogenen Koordinaten sieht das wie folgt aus. Zun achst identizieren
wir, in leichter Verallgemeinerung des in Beispiel 3.2 eingef uhrten Sachverhalts
f ur PG(2, q), sowohl die Punkte wie die Hyperebenen mit lediglich bis auf einen
Skalar bestimmten Vektoren x ,= 0 bzw. [u] ,= [0]; das ist sinnvoll, da jetzt der
Kern einer nichttrivialen Linearform x . u
T
x gerade eine Hyperebene ist. Wir
geben nun eine invertierbare ((n 1) (n 1))-Matrix A uber GF(q) vor; dann
induziert : x . Ax also eine Kollineation, die auf den Hyperebenen gem a
: [u] . [(A
1
)
T
u] operiert:
x I [u] u
T
x = 0 ((A
1
)
T
u)
T
Ax = 0 Ax I [(A
1
)
T
u].
Die bijektiven linearen Abbildungen von V, die bekanntlich die lineare Gruppe
GL(n 1, q) bilden, induzieren also eine Kollineationsgruppe von PG(n, q), die
die projektive lineare Gruppe heit und mit PGL(n, q) bezeichnet wird. (Man
beachte den

Ubergang von n 1 zu n in der projektiven Terminologie!)

Ubung 5.4. Man zeige, da eine bijektive lineare Abbildung des Vektor-
raums GF(q)
n1
genau dann die Identit at auf PG(n, q) induziert, wenn die
Form x . x f ur einen Skalar ,= 0 hat. Mit der Bezeichnung H(n 1, q) =
188 IX Endliche projektive Ebenen und R aume
{ id [ GF(q)

] ist also PGL(n, q) zur Faktorgruppe GL(n1, q)/H(n1, q)


isomorph.
Bemerkung 5.5. Man kann Beispiel 5.3 etwas verallgemeinern, indem man bi-
jektive semilineare Abbildungen von V = GF(q)
n1
verwendet; eine solche
Abbildung ist durch die beiden Forderungen
(a) (x y) = (x) (y) f ur alle x, y V
(b) (x) = ()(x) f ur alle x V, GF(q)
deniert, wobei ein (von abh angiger) Automorphismus von GF(q) zu sein hat,
vergleiche Satz III.3.8. Man sieht sofort, da jede bijektive semilineare Abbildung
von V eine Kollineation von = PG(n, q) induziert. Die Bedeutung dieses Be-
griffes liegt nun darin, da diese Konstruktion bereits alle Kollineationen von
liefert (Zweiter Hauptsatz der Projektiven Geometrie); einen Beweis hierf ur ndet
man beispielsweise bei Artin [1957] oder Lenz [1965].
Sei G eine Permutationsgruppe, die transitiv auf einer Menge X operiert; zu
beliebigen x, y X gibt es also ein G mit (x) = y. Falls G abelsch ist,
kann dann keine von der Identit at verschiedene Permutation in G einen Fixpunkt
auf X haben, wie man leicht nachpr uft. Daher kann insbesondere kein G eine
gr oere Ordnung als [X[ haben, da sonst ja (f ur gegebenes x X)
j
(x) =
k
(x)
f ur zwei verschiedene Potenzen von gelten m usste, womit dann die Permutation

jk
,= id den Fixpunkt x h atte. Falls also die Ordnung [X[ hat, mu G die
von erzeugte zyklische Gruppe sein und regul ar (auch: scharf transitiv) auf X
operieren: Zu beliebigen x, y X gibt es genau ein G(also genau eine Potenz
von ) mit (x) = y.
Der folgende fundamentale Satz von Singer [1938] besagt nun, da =
PG(n, q) stets eine derartige Kollineationsgruppe G zul at; jede solche Gruppe
heit dann eine Singergruppe von . Zun achst jedoch noch ein konkretes Beispiel:
Beispiel 5.6. Wir betrachten nochmals die Repr asentation der projektiven Ebene
= PG(2, 2) der Ordnung 2, die wir in Beispiel 1.3 angegeben haben. Offenbar
induiziert die Abbildung x . x 1 (mod 7) eine Kollineation der Ordnung 7
von , womit die von erzeugte zyklische Gruppe Geine Singergruppe f ur ist.
Satz 5.7 (Satz von Singer). Sei q eine Primzahlpotenz und n N. Dann enth alt
PGL(n 1, q) eine zyklische Untergruppe der Ordnung
q
n1
1
q1
, die sowohl auf
den Punkten als auch auf den Hyperebenen von PG(n, q) regul ar operiert.
Beweis. Nach Beispiel 5.3 induziert jedes GL(n 1, q) eine Kollineation
von = PG(n, q). Wir identizieren nun den Vektorraum GF(q)
n1
mit dem
IX.6 B ogen und MDS-Codes 189
Erweiterungsk orper L = GF(q
n1
) des K orpers K = GF(q), vergleiche Satz
III.3.7; L wird also als (n 1)-dimensionaler Vektorraum uber K betrachtet. Die
Multiplikation x von Vektoren in L mit Skalaren aus K ist also einfach durch die
Einschr ankung der Multiplikation in Lauf Werte K gegeben. Nach Satz III.3.5
ist die multiplikative Gruppe L

zyklisch von der Ordnung q


n1
1. Jedes Element
a L

induziert nun eine bijektive lineare Abbildung


a
des K-Vektorraums L
gem a

a
(x) = ax f ur alle x L
und daher nach Beispiel 5.3 auch eine Kollineation
a
von ; dabei gilt
a
= id
nach

Ubung 5.4 genau f ur a K

. Somit induziert die zyklische Untergruppe


G = {
a
[ a L

] von GL(n 1, q) eine zyklische Permutationsgruppe der


Ordnung v = (q
n1
1)/(q1) auf den Punkten von , n amlich die Faktorgruppe
G/H(n 1, q). Da v gerade die Anzahl aller 1-dimensionalen Unterr aume von
L (also die M achtigkeit der Punktemenge P von ) ist, folgt der erste Teil der
Behauptung. Der zweite Teil ergibt sich ganz analog unter Verwendung homogener
Koordinaten f ur die Hyperebenen. 2
Abschlieend noch eine Bemerkung zu den Beispielen 1.3 und 5.6: Hier sind
die Punkte als die Elemente der zyklischen Gruppe Z
v
der Ordnung v gegeben,
wobei v wieder die Anzahl der Punkte von bezeichnet. Hat man eine zyklische
Singergruppe G vorliegen, so kann man offenbar stets eine derartige Numerierung
der Punktemenge vornehmen, indem man ausgehend von einem

Basispunkt p
die Bilder von p unter den Potenzen eines Erzeugers von G durchl auft. Analog
kann man auch die Geraden (bzw. im allgemeinen Fall die Hyperebenen) als die
Bilder einer

Basisgeraden D erhalten, die man dann durch Identikation ihrer


Punkte mit den zugeh origen Elementen in Z
v
als eine Teilmenge von Z
v
auffassen
kann; allgemeine Geraden bzw. Hyperebenen nehmen dann die Form
D x = {d x [ x Z
v
]
an, wobei x uber Z
v
l auft. Aufgrund des Satzes von Singer erlaubt nun jede endliche
projektive Geometrie PG(n, q) eine derartige Darstellung. Man nennt die Menge
D Z
v
eine

Differenzmenge, da die Differenzen, die man aus den Elementen


in D bilden kann, gleichm aig uber Z
v
verteilt sind. Wir werden uns mit diesem
Ansatz in Kapitel XI in allgemeinerer Form n aher besch aftigen.
6 B ogen und MDS-Codes
Wie (hoffentlich) aus der Schule bekannt ist, schneidet in der euklidischen Ebene
eine Gerade einen Kegelschnitt in h ochstens zwei Punkten. Wir wollen jetzt die
entsprechende Bedingung in endlichen projektiven Ebenen untersuchen:
190 IX Endliche projektive Ebenen und R aume
Denition 6.1. Sei = (P, G, ) eine endliche projektive Ebene. Eine Teilmenge
B P wird ein Bogen genannt, wenn [B G[ 2 f ur jede Gerade G gilt; f ur
[B[ = k spricht man auch von einem k-Bogen. Ein k-Bogen B heit vollst andig,
wenn er in keinem(k1)-Bogen enthalten ist. Man nennt eine Gerade eine Sekante,
Tangente oder Passante von B, je nachdem, ob sie B in zwei Punkten, in einem
Punkt oder uberhaupt nicht schneidet.
Nach Denition enth alt jede projektive Ebene Vierecke, also 4-B ogen. F ur die
Fano-Ebene aus Beispiel 1.3 gibt es offenbar keine gr oeren B ogen. Imallgemeinen
m ussen jedoch gr oere B ogen existieren, was wir sogleich mit einemsehr einfachen
Z ahlargument beweisen werden.
Satz 6.2. Sei B ein vollst andiger k-Bogen in einer endlichen projektiven Ebene der
Ordnung n. Dann gilt k >

2n.
Beweis. W urde es einen Punkt geben, der auf keiner Sekanten von B liegt, so k onnte
man ihn offenbar zu B hinzuf ugen und auf diese Weise einen gr oeren Bogen
erhalten. Da B vollst andig ist, m ussen also die
_
k
2
_
Sekanten von B die n
2
n1k
Punkte der Ebene auerhalb von B uberdecken. Da jede Sekante n1 solche Punkte
abdeckt, erhalten wir die triviale Absch atzung k(k 1)(n1) 2(n
2
n1k),
woraus die Behauptung leicht folgt. 2
Bevor wir konkrete Beispiele konstruieren, wollen wir zun achst auch eine obere
Schranke beweisen; danach uberlegenwir uns, was manimFall der Gleichheit sagen
kann. Diese Ergebnisse stammen von Bose [1947] bzw. von Qvist [1952].
Satz 6.3. Sei B ein Bogen in einer endlichen projektiven Ebene der Ordnung n.
Dann gilt:
(6.1) [B[
_
n 2 f ur n gerade
n 1 f ur n ungerade.
Beweis. Sei p ein beliebiger Punkt von B. Da jede Gerade durch p h ochstens einen
weiteren Punkt q B enthalten kann und jeder solche Punkt q mit p verbunden
sein mu, folgt unmittelbar [B[ n2. Falls hierbei Gleichheit gilt, ist jede Gerade
durch p eine Sekante; es kann dann also keine Tangenten geben. Wir betrachten
nun die Geraden, die einen beliebigen Punkt r / B mit den n 2 Punkten von B
verbinden. Wie wir gesehen haben, sind diese Geraden s amtlich Sekanten, was
offenbar nur danngeht, wennn2gerade ist. F ur ungerade nfolgt somit [B[ n1.
2
IX.6 B ogen und MDS-Codes 191
Denition 6.4. Ein (n 1)-Bogen in einer endlichen projektiven Ebene der Ord-
nung n heit ein Oval und ein (n 2)-Bogen ein Hyperoval.
Satz 6.5. Sei B ein Oval in einer endlichen projektiven Ebene der Ordnung n, wo-
bei n gerade sei. Dann gehen s amtliche Tangenten von B durch einen gemeinsamen
Punkt, den Nukleus von B, und man kann B zu einem Hyperoval H erweitern, in-
dem man den Nukleus zu B hinzuf ugt. Weiterhin ist H das einzige B umfassende
Hyperoval.
Beweis. Jeder Punkt von B liegt offenbar auf genau einer Tangenten und nSekanten,
n amlich den Verbindungsgeraden zu den ubrigen n Punkten von B; es gibt also
insgesamt genau n 1 Tangenten. Wir betrachten nun die Geraden, die einen
beliebigen Punkt r / B mit den n1 Punkten von B verbinden; da n1 ungerade
ist, mu hierbei mindestens eine Tangente auftreten.
Sei nun G eine Sekante von B. Da wie wir eben gesehen haben jeder
der n 1 Punkte von G auf mindestens einer Tangenten liegt und es nur n 1
Tangenten gibt, mu jeder Punkt von G auf genau einer Tangenten liegen. Mit
anderen Worten: Keine zwei Tangenten k onnen sich in einem Punkt schneiden, der
auf einer Sekanten liegt. Daraus folgt sofort, da alle n 1 Tangenten durch einen
gemeinsamen Schnittpunkt p gehen m ussen; dann ist H = B {p] immer noch
ein Bogen, also ein Hyperoval. Offensichtlich kann B auf keine andere Weise zu
einem Hyperoval erweitert werden, da jeder Punkt q ,= p auerhalb von B auf
Sekanten von B liegt. 2

Ubung 6.6. Man verbessere die Absch atzung aus Satz 6.2 zu
_
k1
2
_
n, indem
man die n Punkte auerhalb von B auf einer Tangenten von B betrachtet.

Ubung 6.7 (Qvist). Sei B ein Oval in einer endlichen projektiven Ebene der Ord-
nung n, wobei n ungerade sei. Man zeige, da ein Punkt r / B entweder auf genau
zwei oder aber auf gar keiner Tangenten von B liegt.
Die Frage, ob eine beliebige projektive Ebene Ovale enthalten mu, ist unge-
kl art und schwierig. Leider fehlt auch ein aktueller

Ubersichtsartikel uber die Kon-
struktion von B ogen und Ovalen in beliebigen Ebenen; einiges zu diesem Thema
ndet man beispielsweise bei Korchmros [1991] sowie bei de Resmini, Ghinelli
und Jungnickel [2002]. F ur die klassischen Ebenen kann man jedenfalls sehr leicht
konkrete Beispiele angeben:
Beispiel 6.8. Es sei B die Menge aller Punkte in = PG(2, q) mit homogenen
Koordinaten der Form (1, t, t
2
)
T
oder (0, 0, 1)
T
, also
(6.2) B = {(1, t, t
2
)
T
K [ t K] {(0, 0, 1)
T
K],
192 IX Endliche projektive Ebenen und R aume
wobei wir K = GF(q) schreiben. Wir behaupten, da B ein Oval ist. Dazu gen ugt
es nachzupr ufen, da je drei der in (6.2) angegebenen Koordinatenvektoren linear
unabh angig sind. Aus der linearen Algebra wissen wir, da je drei verschiedene
Vektoren des Typs (1, t, t
2
) linear unabh angig sind, da die Determinante einer
Matrix der Form
_
_
1 t t
2
1 u u
2
1 v v
2
_
_
mit paarweise verschiedenen t, u, v nicht 0 sein kann. Es handelt sich hier n amlich
um eine sogenannte Vandermonde-Matrix, f ur die dies bekanntlich gilt (was man
auch leicht direkt nachrechnen kann); siehe etwa Koecher [1992, pp.126127].
Schlielich sind (0,0,1) und zwei verschiedeneVektoren der Form(1, t, t
2
) offenbar
ebenfalls linear unabh angig.
Falls q gerade ist, kann man auch den Nukleus von B leicht explizit angeben,
n amlich als p = (0, 1, 0)
T
K. Da die Erweiterung von B zu einem Hyperoval
nach Satz 6.5 eindeutig bestimmt ist, gen ugt es zu zeigen, da der Vektor (0,1,0)
nicht von zwei der bisherigen Vektoren linear abh angig sein kann. Einerseits sind
nun (0,1,0), (0,0,1) und ein Vektor der Form (1, t, t
2
) stets linear unabh angig; und
andererseits sind f ur gerades q auch (0,1,0) und je zwei verschiedene Vektoren der
Form (1, t, t
2
) linear unabh angig, da das Quadrieren dann eine Bijektion ist. Man
beachte, da f ur ungerade q dieVektoren (0,1,0), (0, t, t
2
) und (0, t, (t )
2
) linear
abh angig sind, womit B dann wie es nach Satz 6.3 ja der Fall sein mu nicht
um den Punkt (0, 1, 0)
T
K erweitert werden kann.
Wir merken an, da die homogenen Koordinaten der Punkte von B die qua-
dratische Gleichung x
2
1
= x
0
x
2
erf ullen, womit B also ein Kegelschnitt ist. Ein
ber uhmtes Resultat von Segre [1955] besagt, da jedes Oval in PG(2, q), q ungera-
de, ein Kegelschnitt sein mu; einen Beweis ndet man etwa bei Hirschfeld [1998,
8.2]. F ur gerade q werden Hyperovale, die aus einem Kegelschnitt durch Hin-
zuf ugen seines Nukleus hervorgehen, regul ar genannt; es gibt aber daneben auch
andere Beispiele. Die Klassikation der Hyperovale ist eines der wesentlichen un-
gel osten Probleme der Galois-Geometrie; der interessierte Leser sei auf Hirschfeld
[1998] oder den

Ubersichtsartikel von Cherowitzo [1996] verwiesen.
In den Beispielen 6.8 and 3.2 tauchen jeweils Kegelschnittgleichungen auf. Das
legt die Vermutung nahe, Ovale und Polarit aten k onnten etwas miteinander zu tun
haben. Wie die folgende

Ubung zeigt, ist dies tats achlich der Fall; einen Beweis
ndet man beispielsweise bei Hughes und Piper [1982].

Ubung 6.9. Es sei eine Polarit at einer endlichen projektiven Ebene der Ordnung
n, die genau n 1 absolute Punkte hat (vgl. Satz 3.4); derartige Polarit aten heien
IX.6 B ogen und MDS-Codes 193
orthogonal. Man zeige: Falls n ungerade ist, bilden die absoluten Punkte von
ein Oval, und anderenfalls eine Gerade.
Bemerkung 6.10. Die bisher erzielten Ergebnisse verdeutlichen, da die geome-
trischen Eigenschaften von PG(2, q) entscheidend davon abh angen, ob q gerade
oder ungerade ist:
F ur gerade q sind Ovale nicht die gr otm oglichen B ogen, sondern stets zu
Hyperovalen erweiterbar.
F ur gerade q bilden die absoluten Punkte einer orthogonalen Polarit at kein
Oval, sondern eine Gerade.
Da Ovale und Polarit aten aber beide wie erw ahnt mit Kegelschnitten zusam-
menh angen, mag der Leser an dieser Stelle etwas verwirrt sein. Die Diskrepanz ist
aber nur scheinbar: Der in Beispiel 6.8 eingef uhrte Kegelschnitt B besteht n amlich
genau dann aus den absoluten Punkten einer orthogonalen Polarit at, wenn q unge-
rade ist. In diesem Fall kann man die Gleichung x
2
1
= x
0
x
2
in der Tat in der Form
x
T
Ax = 0 schreiben, wobei A die invertierbare symmetrische Matrix
A =
_
_
0 0
1
2
0 1 0
1
2
0 0
_
_
ist; f ur gerade q geht das dagegen nicht, da dann ja 2 kein Inverses hat. Wir erw ahnen
noch, da es in PG(2, q) im wesentlichen nur einen Kegelschnitt gibt: Je zwei Ke-
gelschnitte k onnen durch ein Element der projektiven linearen Gruppe PGL(2, q)
ineinander transformiert werden. Einen Beweis hierf ur ndet man beispielsweise
bei Lenz [1965] oder bei Hughes und Piper [1982].
Wir wollen jetzt den Begriff des Bogens in einer projektiven Ebene auf projekti-
ve R aume verallgemeinern; dies ist insbesondere wegen einer recht uberraschenden
Verbindung zur Codierungstheorie von groem Interesse. Um die dort ublichen Pa-
rameter zu erhalten, werden wir jetzt n und k in einem anderen Sinne als bisher
verwenden.
Denition 6.11. Ein n-Bogen in einer projektiven Geometrie PG(k, q) ist eine
Menge B von n Punkten, von denen keine k 1 in einer Hyperebene liegen. Man
sagt dann auch, da die Punkte von B in allgemeiner Lage sind.
Beispiel 6.12. Es sei B die Menge aller Punkte in = PG(k, q) mit homogenen
Koordinaten der Form (1, t, t
2
, . . . , t
k
)
T
bzw. (0, 0, , . . . , 0, 1)
T
. Man sieht dann
ganz analog zum Vorgehen in Beispiel 6.8, da B ein (q 1)-Bogen ist. B heit
eine rationale Normkurve; mehr zu diesem Thema ndet man bei Hirschfeld und
Thas [1991, 27.5].
194 IX Endliche projektive Ebenen und R aume

Ubung 6.13. Man f uhre den Nachweis daf ur, da die Menge B aus Beispiel 6.12
ein Bogen ist, in Einzelheiten durch. Ferner zeige man, da je k 2 Punkte von
PG(k, q) (q k 1) in allgemeiner Lage auf einem (q 1)-Bogen B liegen.
Hinweis: Man kann einen solchen Bogen als Bild der rationalen Normkurve B aus
Beispiel 6.12 unter einer geeigneten Kollineation erhalten.
Wir k onnen nun den Zusammenhang zwischen B ogen und linearen MDS-Codes
erkl aren, der implizit inderArbeit vonBose [1961] enthaltenist (woallgemeiner der
Zusammenhang zwischen linearen Codes und projektiven Geometrien untersucht
wird), aber explizit wohl erstmals im Buch von MacWilliams und Sloane [1977]
formuliert wurde.
Satz 6.14. Die Existenz eines linearen [n, k, nk 1, q]-MDS-Codes ist aquiva-
lent zur Existenz eines n-Bogens in PG(k 1, q).
Beweis. Sei zun achst ein n-Bogen B = {p
1
, . . . , p
n
] in PG(k 1, q) gegeben;
ferner sei v
i
ein Koordinatenvektor f ur den Punkt p
i
(f ur i = 1, . . . , n). Sei nun H
die (k n)-Matrix mit Spalten v
1
, . . . , v
n
. Da keine k der n Punkte von B in einer
Hyperebene liegen, sind je k Spalten von H linear unabh angig. Nach Satz VIII.4.4
ist H die Kontrollmatrix eines linearen [n, nk, d, q]-Codes C mit d k 1, und
wegen der Singleton-Schranke (III.4.2) mu dabei sogar d = k1 gelten. C ist also
ein MDS-Code der Dimension nk; nach Satz III.4.8 ist C

dann der gew unschte


MDS-Code. Diese Konstruktion l at sich umkehren, womit die Behauptung folgt.
2
Zusammen mit Beispiel 6.12 liefert Satz 6.14 die Existenz zahlreicher MDS-
Codes und verst arkt dabei sogar das Ergebnis aus Satz VIII.6.9 etwas:
Korollar 6.15. F ur jede Primzahlpotenz q und jede nat urliche Zahl k mit
2 k q 1 gibt es einen linearen [q 1, k, q 2 k, q]-MDS-Code. 2
Wir wollen abschlieend noch einige Bemerkungen zum Existenzproblem f ur
MDS-Codes machen, das als eines der fundamentalen offenen Probleme der Codie-
rungstheorie gilt. Mit m(k, q) sei f ur gegebenes k und q der Maximalwert von n
bezeichnet, f ur den ein [n, k, n k 1, q]-MDS-Code existiert; nach Satz 6.14 ist
m(k, q) auch die maximale M achtigkeit eines Bogens in PG(k 1, q). Die Werte
m(3, q) sind somit nach Satz 6.3 und Beispiel 6.8 vollst andig bekannt. F ur k ,= 3
liefert die Griesmer-Schranke III.4.9 zusammen mit Korollar 6.15 die folgende
nichttriviale, wenn auch im allgemeinen nicht sonderlich gute Absch atzung:
IX.7 Unterebenen und Blockademengen 195
Proposition 6.16. F ur 2 k q 1 gilt:
(6.3) q 1 m(k, q) q k 1.
Beweis. Sei C ein [n, k, n k 1, q]-Code. Aus (III.4.3) erh alt man
n N(k, d, q) (n k 1)
_
n k 1
q
_
(k 2).
F ur n k 1 > q ergibt sich hieraus aber der Widerspruch n n 1, weswegen
n k 1 q gelten mu. 2
Korollar 6.17. F ur q 3 gilt m(2, q) = q 1. 2

Ubung 6.18. Man zeige, da ein [n, k, n k 1, q]-MDS-Code mit k n 2


nur f ur q k 1 existieren kann.
Es wird vermutet, da stets
m(k, q) =
_
q 1 f ur 2 k < q
k 1 f ur q k
gilt, mit Ausnahme von m(3, 2
h
) = m(2
h
1, 2
h
) = 2
h
2 (

main conjecture).
Wir haben gesehen, da diese Vermutung f ur k = 2 und 3 stimmt. Sie ist auch
f ur k = 4 und 5 sowie f ur q 11 korrekt. Sie ist ferner f ur alle Paare (k, q) mit
q > (4k 9)
2
erf ullt; entsprechende Literaturhinweise stehen bei MacWilliams
und Sloane [1977]. Zahlreiche Ergebnisse ndet man in der Sprache der B ogen
in projektiven R aumen bei Hirschfeld und Thas [1992, Chapter 27]. Wesentliche
Fortschritte wurden von Bruen, Thas und Blokhuis [1988] erzielt, wo erstmals
die Methoden der algebraischen Geometrie uber endlichen K orpern ausgenutzt
wurden; darauf aufbauende Verbesserungen stammen von Blokhuis, Bruen und
Thas [1990] sowie von Storme und Thas [1993]. Dem interessierten Leser sei auch
der

Ubersichtsartikel von Thas [1992] empfohlen.
Eine Auistung der bekannten Resultate uber B ogen ndet man (mit ent-
sprechenden Literaturhinweisen) in den Artikeln von Hirschfeld und Storme
[1998,2001].
7 Unterebenen und Blockademengen
Die einfachsten Objekte innerhalb einer projektiven Ebene sind Unterebenen, die
man in naheliegender Weise erkl art:
196 IX Endliche projektive Ebenen und R aume
Denition 7.1. Sei = (P, G, ) eine endliche projektive Ebene. F ur eine Teil-
menge U P setzen wir
G[U = {G U [ G G, [G U[ 2]
und nennen
0
= (U, G[U, ) (oder etwas schlampig, aber bequem auch die
Teilmenge U selbst) eine Unterebene von , falls
0
ebenfalls eine projektive
Ebene ist.
Das folgende Resultat von Baer [1946b] und Bruck [1955] zeigt, da Unter-
ebenen keine allzu groe Ordnung haben k onnen:
Satz 7.2. Sei
0
= (U, G[U, ) eine echte Unterebene der Ordnung m in einer
projektiven Ebene = (P, G, ) der Ordnung n. Dann hat man
(7.1) n = m
2
oder n m
2
m.
Ferner gilt n = m
2
genau dann, wenn jeder Punkt in P U auf einer eindeutig
bestimmten Geraden von
0
liegt (und dual dazu jede Gerade in G (G[U) einen
eindeutig bestimmten Punkt von
0
enth alt ).
Beweis. Jede Gerade Gvon
0
enth alt (n1) (m1) = nmPunkte in P U,
und je zwei Geraden von
0
schneiden sich in einem Punkt in U. Somit gibt es
(m
2
m 1)(n m) Punkte in P U, die jeweils auf genau einer Geraden von

0
liegen. Also gilt
n
2
n 1 (m
2
m1)(n m) (m
2
m1),
woraus (n m
2
)(n m) 0 folgt, also n m
2
. In dieser Absch atzung gilt genau
dann Gleichheit, wenn jeder Punkt in P U auf einer (notwendigerweise eindeutig
bestimmten) Geraden von
0
liegt. Im Fall n ,= m
2
existiert also ein Punkt p, der
auf keiner Geraden von
0
liegt, womit dann jede Gerade durch p h ochstens einen
Punkt in U enthalten kann. Da jeder Punkt in U auf einer dieser Geraden liegt, folgt
sofort n 1 m
2
m1, also die Behauptung. 2
Im Falle n = m
2
nennt man
0
eine Baer-Unterebene von und im Fall
n = m
2
m eine Bruck-Unterebene. Nat urlich kennt man keinerlei Beispiele f ur
den zweiten Fall, da ja bislang nur Ebenen von Primzahlpotenzordnung bekannt
sind. Beispiele von Baer-Unterebenen sind dagegen leicht zu konstruieren, wie das
folgende allgemeinere Beispiel lehrt.
IX.7 Unterebenen und Blockademengen 197
Beispiel 7.3. Sei q eine Primzahlpotenz und n 2 eine nat urliche Zahl. Dann
enth alt die klassische Ebene = PG(2, q
n
) eine zu PG(2, q) isomorphe Untere-
bene
0
, f ur n = 2 also eine Baer-Unterebene. Das sieht man ganz leicht, indem
man f ur U die Menge aller derjenigen Punkte w ahlt, die in homogenen Koordi-
naten durch einen Vektor x dargestellt werden k onnen, dessen drei Koordinaten
s amtlich im Teilk orper GF(q) von GF(q
n
) liegen; die Geraden von
0
sind dabei
ganz analog diejenigen Geraden, die einen homogenen Koordinatenvektor [u] aus
GF(q)
3
haben.
Jede klassische projektive Ebene quadratischer Ordnung enth alt also eine Baer-
Unterebene. Wir verwenden jetzt den Satz von Singer, um eine wesentlich st arkere
Aussage zu zeigen, die von Rao [1969] stammt; der Leser mag sich eine Verallge-
meinerung auf andere Ordnungen uberlegen.
Satz 7.4. F ur jede Primzahlpotenz q kann man die klassische projektive Ebene
= PG(2, q
2
) derart in q
2
q 1 paarweise disjunkte Baer-Unterebenen
zerlegen, da diese Zerlegung unter einer zyklischen Singergruppe von invariant
ist.
Beweis. Wir betrachten nochmals den Beweis von Satz 5.7. Dort wurde die Sin-
gergruppe S = G/H(3, q
2
) von PG(2, q
2
) mittels der linearen Abbildungen
a
mit a L

(f ur L = GF(q
6
)) konstruiert. Da GF(q
3
) nach Satz III.3.7 ein Un-
terk orper F von L ist, liefern die
a
mit a F

entsprechend eine Singergruppe


T = {
a
[ a F

]/H(3, q) f ur die durch F beschriebene Baer-Unterebene

0
= PG(2, q) von , vergleiche Beispiel 7.3. Offenbar kann man T mittels der
Identikation

a
H(3, q) .
a
H(3, q
2
)
als die Untergruppe der Ordnung q
2
q1 in der zyklischen Gruppe S der Ordnung
q
4
q
2
1 auffassen. Man erh alt nun die gew unschte Zerlegung von durch die
Bilder der Baer-Unterebene
0
unter S; dies ergibt (q
4
q
2
1)/(q
2
q 1) =
q
2
q 1 Unterebenen. 2
Wie wir gesehen haben, zeichnen sich Baer-Unterebenen unter allen Unter-
ebenen dadurch aus, da jede Gerade der umfassenden Ebene einen Punkt der
Unterebene enth alt, aber keine dieser Geraden g anzlich in der Unterebene liegt.
Punktemengen mit dieser Eigenschaft haben ganz allgemein groes Interesse ge-
funden:
Denition 7.5. Sei = (P, G, ) eine endliche projektive Ebene. Eine Teilmenge
B P heit eine Blockademenge (englisch: blocking set), wenn sie jede Gerade
trifft, aber keine Gerade enth alt. Man nennt B minimal, wenn Bp f ur keinen Punkt
198 IX Endliche projektive Ebenen und R aume
p B eine Blockademenge ist; eine minimale Blockademenge wird manchmal
auch als Kommittee bezeichnet, so etwa bei Hirschfeld [1998].
Blockademengen wurden urspr unglich imRahmen der Spieltheorie eingef uhrt,
siehe Richardson [1956], und werden auch in anderen geometrischen und kom-
binatorischen Strukturen, etwa in projektiven R aumen intensiv untersucht. Ein
guter

Ubersichtsartikel uber Blockademengen in klassischen Ebenen stammt von
Blokhuis [1996]. Vor theoretischen Resultaten zun achst einige Beispiele:
G
p
C
2 1
p
p
G
p
Beispiel 7.6. Die folgenden Punktmengen bilden minimale Blockademengen B in
einer Ebene der Ordnung q, insbesondere in PG(2, q):
(1) eine umeinen Punkt p verminderte Gerade G, zusammen mit je einemPunkt
,= p auf jeder der q Geraden H ,= G durch p, wobei diese q Punkte nicht
s amtlich kollinear sein d urfen: [B[ = 2q;
(2) (C G {p]) {p
1
, p
2
], wobei C ein Oval sei (siehe Beispiel 6.8), G eine
Sekante von C, {p
1
, p
2
] = G C und p der Schnittpunkt der Tangenten an
C durch die Punkte p
1
bzw. p
2
: [B[ = 2q 1;
(3) Baer-Unterebenen (falls q ein Quadrat ist): [B[ = q

q 1.
Wir beweisen nun die folgende untere Schranke f ur die M achtigkeit einer
Blockademenge, die auf Bruen [1971] zur uckgeht, mit dessen Arbeit die syste-
matische Untersuchung von Blockademengen begonnen hat.
Satz 7.7. Sei B eine Blockademenge in einer endlichen projektiven Ebene
= (P, G, ) der Ordnung n. Dann hat man
(7.2) [B[ n

n 1
mit Gleichheit genau dann, wenn B eine Baer-Unterebene von bildet.
IX.7 Unterebenen und Blockademengen 199
Beweis. Wir setzen x = [B[ sowie x
G
= [B G[ f ur G G. Da jeder Punkt von B
auf genau n 1 Geraden liegt und durch je zwei Punkte genau eine Gerade geht,
erhalten wir sofort die beiden Gleichungen

GG
x
G
= x(n 1)

GG
x
G
(x
G
1) = x(x 1).
Weiterhin gilt stets 1 x
G
x n, da B eine Blockademenge ist und somit jede
der n Geraden ,= G durch einen Punkt p G B jeweils mindestens einen Punkt
von B enthalten mu. Damit erhalten wir die G ultigkeit der folgendenAbsch atzung:
0

GG
(x n x
G
)(x
G
1) = (x n)[(x(n 1) (n
2
n 1)] x(x 1),
also
x
2
2x(n 1) (n
2
n 1) 0.
Da das Polynom x
2
2x(n 1) (n
2
n 1) die Nullstellen n

n 1 hat,
folgt hieraus unmittelbar die Behauptung. 2
Es liegt nun nahe, allgemein nach den Blockademengen minimaler M achtigkeit
in PG(2, q) zu fragen. Falls q ein Quadrat ist, sind dies aufgrund der eben erzielten
Resultate genau die Baer-Unterebenen; im allgemeinen ist dieses Problem jedoch
ungel ost. F ur Primzahlen q gilt [B[ 3(q 1)/2; diese bereits von di Paola [1969]
ge auerte Vermutung wurde schlielich von Blokhuis [1994] bewiesen. Wie das
folgende Beispiel zeigt, ist diese Schranke scharf:
Beispiel 7.8. Es sei q eine ungerade Primzahlpotenz. Wir betrachten das durch
die Koordinatenvektoren (1, 0, 0)
T
, (0, 1, 0)
T
und (0, 0, 1)
T
gegebene Dreieck
{p
1
, p
2
, p
3
] in PG(2, q). Die von den drei Ecken verschiedenen Punkte auf den
Seiten des Dreiecks haben dann Koordinatenvektoren der Form(0, 1, a)
T
mit a ,= 0
(Punkte auf p
2
p
3
), (1, 0, b)
T
mit b ,= 0 (Punkte auf p
1
p
3
) bzw. (c, 1, 0)
T
mit
c ,= 0 (Punkte auf p
1
p
2
). Dabei liefern drei derartige Vektoren genau dann kolli-
neare Punkte, wenn sie linear abh angig sind, wenn also a = bc gilt. Wir w ahlen nun
B als die Menge aller derjenigen Punkte des Dreiecks, die wir erhalten, wenn a, b, c
die Quadrate in GF(q)

durchlaufen, zuz uglich der drei Ecken; dann gilt in der Tat
[B[ = 3(q 1)/2, siehe

Ubung III.3.10. Eine beliebige Gerade Genth alt entweder
eine der Ecken des Dreiecks oder schneidet die drei Seiten des Dreiecks in drei
Punkten mit Koordinatenvektoren der eben angegeben Form, f ur die a = bc gilt;
da das Produkt zweier Nichtquadrate in GF(q) nach

Ubung III.3.10 ein Quadrat
200 IX Endliche projektive Ebenen und R aume
ist, schneidet G die Menge B auch in diesem Fall in in mindestens einem Punkt.
Somit ist B in der Tat eine Blockademenge.
Die in Beispiel 7.8 konstruierten Blockademengen heien projektive Dreiecke.
Nach Ghinelli und Jungnickel [2003b] kann man die projektiven Dreiecke auch wie
folgt synthetisch beschreiben: Man w ahle einen Kegelschnitt C und drei Punkte
o, p, q in C; dann bilden diese drei Punkte zusammen mit allen Schnittpunkten
von Tangenten von C mit einer der drei Seiten des Dreiecks opq ein projektives
Dreieck.
Es ist bislang nicht gelungen, alle Blockademengen der (minimalen) M achtig-
keit 3(q 1)/2 in PG(2, q), q Primzahl, zu bestimmen. Das einzige weitere exakte
Resultat betrifft den Fall q = p
3
, p Primzahl: Hier ist die minimale M achtigkeit
einer Blockademenge durch p
3
p
2
1 gegeben, siehe Blokhuis [1996]. Zahlrei-
che weitere Resultate sind in den Artikeln von Hirschfeld und Storme [1998,2001]
aufgelistet. Mehr uber Blockademengen ndet man auch bei Hirschfeld [1998].
8 Anwendungen in der Kryptographie
In diesemAbschnitt diskutieren wir zwei Anwendungen projektiver Ebenen in der
Kryptographie. Zun achst wollen wir noch einmal kurz auf die in III.7 behandelten
Authentikationscodes eingehen. Wie wir in Satz III.7.4 gesehen haben, sind perfekte
Authentikationscodes mit n
2
Schl usseln und r Datens atzen zu orthogonalenArrays
OA(r, n) aquivalent, weswegen man mit einem perfekten Authentikationscode mit
n
2
Schl usseln und n Authentikatoren maximal r = n 1 Datens atze authenti-
zieren kann. Aufgrund der S atze 2.1 und III.2.8 wird diese Schranke genau dann
angenommen, wenn es eine projektive Ebene der Ordnung n gibt, insbesondere
also f ur Primzahlpotenzen n.
Wir verwenden jetzt projektive Ebenen f ur eine direkte geometrische Realisie-
rung von perfekten Authentikationssystemen (ohne den Umweg uber orthogonale
Arrays); allerdings werden wir dabei eine etwas modizierte Formerhalten, bei der
die Nachrichten nicht Paare (s, a) aus Datensatz s undAuthentikator a sind, sondern
selbst andige Objekte, aus denen man aber sofort den Datensatz berechnen kann.
Auch w are es kein Problem, die zuvor verwendete Form als Authentikationscode
herzustellen.
Satz 8.1. Es sei = (P, G, ) eine projektive Ebene der Ordnung n. Wir w ahlen
eine Gerade G
0
und denieren ein Authentikationssystem (S, K, M) wie folgt:
Die Datens atze in S sind die Punkte von G
0
.
Die Schl ussel in K sind die Punkte in P G
0
.
IX.8 Anwendungen in der Kryptographie 201
Die Nachricht zu einem Datensatz q G
0
und einem Schl ussel p P G
0
ist die Gerade H = pq.
Dann ist (S, K, M) ein perfektes Authentikationssystem mit [K[ = n
2
.
Beweis. Man beachte zun achst, da aus jeder Nachricht H der zugeh orige Datensatz
q trivial als H G
0
berechenbar ist.
3
Wir betrachten zuerst einen Impersonations-
angriff, wo also der Angreifer keine g ultige Nachricht kennt. Zu jedem Datensatz
q G
0
existieren genau n m ogliche Nachrichten, n amlich die n Geraden H ,= G
0
durch q; jede dieser Nachrichten geh ort zu n Schl usseln, n amlich den Punkten
p H {q]. Also ist die Wahrscheinlichkeit daf ur, eine g ultige Nachricht zu dem
gew unschten Datensatz q zu w ahlen, n/n
2
= 1/n, da die Schl ussel wie ublich
als gleich wahrscheinlich vorausgesetzt sind.
Nun zu einer Substitutionsattacke, bei der der Angreifer also eine g ultige Nach-
richt H und damit den Datensatz q = H G
0
kennt; die denkbaren Schl ussel sind
jetzt die Punkte p H {q]. F ur jeden Datensatz q
/
,= q und jeden der n m ogli-
chen Schl ussel p gibt es dann genau eine zugeh orige Nachricht, n amlich die Gerade
H
/
= pq
/
; bei gegebenem q
/
,= q durchl auft H
/
aber alle n von G
0
verschiede-
nen Geraden durch q
/
, womit die Wahrscheinlichkeit eines erfolgreichen Betruges
wiederum nur 1/n ist. 2
Unsere zweite Anwendung betrifft sogenannte Zugangsschemata (Englisch:

secret sharing schemes). Ganz allgemein geht es dabei darum, ein Geheimnis
(etwa den Zugangscode f ur den Tresorraum einer Bank oder den f ur das Atomwaf-
fenarsenal eines Staates) in Teilgeheimnisse (

shares) zu zerlegen, so da keiner


der beteiligten Geheimnistr ager f ur sich alleine das gesamte Geheimnis kennt, aber
spezizierte Koalitionen von Personen das Geheimnis aus ihren Teilgeheimnis-
sen rekonstruieren k onnen. Die einfachsten Beispiele von Zugangsschemata erh alt
man, wenn man verlangt, da je t der beteiligten Personen (aber nicht weniger) das
Geheimnis rekonstruieren k onnen; man spricht dann von einemt-Schwellenschema
(

threshold scheme). Wir verzichten auf eine formale Denition und geben statt-
dessen sogleich eine geometrische Konstruktion f ur derartige Systeme an:
Satz 8.2. Es sei G eine Gerade in = PG(t, q), deren q 1 Punkte die m ogli-
chen Geheimnisse sind. Ferner sei f ur jeden Punkt p G eine Hyperebene H
p
gegeben, die G nicht enth alt und in p schneidet, sowie ein p enthaltender (q 1)-
Bogen C
p
in H
p

= PG(t 1, q), siehe Beispiel 6.12, dessen Punkte ,= p dann
die zu p geh orenden Teilgeheimnisse sind. Dies deniert ein t -Schwellenschema,
3
Wenn man formal einenAuthentikationscode wie in III.7 verwenden m ochte, kann man f ur jeden
Schl ussel p P G
0
eine Bijektion
p
der n1 m oglichen Nachrichten, also der n1 Geraden durch
p, auf eine (n 1)-Menge Aw ahlen und statt einer Nachricht H = pq das Paar (q,
p
(H)) senden.
202 IX Endliche projektive Ebenen und R aume
bei dem auch die Kenntnis von t 1 Teilgeheimnissen es lediglich gestattet, mit
Wahrscheinlichkeit 1/(q 1) das korrekte Geheimnis zu w ahlen.
Beweis. Da C
p
ein Bogen in H
p
ist, erzeugen je t Punkte von C
p
diese Hyper-
ebene. Gibt man also t der Teilgeheimnisse vor ( uber die Koordinatenvektoren der
entsprechenden Punkte von C
p
), so kann man aus ihnen zun achst H
p
und dann das
Geheimnis p als den Schnittpunkt von H
p
mit der Geraden G berechnen.
Sind dagegen nur t 1 Punkte von C
p
bekannt, so erzeugen die Koordina-
tenvektoren dieser Punkte lediglich einen (t 1)-dimensionalen Unterraum U des
t -dimensionalenVektorraums H
p
. Dieser UnterraumU kann nun p nicht enthalten,
da ja p auf dem Bogen C
p
liegt und je t Punkte eines Bogens linear unabh angige
Koordinatenvektoren haben. Ein Angreifer kennt also lediglich U und G, wobei U
keinen Punkt von Genth alt. Wir zeigen nun, da dann alle Punkte x Gals m ogli-
ches Geheimnis gleich wahrscheinlich sind: x und U erzeugen einen Unterraum
W
x
der Dimension t , in dem also
(q
t 1
q 1) (q
t 2
q 1) 1 = q
t 1
1
potentielle weitere Teilgeheimnisse liegen, n amlich die von x verschiedenen, nicht
in U enthaltenen Punkte von W
x
; man beachte nun, da durch je t 1 Punkte
von W
x
in allgemeiner Lage ein (q 1)-Bogen geht, siehe

Ubung 6.13, weswegen
tats achlich jeder der genannten Punkte als weiteres Teilgeheimnis in Frage kommt.
Da somit die Anzahl der potentiellen weiteren Teilgeheimnisse f ur jeden der q 1
m oglichen Unterr aume W
x
gleich ist, hat der Angreifer keine bessere M oglichkeit,
als einen dieser Unterr aume (bzw. ein weiteres Teilgeheimnis) zu erraten. 2
Das Schwellenschema aus Satz 8.2 ist perfekt: Es existiert (bei gleicher Wahr-
scheinlichkeit aller Geheimnisse) kein besseres Angriffsverfahren, als das Geheim-
nis zu erraten. Dies war es nat urlich, was wir mit der Forderung gemeint haben, da
weniger als t der Geheimnistr ager das Geheimnis nicht bestimmenk onnenErraten
ist nat urlich immer eine m ogliche Strategie! Es kann daher prinzipiell kein v ollig
sicheres System geben; trotzdem kann man mit Systemen wie dem aus Satz 8.2
auf einfache, leicht implementierbare Weise jedes beliebige Sicherheitsniveau er-
reichen, indem man q hinreichend gro w ahlt. Dabei handelt es sich um eine ma-
thematisch bewiesene Sicherheit, im Gegensatz zu den meisten kryptographischen
Verfahren, die lediglich als

computanionally secure gelten (also mit derzeitigen


Rechenressourcen erfahrungsgem a nicht gebrochen werden k onnen); so ist bei-
spielsweise die Sicherheit des bekannten RSA-Systems nicht bewiesen, sondern
beruht nur auf heuristischen Argumenten.
F ur manche Anwendungen sind Systeme mit verschiedenen Hierarchiestufen
n utzlich; so k onnten beispielsweise wahlweise zwei Bankdirektoren oder drei Pro-
IX.8 Anwendungen in der Kryptographie 203
kuristen gemeinsam aktiv werden. Wir erw ahnen hierzu die folgende interessan-
te Verallgemeinerung der Schwellenschemata: Ein (s, t )-Multilevel-Schema (mit
s < t ) hat zwei Mengen von Geheimnistr agern, etwa S und T ; dabei sollen wahl-
weise
je s Personen aus S
je t Personen aus T
je t k Personen aus T zusammen mit k Personen aus S (f ur k = 1, . . . , s1)
gemeinsam das Geheimnis rekonstruieren k onnen, w ahrend dies f ur andere als
diese legalen Benutzerkonstellationen nicht m oglich sein soll. Die Personen in S
stehen also in der Hierarchie h oher: Bei ihnen wird eine geringere Anzahl zur
Geheimnisrekonstruktion verlangt, und sie k onnen Personen aus T ersetzen. Wir
geben hier lediglich ein Beispiel f ur den Fall s = 2, t = 3 an, das wieder im oben
diskutierten Sinne perfekt ist.
Satz 8.3. Es sei Geine Gerade in = PG(3, q), deren q1 Punkte die m oglichen
Geheimnisse sind. Ist ein solches Geheimnis p G gew ahlt, so seien
H eine Gerade, die G in p schneidet;
E eine Ebene, die H aber nicht p enth alt und somit ebenfalls G in p
schneidet;
C ein Kegelschnitt in E

= PG(2, q), der p enth alt und f ur den H eine
Tangente in p ist, siehe Beispiel 6.8;
H
S
H {p] und C
T
C {p] zwei Punktmengen, f ur die keine Gerade
durch zwei Punkte in C
T
die Gerade H in einem Punkt von H
S
trifft; diese
Punkte bilden die denTeilnehmern in S bzw. T zugeordnetenTeilgeheimnisse.
Dies deniert ein (2, 3)-Multilevel-Schema, bei dem unbefugte Teilnehmerkoali-
tionen lediglich mit Wahrscheinlichkeit 1/(q 1) das korrekte Geheimnis w ahlen
k onnen.
Beweis. Zwei Teilnehmer aus S kennen zwei Punkte von H, k onnen also H und
dann das Geheimnis p = G H bestimmen. Analog kennen drei Personen in
T drei Punkte von C; da diese nicht kollinear sind, k onnen sie die Ebene E und
damit wieder das Geheimnis p = G E bestimmen. Dasselbe Argument trifft f ur
eine Person aus S und zwei Teilnehmer aus T zu, da die diesen beiden Teilnehmern
zugeordneten Punkte von C nachVoraussetzung eine Gerade bestimmen, die keinen
Punkt enth alt, der einer Person in S zugeordnet ist.
Publik ist nur die Gerade G der m oglichen Geheimnisse. Eine Person aus S
f ur sich kennt nun lediglich einen Punkt auerhalb von G; jeder der q 1 Punkte
204 IX Endliche projektive Ebenen und R aume
von G ist damit als Geheimnis m oglich. Zwei Teilnehmer aus T k onnen nur eine
Gerade L E bestimmen, die G nach Voraussetzung nicht schneidet, haben also
ebenfalls keine Information dar uber, welcher der Punkte von G gew ahlt wurde, da
ja jeder Punkt von G zusammen mit L eine eindeutig bestimmte Ebene deniert.
Dieselbe Argumentation trifft f ur je einen Teilnehmer aus S und T zu. 2
Wir erw ahnen, da es eine offene Frage ist, wie gro man die in Satz 8.3
beschriebenen Teilmengen H
S
und C
T
w ahlen kann. In der Praxis ist das nat urlich
kein Problem, da ja q sehr gro ist: Hat man k Punkte auf C beliebig gew ahlt, so
schliet dies trivialerweise maximal
_
k
2
_
Punkte auf H aus; dieser Fall tritt genau
dann auf, wenn keine zwei der zugeh origen Verbindungsgeraden sich in einem
Punkt von H schneiden.

Ubung 8.4. Man verwende rationale Normkurven, um ahnlich wie in Satz 8.3 ein
(2, t )-Multilevel-Schema zu konstruieren.
Mehr uber Zugangsschemata ndet man bei Stinson [2001]; sehr gute Artikel
zu diesem Thema stammen von Simmons [1990,1992b] sowie Stinson [1992b].
9 Afne Geometrien
ZumAbschlu dieses Kapitels gehen wir kurz auf die dem Leser vielleicht vertrau-
tere afne Geometrie ein. Zun achst wieder zum ebenen Fall:
Denition 9.1. Sei = (P, G, I) eine endliche Inzidenzstruktur, wobei wir statt
von Bl ocken wieder von Geraden sprechen wollen. heit eine endliche afne
Ebene, wenn folgendes gilt:
(a) Durch je zwei verschiedene Punkte p, q geht genau eine Gerade G, die wir
mit G = pq bezeichnen.
(b) Zu einem Punkt p und zu einer Geraden G, die nicht durch p geht, gibt es
genau eine Gerade H durch p, die G nicht schneidet; H wird die Parallele
zu G durch p genannt.
(c) Es gibt ein Dreieck, also drei Punkte, die nicht auf einer Geraden liegen.
Man schreibt G | H, wenn G = H gilt oder G und H sich nicht schneiden.
Beispiel 9.2. Sei GF(q) der K orper mit q Elementen und P die Menge aller Vek-
toren des zweidimensionalen Vektorraums V = GF(q)
2
sowie G die Menge aller
NebenklassenUx von1-dimensionalenUnterr aumenvonV. Mansieht leicht, da
= (P, G, ) die Axiome einer endlichen afnen Ebene erf ullt; dabei sind zwei
IX.9 Afne Geometrien 205
Geraden genau dann parallel, wenn sie zu demselben 1-dimensionalen Unterraum
von V geh oren. Diese Ebene wird mit AG(2, q) bezeichnet und die desarguessche
(oder auch die klassische) afne Ebene der Ordnung q genannt.
Wie schon im projektiven Fall werden wir Geraden meist als Punktmengen
auffassen, also o.B.d.A. die Inzidenzrelation I durch ersetzen. Wir zeigen nun,
da afne und projektive Ebenen im wesentlichen aquivalent sind:
Satz 9.3. Sei = (P, G, ) eine endliche projektive Ebene und G

eine Gerade
von . Dann ist
= (P G

, G {G

], )
eine afne Ebene; dabei sind zwei Geraden in genau dann parallel, wenn ihr
Schnittpunkt in auf G

liegt. Jede afne Ebene kann auf diese Weise aus einer
projektiven Ebene erhalten werden.
Beweis. Da in je zwei Punkte eine eindeutige Verbindungsgerade besitzen und
wir die sogenannte unendliche Gerade G

ganz aus entfernt haben, vererbt sich


diese Eigenschaft auf . Sei nun Geine Gerade von und q ihr Schnittpunkt in
mit G

. F ur jeden Punkt p / Gvon wird dann die Verbindungsgerade H = pq


in zu der gesuchten Parallelen von Gdurch p in . Schlielich folgt die Existenz
eines Dreiecks in zusammen mit Lemma 1.4 aus der eines Vierecks in .
Sei nun umgekehrt eine afne Ebene gegeben. Wit f uhren f ur jede Parallelen-
klasse S von Geraden von einen neuen

unendlichen Punkt ein und f ugen ihn


zu jeder Geraden in S hinzu; danach fassen wir alle diese unendlichen Punkte zu
einer neuen

unendlichen Geraden G

zusammen. Wir uberlassen es dem Leser


nachzuweisen, da wir damit eine projektive Ebene deniert haben, aus der man
dann offenbar durch Weglassen der Geraden G

und ihrer Punkte also die in


der Behauptung beschriebene Konstruktion erhalten kann. 2
Die Vervollst andigung einer afnen Ebene zu einer projektiven Ebene gem a
Satz 9.3 ist offenbar bis auf Isomorphie eindeutig bestimmt. Dagegen k onnen aus
derselben projektiven Ebene bei unterschiedlicher Wahl der Geraden G

durchaus
nicht-isomorphe afne Ebenen entstehen.
Aus den S atzen 9.3 und 1.6 ergibt sich sofort das folgende
Korollar 9.4. Sei = (P, G, I) eine endliche afne Ebene. Dann gibt es eine
nat urliche Zahl n, die Ordnung von , so da folgendes gilt:
(1) Auf jeder Geraden G G liegen genau n Punkte.
(2) Durch jeden Punkt p P gehen genau n 1 Geraden.
(3) [P[ = n
2
und [G[ = n
2
n. 2
206 IX Endliche projektive Ebenen und R aume

Ubung 9.5. Man f uhre die in Satz 9.3 beschriebene Konstruktion f ur die klassische
projektive Ebene PG(2, q) durch und zeige, da sich bis auf Isomorphie die
klassische afne Ebene AG(2, q) ergibt (unabh angig von der Wahl von G

), und
leite f ur die Geraden in AG(2, q) Gleichungen der in der Schulgeometrie ublichen
Form x = c bzw. y = mx b her.
Hinweis: Man w ahle etwa G

als die Gerade mit homogenen Koordinaten


[(0, 0, 1)
T
]; die afnen Punkte sind dann die Punkte mit Koordinatenvektoren der
Form(a, b, 1)
T
und k onnen somit mit denVektoren in GF(q)
2
identiziert werden.
Wir verallgemeinern nun Beispiel 9.2 und f uhren die h oher-dimensionalen af-
nen R aume ein:
Denition 9.6. Sei GF(q) der K orper mit q Elementen und AG(n, q) die durch die
Inklusion partiell geordnete Menge aller Nebenklassen von Teilr aumen U des n-
dimensionalenVektorraums V = GF(q)
n
. Man nennt AG(n, q) die n-dimensionale
afne Geometrie uber GF(q); f ur n 3 spricht man auch von einem afnen Raum.
Die Nebenklassen von 0-dimensionalen Teilr aumen werden mit den Vektoren in V
identiziert und heien Punkte; die Nebenklassen von eindimensionalen Teilr aum-
en heien Geraden, die Nebenklassen zweidimensionaler Teilr aume Ebenen und
die Nebenklassen (n1)-dimensionaler Teilr aume Hyperebenen; allgemein spricht
manauchvonafnenUnterr aumen vonV. Zwei nichtleere, echte afne Unterr aume
U und W werden inzident genannt, wenn U W oder W U gilt; man schreibt
daf ur U I W und verwendet wieder die ubliche geometrische Sprechweise (wie
etwa

U liegt auf W f ur U W). Schlielich heien zwei afne Unterr aume


genau dann parallel, wenn f ur die zugeh origen linearen Unterr aume U und W die
Beziehung U W oder W U gilt. Insbesondere bilden also die Nebenklassen
desselben linearen Unterraums eine Parallenschar von afnen Unterr aumen.

Ubung 9.7. Manzeige, dajeder afne RaumAG(n, q) die folgendenLenz-Axiome


erf ullt:
(a) Je zwei verschiedene Punkte p und q liegen auf genau einer Geraden, die
wieder mit pq bezeichnet wird.
(b) Die Geradenmenge ist derart in Parallelenscharen zerlegt, da jede Paralle-
lenschar eine Zerlegung der Punktemenge ist; man schreibt G | H, wenn G
und H parallel sind.
(c) Es seien G, H, K drei verschiedene Geraden und p, q, r drei verschiedene
Punkte, so da G | H, p = G K, q = H K und r K gelten. Dann
schneiden sich die Geraden H und rx f ur jeden Punkt x G.
IX.9 Afne Geometrien 207
p
q
r
x
!
H
G
K
(d) Wenn p, q, r drei verschiedene Punkte sind, die nicht auf einer Geraden
liegen, gibt es einen Punkt s mit pq | rs und pr | qs. (Existenz von Paral-
lelogrammen)
(e) Auf jeder Geraden liegen mindestens zwei Punkte.
(f) Es gibt zwei Geraden, die sich nicht schneiden und auch nicht parallel sind.
Hierbei dienen die Axiome (c) und (d) zur Einf uhrung eines Ebenenbegriffs und
das Axiom (f) stellt sicher, da es windschiefe Geraden gibt, also nicht s amtliche
Punkte in einer Ebene liegen.
Die Bedeutung dieser Axiome liegt nun im folgenden Satz von Lenz [1959];
einen Beweis ndet man auch bei Beutelspacher [1983].
Satz 9.8 (Hauptsatz der afnen Geometrie). Jede endliche Inzidenzstruktur
(P, G, I), die den Lenz-Axiomen aus

Ubung 9.7 gen ugt, ist isomorph zu der Geo-
metrie, die von den Punkten und Geraden eines afnen Raumes AG(n, q) gebildet
wird. 2
Schlielich geben wir noch drei

Ubungen an, die eine Verallgemeinerung der
S atze 1.6 und 9.4 auf projektive bzw. afne Geometrien zum Ziel haben:

Ubung 9.9. Seien q eine Primzahlpotenz und n und d nat urliche Zahlen mit d n.
Dann ist die Anzahl der d-dimensionalen Unterr aume des Vektorraums GF(q)
n
durch
(9.1)
_
n
d
_
q
=
(q
n
1)(q
n1
1) . . . (q
nd1
1)
(q
d
1)(q
d1
1) . . . (q 1)
.
gegeben. Die Zahlen
_
n
d
_
q
heien die Gau-Koefzienten.
Hinweis: Man uberlege sichzun achst, wieviele geordnete d-Tupel linear unabh angi-
ger Vektoren in GF(q)
k
existieren. Siehe auch XV.9.
208 IX Endliche projektive Ebenen und R aume

Ubung 9.10. Man zeige f ur den afnen Raum AG(n, q):


(1) Jeder d-dimensionale afne Unterraum enth alt genau q
d
Punkte.
(2) Jeder Punkt liegt in genau
_
n
d
_
q
d-dimensionalen afnen Unterr aumen.
(3) Je zwei Punkte liegen in genau
_
n1
d1
_
q
d-dimensionalen afnen Unterr aum-
en.
Hinweis: Man kann annehmen, da einer der beteiligten Punkte der Nullvektor ist.

Ubung 9.11. Man zeige f ur den projektiven Raum = PG(n, q):


(1) Jeder d-dimensionale Unterraum von enth alt genau
_
d1
1
_
q
Punkte.
(2) Jeder Punkt liegt in genau
_
n
d
_
q
d-dimensionalen Unterr aumen von .
(3) Je zwei Punkte liegeningenau
_
n1
d1
_
q
d-dimensionalenUnterr aumenvon.
X Blockpl ane
Die Design-Theorie, also die Theorie der sogenannten Blockpl ane (oder Designs)
und verwandter Strukturen, erlebte ihre erste Bl ute im 19. Jahrhundert, unter an-
derem Namen und unter den H anden vor allem von Geometern. Ein typisches
Blockplanproblem ist die folgende, von Kirkman
1
[1851] aufgestellte und in sei-
nem Spezialfall sogleich gel oste Aufgabe.
Kirkmansches Schulm adchenproblem:
Man f uhre f unfzehn Schulm adchen an sieben Sonntagen in jeweils
f unf Dreierreihen so spazieren, da jedes M adchenpaar an genau einem
Sonntag in einer Reihe zusammentrifft.
Eine L osung ist graphisch auf der n achsten Seite dargestellt. Die Abbildung zeigt
die Dreierreihen f ur einen Sonntag. Die Anordnungen f ur die anderen Sonntage
entstehen durch jene Drehungen, bei denen Punkte p
j
in Punkte p
k
ubergehen. Wir
uberlassen es dem Leser, als

Ubung zu verizieren, da dies wirklich eine L osung
des Schulm adchenproblems liefert.
Die Design-Theorie hat sich in den letzten Jahrzehnten in ahnlicher Weise zu
einer eigenen kombinatorischen Disziplin ausgewachsen wie die Graphentheorie.
Dabei stehen Fragen nach der Existenz (und gegebenfalls auch der Charakterisie-
rung) von Blockpl anen mit vorgeschriebenen Eigenschaften im Mittelpunkt des
Interesses. Wir werden u.a. die Beweise f ur die Existenz von Steiner- und Kirk-
mantripelsystemen vollst andig durchf uhren und damit einen gr undlichen Einblick
in die Methoden der kombinatorischen Design-Theorie vermitteln. Einige wei-
terf uhrende groe Ergebnisse der Existenztheorie f ur Blockpl ane mit vorgegebe-
nen Eigenschaften referieren wir an geeigneter Stelle ohne Beweis.
2
All diesen
Existenzbeweisen ist eine Idee gemeinsam, die wir in der Theorie der orthogonalen
1
Rev. Thomas Penyngton Kirkman (18061895), englischer Geistlicher und Mathematiker; eine
interessante Darstellung seiner Biographie und seines umfangreichen Werkes in verschiedenen Teil-
gebieten der Mathematik (Kombinatorik, Gruppentheorie, Polyeder, Knotentheorie) ndet man bei
Biggs [1981]. Von historischemInteresse f ur die Kombinatorik sind insbesondere die Arbeiten Kirkman
[1847;1850a,b,c;1851;1853;1857]; so ndet sich beispielsweise in der Arbeit [1850b] die Konstruktion
einer projektiven Ebene der Ordnung p f ur alle Primzahlen p. Man vergleiche ferner den historischen
Bericht bei Ray-Chaudhuri und Wilson [1971].
2
Unter den fundamentalen fr uhen Arbeiten sind insbesondere Bose [1939], Hanani
[1961,1972,1975], Hanani, Ray-Chaudhuri undWilson [1972], Ray-Chaudhuri undWilson [1971,1973]
210 X Blockpl ane
lateinischen Quadrate bereits in Kap. III kennengelernt haben: Man legt zun achst,
etwa mit algebraisch-gruppentheoretischen Methoden, einen gen ugend groenVor-
rat an Blockpl anen der gew unschtenArt an und beweist sodann Kompositionss atze,
die es gestatten, durch geschicktes Kombinieren der Vorratsbeispiele so viele Block-
pl ane zu gewinnen, da sich die gestellte Aufgabe vollst andig l osen l at.
Eine systematische Darstellung der Design-Theorie ndet man bei Beth, Jung-
nickel und Lenz [1999]. Tabellarische Zusammenstellungen der bekannten Exi-
stenzresultate stehen in den entsprechendenAbschnitten des bereits fr uher erw ahn-
ten CRC handbook of combinatorial designs, siehe Colbourn und Dinitz [1996].
p
0
p
1
p
2
p
3
p
4
p
5
p
6
q
0
q
1
q
2
q
3
q
4
q
5
q
6

.
L osung des Kirkmanschen Schulm adchenproblems
1 Grundlagen
Denition 1.1. Eine endliche Inzidenzstruktur = (V, B, ) heit ein (v, K, )-
PBD (f ur pairwise balanced design), wobei K N ist, wenn
jeder Block B B M achtigkeit aus K hat;
es f ur je zwei verschiedene Punkte p, q V genau Bl ocke B mit p, q B
gibt.
sowie Wilson [1972a,b;1975] zu nennen. Wichtige sp atere Autoren sind u. a. Mills, Mullin, Zhu, Greig
und Abel; f ur ausf uhrliche Literaturhinweise zu diesem nach wie vor sehr aktiven Forschungsgebiet sei
auf Colbourn und Dinitz [1996] sowie Beth, Jungnickel und Lenz [1999] verwiesen.
X.1 Grundlagen 211
Ist dabei K eine 1-elementige Menge, etwa K = {k], so spricht man von einem
(v, k, )-Blockplan (oder Design).
Eine Menge P B heit eine Parallelklasse, wenn die Bl ocke aus P eine
Zerlegung der Punktemenge V bilden. Man nennt au osbar, wenn man die
Blockmenge B disjunkt in Parallelklassen zerlegen kann.
3
Wir werden uns im Grunde nur f ur Blockpl ane und nicht f ur die allgemeineren
PBDs interessieren; wie wir sehen werden, sind diese jedoch ein unentbehrliches
Hilfsmittel, um rekursive Konstruktionen f ur Blockpl ane zu gewinnen.
Beispiel 1.2. Die einleitend angegebene L osung des Kirkmanschen Schulm ad-
chenproblems ist einau osbarer (15,3,1)-Blockplan; die Punkte sinddabei nat urlich
die M adchen, die Bl ocke die Dreierreihen und die Parallelklassen die Mengen von
f unf Dreierreihen, die jeweils zu einem Sonntag geh oren.
Weitere Beispiele von Blockpl anen stehen uns bereits reichlich zur Verf ugung,
wenn wir die Resultate uber endliche afne und projektive Geometrien aus dem
vorigen Kapitel ben utzen. Wir beginnen mit dem ebenen Fall, f ur den wir die S atze
IX.1.6 und IX.9.4 anwenden k onnen:
Beispiel 1.3. Sei q eine Primzahlpotenz. Dann ist die klassische projektive Ebene
PG(2, q) ein (q
2
q 1, q 1, 1)-Blockplan, wobei wir nat urlich die Geraden-
menge G als Blockmenge verwenden. Entsprechend ist die klassische afne Ebene
ein au osbarer (q
2
, q, 1)-Blockplan.
Die afnen und projektiven R aume liefern uns ebenfalls Blockpl ane in H ulle
und F ulle, wie die

Ubungen IX.9.10 und IX.9.11 zeigen:
Beispiel 1.4. Seien q eine Primzahlpotenz und n und d nat urliche Zahlen mit
1 d < n. Dann bilden die Punkte des projektiven Raums PG(n, q) zusammen
mit den d-dimensionalen Unterr aumen einen Blockplan mit Parametern
(1.1) v =
_
n 1
1
_
q
, k =
_
d 1
1
_
q
und =
_
n 1
d 1
_
q
,
3
Nach der eben gegebenen Denition ist Beine Menge; wir schlieen somit die Existenz wiederhol-
ter Bl ocke (also von zwei Bl ocken, die als Punktmengen identisch sind) aus. In der Design-Theorie ist es
dagegen ublich, dieses Ph anomen zu erlauben, B also als Mengenfamilie anzusehen; Designs in unse-
rem Sinne heien dann einfach. Da wir hier in erster Linie Existenzs atze f ur den Fall = 1 nachweisen
wollen, ist die von uns gegebene Denition f ur unsere Zwecke v ollig ad aquat, weil dann wiederholte
Bl ocke trivialerweise nicht auftreten k onnen. Die einzige Ausnahme werden die in 6 behandelten Tri-
pelsysteme bilden; ferner lassen die im Laufe dieses Kapitels zitierten allgemeinen Existenzs atze f ur
beliebiges stets wiederholte Bl ocke zu.
212 X Blockpl ane
der mit PG
d
(n, q) bezeichnet wird. Entsprechend bilden die Punkte des afnen
Raums AG(n, q) zusammen mit den d-dimensionalen afnen Unterr aumen einen
au osbaren Blockplan mit Parametern
(1.2) v = q
n
, k = q
d
und =
_
n 1
d 1
_
q
,
der mit AG
d
(n, q) bezeichnet wird.
Die eben angegebenen Beispiele besitzen eine uber die Forderungen in Deni-
tion 1.1 hinausgehende Regularit at, da jeder Punkt auf einer konstanten Anzahl r
von Bl ocken liegt. Wir zeigen sogleich, da dies kein Zufall ist:
Satz 1.5. Ist = (V, B) ein (v, k, )-Blockplan, so gibt es eine nat urliche Zahl r
(die sogenannte Replikationszahl des Blockplans), so da jeder Punkt auf genau r
Bl ocken liegt. Setzt man uberdies [B[ = b, so gelten
(v 1) = r(k 1) (1.3)
v(v 1) = bk(k 1). (1.4)
Beweis. Sei p V beliebig. Wir bezeichnen die Anzahl der Bl ocke durch p f ur
den Moment mit r
p
. Nach Denition eines Blockplans liegt jeder Punkt q ,= p in
genau der (k 1)-Mengen B {p] mit p B; es gilt also (v 1) = r
p
(k 1).
Daraus folgt sofort, da r = r
p
nicht von p abh angt und (1.3) erf ullt.
Wir betrachten nun die Menge F aller Fahnen (p, B), also alle Paare (p, B) mit
p V, B B und p B. Da jeder Punkt in genau r Bl ocken liegt, gilt [F [ = rb.
Andererseits enth alt jeder Block genau k Punkte, weswegen auch [F [ = vk gilt.
Also haben wir vr = bk und mit (1.3) ergibt sich sofort die Gleichung (1.4). 2
Aus den Gleichungen (1.3) und (1.4) folgen die Fundamentalkongruenzen f ur
(v, k, )-Blockpl ane:
Korollar 1.6 (Notwendige Existenzbedingungen). Falls es einen (v, k, )-Block-
plan gibt, gelten die Kongruenzen
(v 1) 0 mod k 1 (1.5)
v(v 1) 0 mod k(k 1). (1.6)
2
Wie wir zeigen werden, sind diese Bedingungen f ur k = 3 sowie f ur k = 4 und
= 1 auch hinreichend. Wir erw ahnen an dieser Stelle das folgende grundlegende
Ergebnis von Wilson [1972a,b;1975], das mit auerordentlichemAufwand bewie-
sen wurde und weit uber den Rahmen dieses Buches hinausgeht; einen Beweis
ndet man auch bei Beth, Jungnickel und Lenz [1999, Chapter XI].
X.1 Grundlagen 213
Satz 1.7 (Asymptotischer Existenzsatz f ur Blockpl ane). Die notwendigen Exi-
stenzbedingungen aus Korollar 1.6 sind asymptotisch hinreichend. Genauer: F ur
beliebige nat urliche Zahlen k 3 und gibt es eine nat urliche Zahl v
0
= v
0
(k, ),
so da f ur jedes v v
0
, das die Kongruenzen (1.5) und (1.6) erf ullt, ein (v, k, )-
Blockplan existiert. 2
In den folgenden Abschnitten werden einige der Ideen, mit deren Hilfe Wilson
seinen Satz 1.7 bewies, eine Rolle spielen. Zun achst noch die Bedingungen f ur
au osbare Blockpl ane:
Satz 1.8 (Notwendige Existenzbedingungen). Falls es einen au osbaren (v, k, )-
Blockplan gibt, gelten die Kongruenzen
(1.7) v 0 mod k sowie (v 1) 0 mod k 1.
Beweis. Weil die Punktemenge in disjunkte Bl ocke zerlegt werden kann, mu v
ein Vielfaches von k sein. Die zweite Kongruenz gilt nach (1.5); man beachte, da
dann die Kongruenz (1.6) automatisch erf ullt ist. 2
Korollar 1.9. Falls es einen au osbaren (v, k, 1)-Blockplan gibt, gilt die Kongru-
enz
(1.8) v k mod k(k 1). 2
(1.8) ist also eine notwendige Bedingung f ur die Existenz eines au osba-
ren (v, k, 1)-Blockplans. Da diese Bedingung f ur k = 3 hinreicht, bedeutet
die von Ray-Chaudhuri und Wilson [1971] gegebene L osung des allgemeinen
Schulm adchenproblems, die wir in diesem Kapitel mit vollem Beweis vorf uhren
werden. Da diese Bedingung auch im Falle k = 4 hinreicht, bedeutet die L oung
des Schulm adchenproblems f ur Viererreihen; jede Parallelklasse bedeutet einen
Sonntagsspaziergang; dies Resultat wurde von Hanani, Ray-Chaudhuri und Wil-
son [1972] bewiesen. Ferner hat man den folgenden asymptotischen Existenzsatz,
der f ur = 1 von Ray-Chaudhuri und Wilson [1973] und f ur beliebige von Lu
[1984] stammt; siehe auch Beth, Jungnickel und Lenz [1999, XI.7] sowie Lee und
Furino [1995].
Satz 1.10 (Asymptotischer Existenzsatz f ur au osbare Blockpl ane). Die notwen-
digen Existenzbedingungen aus Satz 1.8 bzw. Korollar 1.9 sind asymptotisch hin-
reichend. Genauer: F ur beliebige nat urliche Zahlen k 3 und gibt es eine
nat urliche Zahl v
0
= v
0
(k, ), so da f ur jedes v v
0
, das die Kongruenzen (1.7)
(bzw. f ur = 1 (1.8)) erf ullt, ein au osbarer (v, k, )-Blockplan existiert. 2
214 X Blockpl ane
Nat urlich gibt es auch notwendige Existenzbedingungen f ur PBDs; hierzu die
folgende

Ubung 1.11. Man zeige, da die Existenz eines (v, K, )-PBDs die Kongruenzen
(v 1) 0 mod (1.9)
v(v 1) 0 mod (1.10)
impliziert, wobei und wie folgt deniert sind:
= ggT{k 1 [ k K], (1.11)
= ggT{k(k 1) [ k K]. (1.12)
Schlielich beweisen wir noch die folgende fundamentale Ungleichung, die
f ur Blockpl ane von Fisher [1940] und f ur allgemeine PBDs von Majumdar [1953]
stammt; unser Beweis ist Lenz [1983] entnommen. Wir ben otigen in diesemBeweis
die Inzidenzmatrix eines PBDs, die man ganz analog zum Fall projektiver Ebenen
(siehe Denition IX.2.3) erkl art.
Satz 1.12 (Fisher-Ungleichung). Sei = (V, B) ein(v, K, )-PBDmit b Bl ocken
und v > max K; es gebe also keinen Block, der alle Punkte enth alt. Dann gilt
(1.13) b v.
Beweis. Sei Aeine Inzidenzmatrix f ur , wobei die Punkte als p
1
, . . . , p
v
numeriert
seien. Wir bezeichnen die Anzahl der Bl ocke durch p
i
mit r
i
und erhalten ahnlich
wie in Lemma IX.2.4
AA
T
= diag(r
1
, . . . , r
v
) J.
Nun gilt r
i
> f ur alle i, da sonst die = r
i
Bl ocke durch p
i
jeweils alle Punkte
enthalten m uten, im Widerspruch zur Voraussetzung; somit ist diag(r
1
, . . . , r
v
)
eine positiv denite Matrix ( uber R). Da J eine positiv semidenite Matrix ist,
mu die (v v)-Matrix AA
T
als Summe dieser beiden Matrizen positiv denit,
insbesondere also invertierbar sein. Dies ist aber nur m oglich, wenn die (v b)-
Matrix A Rang v hat, womit sich unmittelbar b v ergibt. 2
Wie h aug in der Mathematik, ist der Fall der Gleichheit in Ungleichung (1.13)
von besonderem Interesse. Man nennt einen (v, k, )-Blockplan mit b = v einen
symmetrischen Blockplan. Die prominentesten Beispiele sind die projektiven Ebe-
nen und die aus den projektiven R aumen gewonnenen Blockpl ane PG
n1
(n, q).
Wir werden symmetrische Blockpl ane im n achsten Kapitel n aher untersuchen und
dann auch weitere Beispiele kennenlernen. In diesem Zusammenhang noch eine
X.2 Direkte Konstruktionen 215

Ubung 1.13. Man zeige, da (f ur n 2) die (n


2
n 1, n 1, 1)-Blockpl ane
genau die projektiven Ebenen der Ordnung n und die (n
2
, n, 1)-Blockpl ane genau
die afnen Ebenen der Ordnung n sind.
Schlielich noch ein weiteres Resultat, das es oft erlaubt, die Existenz

kleiner
PBDs mit = 1 auszuschlieem:
Lemma 1.14. Sei = (V, B) ein (v, K, 1)-PBD mit v > max K; es gebe also
keinen Block, der alle Punkte enth alt. Wir bezeichnen mit k die kleinste M achtigkeit
eines Blocks von . Dann gilt f ur die M achtigkeit eines beliebigen Blocks B die
Ungleichung
(1.14) [B[ (v 1)/(k 1).
Beweis. Sei p ein beliebiger Punkt p / B. Dann bestimmt jeder Punkt q B
einen (eindeutigen) Block pq, der wenigstens k 1 Punkte ,= p enthalten mu.
Wegen = 1 k onnen sich zwei Bl ocke dieser Art nur im Punkt p schneiden. Das
liefert bereits die Existenz von mindestens [B[(k 1) 1 Punkten, woraus 1.14
unmittelbar folgt. 2

Ubung 1.15. Man weise nach, da es weder ein (6, {3, 4], 1)-PBD noch ein
(v, {3, 4, 5], 1)-PBD mit v = 6 oder v = 8 geben kann.
2 Direkte Konstruktionen
In diesem Abschnitt wollen wir eine F ulle von konkreten Beispielen f ur (teils
au osbare) Blockpl ane kennenlernen. Wir verfolgen damit einen doppelten Zweck:
Der Leser soll in die Praxis des Konstruierens von Blockpl anen eingef uhrt
werden.
Wir wollen einen Beispielfundus anlegen, auf den wir sp ater bei allgemeinen
Konstruktionen zur uckgreifen k onnen.
Die wichtigsten direkten Konstruktionen verwenden geeignete Gruppen, analog
zur Konstruktion von lateinischen Quadraten bzw. orthogonalen Arrays mittels
Differenzmatrizen in III.5. Dazu sei im folgenden G stets eine endliche, additiv
geschriebene Gruppe; in den meisten wichtigen Anwendungen die man in groer
Zahl zusammen mit weiteren Varianten der hier vorgestellten Methoden bei Beth,
Jungnickel und Lenz [1999] ndet ist G dabei eine abelsche Gruppe. Wir geben
nun die
216 X Blockpl ane
Denition 2.1. Sei D = (D
1
, . . . , D
t
) eine Familie von k-Teilmengen einer ad-
ditiv geschriebenen Gruppe G der Ordnung v, die die folgende Bedingung erf ullt:
(2.1)
_
d d
/
[ d, d
/
D
i
f ur ein i {1, . . . , t ], d ,= d
/
_
= (G {0]),
4
d. h., jedes Element ,= 0 von G tritt genau -mal als Differenz von Elementen aus
einem der Basisbl ocke D
i
auf. Dann heit D eine (v, k, )-Differenzfamilie in G.
Im Fall t = 1 nennt man D = D
1
eine (v, k, )-Differenzmenge. D heit zyklisch
bzw. abelsch, wenn G die entsprechende Eigenschaft hat.
Aus D bilden wir die Inzidenzstruktur = (G, B) mit
B = (D
i
g [ i = 1, . . . , t, g G),
wobei nat urlich D
i
g = {dg [ d D
i
] sei; diese Struktur heit die Entwicklung
von D und wird mit dev D (f ur development) bezeichnet.
5

Ubung 2.2. Man zeige, da eine (v, k, )-Differenzfamilie nur existieren kann,
wenn die Bedingung
(2.2) (v 1) 0 mod k(k 1)
erf ullt ist.
Beispiel 2.3. Die Teilmenge {0, 1, 3] Z
7
ist eine (7,3,1)-Differenzmenge und
es gilt dev D = PG(2, 2), siehe Beispiel 1.3. Ein weiteres Beispiel: Die Menge
D = {3, 6, 7, 12, 14] Z
21
ist eine (21,5,1)-Differenzmenge. Derartige Aussa-
gen veriziert man bequem, indem man die Differenzen in einem Dreiecksschema
tabellarisch auistet, hier etwa so:
3 6 7 12 14
3 1 5 2
4 6 7
9 8
10
Die Entwicklung dieser Differenzmenge ist ein symmetrischer (21,5,1)-Blockplan,
also nach

Ubung 1.13 eine projektive Ebene der Ordnung 4; das folgt aus dem
allgemeinen
4
Die hier verwendete Schreibweise f ur Multimengen sollte zwar auch ohne explizite Denition
klar sein, aber sicher ist sicher: Wir verwenden runde Klammern f ur Multimengen, also Familien von
Elementen (anstelle der bei Mengen ublichen Mengenklammern); mit cX wird bei gegebener Menge
X eine Multimenge bezeichnet, die jedes Element von X mit Vielfachheit c enth alt.
5
Man beachte, da diese Denition wiederholte Bl ocke erlaubt, vergleiche Funote 3.
X.2 Direkte Konstruktionen 217
Satz 2.4. Sei Deine (v, k, )-Differenzfamilie in einer abelschen Gruppe G. Dann
ist dev D ein (v, k, )-Blockplan.
Beweis. Seien p, q G zwei verschiedene Punkte. Nach Denition von dev D
sind die Bl ocke durch p und q genau die D
i
g mit p = d g und q = d
/
g
f ur geeignete d, d
/
D
i
(f ur ein passendes i), was zu
p q = (d g) (d
/
g) = d d
/
und p = d g
f ur geeignete d, d
/
D
i
aquivalent ist. Die Anzahl der Verbindungsbl ocke von
p und q ist also die Anzahl der Differenzdarstellungen des Gruppenelementes
d d
/
,= 0 durch die Basisbl ocke D
i
und betr agt somit nach Denition einer
Differenzfamilie genau . 2
Wir notieren den folgenden besonders wichtigen Spezialfall von Satz 2.4 sepa-
rat:
Korollar 2.5. Sei D eine (v, k, )-Differenzmenge in einer abelschen Gruppe G.
Dann ist dev D ein symmetrischer (v, k, )-Blockplan.
Beweis. Trivialerweise ist die Anzahl b der (verschiedenen) Bl ocke D g hier
h ochstens v, und nach Satz 1.12 mu dann Gleichheit gelten. 2
Beispiel 2.6. Wir geben jetzt drei weitere Beispiele f ur Differenzfamilien an; die
zugeh origen Blockpl ane werden wir sp ater noch ben otigen.
(a) Die Basisbl ocke D
1
= {1, 3, 9] und D
2
= 2D
1
= {2, 5, 6] bilden eine
(13,3,1)-Differenzfamilie in Z
13
.
(b) Es sei G = Z
5
Z
5
; statt (x, y) schreiben wir xy. Dann bilden die Basis-
bl ocke D
1
= {00, 01, 10, 22] und D
2
= 2D
1
= {00, 02, 20, 44] eine
(25,4,1)-Differenzfamilie.
(c) Die Basisbl ocke D
1
= {0, 1, 3, 24], D
2
= 10D
1
= {0, 10, 18, 30] und
D
3
= 26D
1
= {0, 4, 26, 32] bilden eine (37,4,1)-Differenzfamilie in Z
37
.
Die Verikation dieser Beispiele sei dem Leser als leichte

Ubung uberlassen. Bei-
spiel (a) ist der Spezialfall q = 13, = 2, = 4 der folgenden allgemeinen
Konstruktion, die auf Bose [1939] zur uckgeht:
Satz 2.7. Es sei q eine Primzahlpotenz mit q 1 mod 6. Dann existiert eine
(q, 3, 1)-Differenzfamilie in der additiven Gruppe G von GF(q).
218 X Blockpl ane
Beweis. Es sei q = 6t 1. Nach Satz III.3.5 ist die multiplikative Gruppe H =
GF(q)

von GF(q) zyklisch; sei ein erzeugendes Element von H. Dann ist
:=
t
ein Element der Ordnung 6, also eine Nullstelle des Polynoms x
6
1
GF(q)[x]. Aus der Zerlegung
x
6
1 = (x
2
x 1)(x
2
x 1)(x 1)(x 1)
sehen wir, da
2
1 = 0 gelten mu; w are n amlich eine Nullstelle eines
der anderen drei Faktoren, so h atte es Ordnung 1, 2 oder 3. Wir setzen nun D =
{1,
2
,
4
]; wegen
2
1 = 0 und
3
= 1 bilden die sechs von diesem
Basisblock bestimmten Differenzen gerade die Nebenklasse U(
2
1) der von
erzeugten Untergruppe U von H. Offenbar ist dann
D = {D
i
[ i = 0, . . . , t 1]
die gew unschte (q, 3, 1)-Differenzfamilie in G, da die
i
(i = 0, . . . , t 1) ein
Repr asentantensystem f ur die Nebenklassen von U bilden. 2
Wir verzichten hier auf weitere allgemeine Konstruktionen f ur Differenzfami-
lien, da wir diese nicht ben otigen werden, wollen aber wenigstens den folgenden
asymptotischen Existenzsatz von Wilson [1972c] erw ahnen, der ein wesentliches
Hilfmittel im Beweis des Satzes 1.7 darstellt:
Satz 2.8 (Asymptotischer Existenzsatz f ur Differenzfamilien). Die notwendige
Existenzbedingung (2.2) ist asymptotisch hinreichend f ur die Existenz von Diffe-
renzfamilien in elementar-abelschen Gruppen. Genauer: F ur beliebige nat urliche
Zahlen k 3 und gibt es eine nat urliche Zahl v
0
= v
0
(k, ), so da f ur jede Prim-
zahlpotenz q v
0
, die die Kongruenz (2.2) erf ullt, eine (v, k, )-Differenzfamilie
in der additiven Gruppe von GF(q) existiert. 2
Als n achstes betrachten wir eine Verallgemeinerung von Differenzfamilien,
n amlich die Methode der reinen und gemischten Differenzen von Bose [1939].
Denition 2.9. Sei G eine endliche abelsche Gruppe, deren Verkn upfung wir als
Addition schreiben; sei n eine nat urliche Zahl; zus atzlich verwenden wir das Sym-
bol . Wir bilden die Mengen
V
n
G
= G{1, . . . , n] und V
n
G
= (G{1, . . . , n]) {].
F ur jedes g G lassen wir g auf diesen beiden Mengen gem a
(x, j) g := (x g, j) f ur x G, j = 1, . . . , n und g :=
X.2 Direkte Konstruktionen 219
operieren. F ur eine Teilmenge B von V
n
G
oder V
n
G
sei dann
B g = {b g : b B].
Es sei nun D = (D
1
, . . . , D
t
) eine Familie von Teilmengen von V = V
n
G
bzw.
V = V
n
G
. Analog zu Denition 2.1 bilden wir aus D die Inzidenzstruktur =
(V, B) mit
B = (D
i
g [ i = 1, . . . , t, g G),
die wieder die Entwicklung von D heit und mit dev D (f ur development) bezeich-
net wird.
6
Der Beweis der beiden folgenden S atze von Bose [1939] sei dem Leser als
leichte, aber lehrreiche

Ubung uberlassen.
Satz 2.10. Sei G eine endliche abelsche Gruppe der Ordnung s, und sei ferner
D = (D
1
, . . . , D
t
) eine Familie von Teilmengen von V = V
n
G
. Die Entwicklung
dev D ist genau dann ein (ns, K, )-PBD, wenn die folgenden Bedingungen erf ullt
sind:
(1) Jeder Basisblock D
i
D hat M achtigkeit k
i
K (i = 1, . . . , t ).
(2) F ur jedes j = 1, . . . , n gilt: Zu jedem x ,= 0 aus G gibt es genau Tripel
(g, h, D
l
) G G D mit (g, j), (h, j) D
l
und x = g h (reine
Differenzen).
(3) F ur beliebige i, j = 1, . . . , n mit i ,= j gilt: Zu jedem x G (einschlie-
lich 0) gibt es genau Tripel (g, h, D
l
) GGD mit (g, i), (h, j) D
l
und x = g h (gemischte Differenzen). 2
Satz 2.11. Sei G eine endliche abelsche Gruppe der Ordnung s, weiterhin
D = (D
1
, . . . , D
t
) eine Familie von Teilmengen von V = V
n
G
. Die Entwick-
lung dev D ist genau dann ein (ns 1, K, )-PBD, wenn die Bedingungen aus
Satz 2.10 und zus atzlich
(4) F ur jedes j = 1, . . . , n gilt: Es gibt genau Paare (g, D
l
) G D mit
(g, j), D
l
erf ullt sind. 2
Beispiel 2.12. Die Entwicklung der beiden Basisbl ocke D
1
= {0, 1, 3] und D
2
=
{, 0, 1] in Z
5
ist ein (6,3,2)-Blockplan; das folgt aus Satz 2.11 f ur n = 1.
6
Auch hier sind wiederholte Bl ocke m oglich. Statt (g, j) wird in der Literatur auch oft die k urzere
Schreibweise g
j
verwendet.
220 X Blockpl ane
Die beiden folgenden allgemeinen S atze stammen von Ray-Chaudhuri undWil-
son [1972] und werden sp ater sehr n utzlich sein.
Satz 2.13. Sei q eine Primzahlpotenz mit q 1 mod 6. Dann existiert ein au os-
barer (3q, 3, 1)-Blockplan.
Beweis. Wir verwenden die im Beweis von Satz 2.7 eingef uhrten Bezeichnungen;
insbesondere sei D die dort konstruierte (q, 3, 1)-Differenzfamilie in der additiven
Gruppe Gvon GF(q), q = 6t 1. Wir werden imfolgenden die Tatsache ausnutzen,
da die t Basisbl ocke in D offenbar paarweise disjunkt sind und da 0 in keinem
dieser Bl ocke liegt, die wir ab jetzt mit D
i
= D
i
(i = 0, . . . , t 1) bezeichnen.
Wir w ahlen nun V = V
3
G
sowie drei verschiedene Elemente u
1
, u
2
, u
3
G {0]
und denieren wie folgt eine Kollektion E von 9t 1 Basisbl ocken:
A = {(0, 1), (0, 2), (0, 3)];
B
j
i
= u
i
D
j
{i] f ur i = 1, 2, 3; j = 0, 1, . . . , t 1;
C
x
= {(xu
1
, 1), (xu
2
, 2), (xu
3
, 3)] f ur x G {0],
wobei wir unter M {i] f ur M G die Menge {(m, i) [ m M] verstehen.
Man beachte, da dies die korrekte Anzahl von Basisbl ocken ist, da ein (3q, 3, 1)-
Blockplan f ur q = 6t 1 nach (1.4) b = (9t 1)q Bl ocke hat.
Wir k onnen nun leicht die Bedingungen aus Satz 2.10 verizieren: Da D eine
(q, 3, 1)-Differenzfamilie in G ist, liefern die je t Basisbl ocke
u
i
D
j
{i] mit j = 0, 1, . . . , t 1
f ur i = 1, 2, 3 gerade die reinen Differenzen g G {0] und tragen keine ge-
mischten Differenzen bei. F ur i, j = 1, 2, 3 mit i ,= j erh alt man die gemischten
Differenzen g G{0] aus den C
x
, da wegen u
i
,= u
j
die Elemente x(u
i
u
j
) mit
x ebenfalls G{0] durchlaufen; schlielich ergibt sich die noch fehlende gemischte
Differenz 0 aus A.
Somit ist dev E nach Satz 2.10 ein (3q, q, 1)-Blockplan; es bleibt zu zeigen,
da dieser Blockplan au osbar ist. Eine erste Parallelklasse P
0
ist durch A, alle
Bl ocke
B
j
i
= u
i
D
j
{i] f ur i = 1, 2, 3; j = 0, 1, . . . , t 1
sowie die Bl ocke C
x
gegeben, wobei x diejenigen Elemente von G{0] durchl auft,
die in keinem der Basisbl ocke D
j
(j = 1, . . . , t ) vorkommen. Hieraus erhalten
wir q = 6t 1 Parallelklassen
P
g
=
g
(P
0
) mit
g
: (x, i) . (x g, i) f ur g G.
X.2 Direkte Konstruktionen 221
Schlielich k onnen wir die restlichen Bl ocke in die 3t Parallelklassen
Q
x
= {
g
(C
x
) [ g G] mit x D
1
D
t
zerlegen. Wir uberlassen es dem Leser, diese Konstruktion in Einzelheiten nachzu-
pr ufen. 2
Satz 2.14. Sei q eine Primzahlpotenz mit q 1 mod 6. Dann existiert ein au os-
barer (2q 1, 3, 1)-Blockplan.
Beweis. Wir verwenden die im Beweis des Satzes 2.7 eingef uhrten Bezeichnungen
und setzen := (1
2
)/2, also
2
= 1 . Nun w ahlen wir V = V
2
G
und
denieren wie folgt eine Kollektion E von 4t 1 Basisbl ocken:
A
l
= {(
l
, 2), (
2

l
, 2), (
l
, 1)],
B
l
= A
l

2
,
C
l
= A
l

4
,
D
l
= {(
l
, 1), (
l

2
, 1), (
l

4
, 1)],
E = {(0, 1), (0, 2), ]
f ur l = 0, . . . , t 1. Man beachte wieder, da dies die korrekte Anzahl von Basis-
bl ocken ist, da ein (2q 1, 3, 1)-Blockplan f ur q = 6t 1 nach (1.4) b = (4t 1)q
Bl ocke hat. Wir uberlassen es dem Leser, die Bedingungen aus Satz 2.11 zu veri-
zieren; man verwendet dabei wieder
3
= 1 sowie die Tatsache, da die Menge
D = {1,
2
,
4
] als Differenzen gerade die Nebenklasse U(
2
1) der von
erzeugten Untergruppe U von H liefert.
Damit ist dev E ein (2q 1, 3, 1)-Blockplan; es bleibt zu zeigen, da dieser
Blockplan au osbar ist. Die 4t 1 Bl ocke A
l
, B
l
, C
l
, D
l
(l = 0, . . . , t 1) und
E sind paarweise disjunkt und bilden somit eine Parallelklasse P. Wie im Beweis
von Satz 2.13 sind dann die Bilder
g
(P) von P unter den g G Parallelklassen;
das liefert diesmal bereits die insgesamt ben otigten r = 6t 1 Parallelklassen. 2
Zahlreiche weitere Beispiele und S atze uber Differenzfamilien insbesondere
einen Beweis f ur Satz 2.8 sowie zur Methode der reinen und gemischten Dif-
ferenzen ndet man in den Kapiteln VII und VIII von Beth, Jungnickel und Lenz
[1999].
Schlielich geben wir eine einfache Methode an, die es gestattet, aus PBDs
mit Parallelklassen insbesondere aus au osbaren Blockpl anen direkt interes-
sante weitere PBDs herzustellen. Der Beweis sei dem Leser als einfache

Ubung
uberlassen.
222 X Blockpl ane
Satz 2.15. Sei (V, B) ein (v, K, 1)-PBD mit t paarweise disjunkten Parallelklas-
sen P
1
P
t
. Ferner seien
1
, . . . ,
t
paarweise verschiedene, nicht in V
enthaltene Elemente. Wir setzen V

= V {
1
, . . . ,
t
] und
B

=
_
B
t
_
u=1
P
u
_

t
_
u=1
{B {
u
] [ B P
u
] {B

= {
1
, . . . ,
t
]].
Wenn die M achtigkeiten aller Bl ocke in den P
i
in L K enthalten sind, ist
(V

, B

) ein (v t, K(L1) {t ], 1)-PBD. Insbesondere sei (V, B) au osbar


(womit die Replikationszahl r konstant ist ); w ahlt man dann alle r Parallelklassen,
so ergibt sich ein (v r, (K 1) {r], 1)-PBD. 2
Beispiel 2.16. Wir konstruieren mit Satz 2.15 zwei PBDs, die wir sp ater ben otigen
werden. Dazu w ahlen wir = (V, B) als einen au osbaren (15,3,1)-Blockplan,
siehe Beispiel 1.2, und verwenden drei bzw. vier der sieben Parallelklassen von .
Das Resultat sind dann (v, {3, 4], 1)-PBDs f ur v = 18 und v = 19.
Beispiel 2.17. Die Entwicklung der drei Basisbl ocke D
1
= {, 0], D
2
= {1, 4]
und D
3
= {2, 3] in Z
5
ist ein (6,2,1)-Blockplan ; das folgt wieder aus Satz 2.11
f ur n = 1. Da D
1
, D
2
, D
3
eine Zerlegung der Punktmenge also eine Parallelklas-
se bilden, ist dieser Blockplan offensichtlich au osbar. Die Einf uhrung von f unf
unendlichen Punkten nach Satz 2.15 ergibt dann ein (11, {3, 5], 1)-PBD.

Ubung 2.18. Ein (v, 2, 1)-Blockplan ist nat urlich nichts anderes als der vollst andi-
ge GraphK
v
auf v Punkten, seine Existenz ist alsotrivial. Die explizite Konstruktion
in Beispiel 2.17 zeigt jedoch, da der K
6
au osbar ist, also in graphentheoretischer
Sprechweise eine 1-Faktorisierung besitzt, vgl.

Ubung II.2.3. Man verallgemeinere
dieses Beispiel, um die Existenz einer 1-Faktorisierung des K
2n
f ur alle n N
nachzuweisen.
3 GDDs
In diesem Abschnitt betrachten wir einen weiteren Typus von Inzidenzstrukturen,
der mit den bisher betrachteten Klassen eng zusammenh angt und f ur rekursive
Konstruktionen ebenfalls sehr hilfreich ist.
Denition 3.1. Eine endliche Inzidenzstruktur = (V, B, G, ) nennt man
(v, K, G, )-GDD (f ur group divisible design), wobei K, G N sind, wenn
alle Bl ocke M achtigkeit aus K haben;
X.3 GDDs 223
G eine Zerlegung von V in Punktklassen
7
ist, die s amtlich M achtigkeit aus
G haben;
keine zwei Punkte in derselben Punktklasse durch einen Block verbunden
sind;
es f ur je zwei Punkte p, q V, die zu verschiedenen Punktklassen geh oren,
genau Bl ocke B mit p, q B gibt.
Ist dabei K eine 1-elementige Menge, etwa K = {k], so schreibt man einfach k
statt {k], und entsprechend f ur G = {g]. Wenn es mindestens drei Punktklassen
gibt und zus atzlich
jeder Block jede Punktklasse (in einem notwendigerweise eindeutig be-
stimmten Punkt) schneidet,
so spricht man von einem Transversalplan (kurz: TD f ur transversal design).
Eine Menge P B heit wieder eine Parallelklasse, wenn die Bl ocke aus P
eine Zerlegung der Punktemenge V bilden. Man nennt au osbar, wenn man die
Blockmenge B disjunkt in Parallelklassen zerlegen kann.

Ubung 3.2. Sei (V, B, G, ) ein (v, k, g, 1)-GDD. Man zeige, da es eine nat urli-
che Zahl r gibt (die sogenannte Replikationszahl des GDDs), so da jeder Punkt
auf genau r Bl ocken liegt. Setzt man uberdies [B[ = b, so gelten
(v g) = r(k 1) (3.1)
v(v g) = bk(k 1). (3.2)

Ubung 3.3. Man zeige, da alle Bl ocke eines Transversalplans dieselbe M achtig-
keit habenunddaauchalle Punktklassengleichm achtigsind. DieTransversalpl ane
sind also genau die (kg, k, g, )-GDDs; wir werden stattdessen wie Beth, Jung-
nickel und Lenz [1999] die k urzere Notation TD

(k, g) und im Falle = 1


einfach TD(k, g) verwenden.
Wir zeigen nun, da bestimmte Klassen von GDDs zu uns bereits bekannten
Objekten aquivalent sind; f ur manche Zwecke wird aber der GDD-Standpunkt viel
praktischer sein. Der erste Zusammenhang dieser Art ist eher trivial, wogegen das
darauf folgende Resultat schon interessanter ist.
7
In der englischsprachigen Literatur werden die Punktklassen meist als

groups bezeichnet; um
Verwechslungen mit demalgebraischen Gruppenbegriff zu vermeiden, w ahlen wir statt einer w ortlichen

Ubersetzung den ebenfalls ublichen Term

Punktklasse.
224 X Blockpl ane
Lemma 3.4. Sei (V, B, G, ) ein (v, K, G, 1)-GDD. Dann ist (V, B G, ) ein
(v, KG, 1)-PBDmit einer Parallelklasse G, deren Bl ocke M achtigkeit inGhaben.
Umgekehrt sei (V, B) ein (v, K, 1)-PBD mit einer Parallelklasse G, deren Bl ocke
M achtigkeit in G K haben; dann ist (V, B G, ) ein (v, K, G, 1)-GDD. 2
Lemma 3.5. Die Existenz eines (v, k, 1)-Blockplans ist aquivalent zu der eines
(v 1, k, k 1, 1)-GDD.
Beweis. Sei ein (v, k, 1)-Blockplan. Wenn wir einen Punkt p aus entfernen,
verlieren die Bl ocke durch p jeweils einen Punkt und werden in dem entstehenden
PBD zu einer Parallelklasse G. Wir sehen nun wie in Lemma 3.4 G als Menge
von Punktklassen an und erhalten so das gew unschte (v 1, k, k 1, 1)-GDD.
Ist umgekehrt ein (v1, k, k1, 1)-GDDgegeben, fassen wir die Punktklas-
sen als eine Parallelklasse von Bl ocken auf und wenden auf das resultierende PBD
Lemma 2.15 mit t = 1 an, um den gew unschten (v, k, 1)-Blockplan zu erhalten. 2
Besonders wichtig und hilfreich ist der folgende Zusammenhang zu den ortho-
gonalen Arrays aus Kap. III:
Lemma 3.6. Die Existenz eines (au osbaren) orthogonalen Arrays OA(k, n) ist
aquivalent zu der eines (au osbaren) TD(k, n).
Beweis. Sei = (V, B, G, ) ein TD(k, n). Wir setzen S = {1, . . . , n] und nume-
rieren die n Elemente in jeder der k Punktklassen P
1
, . . . , P
k
von beliebig mit
den Elementen in S, etwa als
P
i
= {p
(i)
1
, . . . , p
(i)
n
] f ur i = 1, . . . , n.
Nun denieren wir eine Abbildung O : G B S durch
O(P
i
, B) = s P
i
B = {p
(i)
s
];
das ist sinnvoll, weil jede Punktklasse jeden Block in genau einem Punkt schnei-
det. Da je zwei Punkte p
(i)
s
P
i
und p
(j)
t
P
j
f ur i ,= j auf genau einem Block
liegen, ergibt sich unmittelbar, da O ein OA(k, n) ist. Die Umkehrung wird ahn-
lich bewiesen und sei dem Leser uberlassen. Schlielich sind Parallelklassen und
Au osbarkeit von orthogonalenArrays bzw. Transversalpl anen so deniert worden,
da sie sich in beiden F allen entsprechen. 2
Mittels Lemma 3.6 k onnen wir nun einige Ergebnisse aus Kap. III in die Sprache
der TDs ubersetzen; wir verwenden dabei die S atze III.2.8, III.4.3, III.5.4 und
X.3 GDDs 225
III.6.3 sowie die Beispiele aus (III.5.2) und (III.5.4). Damit ergibt sich das folgende
Resultat, wobei wir die Notation
TD(k) = {n N [ TD(k, n)]
verwenden.
Korollar 3.7. Ein au osbares TD(k, n) existiert genau dann, wenn n TD(k 1)
gilt. Man hat:
q TD(q 1) f ur Primzahlpotenzen q; (3.3)
m, n TD(k) = mn TD(k); (3.4)
n TD(k) f ur k = min{p
s
1
1
1, . . . , p
s
m
m
1], wobei n = p
s
1
1
. . . p
s
m
m
(3.5)
mit paarweise verschiedenen Primzahlen p
1
, . . . , p
m
gelte;
TD(4) = N {2, 6]; (3.6)
7 TD(12), 5 TD(14), 6 TD(15). (3.7)
2
Beispiel 3.8. Wir ben otigen sp ater ein (29, {4, 8], 1)-PBD. Nun existiert ein
(28, 4, 7, 1)-GDD, wegen 7 TD(4) und

Ubung 3.3. Nach Lemma 3.4 ist dies
dasselbe wie ein (28, {4, 7], 1)-PBDmit einer Parallelklasse G, die aus den Bl ocken
der M achtigkeit 7 besteht. Das gew unschte PBDergibt sich durch Einf uhrung eines
unendlichen Punktes, siehe Satz 2.15.
Dieselbe Argumentation ergibt das folgende allgemeine Resultat:
Lemma 3.9. Es gelte n TD(k). Dann gibt es ein (kn 1, {k, n 1], 1)-PBD. 2
Wir geben schlielich eine weitere, ebenfalls sehr einfache Konstruktion von
PBDs aus Transversalpl anen an, die dennoch von groer Bedeutung ist:
Lemma 3.10. Sei K N und es gelte k, k 1, . . . , k n K. Wenn es ein
T D(k n, g) gibt, so existiert f ur beliebige g
i
mit 0 g
i
g (i = 1, . . . , n) ein
(kg g
1
g
n
, K, {g, g
1
, . . . , g
n
], 1) GDD,
also auch ein (kg g
1
g
n
, K {g, g
1
, . . . , g
n
], 1)-PBD.
Beweis. Man entfernt g g
1
, . . . , g g
n
Punkte aus den letzten n Punktklassen
eines TD(kn, g), umdas gew unschte GDDzu erhalten; danach wendet man noch
Lemma 3.4 an. 2
226 X Blockpl ane
4 Relative Differenzfamilien
In diesem kurzen Abschnitt f uhren wir eine Variante des Begriffs der Differenzfa-
milie ein, die auf GDDs f uhrt:
Denition 4.1. Sei D = (D
1
, . . . , D
t
) eine Familie von k-Teilmengen einer abel-
schen Gruppe G der Ordnung v = mn mit einer Untergruppe U der Ordnung n,
die die folgende Bedingung erf ullt:
(4.1)
_
d d
/
[ d, d
/
D
i
f ur ein i {1, . . . , t ], d ,= d
/
_
= (G U),
d. h., jedes Element von G U tritt genau -mal als Differenz von Elementen aus
einem der Basisbl ocke D
i
auf. Dann heit D eine relative (m, n, k, )-Differenz-
familie in G bez uglich der Untergruppe U; im Fall t = 1 nennt man D = D
1
eine relative (m, n, k, )-Differenzmenge (kurz: RDS f ur relative difference set).
Da die Elemente ,= 0 in U keine Differenzdarstellung besitzen, wird U auch als
die verbotene Untergruppe bezeichnet.
Beispiel 4.2. Wir geben einige Beispiele f ur relative Differenzmengen an:
(a) {0, 1, 3] ist ein (4, 2, 3, 1)-RDS in Z
8
bez uglich U = {0, 4].
(b) {(0, 0), (1, 1), (2, 1)] ist ein (3, 3, 3, 1)-RDS in Z
3
Z
3
bez uglich U =
{0] Z
3
.
(c) {(0, 0), (1, 0), (0, 1), (3, 3)] ist ein (4, 4, 4, 1)-RDS in Z
4
Z
4
bez uglich
U = Z
2
Z
2
.

Ubung 4.3. Sei q eine Primzahlpotenz; wir verwenden K = GF(q), um eine neue
Verkn upfung auf K K zu erkl aren:
(4.2) (a, b) (a
/
, b
/
) = (a a
/
, b b
/
aa
/
).
Man zeige, da K K mit der Verkn upfung (4.2) zu einer abelschen Gruppe G
wird und da D = {(x, x) [ x K] ein (q, q, q, 1)-RDS in G ist. Zur geometri-
schen Bedeutung dieser relativen Differenzmengen verweisen wir auf de Resmini,
Ghinelli und Jungnickel [2002] sowie die dort zitierte Literatur.
Man erh alt nun leicht das folgende Analogon von Satz 2.4:
Satz 4.4. Sei D eine relative (m, n, k, )-Differenzfamilie in einer abelschen
Gruppe G der Ordnung v = mn bez uglich der verbotenen Untergruppe U der
Ordnung n. Dann ist dev D ein (mn, k, n, )-GDD, dessen Punktklassen gerade
die Nebenklassen von U sind. 2
X.4 Relative Differenzfamilien 227
Wir werden sp ater noch zwei weitere Anfangsbeispiele f ur unsere rekursiven
Konstruktionenben otigen, die wir jetzt mit relativenDifferenzfamilienkonstruieren
werden; das zweite dieser Beispiele stammt von Brouwer [1979].
Beispiel 4.5. Es sei G = Z
3
Z
3
Z
3
; statt (x, y, z) schreiben wir xyz. Dann
liefern die Basisbl ocke
D
1
= {000, 020, 111, 211] und D
2
= {000, 102, 012, 110]
gerade die 24 Elemente in GU mit U = {000, 001, 002] als Differenzen, weswe-
gen dev{D
1
, D
2
] nach Satz 4.4 ein (27, 4, 3, 1)-GDD mit den neun Punktklassen
U xy0 (x, y Z
3
) ist. Indem wir die Punktklassen als Bl ocke ansehen, erhalten
wir ein (27, {3, 4], 1)-PBD, in dem die Bl ocke der L ange 3 eine Parallelklasse P
bilden. Wir f ugen nun zu G einen neuen Punkt hinzu und adjungieren zu
den Bl ocken in P, die damit ebenfalls die L ange 4 erhalten. Das Resultat ist nach
Satz 2.15 ein (28,4,1)-Blockplan.
Beispiel 4.6. Es sei G = Z
9
Z
3
; statt (x, y) schreiben wir xy. Dann liefern die
Basisbl ocke
D
1
= {00, 11, 20, 41], D
2
= {00, 10, 42] und D
3
= {00, 22, 50]
gerade die 24 Elemente in G U mit U = {00, 01, 02] als Differenzen, weswegen
dev{D
1
, D
2
, D
3
] analog zu Satz 4.4 ein (27, {3, 4], 3, 1)-GDD mit den neun
Punktklassen U x0 (x Z
9
) ist. Indemwir die Punktklassen als Bl ocke ansehen,
erhalten wir wieder ein (27, {3, 4], 1)-PBD, in dem die Nebenklassen von U eine
Parallelklasse P bilden. Dar uber hinaus kann man aber auch die restlichen 54
Bl ocke der L ange 3 in Parallelklassen zerlegen: Die drei Punkte in einem Block
der Form D
2
x0 (x Z
9
) sind offenbar in verschiedenen Nebenklassen der von
11 erzeugten Untergruppe H der Ordnung 9; damit bilden die neun Bl ocke
(D
2
x0) yz mit yz H
f ur x = 0, 1, 2 drei paarweise disjunkte Parallelklassen. Entsprechend bilden auch
die neun Bl ocke
(D
3
x0) yz mit yz H
/
,
wobei H
/
die von 12 erzeugte Untergruppe der Ordnung 9 sei, f ur x = 0, 1, 2
drei paarweise disjunkte Parallelklassen. Daher k onnen wir Satz 2.15 mit t = 7
anwenden und erhalten ein (34, {4, 7], 1)-PBD. Wir empfehlen dem Leser, die
Einzelheiten dieser Konstruktion zur

Ubung zu uberpr ufen.
228 X Blockpl ane

Ubung 4.7. Es sei G = Z


17
Z
3
; statt (x, y) schreiben wir x
y
. Man zeige, da die
Basisbl ocke
D
1
= {0
0
, 1
0
, 4
0
, 5
1
], D
2
= {0
0
, 2
0
, 8
0
, 11
1
], D
3
= {0
0
, 5
0
, 2
1
, 12
1
],
D
4
= {0
0
, 8
1
, 7
2
], D
5
= {0
0
, 6
1
, 4
2
]
ein(51, 4, 3, 1)-GDDmit PunktklassenUx
0
(x Z
17
) denieren, undverwen-
de dieses GDD ahnlich wie in Beispiel 4.6 zur Konstruktion eines (58, {4, 7], 1)-
PBDs.
Schlielich geben wir noch eine interessante, aber nicht ganz einfache

Ubung
an, deren L osung man beispielsweise bei Jungnickel [1987, Example 3.5] nachlesen
kann.

Ubung 4.8. Die Menge D = {0, 1, 4, 6] ist eine relative (7,2,4,1)-Differenzmenge


in Z
14
. Man zeige, da sich dev D als diejenige Inzidenzstruktur deuten l at, die
man erh alt, wenn man aus der projektiven Ebene der Ordnung 4 eine geeignete
Baer-Unterebene entfernt.
Hinweis: Die sieben Punktklassen entsprechen den Geraden der entfernten Baer-
Unterebene.
5 Der PBD-H ullenoperator
Nachdem wir bisher mit direkten Konstruktionen den ben otigten Vorrat an konkre-
ten Beispielen angelegt haben, spielen wir im Rest dieses Kapitels eine Art Glas-
perlenspiel mit Blockpl anen, au osbaren Blockpl anen, PBDs, GDDs und TDs. Der
Zweck des Spiels besteht darin, aus gegebenen Blockpl anen etc. neue zu konstruie-
ren; man kann die betreffenden Resultate auch als Kompositionss atze ansprechen.
AmSchlu werden wir uber ein Instrumentariumverf ugen, mit dessen Hilfe wir aus
unseremBeispielvorrat gen ugendviele au osbare Blockpl ane konstruierenk onnen,
um das Kirkmansche Schulm adchenproblem vollst andig zu l osen. Mit wesentlich
geringerem Aufwand werden wir zuvor zeigen k onnen, da die notwendigen Exi-
stenzbedingungen f ur (v, k, )-Blockpl ane in den F allen k = 3 sowie = 1 und
k = 4 hinreichend sind.
Denition 5.1. Sei K eine nichtleere Menge von nat urlichen Zahlen. Wir setzen
(5.1) B(K) = {v N [ es gibt ein (v, K, 1)-PBD].
Ist dabei K eine 1-elementige Menge, etwa K = {k], so schreibt man einfach B(k)
statt B({k]). Per Konvention gelte stets 1 B(K).
X.5 Der PBD-H ullenoperator 229
Die Menge B(K) wird als der Abschlu von K bezeichnet; falls B(K) =
K gilt, nennt man K abgeschlossen. Die Abbildung B : K . B(K) heit der
PBD-H ullenoperator. Die Rechtfertigungf ur diese Bezeichnunggebendie trivialen
Beobachtungen
K B(K), (5.2)
K L = B(K) B(L) (5.3)
sowie der folgende Satz.
Satz 5.2 (

breaking up blocks). Aus v B(L) und L B(K) folgt v B(K);


insbesondere gilt
(5.4) B(B(K)) = B(K) f ur alle K N.
Beweis. Sei = (V, B) ein (v, L, 1)-PBD. Nach Voraussetzung k onnen wir auf
jedem Block B B ein ([B[, K, 1)-PBD (B, B
B
) bilden. Dann liefert die Ver-
einigung aller dieser Blockmengen B
B
das gew unschte (v, K, 1)-PBD, n amlich
_
V,

BB
B
B
_
. 2
Der von Wilson [1972a,b] eingef uhrte PBD-H ullenoperator ist das wohl wich-
tigste Werkzeug in der rekursiven Existenztheorie von Blockpl anen und verwand-
ten Strukturen; mit seiner Hilfe ist es m oglich, zahlreiche fr uhere Konstruktionen
wesentlich einfacher darzustellen. Zu den abgeschlossenen Mengen z ahlt beispiels-
weise
TD

(k) = {n N [ es gibt ein TD(k, n) mit einer Parallelklasse];


wir werden dieses Ergebnis hier nicht ben otigen und verweisen etwa auf Beth,
Jungnickel und Lenz [1999, TheoremX.1.1]. Besonders wichtig ist dieAbgeschlos-
senheit der Mengen
(5.5) R
k
= {r N [ es gibt einen ((k 1)r 1, k, 1)-Blockplan],
die wir jetzt mit Hilfe von GDDs beweisen wollen; es wird dabei n utzlich sein,
das Kernst uck des Beweises in dem folgenden, etwas allgemeineren Lemma zu
formulieren.
Lemma 5.3. Wenn es ein (v, R
k
, G, 1)-GDD gibt, dann existiert auch ein
((k 1)v, k, (k 1)G, 1)-GDD.
230 X Blockpl ane
Beweis. Sei = (V, B) ein (v, R
k
, G, 1)-GDD. Wir ersetzen die Punkte p V
durch paarweise disjunkte Mengen G
p
von jeweils k 1 Punkten; so wird aus einer
Punktklasse von der M achtigkeit g Gjeweils eine Punktklasse der M achtigkeit
(k 1)g des zu konstruierenden GDDs entstehen. Nach Voraussetzung gibt es f ur
jeden Block B B, etwa mit M achtigkeit t
B
, einen ((k1)t
B
1, k, 1)-Blockplan,
alsonachLemma 3.5auchein((k1)t
B
, k, k1, 1)-GDD. Wir bildeneinderartiges
GDD
B
, dessen Punktklassen die zu B geh orenden Mengen G
p
sind, etwa

B
=
_
_
pB
G
p
, B
B
, {G
p
[ p B]
_
.
Wir verwenden nun die

Vereinigung aller dieser GDDs


B
, setzen also
=
_
_
pV
G
p
,
_
BB
B
B
,
_
_
pG
G
p
[ G G
__
.
Man uberzeugt sich nun leicht davon, da ein ((k 1)v, k, (k 1)G, 1)-GDD
ist. 2
Satz 5.4. F ur jedes k N gilt B(R
k
) = R
k
.
Beweis. Sei v B(R
k
). Es gibt also ein (v, R
k
, 1)-PBD, was wir auch als ein
(v, R
k
, 1, 1)-GDD mit trivialen Punktklassen der M achtigkeit 1 interpretieren
k onnen. Mit Lemma 5.3 erhalten wir daraus ein ((k 1)v, k, k 1, 1)-GDD und
dann nach Lemma 3.5 einen ((k 1)v 1, k, 1)-Blockplan. Damit gilt wie
behauptet v R
k
. 2
Wir geben ein erstes konkretes Beispiel f ur die Anwendung von Satz 5.4 an und
zeigen
(5.6) 33 B(3).
Die afne Ebene AG(2, 3) impliziert n amlich 9 B(3), also 4 R
3
, und wegen
der afnen Ebene AG(2, 4) folgt 16 B(4) B(R
3
) = R
3
, also die Behauptung.

Ubung 5.5. Man zeige, da die Existenz eines (v, k, g, )-GDDs und eines
TD(k, n) diejenige eines (nv, k, ng, )-GDD implizieren.
Hinweis: Man interpretiere das gegebene TD nach

Ubung 3.3 als ein (kn, k, n, 1)-
GDD und verwende dieses ahnlich wie im Beweis von Lemma 5.3, um die Punkte
des gegebenen GDDs jeweils durch n Punkte (und damit die alten Punktklassen
der M achtigkeit g durch solche der M achtigkeit ng) zu ersetzen.
X.5 Der PBD-H ullenoperator 231
Beispiel 5.6. Wir konstruieren zwei weitere PBDs, die wir sp ater ben otigen wer-
den. Dazu w ahlen wir einen au osbaren (15,3,1)-Blockplan , siehe Beispiel 1.2,
und f uhren f ur jede der sieben Parallelklassen von einen unendlichen Punkt ein,
siehe Satz 2.15; das Resultat ist ein (22, {4, 7], 1)-PBD.
Mit einer ahnlichen, aber etwas komplizierteren Konstruktion k onnen wir auch
ein (82, {4, 7], 1)-PBD erhalten. Zun achst verschaffen wir uns aus dem (16,4,1)-
Blockplan AG(2, 4) nach Lemma 3.5 ein (15,4,3,1)-GDD; aus diesem sowie ei-
nem nach (3.3) existierenden TD(4, 5) konstruieren wir gem a

Ubung 5.5 ein
(75,4,15,1)-GDD. Nun bilden wir auf jeder der f unf Punktklassen P von einen
au osbaren (15,3,1)-Blockplan
P
, den wir wie zuvor zu einem (22, {4, 7], 1)-
PBD
P
erg anzen k onnen. Wenn wir dabei f ur jede der f unf Wahlen von P diesel-
ben sieben unendlichen Punkte verwenden, ergibt sich insgesamt aus den Bl ocken
von zusammen mit den Bl ocken der
P
das gesuchte (82, {4, 7], 1)-PBD.
Schlielich bestimmen wir f ur zwei konkrete Mengen K N den Anschlu,
was im n achsten Abschnitt ben otigt werden wird:
Lemma 5.7. Es gilt B({3, 4]) = (3N
0
{1, 3]) {6].
Beweis. Nach

Ubung 1.11 kann ein (v, {3, 4], 1)-PBDnur f ur v(v1) 0 (mod 6)
existieren; dabei gilt v ,= 6 nach

Ubung 1.15. F ur die ubrigen in Frage kommenden
Werte von v verwenden wir die folgende Rekursion f ur L = B({3, 4]), die aus
Lemma 3.10 und (5.4) folgt:
g L TD(4), g
1
L {0] und g
1
g = 3g g
1
L.
Man beachte nun 7 B(3) L(wegen der projektiven Ebene der Ordnung 2) und
g TD(4) f ur g , 2 (mod 4), siehe (3.5)
8
. Die Tabelle
g 3 4 7 9
g
1
0, 1, 3 0, 1, 3, 4 0, 1, 3, 4 0, 1, 3, 4, 7
3g g
1
9, 10, 12 12, 13, 15, 16 21, 22, 24, 25 27, 28, 30, 31, 34
g 12 13
g
1
0, 1, 3, 4, 7, 9 0, 1, 3, 4, 7, . . . , 13
3g g
1
36, 37, . . . , 43, 45 39, . . . , 43, 46, . . . , 52
liefert die m oglichen Werte bis 52 in L, wobei allerdings noch die L ucken 18, 19
und 33 bleiben; diese werden aber durch Beispiel 2.16 und (5.6) beseitigt. Man
sieht nun leicht, da jedes x 0 oder 1 (mod 3) mit x > 52 eine Darstellung der
Form x = 3g g
1
mit g, g
1
0 oder 1 (mod 3), g , 2 (mod 4) und 7 g
1
g
hat, weswegen die Behauptung mit Induktion folgt. 2
8
Auf die Verwendung des st arkeren Resultats (3.6), das wir mit betr achtlichemAufwand in Kapitel
III in der Sprache der lateinischen Quadrate erhalten haben, kann man hier verzichten.
232 X Blockpl ane
Lemma 5.8. Es gilt B({3, 4, 5]) = N {2, 6, 8].
Beweis. Man beachte, da sich aus

Ubung 1.11 keinerlei Einschr ankungen f ur die
Existenz eines (v, {3, 4, 5], 1)-PBDs ergeben. Trivialerweise ist aber v ,= 2, und
v ,= 6, 8 gilt nach

Ubung 1.15. Wegen Lemma 5.7 m ussen wir nur noch
3n 2 B({3, 4, 5]) =: L f ur n N {2]
nachweisen. F ur n = 3 gilt das nach Beispiel 2.17. Aus Lemma 3.10 ergibt sich
3g g
1
g
2
L, falls g L TD(5), g
1
, g
2
L {0] und g
1
, g
2
g gelten,
weswegen die Behauptung unter Verwendung von (3.5) mit Induktion folgt:
Man w ahle g = 4, 5, 7, 9, . . . , 6n 1, 6n 5, . . . 2
6 Blockpl ane mit k 5
Wir zeigen zun achst, da die nach Korollar 1.6 notwendige Existenzbedingung v
1oder 3(mod6) f ur (v, 3, 1)-Blockpl ane, die h augauchals Steiner-Tripelsysteme
9
bezeichnet werden, hinreichend ist:
Satz 6.1. Es gilt B(3) = 6N
0
{1, 3].
Beweis. Mit der Notation aus (5.5) ist die Behauptung aquivalent zu
(6.1) R
3
= 3N
0
{0, 1].
Nun gilt 7, 9, 13 B(3), wegen PG(2, 2), AG(2, 3) und Beispiel 2.6(a); das be-
deutet 3, 4, 6 R
3
. Da R
3
nach Satz 5.4 abgeschlossen ist, folgt die Behauptung
(6.1) unmittelbar aus Lemma 5.7. 2
Ganz ahnlich k onnen wir auch zeigen, da die nach Korollar 1.6 notwendige
Existenzbedingung v 1 oder 4 (mod 12) f ur (v, 4, 1)-Blockpl ane hinreichend
ist:
Satz 6.2. Es gilt B(4) = 12N
0
{1, 4].
Beweis. Mit der Notation aus (5.5) ist die Behauptung aquivalent zu
(6.2) R
4
= 4N
0
{1, 4].
9
Nach Jacob Steiner (1796 1863), der in allgemeineremZusammenhang in Steiner [1853] nach
ihrer Existenz fragte; man beachte, da Kirkman [1847] bereits sechs Jahre zuvor dieses Problem gel ost
hatte!
X.6 Blockpl ane mit k 5 233
Nun gilt 13, 16, 25, 28, 37 B(4), wegen PG(2, 3), AG(2, 4) und wegen der Bei-
spiele 2.6(b) und (c) sowie 4.5; das bedeutet 4, 5, 8, 9, 12 R
4
. Da R
4
nach Satz
5.4 abgeschlossen ist, gen ugt es,
(6.3) B({4, 5, 8, 9, 12]) = 4N {1, 4]
zu zeigen. Dazu gehen wir analog zum Beweis von Lemma 5.7 vor. Nach

Ubung
1.11 kann ein (v, {4, 5, 8, 9, 12], 1)-PBD jedenfalls nur f ur v(v 1) 0 (mod 6)
existieren. F ur diese Werte von v verwenden wir die folgende Rekursion f ur L =
B({4, 5, 8, 9, 12]), die wieder aus Lemma 3.10 und (5.4) folgt:
g L TD(5), g
1
L {0] und g
1
g = 4g g
1
L.
Man beachte nun 13, 28 B(4) L, 29 B({4, 8]) L nach Beispiel 3.8
sowie g TD(5) f ur g 1, 4, 5, 8, 9 (mod 12) sowie g = 12, siehe Korollar
3.7. Die Behauptung folgt dann mit Induktion, indem man die obige Rekursion f ur
g = 4, 5, 8, 9, 12, 12n1, 12n4, 12n5, 12n8 und 12n13 = 12(n1)1
anwendet. Der Leser m oge sich dies in Einzelheiten uberlegen, am bequemsten in
tabellarischer Form wie im Beweis von Lemma 5.7. 2
Mit ahnlichen Methoden kann man auch Blockpl ane mit ,= 1 behandeln. Wir
wollen das exemplarisch f ur Tripelsysteme tun, also f ur (v, 3, )-Blockpl ane, wo
die notwendigen Existenbedingungen sich ebenfalls als hinreichend herausstellen.
Dabei lassen wir jetzt wie in Funote 3 auf S. 216 diskutiert wiederholte Bl ocke
zu. Dann reicht es, die Existenz f ur die F alle {1, 2, 3, 6] zu nachzuweisen,
da die notwendigen Existenzbedingungen aus Korollar 1.6 f ur k = 3 nur von
der Restklasse von modulo 6 abh angen; so kann man beispielsweise den Fall
= 14 dadurch l osen, da man jeweils alle Bl ocke in einem (v, 3, 2)-Blockplan
mit Vielfachheit 7 verwendet.
Als erstes ben otigen wir die folgende Verallgemeinerung von Satz 5.2, die man
ganz analog beweist:
Satz 6.3. F ur jede Teilmenge K N und jedes N ist die Menge
B(K, ) = {v N [ es gibt ein (v, K, )-PBD]
abgeschlossen. 2
Wir gehen nun die noch fehlenden F alle = 2, 3, 6 durch; dabei ergibt sich die
Tatsache, da B(3, ) nicht gr oer als die angegebene Menge sein kann, stets aus
den notwendigen Bedingungen in Korollar 1.6.
Satz 6.4. Es gilt B(3, 2) = 3N
0
{1, 3].
234 X Blockpl ane
Beweis. Trivialerweise gilt 3, 4 B(3, 2). Da B(3, 2) abgeschlossen ist, liefert
Lemma 5.7 zusammen mit Beispiel 2.12 unmittelbar die Behauptung. 2
Satz 6.5. Es gilt B(3, 6) = N {2].
Beweis. Wegen B(3, 2) B(3, 6) gilt 3, 4, 6 B(3, 6). W ahlt man alle 3-Teilmen-
gen einer 5- bzw. einer 8-Menge als Bl ocke, sieht man 5 B(3, 3) B(3, 6) sowie
8 B(3, 6). Da B(3, 6) abgeschlossen ist, folgt die Behauptung aus Lemma 5.8.
2
Der Fall = 3 ist etwas komplizierter; hier ben otigen wir erst noch das folgende
Lemma 6.6. Es gilt B({3, 5]) = 2N 1.
Beweis. Nach

Ubung 1.11 kann ein (v, {3, 5], 1)-PBD nur f ur ungerade v existie-
ren. Wegen Satz 6.1 m ussen wir nur noch den Fall v 5 (mod 6) betrachten.
Sei zun achst v 5 (mod 12), etwa v = 12n 5. Nun gilt 6n 3 B(3),
weswegen es nach Lemma 3.5 ein (6n 2, 3, 2, 1)-GDD gibt. Wir verwenden
dieses GDD zusammen mit einem TD(3, 2) in

Ubung 5.5, um auf die Existenz
eines (12n4, 3, 4, 1)-GDDs zu schlieen. Nach Lemma 3.4 ist dies dasselbe wie
ein (12n 4, {3, 4], 1)-PBD mit einer Parallelklasse G, die von den Bl ocken der
M achtigkeit 4 gebildet wird; das gew unschte (12n 5, {3, 5], 1)-PBD ergibt sich
durch Einf uhrung eines unendlichen Punktes, siehe Satz 2.15.
Schlielich sei v 11 (mod 12), etwa v = 12n 11. Nach

Ubung 2.18
ist der vollst andige Graph K
6n6
ein au osbarer (6n 6, 2, 1)-Blockplan. Wir
f uhren nun 6n 5 unendliche Punkte auf den Parallelklassen dieses Blockplans
ein und erhalten v B({3, 6n 5]). Mit Induktion k onnen wir 6n 5 B({3, 5])
annehmen, woraus die Behauptung folgt, da ja B({3, 5]) abgeschlossen ist. 2
Satz 6.7. Es gilt B(3, 3) = 2N 1.
Beweis. Trivialerweise gilt 3, 5 B(3, 3). Da B(3, 5) abgeschlossen ist, folgt die
Behauptung aus Lemma 6.6. 2
Insgesamt erhalten wir aus den S atzen 6.1, 6.4, 6.5 und 6.7 das folgenden
Resultat von Hanani [1961]:
Satz 6.8. Ein (v, 3, )-Blockplan existiert genau dann, wenn v ,= 2 gilt und einer
der folgenden F alle vorliegt:
v 1 oder 3 (mod 6) f ur 1 oder 5 (mod 6),
v 0 oder 1 (mod 3) f ur 2 oder 4 (mod 6),
X.7 Au osbare Blockpl ane 235
v 1 (mod 2) f ur 3 (mod 6),
v ,= 2 f ur 0 (mod 6).
2
F ur k = 4 und k = 5 ist das Existenzproblem f ur (v, k, )-Blockpl ane durch
die beiden folgenden S atze von Hanani [1961,1972,1975] vollst andig gel ost; einen
Beweis ndet man auch bei Beth, Jungnickel und Lenz [1999, Chapter IX].
Satz 6.9. Ein (v, 4, )-Blockplan existiert genau dann, wenn v ,= 2, 3 gilt und
einer der folgenden F alle vorliegt:
v 1 oder 4 (mod 12) f ur 1 oder 5 (mod 6),
v 1 (mod 3) f ur 2 oder 4 (mod 6),
v 1 oder 4 (mod 4) f ur 3 (mod 6),
v ,= 2, 3 f ur 0 (mod 6).
2
Satz 6.10. Die notwendigen Bedingungen v , {2, 3, 4] und
(v 1) 0 (mod 4)
v(v 1) 0 (mod 20)
f ur die Existenz eines (v, 5, )-Blockplans sind hinreichend, mit der einzigen Aus-
nahme (v, ) = (15, 2). 2
Wir verzichten darauf, die Kongruenzen in Satz 6.10 explizit auszuwerten; die
Bedingungen h angen nat urlich von der Restklasse von modulo 20 ab. Bereits der
Beweis dieses Satzes ist auerordentlich kompliziert; es verwundert daher nicht,
da das Existenzproblemf ur (v, k, )-Blockpl ane f ur kein k 6 vollst andig gel ost
ist. F ur eine

Ubersicht uber die meisten bekannten Resultate verweisen wir auf
IX.12 von Beth, Jungnickel und Lenz [1999] sowie auf Colbourn und Dinitz
[1996].
7 Au osbare Blockpl ane
In disem Abschnitt werden wir au osbare Blockpl ane mit rekursiven Methoden
studieren und insbesondere nachweisen, da die nach Korollar 1.8 notwendige
Existenzbedingung v 3 (mod 6) f ur au osbare (v, 3, 1)-Blockpl ane h aug
auch Kirkman-Tripelsysteme genannt hinreichend ist.
236 X Blockpl ane
Das wichtigste Hilfsmittel f ur die rekursive Konstruktion au osbarer Block-
pl ane ist die Abgeschlossenheit der Mengen
R

k
= {r N [ es gibt einen au osbaren ((k 1)r 1, k, 1)-Blockplan],
die wir jetzt beweisen wollen. Wir ben otigen dazu zun achst ein Hilfsresultat, das
ein Analogon von Lemma 3.5 f ur den au osbaren Fall darstellt.
Seien k, r nat urliche Zahlen. Wir nennen ein (v, {k 1, r], 1)-PBD (V, B) ein
(k, r)-Projektum,
10
wenn v = kr 1 gilt und B aus einemr-Block und sonst lauter
(k 1)-Bl ocken besteht. Man darf sich unter einem(k, r)-Projektum etwas

Ahnli-
ches wie eine um eine r-elementige unendliche Gerade erg anzte projektive Ebene
vorstellen. Was damit genau gemeint ist, sagen Inhalt und Beweis des folgenden
Lemmas, das in der Tat Satz IX.9.3 verallgemeinert.
Lemma 7.1. Seien k, r nat urliche Zahlen. Dann gilt r R

k
genau dann, wenn es
ein (k, r)-Projektum gibt.
Beweis. Sei r R

k
und = (V, B) ein au osbarer ((k1)r 1, k, 1)-Blockplan.
Wir f uhren f ur s amtliche r = (v 1)/(k 1) Parallelklassen von einen unend-
lichen Punkt ein und erhalten nach Satz 2.15 das gew unschte (k, r)-Projektum.
Sei nun umgekehrt (V, B) ein (k, r)-Projektum und B

= {
1
, . . . ,
r
] der
eindeutig bestimmte r-Block. Wir setzen V = V B

. Durch jeden Punkt x V


gehen kr/k = r Bl ocke aus B, was man wie im Beweis von Satz 1.5 sieht; jedes

mu in einem dieser r Bl ocke enthalten sein. Da aber keiner dieser


Bl ocke B

in mehr als einem Punkt schneiden kann, mu jeder von ihnen genau
ein

enthalten; nehmen wir

aus ihm heraus, so entsteht ein in V enthaltener


Block der M achtigkeit k. Die Gesamtheit der so erhaltenen Bl ocke liefert nun einen
au osbaren ((k 1)r 1, k, 1)-Blockplan, bei dem die Einteilung der Bl ocke in
Parallelklassen unmittelbar durch die entfernten Punkte

induziert wird. 2
Satz 7.2. F ur jedes k N gilt B(R

k
) = R

k
.
Beweis. Sei v B(R

k
). Es gibt also ein (v, R

k
, 1)-PBD = (V, B). Nach Lem-
ma 7.1 sind wir fertig, wenn es uns gelingt, ein (k, v)-Projektum zu konstruieren.
Wir w ahlen hierzu ein Element , P und bilden die Punktmenge
V = [V {1, . . . , k]] {].
Sei S B beliebig. Wegen [S[ R

k
gibt es ein (k, [S[)-Projektum
B
, das
o.B.d.A. auf der Punktmenge [S {1, . . . , k]] {] deniert sei. Wir k onnen wei-
terhin annehmen, da der eindeutig bestimmte Block in
B
mit t = [S[ Elementen
10
Diese Terminologie ist nicht allgemein ublich, aber bequem.
X.7 Au osbare Blockpl ane 237
{(a
1
, 1), . . . , (a
t
, 1)] ist, wobei S = {a
1
, . . . , a
t
] sei, und da es sich bei den t durch
gehenden Bl ocken von
B
gerade um die Mengen {(a
i
, 1), . . . , (a
i
, k), ]
(i = 1, . . . , t ) handelt. Mit B
S
bezeichnen wir die Menge der restlichen Bl ocke
aus
B
. Wir setzen nun
C =
_
{(a, 1) [ a V]
_

_
{{(a, 1), . . . , (a, k), ] [ a V]
_

_
SB
B
S
.
Der Leser kann dann leicht uberpr ufen, da (V, C) das gesuchte (k, v)-Projektum
ist. 2
Wir kommen nun zur allgemeinen L osung des Existenzproblems f ur Kirkman-
Tripelsysteme und zeigen den von Ray-Chaudhuri und Wilson [1971] bewiesenen
Satz 7.3. F ur jedes u N gibt es einen au osbaren (6u 3, 3, 1)-Blockplan.
Der Beweis dieses Satzes wird eine gewisse Anstrengung erfordern. Wir bilden
zun achst die Menge
U = {u N [ es gibt einen au osbaren (6u 3, 3, 1)-Blockplan];
unser Satz besagt dann gerade U = N. Wir behandeln erst einmal die kleinsten
F alle im folgenden
Lemma 7.4. Es gilt 1, 2, . . . , 19, 26, 27 U.
Beweis. Wir greifen auf das zuvor bereitgestellte Beispielmaterial und die uns be-
kannten Kompositionss atze zur uck und schreiben die Erledigung der F alle u =
1, . . . , 19, 26, 27 im Folgenden tabellarisch auf, wobei wir ohne weiteren Kom-
mentar die Abgeschlossenheit von R

3
sowie 4, 7 R

3
(was den F allen u = 1 und
u = 2 entspricht) verwenden; damit ist dann der Beweis des Lemmas vollbracht.
2
Zum Beweis von Lemma 7.4.
u 6u 3 Beweismaterial
0 3 trivial
1 9 AG(2, 3), siehe Beispiel 1.3
2 15 Satz 2.14 mit q = 7
3 21 Satz 2.13 mit q = 7
238 X Blockpl ane
4 27 Satz 2.14 mit q = 13
5 33 16 B(4) R

3
nach Satz 6.2
6 39 Satz 2.13 mit q = 13
7 45 22 B({4, 7]) R

3
nach Beispiel 5.6
8 51 Satz 2.14 mit q = 25
9 57 Satz 2.13 mit q = 19
10 63 Satz 2.14 mit q = 31
11 69 34 B({4, 7]) R

3
nach Beispiel 4.6
12 75 Satz 2.13 mit q = 25
13 81 40 B(4) R

3
nach Satz 6.2
14 87 Satz 2.14 mit q = 43
15 93 Satz 2.13 mit q = 31
16 99 Satz 2.14 mit q = 49
17 105 52 B(4) R

3
nach Satz 6.2
18 111 Satz 2.13 mit q = 37
19 117 58 B({4, 7]) R

3
nach

Ubung 4.7
26 159 Satz 2.14 mit q = 79
27 165 82 B({4, 7]) R

3
nach Beispiel 5.6.
Als n achstes beweisenwir denfolgendenKompositionssatz f ur Kirkman-Tripel-
systeme:
Lemma 7.5. Es seien t, q U mit q t gegeben. Wenn es ein TD(5, t ) gibt, so
gilt auch 4t q U.
Beweis. Lemma 3.10 liefert uns die Existenz eines (4t q, {4, 5], {t, q], 1)-GDDs.
Mit 4, 5 R
4
, siehe (6.2), folgt hieraus nach Lemma 5.3 auch die Existenz
eines (3(4t q), 4, {3t, 3q], 1)-GDDs, was nach Lemma 3.4 dasselbe wie ein
(3(4t q), {4, 3t, 3q], 1)-PBDmit einer Parallelklasse Gist, derenBl ocke M achtig-
keit 3t bzw. 3q haben. Durch Einf uhrung eines unendlichen Punktes gem a Satz
2.15 erhalten wir ein (3(4t q) 1, {4, 3t 1, 3q 1], 1)-PBD. Nach Vorausset-
zung gilt 4, 3t 1, 3q 1 R

3
, woraus sich nach Satz 7.2 3(4t q) 1 R

3
ergibt, was gerade 4t q U bedeutet. 2
X.7 Au osbare Blockpl ane 239
Beweis von Satz 7.3. Um U = N zu beweisen, bilden wir
L = {l [ 24l m U f ur m {0, 1, . . . , 23]].
Als erstes zeigen wir l U f ur l = 0, 1, 2. In der folgenden Tabelle sind Werte
u, t, q kombiniert, die nach Lemma 7.5 dieses Resultat liefern, wenn man noch
Lemma 7.4ber ucksichtigt; die Existenz der ben otigtenTDs ist durch(3.3) gesichert.
u t q
20, 21, 22, 23, 24, 25 5 u 4t
28, 29, 30, . . . , 35 7 u 4t
36, . . . , 45 9 u 4t
46, . . . , 55 11 u 4t
56, . . . , 65 13 u 4t
66, . . . , 80 16 u 4t
81, . . . , 95 19 u 4t
Wir k onnen nun mit Induktion l L f ur alle l 3 nachweisen. Hierzu legen
wir als erstes folgende Tabelle an:
u = 4t q t q u = 4t q t q
24l 6l 1 4 24l 12 6l 1 8
24l 1 6l 1 5 26l 13 6l 1 9
24l 2 6l 1 6 24l 14 6l 1 10
24l 3 6l 1 7 24l 15 6l 1 11
24l 4 6l 1 0 24l 16 6l 1 12
24l 5 6l 1 1 24l 17 6l 1 13
24l 6 6l 1 2 24l 18 6l 1 14
24l 7 6l 1 3 24l 19 6l 1 15
24l 8 6l 1 4 24l 20 6l 5 0
24l 9 6l 1 5 24l 21 6l 5 1
24l 10 6l 1 6 24l 22 6l 5 2
24l 11 6l 1 7 24l 23 6l 5 3
Hierbei sind alle vorkommenden t und q nach Induktionsannahme in U. Wir
wenden Satz 7.5 an und m ussen hierzu noch die Existenz eines TD(5, t ) sicherstel-
len. Dies aber leistet (3.5), da eine Zahl t der Form6l 1, 6l 1 oder 6l 5 weder 2
noch 3 als Primfaktor haben kann, weswegen alle in der Primzahlpotenzzerlegung
einer solchen Zahl t auftretenden Faktoren 5 sein m ussen. 2
240 X Blockpl ane
Bemerkung 7.6. Wir haben in unserem Beweis einen beachtlichen Teil des Start-
materials in Lemma 7.4 unter Ausnutzung der Abgeschlossenheit von R

3
sowie
der Tatsache 4, 7 R

3
erhalten; man h atte dies auch noch in einigen weiteren
F allen tun k onnen, in denen wir uns auf die S atze 2.13 bzw. 2.14 bezogen haben.
In der Tat kann eine ahnliche, aber aufwendigere Schluweise als die von uns hier
vorgef uhrte zum Nachweis der Identit at
(7.1) B({4, 7]) = (3N
0
1) {10, 19]
verwendet werden, woraus dann nat urlich auch der Beweis von Satz 7.3 folgt. Dies
ist der bei Beth, Jungnickel und Lenz [1999] verwendete Ansatz, wo man also
einen Beweis von (7.1) nden kann mit Ausnahme der ziemlich technischen, von
Brouwer [1979] stammenden Konstruktion eines (31, {4, 7], 1)-PBDs.
XI Symmetrische Blockpl ane und Differenzmengen
Wie bereits im vorigen Kapitel erw ahnt, heit ein (v, k, )-Blockplan mit [B[ = v
ein symmetrischer Blockplan. Mit die prominentesten und uns bereits bekannten
Beispiele sind die projektiven Ebenen und die aus den projektiven R aumen gewon-
nenen Blockpl ane PG
n1
(n, q). Wir werden uns in diesemKapitel n aher mit dieser
besonders wichtigen und interessanten Klasse von Blockpl anen auseinandersetzen.
Nach einigen grundlegenden Eigenschaften beweisen wir den ber uhmten Nichtexi-
stenzsatz von Bruck, Ryser und Chowla und diskutieren den Zusammenhang zu
Hadamard-Matrizen.
Danach wenden wir uns den ebenfalls bereits im vorigen Kapitel denierten
Differenzmengen zu, die zu symmetrischen Blockpl anen mit einer regul ar ope-
rierenden Automorphismengruppe aquivalent sind. Der klassische Satz von Sin-
ger den wir in Satz IX.5.7 bewiesen haben besagt gerade, da die Blockpl ane
PG
n1
(n, q) eine Darstellung uber eine Differenzmenge zulassen. Wir werden
einige Familien von Differenzmengen konstruieren und etliche interessante theore-
tische Resultate beweisen, insbesondere uber sogenannte Multiplikatoren. Hierzu
ben otigen wir ein algebraisches Werkzeug, n amlich Gruppenringe, deren Grund-
begriffe wir daher ebenfalls darstellen werden. Schlielich gehen wir noch einmal
auf die Primzahlpotenzvermutung f ur endliche projektive Ebenen ein, diesmal un-
ter der Zusatzannahme, da die Ebene eine groe abelsche Kollineationsgruppe
besitzt.
1 Symmetrische Blockpl ane: Grundlagen
Wir beginnen mit einigen kombinatorischen Eigenschaften symmetrischer Block-
pl ane. Mit b = v ergibt sich aus den beiden Gleichungen in Satz X.1.5 sofort r = k;
es gilt also das folgende
Lemma 1.1. In einem symmetrischen (v, k, )-Blockplan liegt jeder Punkt auf ge-
nau k Bl ocken, und es gilt die Gleichung
(1.1) (v 1) = k(k 1).
2
242 XI Symmetrische Blockpl ane und Differenzmengen
Es ist n utzlich, einen weiteren Parameter einzuf uhren, n amlich die Ordnung
von , die als n := k deniert ist, was mit dem entsprechenden Begriff f ur
projektive Ebenen (also = 1) ubereinstimmt. In

Ubung X.1.13 sollte der Leser ja
zeigen, da die (n
2
n1, n1, 1)-Blockpl ane genau die projektiven Ebenen der
Ordnung n sind. Insbesondere gilt also, da sich je zwei Bl ocke eines derartigen
Blockplans in genau einem Punkt schneiden. Etwas allgemeiner beweisen wir jetzt
das folgende Resultat von Ryser [1950]:
Satz 1.2. Sei = (V, B, I) ein symmetrischer (v, k, )-Blockplan mit v > k.
Dann schneiden sich je zwei verschiedene Bl ocke in genau Punkten.
Beweis. Wir verwenden wie im Beweis von Satz X.1.12 eine Inzidenzmatrix A
f ur . Wie Lemma 1.1 und der Beweis dieses Satzes zeigen, ist A dann eine
invertierbare Matrix ( uber R), die der Gleichung
(1.2) AA
T
= (k )I J
gen ugt. Da jeder Block von genau k Punkte hat und jeder Punkt auf genau k
Bl ocken liegt, gilt weiterhin kJ = AJ = JA, also A
1
JA = J. Damit erhalten
wir
A
T
A = A
1
AA
T
A = A
1
[(k )I J]A = (k )I J.
Also haben je zwei Spalten von A(die ja zwei verschiedenen Bl ocken entsprechen)
in genau Positionen einen gemeinsamen Eintrag 1 (was jeweils einem Schnitt-
punkt der beiden Bl ocke entspricht). Das zeigt bereits die Behauptung. 2
Als Folgerung erhalten wir eine Reihe von Charakterisierungen der symmetri-
schen Blockpl ane in der Klasse aller Blockpl ane. Dabei sei die duale Struktur einer
Inzidenzstruktur = (V, B, I) als
(1.3)

= (B, V, I

) mit BI

p pIB
erkl art.

geht also aus durchVertauschen der Rollen von Punkten und Bl ocken
hervor, wie wir es bereits in IX.1 im Spezialfall projektiver Ebenen bei unserer
Diskussion des Dualit atsprinzips kennengelernt haben.
Korollar 1.3. Sei = (V, B, I) ein (v, k, )-Blockplan. Dann sind die folgenden
Aussagen aquivalent:
(1) ist symmetrisch, es gilt also b = v.
(2) r = k.
(3) Je zwei Bl ocke von schneiden sich in derselben Zahl von Punkten.
XI.1 Symmetrische Blockpl ane: Grundlagen 243
(4) Die duale Inzidenzstruktur

ist ein Blockplan.


(5)

ist ein (v, k, )-Blockplan.


Beweis. Der Beweis, der nach den bisherigen Ausf uhrungen keine Probleme berei-
ten sollte, sei dem Leser als

Ubung uberlassen; f ur den Teil (4) (5) verwendet
man dabei die Fischersche Ungleichung aus Satz 1.12 sowohl f ur als auch f ur

. 2
Als n achstes werden wir eine interessante Ungleichung zwischen der Punkte-
zahl v und der Ordnung neines symmetrischen Blockplans beweisen; dazu zun achst
noch eine eher leichte

Ubungsaufgabe.

Ubung 1.4. Sei = (V, B, ) ein symmetrischer (v, k, )-Blockplan der Ord-
nung n = k . Man zeige, da dann
= (V, B, ) mit B = {V B [ B B]
ein symmetrischer (v, v k, v 2k )-Blockplan ist, der ebenfalls Ordnung n
hat und der komplement are Blockplan zu heit. Ferner zeige man, da der Fall
k = v/2 unm oglich ist; man kann also bei der Untersuchung des Existenzproblems
f ur symmetrische Blockpl ane stets k (v 1)/2 annehmen.
Hinweis: F ur die zweite Aussage l ose man (1.1) nach auf und verwende Teilbar-
keits uberlegungen.
Satz 1.5. Sei ein symmetrischer (v, k, )-Blockplan mit 1 < k < v 1. Dann
gilt
(1.4) 4n 1 v n
2
n 1.
Beweis. Mit (1.1) und k = n ergibt sich die quadratische Gleichung
(v 1) = k(k 1) =
2
(2n 1) n(n 1)
f ur , deren L osungen
(1.5)
1,2
=
1
2
_
v 2n
_
(v 2n)
2
4n(n 1)
_
die -Werte f ur bzw. den komplement aren Blockplan sind. Da diese beiden
Werte nat urliche Zahlen sein m ussen, folgt
v 2n 2
_
(v 2n)
2
4n(n 1) ;
244 XI Symmetrische Blockpl ane und Differenzmengen
Quadrieren liefert die obere Schranke f ur v. Weiter gilt (v 2n)
2
4n(n1) und
daher v 2n 2n 1; man beachte dabei, da v 2n wegen (1.5) gilt und da
(2n 1)
2
die kleinste Quadratzahl 4n(n 1) ist. 2
Bemerkung 1.6. Auch in (1.4) sind wie so oft in der Mathematik die Ex-
tremf alle von besonderem Interesse: Die obere Schranke f ur v wird gerade f ur die
projektivenEbenen(undihre Komplemente) angenommen, unddie untere Schranke
tritt genau f ur (4n1, 2n1, n1)-Blockpl ane und ihre Komplemente ein. Derar-
tige Blockpl ane heien Hadamard-Blockpl ane; sie werden uns in 3 besch aftigen.

Ubung 1.7. Sei ein symmetrischer (v, k, )-Blockplanmit v = 4n. Man zeige,
da n ein Quadrat sein mu und da die Parameter von die Form
(1.6) (v, k, ) = (4u
2
, 2u
2
u, u
2
u).
haben. Ferner konstruiere man einen (16,6,2)-Blockplan, dessen Punkte die Felder
eines (44)-Schachbretts sind, indemman als Bl ocke diejenigen 6-Mengen w ahlt,
die sich jeweils f ur ein gegebenes Feld als die restlichen Felder in derselben
Zeile bzw. Spalte des Schachbretts ergeben.
Zum Abschlu dieses einf uhrenden Abschnitts beweisen wir noch ein erstes
Nichtexistenz-Resultat, das Sch utzenberger [1949] wie auch Chowla und Ryser
[1950] und Shrikhande [1950] unabh angig voneinander entdeckt haben.
Satz 1.8. Ein symmetrischer (v, k, )-Blockplan mit einer geraden Punktezahl
v kann nur existieren, falls n = k ein Quadrat ist.
Beweis. Wir verwenden wieder eine Inzidenzmatrix A f ur sowie die Gleichung
(1.2). Der Leser m oge als

Ubung nachpr ufen, da
det [(k )I J] = k
2
(k )
v1
gilt. Mit (1.2) folgt daher
(det A)
2
= (det A)(det A
T
) = det AA
T
= k
2
(k )
v1
.
Also ist k
2
(k )
v1
und somit auch k ein Quadrat. 2
Beispiel 1.9. Satz 1.8 zeigt, da es keinen symmetrischen (22,7,2)-Blockplan gibt.
XI.2 Der Satz von Bruck, Ryser und Chowla 245
2 Der Satz von Bruck, Ryser und Chowla
Dieser tief liegende Satz schliet die Existenz zahlreicher symmetrischer Block-
pl ane auf einer ungeradenAnzahl von Punkten aus und besagt insbesondere, da es
f ur unendlich viele n keine projektive Ebene der Ordnung n gibt, siehe Satz IX.2.6;
er wurde zun achst im Spezialfall projektiver Ebenen (also = 1) von Bruck und
Ryser [1949] bewiesen und dann von Chowla und Ryser [1950] auf beliebige ver-
allgemeinert. Wir geben hier einen besonders einfachen Beweis an, der unabh angig
voneinander von Ryser [1982] und Lenz [1983] gefunden wurde.
F ur unseren Beweis ben otigen wir den folgenden, ebenfalls tief liegenden Satz
aus der Zahlentheorie, f ur dessen Beweis wir auf Hardy undWright [1938], Herstein
[1964] oder Ireland und Rosen [1990] verweisen.
Satz 2.1 (Satz von Lagrange). Jede nat urliche Zahl n l at sich als Summe von
h ochstens vier Quadraten nat urlicher Zahlen schreiben. 2
Weiterhin sind einige Resultate uber quadratische Formen notwendig, die aus
der Linearen Algebra bekannt sind (oder sein sollten), die wir aber trotzdem kurz
wiederholen wollen. Sei V = K
n
der n-dimensionale Vektorraum uber einem
K orper K mit Charakteristik ,= 2. Eine quadratische Form ist eine Abbildung
x . x
T
Gx von V nach K, wobei G eine symmetrische (n n)-Matrix uber K
ist; die Form heit ausgeartet, falls det G = 0 gilt. Zwei quadratische Formen und
die zugeh origen Matrizen G, H heien aquivalent (in Symbolen: G

= H), falls
es eine invertierbare (n n)-Matrix S uber K gibt, f ur die H = S
T
GS gilt; man
beachte det H = (det S)
2
det G. Jede symmetrische reelle Matrix ist zu einer
Diagonalmatrix aquivalent. Es gilt das folgende einfache
Lemma 2.2. F ur reelle Matrizen folgt aus
G =
_
_
_
_
_
a
1
H
.
.
.
a
n1
a
1
. . . ..a
n1
a
n
_
_
_
_
_
und det H ,= 0, da
(2.1) G

=
_
_
_
_
_
0
H
.
.
.
0
0 0 . . . 0 x
_
_
_
_
_
246 XI Symmetrische Blockpl ane und Differenzmengen
mit x =
det G
det H
oder mit x = det G det H gilt, da man eine ahnliche Matrix erh alt,
wenn man x durch c
2
x mit beliebigem c ,= 0 ersetzt. 2
Weiterhin ben otigen wir das folgende fundamentale Resultat von Witt [1937];
einen Beweis ndet man beispielsweise bei Artin [1957] oder Jacobson [1974].
Satz 2.3 (Wittscher K urzungssatz). Es sei c ,= 0, und es gelte
diag(a
1
, . . . , a
n
, c)

= diag(b
1
, . . . , b
n
, c).
Dann folgt
diag(a
1
, . . . , a
n
)

= diag(b
1
, . . . , b
n
).
2
Im unserem Beweis wird der folgende Hilfssatz ebenfalls eine Schl usselrolle
spielen:
Lemma 2.4.

Uber K = Q gilt f ur jede nat urliche Zahl n
diag(n, n, n, n)

= diag(1, 1, 1, 1) = I
4
.
Beweis. Nach Satz 2.1 gibt es a, b, c, d Z mit n = a
2
b
2
c
2
d
2
. Dann
erf ullt die Matrix
S =
_
_
_
_
a b c d
b a d c
c d a b
d c b a
_
_
_
_
die Gleichung SS
T
= diag(n, n, n, n), woraus die Behauptung folgt. 2
Lemma 2.5. Es sei Aeine rationale (vv)-Matrix, die die Gleichung (1.2) erf ullt,
wobei k > gelte und v ungerade sei. Dann hat die diophantische Gleichung
(2.2) x
2
= (k )y
2
(1)
(v1)/2
z
2
eine nichttriviale L osung (x, y, z) Q
3
{(0, 0, 0)] und somit auch eine nichttri-
viale L osung in ganzen Zahlen.
Beweis. Die G ultigkeit der Gleichung (1.2) besagt gerade
(2.3) I

= (k )I J =: H.
Wir denieren nun zwei ((v 1) (v 1))-Matrizen
D = diag(n, n, . . . , n, ) mit n = k
XI.2 Der Satz von Bruck, Ryser und Chowla 247
und
S =
_
_
_
_
0
I
v
.
.
.
0
1 1 . . . 1 1
_
_
_
_
.
Eine kurze Rechnung zeigt
S
T
DS =
_
_
_
_

H
.
.
.

. . .
_
_
_
_
.
Nun gilt det D = n
v
, wobei v ungerade ist; weiterhin ist det H = det AA
T
ein
Quadrat. Mit Lemma 2.2 folgt
D

=
_
_
_
_
0
H
.
.
.
0
0 0 . . . 0 n
_
_
_
_
und dann wegen (2.3)
(2.4) D = diag(n, . . . , n, )

= diag(1, . . . , 1, n).
Der Rest des Beweises wird sich nun leicht aus dem Wittschen K urzungssatz zu-
sammen mit Lemma 2.4 ergeben. Wir unterscheiden dabei zwei F alle.
Fall 1. v 1 (mod 4).
Nach Lemma 2.4 gilt dann die folgende Kongruenz der L ange v 1:
(2.5) diag(n, . . . , n, n, )

= diag(1, . . . , 1, n, ).
Die rechten Seiten von (2.4) und (2.5) haben v 1 Diagonaleintr age 1 gemein, die
wir nach Satz 2.3 k urzen k onnen; wir erhalten
diag(1, n)

= diag(n, ).
Es gibt also eine invertierbare Matrix
A =
_
a b
c d
_
mit A
T
_
n 0
0
_
A =
_
1 0
0 n
_
;
daraus folgt na
2
c
2
= 1, womit wir die gew unschte L osung von (2.2) gefunden
haben.
248 XI Symmetrische Blockpl ane und Differenzmengen
Fall 2. v 3 (mod 4).
Nach Lemma 2.4 gilt diesmal die Kongruenz
(2.6) diag(n, . . . , n, n, n, n, )

= diag(1, . . . , 1, n, n, n, ).
Die rechten Seiten von (2.4) und (2.6) haben nun v 3 Diagonaleintr age 1 gemein,
und wir erhalten aus Satz 2.3
diag(1, 1, 1, n)

= diag(n, n, n, ).
Hieraus folgt unmittelbar
diag(1, 1, 1, n, n)

= diag(n, n, n, n, )

= diag(1, 1, 1, 1, )
und somit
diag(n, n)

= diag(1, ).
Dieselbe Argumentation wie zuvor ergibt diesmal na
2
nc
2
= 1, womit wir
wieder eine L osung von (2.2) gefunden haben, n amlich
(na)
2
= n 1
2
(nc)
2
.
2
Da die Inzidenzmatrix eines symmetrischen (v, k, )-Blockplans die Gleichung
(1.2) erf ullt, ergibt sich aus Lemma 2.5 unmittelbar das gew unschte Existenzkrite-
rium:
Satz 2.6 (BruckRyserChowlaTheorem). Ein symmetrischer (v, k, )- Block-
plan mit ungeradem v > k kann nur existieren, falls die diophantische Gleichung
(2.2) eine nichttriviale L osung in ganzen Zahlen hat. 2
F ur praktische Zwecke ist es leichter, das Kriterium in der folgenden Version
von Satz 2.6 anzuwenden:
Korollar 2.7. Es gebe einen symmetrischen (v, k, )-Blockplan, wobei v > k un-
gerade sei. Seien
/
und n
/
der quadratfreie Teil von bzw. n = k . Falls es eine
ungerade Primzahl p gibt, die n
/
aber nicht
/
teilt, mu (1)
v1
2

/
ein Quadrat in
Z
p
sein.
Beweis. Eine L osung der Gleichung (2.2) ergibt unmittelbar eine L osung von
x
2
= n
/
y
2
(1)
v1
2

/
z
2
;
Reduktion modulo p liefert dann die Behauptung. 2
XI.3 Hadamardmatrizen und Blockpl ane 249
Beispiel 2.8. Wir verwenden Korollar 2.7 mit p = 3, um die Existenz eines sym-
metrischen (29,8,2)-Blockplans auszuschlieen: 2 ist kein Quadrat in Z
3
. Dagegen
w are eine direkte Anwendung von Satz 2.6 deutlich m uhsamer.
Im Spezialfall = 1 ergibt sich nun leicht der bereits in IX.2 formulierte
Satz 2.9. Sei n Nmit n 1 (mod 4) oder n 2 (mod 4). Wenn der quadratfreie
Teil von n einen Primteiler q 3 (mod 4) hat, gibt es keine projektive Ebene der
Ordnung n.
Beweis. Es ist (v 1)/2 = (n
2
n)/2 1(mod 2) wegen n 1 oder 2(mod 4).
Andererseits kann 1 wegen der Voraussetzung p 3 (mod 4) kein Quadrat in
GF(p) sein, siehe

Ubung III.3.10. Die Behauptung folgt daher aus Korollar 2.7. 2

Ubung 2.10. Man schliee die Existenz von symmetrischen Blockpl anen mit Pa-
rametern (46,10,2), (67,12,2) und (43,15,5) aus.
Noch eine Bemerkung: Abgesehen vom Fall = 1 (also dem Fall projektiver
Ebenen) ist f ur keinen Wert von eine unendliche Serie symmetrischer Blockpl ane
bekannt. Marshall Hall hat vermutet, da es in der Tat f ur jedes feste nur endlich
viele symmetrische (v, k, )-Blockpl ane gibt; leider hatte bislang niemand eine
Idee, wie man dies beweisen k onnte.
3 Hadamardmatrizen und Blockpl ane
Neben den projektiven Ebenen sind die in Bemerkung 1.6 eingef uhrten Hadamard-
Blockpl ane wohl die wichtigste Familie symmetrischer Blockpl ane; sie tragen ihren
Namen, da sie zu den sogenannten Hadamard-Matrizen aquivalent sind, die wie-
derum so heien, weil sie die ber uhmte Ungleichung von Hadamard [1893] mit
Gleichheit erf ullen. Wir erinnern hier nur kurz an dieses Resultat aus der Linearen
Algebra, das wir in 9 beweisen werden.
Satz 3.1 (Hadamardsche Ungleichung). Sei Aeine komplexe (mm)- Matrix mit
von 0 verschiedenen Zeilen a
1
, . . . , a
m
. Dann gilt
(3.1) [ det A[ |a
1
| |a
m
|
mit Gleichheit genau dann, wenn je zwei verschiedene Zeilen von A Skalarprodukt
0 haben. 2
250 XI Symmetrische Blockpl ane und Differenzmengen
Korollar 3.2. Jede reelle (m m)-Matrix H = (h
ij
) mit Eintr agen vom Betrag
[h
ij
[ 1 erf ullt [ det H[ m
m/2
. Diese Schranke wird genau dann angenommen,
wenn H nur Eintr age 1 hat und
(3.2) HH
T
= H
T
H = mI
gilt. Jede derartige Matrix heit eine Hadamard-Matrix der Ordnung m.
Beweis. Da alle Eintr age Betrag 1 haben, gilt f ur i = 1, . . . , m die Absch atzung
(3.3) |h
i
|
2
=
m

j=1
[h
ij
[
2
m
und damit nach (3.1)
(det H)
2

i=1
|h
i
|
2
m
m
.
Der Maximalwert m
m
wird dabei genau dann angenommen, wenn je zwei verschie-
dene Zeilen von H orthogonal zueinander sind und f ur alle Zeilenindizes i in (3.3)
Gleichheit gilt, also wenn h
ij
= 1 f ur alle i, j ist, womit sich die gew unschte
Gleichung (3.2) ergibt. 2
Beispiel 3.3. Hier sind drei triviale Beispiele von Hadamard-Matrizen:
( 1 ),
_
1 1
1 1
_
,
_
_
_
_
1 1 1 1
1 1 1 1
1 1 1 1
1 1 1 1
_
_
_
_
.
Satz 3.4. Sei H eine Hadamard-Matrix der Ordnung m ,= 1, 2. Dann ist m ein
Vielfaches von 4, etwa m = 4n. Die Existenz einer solchen Hadamard-Matrix ist zu
der eines symmetrischen (4n1, 2n1, n1)-Blockplans, also eines Hadamard-
Blockplans der Ordnung n, aquivalent.
Beweis. Wenn wir beliebige Zeilen oder Spalten von H mit 1 multiplizieren,
andert sich nichts an der denierenden Gleichung (3.2). Daher k onnen wir o.B.d.A.
annehmen, da alle Eintr age in der ersten Zeile und der ersten Spalte 1 sind. Jede
andere Zeile mu dann genau m/2 Eintr age 1 enthalten, da sie ja zur ersten Zeile
orthogonal ist; wir k onnen also m = 2s schreiben. Wir betrachten nun die i-te und
die j-te Zeile von H, wobei i, j 2 und i ,= j sei, und bezeichnen mit x, y, z, w
die Anzahl der Spalten k mit h
ik
= h
jk
= 1; h
ik
= 1 und h
jk
= 1; h
ik
= 1
XI.3 Hadamardmatrizen und Blockpl ane 251
und h
jk
= 1; bzw. h
ik
= h
jk
= 1. Die paarweise Orthogonalit at der Zeilen
1, i, j liefert dann das Gleichungssystem
(3.4)
x y z w = 2s
x y = s
x z = s
x y z w = 0
mit der eindeutigen L osung x = y = z = w = s/2. Insbesondere ist s gerade, also
m durch 4 teilbar, etwa m = 4n. Es sei nun A = (a
ij
) diejenige Matrix, die aus
H durch Streichen der ersten Zeile und Spalte entsteht. Wir w ahlen die Zeilen und
Spalten von A als Punkte bzw. Bl ocke und sagen genau dann, da der i-te Punkt
und die k-te Spalte inzident sind, wenn h
ik
= 1 gilt. Man sieht nun leicht, da
man so den gesuchten Hadamard-Blockplan erh alt (mit A als 1-Inzidenzmatrix):
Jede auer der ersten Spalte von H mu genau 2n Eintr age 1 enthalten, da sie ja
zur ersten Spalte orthogonal ist, womit dann jeder Block genau 2n 1 Punkte hat;
und wegen x = n haben je zwei Punkte genau n 1 Verbindungsbl ocke.
Umgekehrt sei ein symmetrischer (4n 1, 2n 1, n 1)-Blockplan ge-
geben; wir bezeichnen dann mit A seine 1-Inzidenzmatrix (die aus der ublichen
Inzidenzmatrix durch Ersetzen aller Eintr age 0 durch 1 hervorgeht) und f ugen
eine Zeile und Spalte mit lauter Eintr agen 1 hinzu, um die gesuchte (4n 4n)-
Hadamard-Matrix zu erhalten. Die Einzelheiten seien dem Leser uberlassen. 2
Beispiel 3.5. Die klassischensymmetrischenBlockpl ane PG
n1
(n, 2) aus Beispiel
1.4 sind f ur q = 2 Hadamard-Blockpl ane mit Parametern
v = 2
n1
1, k = 2
n
1 und = 2
n1
1;
es gibt also Hadamard-Matrizen der Ordnung 2
a
f ur alle a N.
Wir konstruieren nun weitere Beispiele, indem wir geeignete Differenzmengen
angeben, vergleiche Korollar X.2.5.
Satz 3.6. Es sei q eine Primzahlpotenz der Form q = 4n 1. Dann ist die Menge
D der Quadrate in GF(q)

eine (4n 1, 2n 1, n 1)-Differenzmenge in der


additiven Gruppe Gvon GF(q). Insbesondere existiert eine Hadamard-Matrix der
Ordnung q 1.
Beweis. Nach

Ubung III.3.10 gilt [D[ = 2n 1. Nun h angt die Anzahl der Diffe-
renzdarstellungen eines Elementes x G nur davon ab, ob x zu D geh ort, da
x = d d
/
mit d, d
/
D sx = sd sd
/
mit sd, sd
/
D
252 XI Symmetrische Blockpl ane und Differenzmengen
f ur beliebige Quadrate s gilt. Wegen q 3 (mod 4) ist 1 kein Quadrat, siehe

Ubung III.3.10; somit zeigt die triviale Beobachtung


x = d d
/
mit d, d
/
D x = d
/
d mit d
/
, d D,
da Quadrate und Nicht-Quadrate dieselbe Anzahl von Differenzdarstellungen ha-
ben, D also eine Differenzmenge ist. Der Wert des Parameters ergibt sich dann
sofort aus (1.1). 2
Satz 3.6 geht im wesentlichen auf Paley [1933] zur uck, der die entsprechenden
Hadamard-Matrizen konstruiert hat, weswegen diese Differenzmengen als Paley-
Differenzmengen bezeichnet werden. Paley konnte auch das folgende Resultat er-
zielen, f ur dessen merklich komplizierteren Beweis wir auf Beth, Jungnickel
und Lenz [1999,I.9] verweisen.
Satz 3.7. Es sei q eine Primzahlpotenz der Form q = 4n 1. Dann gibt es einen
symmetrischen (8n 3, 4n 1, 2n)-Blockplan, also eine Hadamard-Matrix der
Ordnung 2(q 2). 2
Mehr Beispiele von Hadamard-Matrizen liefern das folgende Kompositions-
verfahren sowie eine weitere Konstruktion von Differenzmengen, die wir als nicht
ganz leichte

Ubung angeben; siehe Stanton und Sprott [1958] oder Beth, Jungnickel
und Lenz [1999, Theorem VI.8.2].
Lemma 3.8. Falls es Hadamard-Matrizen der Ordnungen mund m
/
gibt, existiert
auch eine Hadamard-Matrix der Ordnung mm
/
.
Beweis. Seien H = (h
ij
) und H
/
= (h
/
kl
) die gegebenen Hadamard-Matrizen.
Dann ist das Kronecker-Produkt
H H
/
=
_
_
_
h
11
H
/
h
12
H
/
. . . h
1m
H
/
.
.
.
.
.
.
.
.
.
h
m1
H
/
h
m2
H
/
. . . h
mm
H
/
_
_
_
von H mit H
/
die gesuchte Hadamard-Matrix der Ordnung mm
/
, wie man leicht
nachrechnet. 2

Ubung 3.9. Es seien q und q 2 zwei ungerade Primzahlpotenzen. Man erkl art
den quadratischen Charakter auf GF(q) durch
(3.5) (x) =
_

_
1 falls x ,= 0 ein Quadrat ist
0 f ur x = 0
1 falls x kein Quadrat ist.
XI.3 Hadamardmatrizen und Blockpl ane 253
Man zeige, da die durch
{(x, y) [ x GF(q)

, y GF(q 2)

, (x) = (y)] {(x, 0) [ x GF(q)]


denierte Menge D (GF(q), ) (GF(q 2), ) eine (4n1, 2n1, n1)-
Differenzmenge mit n = (q 1)
2
/4 ist.
Hinweis: Man verwende die Tatsache, da die Elemente ,= 0 in Deine multiplikati-
ve Gruppe M mit MD = D imRing GF(q) GF(q 2) bilden, und argumentiere
ahnlich wie im Beweis von Satz 3.6.
Es gibt zahlreiche weitere Konstruktionen f ur Hadamard-Matrizen sowie eine
umfangreiche Literatur. Wir verweisen insbesondere auf die Monographien von
Wallis, Street und Wallis [1972], Geramita und Seberry [1979] und Agaian [1985]
sowie den

Ubersichtsartikel von Seberry und Yamada [1992]. Ausf uhrliche Tabel-
len zur Existenz von (speziellen Typen von) Hadamard-Matrizen ndet man bei
Colbourn und Dinitz [1996]. Hadamard-Matrizen sind auch in zahlreichenAnwen-
dungen wichtig, die von der Statistik, siehe Raghavarao [1971], uber die Codie-
rungstheorrie, siehe MacWilliams und Sloane [1978] sowie Zinoviev [1996], und
die Nachrichtentechnik, siehe Posner [1969], bis zur Optik reichen, siehe Harwit
und Sloane [1979].
Von besonderem Interesse sind Hadamard-Matrizen, f ur die alle Zeilen und
Spalten eine konstante Anzahl von Eintr agen 1 enthalten; solche Hadamard-
Matrizen heien regul ar. Mit ahnlichen Argumenten wie im Beweis von Satz 3.4
erh alt man den folgenden Satz, dessen Beweis eine gute

Ubung ist bzw. bei Beth,
Jungnickel und Lenz [1999, Proposition II.3.14] nachgelesen werden kann:
Satz 3.10. Sei H eine regul are Hadamard-Matrix der Ordnung 4n. Dann ist n
ein Quadrat, etwa n = u
2
. Die Existenz einer solchen Hadamard-Matrix ist zu der
eines symmetrischen Blockplans mit Parametern (1.6) aquivalent, siehe

Ubung 1.7.
2
Wir geben eine Konstruktion entsprechender Differenzmengen mit gruppen-
theoretischen Methoden an, die von Dillon [1974] stammt; weitere Beispiele wer-
den wir im n achsten Abschnitt kennenlernen.
Lemma 3.11. Sei G eine Gruppe der Ordnung 4u
2
, die u paarweise disjunkte
Untergruppen der Ordnung 2u enth alt, also Untergruppen U
1
, . . . , U
u
mit
U
i
U
j
= {0] f ur i ,= j. Dann ist
D = (U
1
U
u
) {0]
eine Differenzmenge mit Parametern (1.6).
254 XI Symmetrische Blockpl ane und Differenzmengen
Beweis. Offensichtlich hat D M achtigkeit u(2u 1) = 2u
2
u. Wir m ussen noch
= u
2
u nachweisen. Da die gebenenen Untergruppen paarweise disjunkt sind,
gilt
(3.6) (u
i
u
j
[ u
i
U
i
, u
j
U
j
) = G f ur i ,= j.
Dies zeigt sofort, da jedes Element x / D genau u(u 1) = Darstellungen als
Differenz zweier Elemente in D hat. Sei nun x D, etwa x U
1
. Dann m ussen
wir in (3.6) i, j ,= 1 verlangen, da sonst eines der beiden beteiligten Elemente
in der Differenzdarstellung von x das entfernte neutrale Element 0 ist, womit wir
zun achst nur (u1)(u2) Darstellungen vomTyp (3.6) erhalten. Daf ur hat x dann
aber noch 2u 2 Differenzdarstellungen der Form x = u v mit u, v U
1
{0],
womit sich insgesamt wieder Differenzdarstellungen ergeben. 2
Beispiel 3.12. Sei G = Z
6
Z
6
. Dann sind
U
1
= {0] Z
6
, U
2
= Z
6
{0] und U
3
= {(x, x) [ x Z
6
]
drei paarweise disjunkte Untergruppen; es gibt also eine (36,15,6)-Differenzmenge
und daher auch eine regul are Hadamard-Matrix der Ordnung 36.

Ubung 3.13. Sei G die additive Gruppe des Vektorraums GF(q)


2
f ur q = 2
m
.
Man verwende q/2 Geraden von AG(2, q) durch den Ursprung (0, 0)
T
, um q/2
paarweise disjunkte Untergruppen von Gzu konstruieren (siehe

Ubung 9.5). Wenn
u eine Potenz von 2 ist, gibt es also stets eine Differenzmenge mit Parametern (1.6)
und daher auch eine regul are Hadamard-Matrix der Ordnung 4u
2
.
Leider sind dies schon nahezu alle F alle, in denen man Lemma 3.11 anwenden
kann, siehe Beth, Jungnickel und Lenz [1999, VI.9] und die dort zitierte Literatur.
Drei der groen ungel osten Vermutungen in der Kombinatorik betreffen Hada-
mard-Matrizen:
F ur jede nat urliche Zahl n gibt es eine Hadamard-Matrix der Ordnung 4n
(Hadamard matrix conjecture).
F ur jede nat urliche Zahl u gibt es eine regul are Hadamard-Matrix der Ord-
nung 4u
2
(regular Hadamard matrix conjecture).
F ur keine nat urliche Zahl n ,= 1 gibt es eine zirkulante Hadamard-Matrix
der Ordnung 4n (circulant Hadamard matrix conjecture). (Man beachte, da
die anfangs angegebene Hadamard-Matrix der Ordnung 4 zirkulant ist.)
F ur die erste dieser Vermutungen sind die kleinsten offenen F alle derzeit die Exi-
stenz von Hadamard-Matrizen der Ordnungen 428, 668 und 716. Wir erw ahnen
XI.4 Eine rekursive Konstruktion 255
das folgende bemerkenswerte Ergebnis von Craigen, Holzmann und Kharaghani
[1997]: F ur jede ungerade Zahl t gibt es eine Hadamard-Matrix der Ordnung 4n
mit n = 2
s
t , sobald
s 4
_
log
2
(t 1)
10
_
6
gilt. Hinsichtlich der zweiten Vermutung gibt es ein ahnliches asymptotisches Re-
sultat, siehe Craigen und Kharaghani [1994]. Weiterhin konnten vor einigen Jahren
Differenzmengen mit Parametern (1.6) f ur alle Quadrate u konstruiert werden, wo-
mit es also f ur jede nat urliche Zahl u eine regul are Hadamard-Matrix der Ordnung
4u
4
gibt; der auerordentlich aufwendige Beweis ist bei Beth, Jungnickel und Lenz
[1999, Chapter VI] dargestellt, wo auch ausf uhrliche Literaturhinweise zu nden
sind.
Die dritte und letzte Vermutung ist wie man ohne Schwierigkeiten sieht
zur Nichtexistenz von zyklischen Differenzmengen mit Parametern (1.6) aquiva-
lent. Nach zwei fundamentalen Arbeiten von Turyn [1965,1969] passierte lange
Zeit gar nichts (abgesehen von einigen inkorrekten

Beweisen), bis schlielich


Schmidt [1999] bahnbrechende Fortschritte erzielen konnte; bis auf zwei m ogliche
Ausnahmen ist die Nichtexistenz jetzt f ur alle v = 4u
2
10
11
bewiesen. Man
vergleiche zu Schmidts v ollig neuen Methoden, die auch in vielen anderen Situa-
tionen anwendbar sind, Beth, Jungnickel und Lenz [1999, VI.16] sowie Schmidt
[2001,2002] und Leung, Ma und Schmidt [2003].
4 Eine rekursive Konstruktion
In den letzten Jahren ist es gelungen, mittels rekursiver Methoden zahlreiche neue
symmetrische Blockpl ane und Differenzmengen zu konstruieren. Dabei sind ins-
besondere die fundamentale Arbeit von Davis und Jedwab [1997] zur Konstruktion
von Differenzmengen mit ggT(v, n) ,= 1 sowie eine Serie von Arbeiten von Ionin
zu nennen, von denen Ionin [1999], wo man sieben unendliche Serien symmetri-
scher Blockpl ane ndet, besonders interessant ist; eine noch weitergehende Verein-
heitlichung stammt von bei Ionin und Shrikhande [2003]. Diese Ergebnisse sind
allerdings technisch viel zu anspruchsvoll, um in einem einf uhrenden Text darge-
stellt zu werden. Die Davis-Jedwab-Theorie ndet man in allen Einzelheiten auch
bei Beth, Jungnickel und Lenz [1999, Chapter VI]; eine ausf uhrliche Monographie
uber symmetrische Blockpl ane ist in Vorbereitung, siehe Ionin und Shrikhande
[2004].
Wir werden hier lediglich eine altere, verh altnism aig einfache rekursive Kon-
struktion f ur symmetrische Blockpl ane darstellen, die aber einen ersten Eindruck
von den verwendeten Methoden gibt: Man bastelt aus kleineren symmetrischen
256 XI Symmetrische Blockpl ane und Differenzmengen
Blockpl anen (die hier trivial sind, im allgemeinen aber nicht) sowie anderen Hilfs-
strukturen (hier geeigneten Matrizen, die man aus sogenannten afnen Blockpl anen
erh alt, im allgemeinen meist aus sogenannten

balanced generalised weighing ma-


trices) neue, wesentlich gr oere symmetrische Blockpl ane. Die von uns behan-
delte Konstruktion geht auf Wallis [1971] zur uck, der sie in graphentheoretischer
Sprechweise formuliert hat. Wie schon angedeutet, ben otigen wir zun achst einen
weiteren Begriff:
Denition 4.1. Sei = (V, B, I) ein au osbarer (v, k, )-Blockplan. heit
afn au osbar oder kurz ein afner Blockplan, wenn sich je zwei nicht-parallele
Bl ocke in einer konstanten Anzahl von Punkten schneiden.
1
Beispiel 4.2. Die klassischen Beispiele von afnen Blockpl anen sind die aus den
afnen R aumen gewonnenen Blockpl ane AG
n1
(n, q), siehe Beispiel X.1.4. Hier
gilt = q
n2
, da sich je zwei nicht-parallele Hyperebenen von AG(n, q) in einem
afnen Unterraum der Dimension n 2 schneiden.
Wir verwenden nun Hadamard-Blockpl ane, um eine weitere Klasse von Bei-
spielen zu konstruieren:
Beispiel 4.3. Seien = (V, B, ) ein (4n 1, 2n 1, n 1)-Blockplan und
/ V. Wir setzen

= (

V,

B, ) mit

V = V {] und

B = {B {] [ B B] {V B [ B B]
und zeigen, da

ein afner (4n, 2n, 2n 1)-Blockplan ist. Trivialerweise haben
alle Bl ocke M achtigkeit 2n. Da Replikationszahl r = 2n 1 hat, liegen ein
beliebiger Punkt p V und in genau

= 2n1 Bl ocken in

B. Seien nun zwei
verschiedene Punkte p, q V gegeben. Weil der komplement are Blockplan von
nach

Ubung 1.4 ein (4n 1, 2n, n)-Blockplan ist, liegen p und q offenbar in
genau (n 1) n = 2n 1 Bl ocken in

B.
Es bleibt zu zeigen, da

afn au osbar ist. Jeder Block B B liefert eine
Parallelklasse {B {], V B], womit

jedenfalls au osbar ist. Mit Fallunter-
scheidung sieht man nun leicht, da je zwei nicht-parallele Bl ocke sich in genau
= n Punkten schneiden: Das folgt direkt aus Satz 1.2, falls entweder beide oder
aber keiner der beiden Bl ocke enthalten, weil sowohl als auch symmetri-
sche Blockpl ane sind. Wenn schlielich zwei nicht-parallele Bl ocke B {] und
1
ImFalle eines afnen Blockplans ist also, ahnlich wie in afnen Ebenen, der Parallelismus eindeutig
bestimmt: Zwei verschiedene Bl ocke sind genau dann parallel, wenn sie sich nicht schneiden. Dagegen
kann ein Blockplan imallgemeinen durchaus verschiedene Parallelismen zulassen; beispielsweise haben
die Blockpl ane AG
1
(n, q) stets einen vom nat urlichen Parallelismus verschiedenen Parallelismus, wie
Fuji-Hara und Vanstone [1987] gezeigt haben.
XI.4 Eine rekursive Konstruktion 257
V C gegeben sind, so schneidet B {] den Block C{] in genau n Punkten,
womit [(B {]) (V C)[ = 2n n = n folgt.
Der Blockplan

hat in Wirklichkeit noch st arkere Regularit atseigenschaften,
da er sogar ein sogenanntes 3-Design ist: Je drei Punkte liegen in gleich vielen
(n amlich n 1) Bl ocken. Wir ben otigen dieses Resultat, dessen Beweis man etwa
bei Beth, Jungnickel und Lenz [1999, Theorem I.9.9] ndet, jedoch nicht.
Mankannnuneinige interessante kombinatorische Eigenschaftenafner Block-
pl ane zeigen. Wir ben otigen nur den folgenden Satz von Bose [1942], der mit uns
schon bekannten Methoden bewiesen werden kann; hierf ur und f ur weitere Ergeb-
nisse verweisen wir auf Beth, Jungnickel und Lenz [1999,II.8].
Satz 4.4. Sei = (V, B, ) ein au osbarer (v, k, )-Blockplan. Dann gilt
(4.1) b v r 1 bzw. aquivalent dazu r k .
Ferner hat man genau dann Gleichheit in (4.1), wenn ein afner Blockplan ist.
In diesem Fall haben die Parameter von die folgende Form:
(4.2) k = s, v = s
2
, =
s 1
s 1
, r =
s
2
1
s 1
und b = sr.
Man kann also alle Parameter durch s und ausdr ucken, wobei s die M achtigkeit
der Parallelklassen von ist; man bezeichnet kurz als ein A

(s). 2
Die Beispiele 4.2 und 4.3 liefern alle bekannten Parameter-Paare (s, ) f ur
afne Blockpl ane. Wir k onnen nun den bereits angek undigten Satz von Wallis
[1971] beweisen; der einfachere Beweis, den wir hier darstellen wollen, stammt
von Lenz und Jungnickel [1979].
Satz 4.5. Wenn es einen afnen (v, k, )-Blockplan = (V, B, ) gibt, so exi-
stiert auch ein symmetrischer Blockplan = (V
/
, B
/
, ) mit Parameterm
(4.3) v
/
= (r 1)v, k
/
= kr und
/
= k.
Beweis. Wir numerieren die Punkte und Parallelklassen von als p
1
, . . . , p
v
bzw.
P
1
, . . . , P
r
und denieren

Hilfsmatrizen M
h
= (m
h
ij
) f ur h = 1, . . . , r durch
m
h
ij
=
_
1 falls p
i
, p
j
B f ur ein B P
h
gilt
0 sonst.
258 XI Symmetrische Blockpl ane und Differenzmengen
Die Eigenschaften eines afnen Blockplans liefern dann leicht die folgenden Glei-
chungen:
(4.4) M
h
M
T
l
=
_
J f ur h ,= l
kM
h
f ur h = l
f ur alle h, l = 1, . . . , r. Wir verwenden nun wieder eine Inzidenzmatrix A f ur ;
dann gilt offenbar AA
T
=

r
h=1
M
h
und daher wie imBeweis von Satz X.1.12
(4.5)
r

h=1
M
h
M
T
h
= k
r

h=1
M
h
= k(r )I kJ,
wobei wir noch (4.4) verwendet haben. Wir schreiben nun M
0
f ur die 0-Matrix und
bilden die zirkulante Matrix
L =
_
_
_
_
_
M
0
M
1
. . . M
r
M
1
M
2
. . . M
0
.
.
.
M
r
M
0
. . . M
r1
_
_
_
_
_
=
_
_
_
_
_
L
0
L
1
.
.
.
L
r
_
_
_
_
_
.
Unter Verwendung der Gleichungen (4.4) und (4.5) berechnen wir
(4.6) L
h
L
T
l
=
_
(r 1)J f ur h ,= l
k(r )I kJ f ur h = l.
Nun gilt aber (r 1) = k nach (4.2), weswegen sich aus (4.6) die Gleichung
(4.7) LL
T
= k(r )I kJ
ergibt. Somit ist L eine Inzidenzmatrix f ur den gesuchten symmetrischen Block-
plan . 2
Es sei noch angemerkt, da man die im Beweis verwendete Matrix L als Inzi-
denzmatrix eines symmetrischen (r 1, r, r 1)-Blockplans deuten kann, wenn
man M
0
mit 0 sowie alle von M
0
verschiedenen Eintr age mit 1 identiziert. Dies
ist hier der in unserem Fall triviale zu Grunde liegende

kleine symmetrische
Blockplan.
Wir verwenden nun unsere Beispiele 4.2 und 4.3 von afnen Blockpl anen und
erhalten das folgende
XI.5 Differenzmengen und Gruppenringe 259
Korollar 4.6. Es gibt symmetrische Blockpl ane mit Parametern
v = q
d1
(q
d
q 2), k = q
d
(q
d
q 1) und (4.8)
= q
d
(q
d1
q 1)
f ur jede Primzahlpotenz q und jedes d N.
v = 16n
2
, k = 2n(4n 1) und = 2n(2n 1), (4.9)
falls eine Hadamard-Matrix der Ordnung 4n existiert. 2
Mit Satz 3.10 ergibt sich aus Korollar 4.6 noch eine weitere interessante Fol-
gerung, n amlich
Korollar 4.7. Falls eine Hadamard-Matrix der Ordnung 4n existiert, so gibt es
auch eine regul are Hadamard-Matrix der Ordnung 16n
2
. 2
5 Differenzmengen und Gruppenringe
Wir wenden uns nun Differenzmengen zu. Wie wir aus Korollar X.2.5 wissen
und schon mehrfach verwendet haben impliziert die Existenz einer (v, k, )-
Differenzmenge die eines symmetrischen (v, k, )-Blockplans. Wir wollen uns als
erstes uberlegen, da auch eine geeignete Umkehrung gilt. Dazu zun achst die
Denition 5.1. Sei = (V, B, ) ein symmetrischer (v, k, )-Blockplan. Wenn
G eine auf den Punkten wie den Bl ocken regul ar operierende Automorphismen-
gruppe von ist, nennt man G eine Singergruppe f ur .
Satz 5.2. Sei D eine (v, k, )-Differenzmenge in einer abelschen Gruppe G. Dann
ist dev D ein (v, k, )-Blockplan, der G als Singergruppe zul at. Umgekehrt hat
jeder symmetrische Blockplan mit einer Singergruppe eine derartige Darstellung.
Beweis. Sei zun achst D eine (v, k, )-Differenzmenge. Nach Satz X.2.4 wissen wir
bereits, da
dev D = (G, {D g [ g G], )
ein symmetrischer (v, k, )-Blockplan ist; man beachte dabei, da hier wegen Satz
1.2 keine wiederholten Bl ocke auftreten k onnen und somit die Bl ocke tats achlich
eine Menge bilden. Es ist dann klar, da G per Rechtstranslation als Singergruppe
von dev D operiert, wenn wir

g
: x . x g, D x . D x g f ur g G
setzen.
260 XI Symmetrische Blockpl ane und Differenzmengen
Sei nun umgekehrt ein symmetrischer (v, k, )-Blockplan mit Singergruppe
G gegeben. Wir k onnen dann die Punktemenge von mit G identizieren, indem
wir ausgehend von einem

Basispunkt p die Bilder von p unter den Elementen


von G durchlaufen. Analog k onnen wir auch die Bl ocke als die Bilder eines

Ba-
sisblocks D erhalten, den man dann durch Identikation seiner Punkte mit den
zugeh origen Elementen in Gauch als eine Teilmenge von Gauffassen kann; damit
nehmen alle Bl ocke die Form D x = {d x [ x G] an, wobei x uber G
l auft. Insgesamt haben wir also in die Form dev D gebracht. Da dabei D eine
Differenzmenge sein mu, folgt nun ganz analog zum Beweis von Satz X.2.4. 2
Differenzmengen sind also nichts anderes als symmetrische Blockpl ane mit
einer besonders sch onen Gruppe! Aus demSatz von Singer (Satz IX.5.7) und

Ubung
X.1.4 folgt sofort
Satz 5.3. Sei q eine Primzahlpotenz und d > 1 eine nat urliche Zahl. Dann gibt es
eine zyklische Differenzmenge mit Parametern
(5.1) v =
q
d1
1
q 1
, k =
q
d
1
q 1
und =
q
d1
1
q 1
.
2
Das wichtigste Problem in der Theorie der Differenzmengen ist die Frage, wel-
che (abelschen) Gruppen derartige Mengen enthalten oder etwas einfacher, aber
immer noch ziemlich aussichtslos welche Parameter uberhaupt auftreten k onnen.
Dabei sind wir nat urlich nur an nichttrivialen Beispielen interessiert, wir verlangen
also 2 k v 2. Man kann derartige Probleme nur mittels algebraischer Me-
thoden angehen; insbesondere ben otigt man dazu den Begriff des

Gruppenrings,
den wir jetzt einf uhren wollen.
Seien Geine multiplikativ geschriebene Gruppe und R ein kommutativer Ring
mit Einselement 1. Der Gruppenring RG besteht aus allen formalen Summen

gG
a
g
g, wobei die Koefzienten a
g
aus R kommen, zusammen mit den wie
folgt denierten Operationen Addition () und Multiplikation ():
_

gG
r
g
g
_

gG
s
g
g
_
=

gG
(r
g
s
g
)g;
_

gG
r
g
g
_

hG
s
h
h
_
=

kG
_

g, h G
gh = k
r
g
s
h
_
k.
Man kann nun durch Nachrechnen uberpr ufen, da RG damit in der Tat zu einem
Ring wird (der genau dann kommutativ ist, wenn G abelsch ist): RG ist bez uglich
der Addition eine abelsche Gruppe mit der Null 0e und bez uglich der Multiplikation
XI.5 Differenzmengen und Gruppenringe 261
eine Halbgruppe mit der Eins 1e, und es gelten die Distributivgesetze; wir haben
dabei das neutrale Element der Gruppe G mit e bezeichnet und den Ring R durch
die Identikation r re in RGeingebettet. Wir f uhren nun einige allgemein ubli-
che Konventionen ein, von denen manche zwar streng genommen einen

abuse of
notation darstellen, also nicht ganz korrekt sind, aber wesentlich leichter lesbare
Formeln ergeben. Zun achst identizieren wir die neutralen Elemente f ur die Multi-
plikationen in R, Gund RGund bezeichnen sie s amtlich als 1; dann schreiben wir
f ur r R statt der oben verwendeten Notation re einfach r. Analog ist eine ganze
Zahl z in RG als die Summe von z Kopien des gemeinsamen Einselementes 1 von
R, G und RG zu interpretieren. Schlielich identizieren wir noch jede Teilmen-
ge S von G mit der formalen Summe ihrer Elemente in RG und benutzen somit
dasselbe Symbol S auch, um dieses Element des Gruppenrings zu bezeichnen:
S =

gS
g.
Insbesondere wird also die formale Summe aller Gruppenelemente einfach wieder
als G geschrieben. Sei nun t eine ganze Zahl; dann schreibt man
(5.2) A
(t )
=

gG
a
g
g
t
f ur A =

gG
a
g
g.
Weiterhin setzt man eine Abbildung : G H von G in irgendeine Gruppe H
wie folgt zu einer linearen Abbildung vom Gruppenring RG in den Gruppenring
RH fort:
(5.3) (A) =

gG
a
g
(g) f ur A =

gG
a
g
g.
Schlielich ben otigen wir noch die Schreibweisen
(5.4) [A[ =

gG
a
g
und [A]
g
= a
g
f ur A =

gG
a
g
g.
Wir k onnen nun die denierende Bedingung einer Differenzmenge in eine Glei-
chung im ganzzahligen Gruppenring ZG ubersetzen. Nat urlich treten dabei statt
Differenzen formal Quotienten auf, da wir die zu Grunde liegenden Gruppe G
multiplikativ schreiben m ussen.
Lemma 5.4. Eine Teilmenge D einer multiplikativ geschriebenen Gruppe G der
Ordnung v ist genau dann eine (v, k, )-Differenzmenge, wenn die folgende Glei-
chung in ZG gilt:
(5.5) DD
(1)
= (k ) G.
262 XI Symmetrische Blockpl ane und Differenzmengen
Beweis. Man beachte zun achst, da der Koefzient des neutralen Elementes 1 von G
in Gleichung (6.3) k ist, was gerade bedeutet, da D eine k-Menge ist. Alle anderen
Gruppenelemente erscheinen auf der rechten Seite von (6.3) mit Koefzient , und
auf der linken Seite dieser Gleichung ist der Koefzient von g G gerade die
Anzahl aller Paare (c, d) D mit cd
1
= g. Das zeigt schon unsere Behauptung.
2
Lemma 5.4 erlaubt es nun, das Existenzproblemf ur Differenzmengen zu unter-
suchen, indem man die L osbarkeit der Gleichung (6.3) studiert. Wir werden daf ur
einige elementare, aber dennoch beeindruckende Beispiele kennenlernen. Ein ver-
tieftes Studiumerfordert technisch kompliziertere Hilfsmittel, n amlich sowohl Dar-
stellungstheorie (also f ur abelsche Gruppen Charaktertheorie) als auch algebraische
Zahlentheorie, insbesondere Kreisteilungsk orper. Derartige Methoden gehen weit
uber den Rahmen unseres Buches hinaus; wir verweisen den interessierten Leser
auf Beth, Jungnickel und Lenz [1999, Chapter VI] und die dort zitierte Literatur.
Wir beschlieen diesen Abschnitt mit drei einfachen Resultaten, die wir sp ater
ben otigen werden.
Lemma 5.5. Sei Geine multiplikativ geschriebene abelsche Gruppe der Ordnung
v und p eine Primzahl. Dann gilt f ur jedes A ZG die Kongruenz
A
(p)
A
p
(mod p).
Beweis. Mit A =

gG
a
g
g ergibt sich wegen

Ubung I.2.9
A
p
=
_

gG
a
g
g
_
p
=

gG
a
p
g
g
p
pC
f ur ein geeignetes C ZG, da alle anderen auftretenden Multinomialkoefzienten
durch p teilbar sind. Daher folgt die Behauptung aus dem kleinen Fermatschen
Satz x
p
x (mod p) f ur x Z. 2
Lemma 5.6. Sei Geine multiplikativ geschriebene abelsche Gruppe der Ordnung
v und p eine Primzahl, die v nicht teilt. Dann kann f ur A ZG die Kongruenz
A
m
zG (mod p) f ur ein z Z und ein m N nur gelten, wenn bereits
A yG (mod p) f ur ein y Z gilt.
Beweis. Da p kein Teiler von v ist, gibt es eine nat urliche Zahl t , f ur die p
t
1
(mod v) gilt. Wir w ahlen ein c N mit ct > m. Dann ist g
p
ct
= g
p
t
= g f ur alle
g G sowie aufgrund unserer Voraussetzung
A
p
ct
= A
m
A
p
ct
m
zA
p
ct
m
G (mod p).
XI.6 Multiplikatoren 263
Mit Lemma 5.5 folgt
A =

gG
a
g
g =

gG
a
g
g
p
ct
= A
(p
ct
)
A
p
ct
(mod p)
und daher A yG (mod p) f ur y = z

A
p
ct
m

. 2
Lemma 5.7. Sei Geine multiplikativ geschriebene abelsche Gruppe. Dann gilt f ur
beliebige A, B G
[A Bg[ =
_
AB
(1)
_
g
.
Beweis. Ein beliebiges Element a A liegt genau dann in Bg, wenn es ein b B
mit a = bg gibt; dies ist aber gleichbedeutend mit ab
1
= g. Daher ist die Anzahl
der Elemente a A Bg in der Tat der Koefzient von g in AB
(1)
. 2
6 Multiplikatoren
Die Darstellung eines symmetrischen Blockplans mit Singergruppe G durch
eine Differenzmenge D liefert uns unmittelbar die regul ar operierende Automor-
phismengruppe G. Meist wird aber noch viele weitereAutomorphismen besitzen,
wie das f ur die klassischen projektiven Ebenen und die Blockpl ane PG
n1
(n, q) der
Fall ist, siehe Beispiel IX.5.3. Oft kann man einige dieser weiteren Automorphis-
men mit Hilfe der Differenzmengendarstellung nden, indemman die von Marshall
Hall im Jahre 1947 eingef uhrten

Multiplikatoren verwendet. Im abelschen Fall


auf den wir uns der Einfachheit halber beschr anken wollen kann ein Multiplikator
von D als ein Automorphismus der Singergruppe G deniert werden, der einen
Automorphismus von = dev D induziert. Besonders wichtig sind die numeri-
schen Multiplikatoren, die die Form : x . t x f ur eine zu v = [G[ teilerfremde
ganze Zahl t haben; man nennt dann auch t selbst einen numerischen Multiplikator.
Man sieht sofort, da t genau dann ein Multiplikator ist, wenn t D = Dg f ur ein
geeignetes g G gilt. Man beachte, da im Fall einer zyklischen Gruppe G jeder
Multiplikator numerisch ist, da dann die Automorphismengruppe von Ggenau aus
denAbbildungen : x . t x f ur eine zu v = [G[ teilerfremde ganze Zahl t besteht.
Beispiel 6.1. Die (7,3,1)-Differenzmenge D = {0, 1, 3] Z
7
hat die Multipli-
katoren 1, 2 und 4; beispielsweise gilt 2D = {0, 2, 6] = D 6. Die Paley-
Differenzmengen aus Satz 3.6 haben nach Konstruktion jedes Quadrat als Mul-
tiplikator.
264 XI Symmetrische Blockpl ane und Differenzmengen
Die Bedeutung des Multiplikatorbegriffs liegt darin, da man oft bereits aus
den Parametern einer hypothetischen abelschen Differenzmenge D die Existenz
gewisser numerischer Multiplikatoren herleiten kann, die man dann entweder zur
Konstruktion der Differenzmenge oder aber auch zu einem Nichteexistenzbeweis
verwenden kann; wir werden f ur diesen Ansatz etliche interessante Beispiele an-
geben. Die eben skizzierten Ideen gehen auf die fundamentale Arbeit von Marshall
Hall [1947] zur uck, wo der Spezialfall zyklischer planarer Differenzmengen (also
zyklischer (n
2
n1, n1, 1)-Differenzmengen) untersucht wurde. Seine Ergeb-
nisse wurden dann von Chowla und Ryser [1950] auf abelsche Differenzmengen
mit beliebigem verallgemeinert:
Satz 6.2 (Erster Multiplikatorsatz). Sei Deine abelsche (v, k, )-Differenzmenge;
ferner sei p eine Primzahl, die n = k teilt, aber nicht v. Falls p > gilt, ist p
ein Multiplikator f ur D.
Korollar 6.3. Sei D eine abelsche planare Differenzmenge der Ordnung n. Dann
ist jeder Teiler von n ein Multiplikator f ur D.
Halls Beweis (wie auch seine Verallgemeinerung durch Chowla und Ryser) war
ausgesprochen technischer Natur und ben otigte mehrere Seiten; hinterher war der
Satz zwar bewiesen, aber sein tieferer Grund blieb eher unklar. Mehr als 30 Jahre
sp ater fand Lander [1980] einen wesentlich erhellenderen, konzeptionellen Beweis,
der sp ater von Pott [1988,1990] und von van Lint und Wilson [2001] noch weiter
vereinfacht wurde. Wir f uhren jetzt einen derartigen Beweis vor, der einen ersten
Eindruck von der St arke des Gruppenring-Ansatzes liefern wird und an K urze und
Eleganz wohl nicht mehr ubertroffenwerdenkann. Der Beweis zerf allt inzwei Teile,
n amlich ein rein kombinatorisches Lemma und ein algebraisches Argument. Das
kombinatorische Resultat ist die folgende einfache Charakterisierung der Bl ocke
eines symmetrischen Blockplans von Lander [1980].
Lemma 6.4. Sei S eine Menge von k Punkten in einem symmetrischen (v, k, )-
Blockplan. Falls S jeden Block in mindestens Punkten schneidet, ist S selbst ein
Block.
Beweis. Wir numerieren die Bl ocke als B
1
, . . . , B
v
und setzen a
i
= [SB
i
[. Indem
man die Paare (x, B
i
) mit x B
i
S sowie die Tripel (x, y, B
i
) mit x, y B
i
S
und x ,= y jeweils auf zwei Weisen abz ahlt, ergeben sich die Gleichungen
v

i=1
a
i
= k
2
und
v

i=1
a
i
(a
i
1) = k(k 1).
XI.6 Multiplikatoren 265
Damit folgen
v

i=1
(a
i
)
2
= k(k 1) k
2
2k
2
v
2
= (k
2
v) k(k )
= (k ) k(k ) = n
2
,
wobei wir f ur die letzte Gleichung (1.1) verwendet haben, sowie
v

i=1
(a
i
) = k
2
v = n.
Nun nimmt die Summe der Quadrate von v nichtnegativen ganzen Zahlen mit
Summe n ihr Maximum n
2
genau dann an, wenn eine dieser Zahlen gleich n ist
und alle anderen 0 sind. Daher gibt es einen Index j mit
a
i
=
_
k f ur i = j
f ur i ,= j,
womit S in der Tat ein Block ist. 2
Wegen Lemma 6.4 folgt nun Satz 6.2, falls wir
(6.1) [pD (D g)[ f ur alle g G
zeigen k onnen. InAnbetracht der Voraussetzung p > reicht es dazu, die folgende
Kongruenz nachzuweisen:
(6.2) [pD (D g)[ (mod p) f ur alle g G.
Alle bekannten Beweise ben otigen hierf ur algebraische Argumente und verwen-
den den ganzzahligen Gruppenring ZG von G; daher schreiben wir f ur den Rest
des Beweises G multiplikativ. Nach Lemma 5.4 mu die Differenzmenge D die
Gleichung
(6.3) DD
(1)
= (k ) G
erf ullen, und die Behauptung (6.2) ubersetzt sich in
(6.4) [D
(p)
Dg[ (mod p) f ur alle g G.
266 XI Symmetrische Blockpl ane und Differenzmengen
Lemma 5.7 legt es nun nahe, (6.4) nachzuweisen, indem man das Gruppenring-
element D
(p)
D
(1)
modulo p auswertet. Wir reduzieren also alle Koefzienten
modulo p; anders gesagt, arbeiten wir ab jetzt im Gruppenring Z
p
G uber dem
K orper Z
p
der Reste modulo p, wobei wir nunmehr endlich die Voraussetzung
p [ n = k benutzen. Mit Gleichung (6.3), der Tatsache DG = kG sowie
Lemma 5.5 ergibt sich die folgende Rechnung in Z
p
G:
D
(p)
D
(1)
= D
p
D
(1)
= D
p1
(DD
(1)
)
= D
p1
(G) = k
p1
G =
p
G = G,
womit wir schon die ben otigte Kongruez (6.4) erhalten haben. 2
Es gibt weitere Multiplikators atze, deren Essenz darin besteht, die Vorausset-
zung p > in Satz 6.2 durch schw achere (aber wesentlich kompliziertere) Vor-
aussetzungen zu ersetzen; man vermutet n amlich, da diese Voraussetzung nicht
wirklich ben otigt wird (multiplier conjecture). Der interessierte Leser sei hierf ur
auf Beth, Jungnickel und Lenz [1999] und die dort zitierte Literatur verwiesen. Um
Satz 6.2 anzuwenden, ben otigen wir noch das folgende einfache Resultat; ab jetzt
schreiben wir die Gruppe G wieder additiv.
Lemma 6.5. Sei D eine abelsche (v, k, )-Differenzmenge in G. Falls k und v
teilerfremd sind, existiert ein Element b G, f ur welches das Translat Db unter
jedem Multiplikator festbleibt.
Beweis. Es sei D = {d
1
, . . . , d
k
]. Da k und v teilerfremd sind, ist die Abbildung
x . kx bijektiv, weswegen es genau ein b G mit d
1
d
k
kb = 0
gibt. Sei nun ein beliebiger Multiplikator f ur D. Dann gibt es also ein c G mit
(D b) = D c. Es folgt
0 = (d
1
d
k
kb) = ((d
1
b) (d
k
b))
= (d
1
c) (d
k
c) = d
1
d
k
kc
und somit kc = kb, also c = b. 2
Korollar 6.6. Sei M eine Gruppe von Multiplikatoren einer abelschen (v, k, )-
Differenzmenge in G, und k und v seien teilerfremd. O.B.d.A. werde D von M
festgelassen. Dann ist D die Vereinigung von Bahnen von M auf G, weswegen k
die Summe von Bahnl angen von M ist.
Beweis. Nach Lemma 6.5 k onnen wir in der Tat annehmen, da D unter jedem
Multiplikator festbleibt. Mit d D liegt somit das Bild von d unter M ganz in D,
womit die Behauptung folgt. 2
XI.6 Multiplikatoren 267
Wir geben nun einige ziemlich einfache, aber durchaus typische Beispiele an,
die zeigen, wie man die vorangehenden Resultate anwenden kann.
Beispiel 6.7. Wir untersuchen, ob es eine (37, 9, 2)-Differenzmenge D gibt. Da 37
eine Primzahl ist, gilt G = Z
37
. Wegen Satz 6.2 mu 7 ein Multiplikator f ur D sein,
und nach Korollar 6.6 k onnen wir annehmen, da Daus Bahnen der von 7 erzeugten
Multiplikatorgruppe M besteht. Nun gilt M = {1, 7, 12, 10, 33, 9, 26, 34, 16]; bis
auf

Aquivalenz also den

Ubergang von D zu einer Differenzmenge der Form
t D b f ur ein b G und eine zu v teilerfremde Zahl t ist daher die einzig
denkbare M oglichkeit f ur D einfach D = M. Man pr uft nun leicht nach, da dies
in der Tat die gew unschte Differenzmenge liefert.
Beispiel 6.8. Nach Satz IX.5.7 kann die klassische projektive Ebene PG(2, q) stets
durch eine zyklische planare Differenzmenge dargestellt werden. Wir benutzen nun
Multiplikatoren, umein konkretes Beispiel f ur den Fall n = 5 zu nden. Da v = 31
eine Primzahl ist, k onnen wir wie in Beispiel 6.7 annehmen, da 1 D gilt und
da D unter der vom Multiplikator 5 erzeugten Gruppe M = {1, 5, 25] festbleibt.
Es mu also D = M aM f ur ein geeignetes a gelten. Mit etwas Probieren ndet
man die M oglichkeit a = 11.
Beispiel 6.9. Wir untersuchen, ob es eine (31, 10, 3)-Differenzmenge D gibt. Da
31 eine Primzahl ist, gilt G = Z
31
. Wegen Satz 6.2 mu 7 ein Multiplikator f ur D
sein, und nach Korollar 6.6 k onnen wir annehmen, da D aus Bahnen der von 7
erzeugten Multiplikatorgruppe M besteht. Da aber M = {1, 7, 18, 2, . . . ] f unfzehn
Elemente hat, ist dies unm oglich; es kann also keine (31, 10, 3)-Differenzmenge
geben.
Beispiel 6.10. Wir zeigen, da es keine abelsche (253, 28, 3)-Differenzmenge D
geben kann. Nach Satz 6.2 w are 5 ein Multiplikator f ur D. Da 5 Ordnung 5 (mod 11)
und Ordnung 22 (mod 23) hat, hat die von 5 erzeugte Gruppe M Bahnen der L angen
1, 5, 5, 22, 110 und 110 auf G

= Z
253
, wie sich der Leser in Einzelheiten uberlegen
sollte. Nach Korollar 6.6 m ute D also eine Bahn der L ange 5 sowie die Bahn {0]
der L ange 1 und die Bahn {11, 511,5
2
11, . . . } der L ange 22 enthalten. Somit l age
die zyklische Untergruppe H der Ordnung 23 von Gganz in D, was offensichtlich
unm oglich ist.
Beispiel 6.11. Wir zeigen, da es keine planare abelsche Differenzmenge geben
kann, deren Ordnung n durch 6 teilbar ist. Angenommen, es gibt eine solche Dif-
ferenzmenge D. Wegen Korollar 6.3 und Satz 6.6 k onnen wir dann annehmen, da
D unter den Multiplikatoren 2 und 3 festbleibt. F ur jedes Element d ,= 0 in D gilt
somit 2d, 3d D. Wegen = 1 und 3d 2d = 2d d ist dies aber unm oglich.
268 XI Symmetrische Blockpl ane und Differenzmengen

Ubung 6.12. Man zeige, da es keine planare abelsche Differenzmenge geben


kann, deren Ordnung n durch 10, 14, 15 oder 21 teilbar ist.

Ubung 6.13. Man konstruiere explizite Beispiele f ur planare abelsche Differenz-


mengen der Ordnungen 3, 7 und 8.

Ubung 6.14. Man zeige, da es bis auf



Aquivalenz genau eine (19,9,4)-Differenz-
menge gibt.
7 Der Mann-Test
In diesemAnschnitt wollen wir ein weiteres wichtiges Existenzkriterium f ur abel-
sche Differenzmengen kennenlernen, n amlich den sogenannten Mann-Test, der auf
Mann[1964] zur uckgeht. Wir begn ugenuns mit einer einfachenFassung; die st arke-
re, recht technische Version, die Resultate von Jungnickel und Pott [1988] und von
Arasu et al. [1990] beinhaltet und auch nicht-abelsche Gruppen betrifft, kann man
in VI.7 von Beth, Jungnickel und Lenz [1999] nachlesen. Der Beweis, den wir hier
vorstellen, ist zudem wenig elegant, daf ur aber elementar; mit mehr algebraischen
Hilfsmitteln lassen sich die von uns durchgef uhrten Rechnungen vermeiden. Wir
erinnern daran, da der Exponent einer abelschen Gruppe G das kleinste gemein-
same Vielfache aller Ordnungen von Elementen von G ist.
Satz 7.1 (Mann-Test). Es sei D eine (v, k, )-Differenzmenge in einer abelschen
Gruppe G. Ferner sei U eine echte Untergruppe der Ordnung s und vom Index
u = v/s. Wir setzen H = G/U und bezeichnen den Exponenten von H mit u

.
Schlielich sei p eine Primzahl, die u

nicht teilt. Falls es eine nichtnegative ganze


Zahl f und einen Multiplikator t von D mit tp
f
1 (mod u

) gibt, kann p kein


Teiler des quadratfreien Teils von n = k sein.
Beweis. Wir verwenden den ganzzahligen Gruppenring ZGvon G; daher schreiben
wir in diesem Beweis G wieder multiplikativ. Sei : G H der kanonische
Epimorphismus von G auf H; wie vereinbart, bezeichnen wir auch die lineare
Fortsetzung von zu einemEpimorphismus ZG ZH mit . Indemwir auf die
Differenzmengengleichung (6.3) anwenden, erhalten wir die folgende Gleichung
in ZH:
(7.1) (D)(D
(1)
) = n sH.
Wegen tp
f
1 (mod u

) k onnen wir o.B.d.A.


(D
(1)
) = (D
(tp
f
)
) = (D
(p
f
)
)
XI.7 Der Mann-Test 269
annehmen, weil ja t ein Multiplikator ist. Mit X := (D)(D
(1)
) erhalten wir
also aus (7.1) die Identit at
(7.2) X = (D)(D
(p
f
)
) = n sH.
Sei nun p
i
die h ochste p-Potenz, die n teilt; man schreibt daf ur p
i
| n. Wegen
(7.2) liegt dann X im von p
i
und H erzeugten Ideal von ZH, wof ur man X 0
mod (p
i
, H) schreibt. Wir zeigen zun achst, da X , 0 mod (p
i1
, H) gelten mu.
Andernfalls w urden n amlich C, C
/
ZH und ein x Z existieren, f ur die
X = n sH = p
i1
C C
/
H = p
i1
C xH
gilt. Dann folgt aber p
i1
C = n(s x)H und damit weil H ein Element ,= 1
enth alt sowohl p
i1
|
| s x als auch p
i1
|
| n (s x), also der Widerspruch
p
i1
|
| n. Somit ist i die gr ote nat urliche Zahl, f ur die X 0 mod (p
i
, H) gilt.
Wir untersuchen nun (D). Es sei j die gr ote nichtnegative ganze Zahl mit
(D) 0 mod (p
j
, H), also etwa (D) = p
j
A yH mit A ZH und y Z.
Da die Abbildung Y . Y
(p
f
)
wegen p u

ein Automorphismus von ZH ist, folgt


die analoge Gleichung (D)
(p
f
)
= p
j
A
(p
f
)
yH. Mit (7.2) ergibt sich
(7.3) X =
_
p
j
A yH
__
p
j
A
(p
f
)
yH
_
0 mod (p
2j
, H),
also i 2j. Angenommen, es gilt i > 2j. Wegen (7.3) folgt dann AA
(p
f
)
0 mod
(p, H), was nach Lemma 5.5 A
p
f
1
0 mod (p, H) und dann wegen Lemma 5.6
A 0 mod (p, H) ergibt. Das bedeutet aber (D) 0 mod (p
j1
, H), im
Widerspruch zur Wahl von j. Somit mu i = 2j gelten, p teilt also nicht den
quadratfreien Teil von n. 2
Wir geben ein einfaches Beispiel f ur die Anwendung des Mann-Testes an; da-
nach folgt ein starkes Korollar, das insbesondere im planaren Fall sehr n utzlich
ist.
Beispiel 7.2. Wir zeigen, da es keine (25, 9, 3)-Differenzmenge D geben kann;
man beachte, da die zu Grunde liegende Gruppe abelsch sein m ute. (Ein Ergebnis
der elementaren Gruppentheorie besagt, da jede Gruppe der Ordnung p
2
, p prim,
abelsch ist.) Wir wenden Satz 7.1 mit t = 1 und p = 2 auf eine Untergruppe des
Index u = 5 an; wegen 2
2
1 (mod 5) erhalten wir einen Widerspruch, da 2 den
quadratfreien Teil von n = 6 teilt.

Ubung 7.3. Man zeige, da es keine abelsche (39,19,9)-Differenzmenge gibt.


270 XI Symmetrische Blockpl ane und Differenzmengen
Korollar 7.4. Sei D eine abelsche (v, k, )-Differenzmenge in G. Falls n und v
teilerfremd sind und ein numerischer Multiplikator existiert, der gerade Ordnung
modulo u f ur einen Primteiler u von v hat, ist n notwendigerweise ein Quadrat.
Beweis. Sei mein Multiplikator f ur D, der gerade Ordnung modulo u hat, etwa 2h;
daraus folgt sofort die Konguenz m
h
1 (mod u). Wir w ahlen eine Untergruppe
U von G vom Index u und einen beliebigen Primteiler p von n. Da p nach Vor-
aussetzung von u verschieden ist und da der Multiplikator t = m
h
die Kongruenz
tp
f
1 (mod u) f ur f = 0 erf ullt, k onnen wir Satz 7.1 anwenden. Es kann also
keinen Primteiler des quadratfreien Teils von n geben, womit n ein Quadrat ist. 2
8 Planare Differenzmengen
In diesemAbschnitt wollen wir noch einmal auf die Primzahlpotenzvermutung f ur
endliche projektive Ebenen zur uckkommen, diesmal unter der Zusatzannahme, da
die Ebene eine groe abelsche Kollineationsgruppe besitzt. Der wichtigste Fall ist
dabei nat urlich der einer abelschen Singergruppe.
Wir betrachten jetzt also planare abelsche Differenzmengen. Hier sind zahlrei-
che Existenztests bekannt, von denen wir einige darstellen werden. Insgesamt ist
die Evidenz f ur die G ultigkeit der Primzahlpotenzvermutung f ur planare abelsche
Differenzmengen beachtlich: Sie ist jedenfalls f ur n 2.000.000 und im zykli-
schen Fall sogar f ur n 2 10
9
korrekt, wie Gordon [1994] bzw. Baumert und
Gordon [2003] gezeigt haben. H aug wird sogar die st arkere Vermutung ge auert,
da die einzigen endlichen projektiven Ebenen mit einer (abelschen) Singergruppe
die klassischen Ebenen PG(2, q) sind. Hier ist die konkrete Evidenz gering: Die
Vermutung gilt f ur alle Ordnungen n und n
2
mit n 9, siehe Bruck [1960]. Es gibt
aber das folgende tief liegende Resultat, das im zyklischen Fall von Ott [1975] und
im abelschen Fall von Ho [1998] bewiesen wurde; sein Beweis w urde weit uber
den Rahmen dieses Buches hinausgehen.
Satz 8.1 (Ott-Ho-Theorem). Eine endliche projektive Ebene, die zwei verschiedene
Singergruppen besitzt, ist notwendigerweise klassisch.
Wenden wir uns also der leichteren, aber immer noch fast aussichtslos erschei-
nendenPrimzahlpotenzvermutungzu! Mit ahnlichenMethodenwie inBeispiel 6.11
und

Ubung 6.12 erh alt man die folgende Einschr ankung, die im wesentlichen auf
Hall [1947] zur uckgeht und von Gordon [1998] auf zahlreiche weitere Produkte
zweier Primzahlen ausgedehnt wurde; einen Beweis ndet man in TheoremVI.7.19
von Beth, Jungnickel und Lenz [1999].
XI.8 Planare Differenzmengen 271
Satz 8.2. Die Ordnung einer planaren abelschen Differenzmenge ist durch keine
der Zahlen 6, 10, 14, 15, 21, 22, 26, 33, 34, 35, 38, 39, 46, 51, 55, 57, 58, 62 und
65 teilbar.
Als n achstes wenden wir den Mann-Test im planaren Fall an:
Satz 8.3. Sei D eine planare abelsche Differenzmenge der Ordnung n in G. Dann
impliziert jede der folgenden Bedingungen, da n ein Quadrat ist; dabei seien p
bzw. q Primteiler von n bzw. von v = n
2
n 1.
(a) Es gibt einen numerischen Multiplikator f ur D, der gerade Ordnung modulo
q hat.
(b) p ist kein quadratischer Rest modulo q.
(c) n 4 oder 6 (mod 8).
(d) n 1 oder 2 (mod 8) und p 3 (mod 4).
(e) n m oder m
2
(mod m
2
m 1), und p hat gerade Ordnung modulo
m
2
m1.
Beweis. Das Kriterium (a) ist gerade die Bedingung aus Korollar 7.4. Kriterium (b)
folgt dann aus der Tatsache, da p ein quadratischer Rest w are, wenn es ungerade
Ordnung modulo q h atte. Sei nun n 4 oder 6 (mod 8). Dann ist n gerade, und es
gilt v 5 oder 3 (mod 8). Aufgrund eines bekannten Resultats aus der elementaren
Zahlentheorie kann dann 2 kein quadratischer Rest modulo v sein, weswegen es
einen Primteiler q von v geben mu, f ur den 2 auch kein quadratischer Rest modulo
q ist. Somit ist (c) ein Spezialfall von (b), wobei wir p = 2 w ahlen. Die beiden
ubrigen Kriterien folgen mit ahnlichen Argumenten. 2
Satz 8.3 wird dadurch besonders n utzlich, da die Existenz einer planaren abel-
schen Differenzmenge quadratischer Ordnung n = m
2
auch die einer solchen
Menge der Ordnung m impliziert. Wir wollen jetzt dieses Resultat beweisen, das
im zyklischen Fall von Ostrom [1953] und im allgemeinen Fall von Jungnickel und
Vedder [1984] stammt.
Satz 8.4. Wenn es eine planare abelsche Differenzmenge der Ordnung n = m
2
gibt, existiert auch eine solche Differenzmenge f ur die Ordnung m.
Beweis. NachKorollar 6.3sindmunddamit auchm
3
Multiplikatorender gegebenen
Differenzmenge D, wobei o.B.d.A. Dm = Dgelte. Wir betrachtendie Menge F der
Fixpunkte des Multiplikators m
3
in der zu Grunde liegenden abelschen Gruppe G.
Nun ist x F zu x(m
3
1) = 0 aquivalent, gilt also genau dann, wenn die Ordnung
272 XI Symmetrische Blockpl ane und Differenzmengen
von x ein Teiler von m
3
1 ist. Andererseits teilt die Ordnung jedes Elementes
die Ordnung von G, weswegen F genau aus denjenigen Elementen von G besteht,
deren Ordnung ein Teiler von ggT(m
3
1, m
4
m
2
1) = m
2
m1 ist. Nach
einem von Frobenius stammenden elementaren Resultat der Gruppentheorie (siehe
etwa Theorem 9.5.2 bei Hall [1959]) ist die Anzahl dieser Elemente ein Vielfaches
von m
2
m1. Man sieht nun leicht ein, da F ,= Ggilt, womit dann die von F und
den Fixgeraden D g (g F) induzierte Inzidenzstruktur eine echte Unterebene

0
von = dev D bildet. Wegen Satz IX.7.2 hat
0
h ochstens die Ordnung m,
mu also in unserem Fall genau diese Ordnung haben und eine Baer-Unterebene
bilden; insbesondere gilt [F[ = m
2
m1. Da die Summe von zwei Elementen
in F wieder ein Fixpunkt ist, ist F eine Untergruppe von G, die trivialerweise
regul ar auf sich selbst und damit auf der Baer-Unterebene
0
operiert. F ist also
eine Singergruppe f ur
0
, und die Behauptung folgt aus Satz 5.2. 2
Eine weitere interessante Einschr ankung wird sich aus dem folgenden Satz von
Wilbrink [1985] ergeben. Wir ubernehmen den einfachen Beweis von Ghinelli und
Jungnickel [2003a], der mit einigen Rechnungen im ganzzahligen Gruppenring
modulo p bzw. p
2
auskommt. F ur Verallgemeinerungen auf beliebige Differenz-
mengen verweisen wir auf Beth, Jungnickel und Lenz [1999, VI.7].
Satz 8.5 (Satz von Wilbrink). Seien D eine planare Differenzmenge der Ordnung
n in einer multiplikativ geschriebenen abelschen Gruppe G und p ein Primteiler
von n, f ur den p
2
kein Teiler von n ist. Falls D unter demMultiplikator p fest bleibt,
gilt die folgende Gleichung im Gruppenring Z
p
G:
(8.1) D
p1

_
D
(1)
_
p1
= 1 G.
Beweis. Nach Korollar 6.3 ist p ein Multiplikator f ur D, und wegen Lemma 6.5
k onnen wir in der Tat annehmen, da D unter p fest bleibt. Im Gruppenring gilt
also D
(p)
= D. In Anbetracht von Lemma 5.5 folgt
D(D
p1
1) = D
p
D = pA
f ur ein geeignetes A ZGund somit auch D
(1)
((D
(1)
)
p1
1) = pA
(1)
. Wir
erhalten daher die folgende Konguenz modulo p
2
:
0 (pA)
_
pA
(1)
_
=
_
DD
(1)
_
p
DD
(1)
_
1 D
p1

_
D
(1)
_
p1
_
.
Mit Gleichung (6.3) und DG = D
(1)
G = (n 1)G ergibt sich daraus
(8.2) n
_
D
p1

_
D
(1)
_
p1
_
(n G)
p
(n G) 2(n 1)
p1
G.
XI.8 Planare Differenzmengen 273
Wegen p[n gilt weiterhin
(n G)
p
G
p
(n 1)
p1
G (1 n)G mod p
2
,
wie man leicht nachpr uft. Daher reduziert sich (8.2) zu
(8.3) n
_
D
p1

_
D
(1)
_
p1
_
(1 n)G(n G) n nG,
woraus die Behauptung folgt, wenn man n = cp f ur eine nicht durch p teilbare
nat urliche Zahl c verwendet. 2
Korollar 8.6. Sei D eine planare abelsche Differenzmenge der Ordnung n, wobei
n gerade sei. Dann gilt n = 2, n = 4, oder n ist durch 8 teilbar.
Beweis. Falls n nicht durch 4 teilbar ist, folgt aus Satz 8.5 die Gleichung
(8.4) D D
(1)
= 1 G in Z
2
G.
Die rechte Seite von (8.4) enth alt n
2
n Gruppenelemente mit Koefzient 1,
w ahrend auf der linke Seite h ochstens 2(n 1) solche Elemente auftreten k onnen.
Somit gilt 2(n 1) n
2
n und daher n = 2. Als n achstes nehmen wir n 4
(mod 8) an. Dann mu n nach Satz 8.3 ein Quadrat sein, etwa n = m
2
. Wegen
Korollar 8.4 gibt es also auch eine planare abelsche Differenzmenge der Ordnung
m. Da m gerade, aber nicht durch 4 teilbar ist, zeigt der bereits betrachtete Fall
m = 2, also n = 4. 2
Korollar 8.6 stammt von Jungnickel undVedder [1984], die dieses Ergebnis mit
geometrischen Methoden bewiesen haben. Die erste H alfte des hier angegebenen
Beweises ndet sich bei Wilbrink [1985], der mit ahnlichen allerdings etwas
komplizierteren Argumenten auch das folgende Ergebnis f ur den Fall p = 3
erhalten hat; bisher ist es nicht gelungen, Satz 8.5 auch f ur p 5 anzuwenden.
Korollar 8.7. Sei D eine planare abelsche Differenzmenge der Ordnung n, wobei
n durch 3 teilbar sei. Dann gilt entweder n = 3, oder n ist durch 9 teilbar.
In diesem Zusammenhang erw ahnen wir noch die folgende, vielleicht etwas
k unstlich wirkende Umformulierung der Primzahlpotenzvermutung: Wenn es eine
planare abelsche Differenzmenge der Ordnung n gibt und wenn p
i
|
| n, aber p
i1
n
f ur eine Primzahl p und ein i N gilt, folgt n = p
i
. Die Korollare 8.6 und 8.7
zeigen, da dieseVermutung f ur p
i
{2, 3, 4] korrekt ist; diese drei F alle sind nach
wie vor die einzigen bekannten allgemeinen Resultate. Beispielsweise scheint es
mit den gegenw artigen Methoden nicht m oglich zu sein, eine so spezielle Serie von
274 XI Symmetrische Blockpl ane und Differenzmengen
Ordnungen wie n = p(p 2) f ur Primzahlzwillinge p und p 2 auszuschlieen;
dieser Fall wurde von Ho [1991] untersucht. Es bleibt in diesem Gebiet also noch
viel zu tun!
Abschlieend wollen wir kurz projektive Ebenen mit einer

groen abel-
schen Kollineationsgruppe G diskutieren. Genauer gesagt gelte
[G[ > (n
2
n 1)/2,
wobei n wie ublich die Ordnung von sei. Ein wichtiges Ergebnis von Dembowski
und Piper [1967] besagt, da hier einer der acht folgenden F alle vorliegen mu, wo-
bei t dieAnzahl der Bahnen von Gauf der Punktemenge (die nach demsogenannten
Orbittheorem mit der Anzahl der Bahnen auf der Geradenmenge ubereinstimmt,
vgl.

Ubung XIII.2.9) und F die Fixstruktur von G bezeichnen:
(a) [G[ = n
2
n 1, t = 1, F = : G ist eine Singergruppe f ur .
(b) [G[ = n
2
, t = 3, F ist eine Fahne, also ein inzidentes Punkt-Geraden-Paar
(, L

).
(c) [G[ = n
2
, t = n2, F ist entweder eine Gerade mit allen ihren Punkten oder
dual dazu ein Punkt mit allen seinen Geraden. Dies sind die sogenannten
(dualen) Translationsebenen.
(d) [G[ = n
2
1, t = 3, F ist eine Antifahne, also ein nicht-inzidentes Punkt-
Geraden-Paar (, L

).
(e) [G[ = n
2

n, t = 2, F = . In diesem Fall ist eine der beiden Bahnen


von G die Punktemenge einer Baer-Unterebene von .
(f) [G[ = n(n 1), t = 5, F besteht aus zwei Punkten, ihrer Verbindungsgera-
den und einer weiteren Geraden durch einen der beiden Punkte.
(g) [G[ = (n 1)
2
, t = 7, F besteht aus den Punkten und Geraden eines
Dreiecks.
(h) [G[ = (n
2

n 1)
2
, t = 2

n 1, F = . In diesem Fall bilden t 1


der Bahnen Unterebenen der Ordnung

n 1.
Diese acht F alle sind intensiv untersucht worden, und in vier von ihnen n amlich
f ur Gruppen der Typen (b), (c), (f) und (h) konnte die Primzahlpotenzvermutung
nachgewiesen werden, wenn auch mit Ausnahme des Typs (h), der nur f ur die
Ebene der Ordnung 4 vorkommt bislang keine vollst andige Klassikation der
auftretenden Beispiele gelungen ist. In sieben dieser F alle die Ausnahme bildet
der untypische Fall (c) spielen Verallgemeinerungen von Differenzmengen eine
entscheidende Rolle; ahnlich wie im planaren Fall (a) kann die projektive Ebene
durch eine solche Menge dargestellt werden, was dann wieder eine Untersuchung
XI.9 Die Hadamardsche Ungleichung 275
mit Hilfe von Gruppenringen erm oglicht. Wir geben hier nur eine

Ubungsaufgabe
an und verzichten ansonsten auf eine n ahere Diskussion und verweisen stattdes-
sen auf den umfangreichen

Ubersichtsartikel von Ghinelli und Jungnickel [2003a].
In diesem Artikel ndet man auerdem auch eine Auswahl interessanter geome-
trischer Anwendungen solcher Kollineationsgruppen bzw. der zugeh origen verall-
gemeinerten Differenzmengen, wie beispielsweise die Konstruktion von Unitalen
(das sind gewisse in die Ebene eingebettete Blockpl ane), B ogen und Familien von
(Hyper-)Ovalen.

Ubung 8.8. Man zeige, da eine projektive Ebene der Ordnung n mit einer abel-
schen Gruppe des Typs (b) (bzw. (d)) zu einer abelschen relativen Differenzmenge
mit Parametern (n1, n1, n, 1) (bzw. (n, n, n, 1)) aquivalent ist; man vergleiche
dazu auch

Ubung X.4.3.
9 Die Hadamardsche Ungleichung
Zum Abschlu dieses Kapitels wollen wir quasi als Anhang Satz 3.1, also die
Hadamardsche Ungleichung, beweisen. Zwar handelt es sich hier um kein Resul-
tat aus der Kombinatorik, sondern aus der Linearen Algebra. Zum einen ist die
Hadamardsche Ungleichung aber f ur die Kombinatorik sehr wichtig, da sie den
Ausgangspunkt f ur das Studium von Hadamard-Matrizen sowie der zugeh origen
Blockpl ane und Differenzmengen bildet; und zum anderen gibt es seit einigen Jah-
ren einen besonders einfachen Beweis, der noch l angst nicht so bekannt ist, wie er
es verdient h atte. Wir werden jetzt diesen von Craigen [1994] stammenden Beweis
darstellen.
Sei also A eine komplexe (m m)-Matrix mit von 0 verschiedenen Zeilen
a
1
, . . . , a
m
. Wir wenden das aus der Linearen Algebra bekannte Orthogonalisie-
rungsverfahren an, um aus den a
i
paarweise orthogonale Vektoren b
1
, . . . , b
m
zu
konstruieren, die denselben Unterraum des C
n
erzeugen (aber ohne die neuen Vek-
toren zu normieren). Dann gilt also b
1
= a
1
; und wenn paarweise orthogonale
Vektoren b
1
, . . . , b
k
(k < m) mit a
1
, . . . , a
k
) = b
1
, . . . , b
k
) bereits gefunden
sind, wird b
k1
aus der Forderung
b
k1
= a
k1
c
k1
mit c
k1
a
1
, . . . , a
k
) und b
k1
b
1
, . . . , b
k
)
bestimmt, indem man c
k1
=
1
b
1

k
b
k
ansetzt und
i
jeweils aus der
Bedingung b
T
k1
b
i
= 0 ausrechnet. Dabei ist zu beachten, da stets b
T
i
b
i
,= 0 gilt,
da A nach Voraussetzung keine Nullzeile enth alt. Insbesondere ist also c
m
eine
276 XI Symmetrische Blockpl ane und Differenzmengen
Linearkombination von a
1
, . . . , a
m1
, weswegen
det A = det
_
_
_
_
_
a
1
.
.
.
a
m1
a
m
_
_
_
_
_
= det
_
_
_
_
_
a
1
.
.
.
a
m1
b
m
c
m
_
_
_
_
_
= det
_
_
_
_
_
a
1
.
.
.
a
m1
b
m
_
_
_
_
_
gilt. F ahrt man so fort, erh alt man schlielich det A = det B, wobei B die Matrix
mit Zeilen b
1
, . . . , b
m
bezeichnet. Da je zwei Zeilen von B orthogonal zueinander
sind, folgt mit dem Determinantenproduktsatz
[ det A[ = [ det B[ =
_
det B det B =

det B det B

(9.1)
=

det BB

=
_
det
_
diag(|b
1
|
2
, . . . , |b
m
|
2
)
_
= |b
1
| . . . |b
m
|,
wobei B

wie ublich die komplex-konjugierte und transponierte Matrix zu B be-


zeichnet. Andererseits gilt f ur k = 1, . . . , m1 die Absch atzung
|a
k1
| = |b
k1
c
k1
| =
_
(b
k1
c
k1
)
T
(b
k1
c
k1
)
=
_
b
T
k1
b
k1
c
T
k1
c
k1
|b
k1
|,
da wir ja c
k1
a
1
, . . . , a
k
) = b
1
, . . . , b
k
) b
k1
erreicht hatten; dabei haben
wir genau dann Gleichheit, wenn c
k1
= 0 gilt, also f ur a
k1
= b
k1
. Zusammen
mit (9.1) ergibt sich nun direkt die Hadamardsche Ungleichung (3.1). Schlielich
erhalten wir genau dann Gleichheit, wenn a
k
= b
k
, also c
k
= 0, f ur k = 1, . . . , m
gilt. Nach unserer Konstruktion der c
k
bedeutet diese Bedingung aber gerade, da
je zwei der Zeilen a
i
orthogonal zueinander sind. 2
XII Partitionen
In diesemKapitel betrachten wir Partitionen nat urlicher Zahlen. Darunter verstehen
wir eine Darstellung n = n
1
n
r
mit nat urlichen Zahlen, bei der es uns auf
die Reihenfolge der Summanden nicht ankommt.

Aquivalent hierzu k onnen wr uns
eine Partition von n auch als eine disjunkte Zerlegung einer n-elementigen Menge
vorstellen, bei der es uns nur auf die M achtigkeiten der Bestandteile ankommt. Zum
Studiumdieses Begriffes werden wir zun achst ganz allgemein ein m achtiges Werk-
zeug einf uhren, das bei Abz ahlproblemen aller Art von fundamentaler Bedeutung
ist, n amlich erzeugende Funktionen. Zu diesem Thema gibt es dicke B ucher; ganz
besonders sind die beiden Monographien von Stanley [1986,1999] zu empfehlen.
Ein weiteres Standardwerk zur Enumeration ist Goulden und Jackson [1983].
1 Formale Potenzreihen
F uhrt man in der Menge
C
Z

= {(a
0
, a
1
, . . . ) [ a
0
, a
1
, C]
aller Folgen von komplexen Zahlen zwei Verkn upfungen ein, n amlich
komponentenweise Addition:
(a
0
, a
1
, . . . ) (b
0
, b
1
, . . . ) := (a
0
b
0
, a
1
b
1
, . . . )
Multiplikation wie bei Polynomringen, siehe VIII.5:
(a
0
, a
1
, . . . )(b
0
, b
1
, . . . ) := (a
0
b
0
, a
0
b
1
a
1
b
0
, . . . ),
so wird C
Z

zu einem Ring im Sinne der Algebra; man bezeichnet ihn als den Ring
der formalen Potenzreihen in einer Unbestimmten und ben utzt f ur ihn auch das
Symbol C[[z]]. Der Polynomring C[z] ist also der Unterring aller derjenigen forma-
len Potenzreihen uber C, f ur die nur endlich viele Koefzienten von 0 verschieden
sind.
278 XII Partitionen
Man kann in C[[z]] auch unendliche Summen denieren, sofern dabei in jeder
Komponente nur endlich viele Summanden ,= 0 auftreten. Setzt man wie bei der
Denition der Polynomringe z = (0, 1, 0, 0, . . . ), so wird wieder
z
n
= (0, . . . , 0, 1, 0, . . . )
(mit der 1 in der (n 1)-ten Komponente), und man darf
(a
0
, a
1
, . . . ) = a
0
a
1
z a
2
z
2
=

n=0
a
n
z
n
schreiben, so da das ubliche Potenzreihen-Bild entsteht und die f ur Potenzreihen
gewohnten Rechenmethoden in Kraft treten. Wir erw ahnen die folgende wichtige
Identit at, die wir im folgenden ohne weiteren Kommentar verwenden werden:
(1.1)

n=0
z
cn
=
1
1 z
c
f ur c N.
Dabei ist diese Formel im Kontext formaler Potenzreihen in dem ja der Bruch
1
1z
c
bisher nicht erkl art ist nur als eine andere Schreibweise f ur die Identit at
(1 z
c
)
_

n=0
z
cn
_
= 1
anzusehen, deren G ultigkeit man mit den oben gegebenen Denitionen leicht direkt
nachrechnet, womit die Potenzreihe 1 z
c
in der Tat in C[[z]] invertierbar ist.
Der Bereich des analytischAltbekannten dehnt sich noch weiter aus, wenn man
sich auf
C
conv
[[z]] =
_
(a
0
, a
1
, . . . ) [ die Potenzreihe

n=0
a
n
z
n
hat strikt positiven Konvergenzradius
_
zur uckzieht. Hier darf man imKonvergenzbereich die Potenzreihe mit der durch sie
dargestellten Funktion identizieren und mit diesen Funktionen wie ublich rechnen.
Dazu ein Beispiel: F ur [z[ < 1 gelten

n=0
z
n
=
1
1 z
sowie

n=0
(1)
n
z
n
=
1
1 z
XII.2 Erzeugende Funktionen von Partitions-Anzahlen 279
und dann auch
_

n=0
z
n
__

m=0
(1)
m
z
m
_
=
1
1 z

1
1 z
=
1
1 z
2
=

k=0
z
2k
.

Ubung 1.1. Der Leser m oge das eben vorgef uhrte Beispiel im formalen Zusam-
menhang interpretieren und best atigen sowie die allgemeine Identit at
(1.2)

n=0
(1)
n
z
cn
=
1
1 z
c
f ur c N
beweisen.
Eine formale Potenzreihe ist also einfach eine Folge (a
0
, a
1
, . . . ). Nach (1.1) ist
beispielsweise
1
1z
eine kurze Schreibweise f ur die Folge (1, 1, . . . ); wir sagendann
auch, da
1
1z
die erzeugende Funktion dieser Folge ist. Formale Potenzreihen und
erzeugende Funktionen sind ein wirkungsvolles Hilfsmittel bei der Untersuchung
von Zahlenfolgen (a
0
, a
1
, . . . ). Wir werden uns die Freiheit nehmen, von Fall zu
Fall auch Potenzreihen und Funktionen in mehreren Unbestimmten bzw. Variablen
zu betrachten. Die dazu ben otigtenVerallgemeinerungen werden in jedemFalle auf
der Hand liegen.
2 Erzeugende Funktionen von Partitions-Anzahlen
Wir pr azisieren zun achst die Denition einer Partition einer nat urlichen Zahl und
f uhren einige Bezeichnungen ein.
Denition 2.1. Es sei N

r=1
N
r
die Menge der nichtleeren endlichen Folgen
von nat urlichen Zahlen, vgl. Denition VIII.1.1. Wir nennen zwei Elemente von
N

aquivalent, wenn sie gleiche L ange haben und durch Permutation ihrer Eintr age
ineinander ubergehen. Die (n
1
, . . . , n
r
) enthaltende

Aquivalenzklasse bezeichnen
wir mit [(n
1
, . . . , n
r
)]; wenn n
1
n
r
= n ist, heit = [(n
1
, . . . , n
r
)] eine
Partition der nat urlichen Zahl n.

Ublicherweise nennt man n
1
, . . . , n
r
die Teile
oder Komponenten von ; meist werden wir o.B.d.A. n
1
n
2
n
r
annehmen
und dann einfach (n
1
, . . . , n
r
) statt [(n
1
, . . . , n
r
)] schreiben. Wir bezeichnen die
Menge aller Partitionen von n mit P
n
und die Menge P
1
P
2
. . . aller Partitionen
nat urlicher Zahlen mit P.
Die Grundaufgabe der Theorie der Partitionen besteht in der Bestimmung der
M achtigkeiten der P
n
und einiger verwandter Mengen. Eine einfache Veranschau-
lichung der durch (n
1
, . . . , n
r
) gegebenen Partition von n gewinnt man, wenn
280 XII Partitionen
man in Z
2
die Gitterpunkte
(1, 1), . . . , (n
1
, 1)
(1, 2), . . . , (n
2
, 2)
.
.
.
(1, r), . . . , (n
r
, r)
markiert. F ur (5,5,3,1,1) erh alt man so beispielsweise das Partitionsbild
In der Literatur werden Partitionsbilder meist als Ferrers-Diagramme bezeichnet.
Durch Umklappen eines Partitionsbildes um seine Hauptdiagonale erh alt man in
eineindeutiger Weise wieder ein Partitionsbild. So gewinnt man m uhelos den
Satz 2.2. Sei n eine nat urliche Zahl. Es gibt genau so viele Partitionen von n mit
r Teilen wie Partitionen von n mit lauter Teilen r.

Ubung 2.3. Man arbeite einen formalen Beweis dieses Satzes aus, indem man das
Umklappen als eine Bijektion von P
n
auf sich darstellt.
Denition 2.4. Seien S N, r, n N. Mit p(S, r, n) bezeichnen wir die Anzahl
[{(n
1
, . . . , n
r
) [ n
1
, . . . , n
r
S, n
1
n
r
, n
1
n
r
= n][
aller Partitionen von n in r Teile, die s amtlich aus S entnommen sind, und mit
p
d
(S, r, n) die Anzahl
[{(n
1
, . . . , n
r
) [ n
1
, . . . , n
r
S, n
1
> > n
r
, n
1
n
r
= n][
aller Partitionen von n in r paarweise verschiedene, aus S entnommene Teile.
Zus atzlich vereinbaren wir die folgenden Konventionen:
p(S, 0, n) = p
d
(S, 0, n) = 0 f ur n = 1, 2, . . .
p(S, r, 0) = p
d
(S, r, 0) = 0 f ur r = 1, 2, . . .
p(S, 0, 0) = p
d
(S, 0, 0) = 1
XII.2 Erzeugende Funktionen von Partitions-Anzahlen 281
Satz 2.5. Sei S N. Dann gilt f ur [q[ < 1 und [z[ <
1
[q[
:

n=0

r=0
p(S, r, n)z
r
q
n
=

nS
1
1 zq
n
(2.1)

n=0

r=0
p
d
(S, r, n)z
r
q
n
=

nS
(1 zq
n
) (2.2)
Beweis. Man beachte zun achst, da die rechten Seiten der Gleichungen (2.1) und
(2.2) nach bekannten S atzen uber unendliche Produkte im angegebenen Bereich
konvergent sind; im ubrigen k onnen die folgenden Rechnungen auch rein formal
durchgef uhrt werden. Wir schreiben dazu S = {n
1
, n
2
, . . . ] mit 1 n
1
< n
2
<
Dann gilt f ur jedes K N
K

k=1
1
1 zq
n
k
=
K

k=1
_

r
k
=0
z
r
k
q
r
k
n
k
_
=

r
1
=0

r
K
=0
z
r
1
r
K
q
r
1
n
1
r
K
n
K
=

n=0

r=0
p
(K)
(r, n)z
r
q
n
,
wobei p
(K)
(r, n) anzeigt, wie oft r
1
r
K
= r mit r
1
n
1
r
K
n
K
= n
vorkommt. Das ist f ur r = 0, n = 0 genau einmal der Fall, und es gilt daher
p
(K)
(0, 0) = 1; man sieht ferner p
(K)
(0, n) = p
(K)
(r, 0) = 0 f ur alle r, n N.
Ansonsten ist p
(K)
(r, n) die Anzahl der Partitionen von n in r Teile, bei denen
jeweils r
i
Teile die Gr oe n
i
haben (i = 1, . . . , K), so da insbesondere S =
{n
1
, n
2
, . . . ] nur bis n
K
in Anspruch genommen wird. L at man nun K wachsen,
so steigt p
(K)
(r, n) nach endlich vielen Schritten auf den Endwert p(S, r, n). Die

Uberlegungen, die nun noch n otig sind, um (2.1) sicherzustellen, sind einfacher
technischer Natur und m ogen dem Leser uberlassen bleiben. F ur den Nachweis
von (2.2) gehen wir ganz ahnlich vor:
K

k=1
(1 zq
n
k
) =
K

k=1
_
1

r
k
=0
z
r
k
q
r
k
n
k
_
=
1

r
1
=0

1

r
K
=0
z
r
1
r
K
q
r
1
n
1
r
K
n
K
=

n=0

r=0
p
(K)
d
(r, n)z
r
q
n
,
wobei p
(K)
d
(r, n) anzeigt, wie oft r
1
r
K
= r mit r
1
n
1
r
K
n
K
= n
und r
i
{0, 1] vorkommt. Offenbar gelten p
(K)
d
(0, 0) = 1 und p
(K)
d
(0, n) =
282 XII Partitionen
p
(K)
d
(r, 0) = 0 f ur alle r, n N, und ansonsten ist p
(K)
d
(r, n) die Anzahl der Parti-
tionen von n in maximal K Teile, bei denen jeder Teil eine Gr oe aus {n
1
, . . . , n
K
]
hat und jede Gr oe h ochstens einmal auftritt. Man schliet nun wie vorhin den
Beweis ab. 2
Der Leser m oge als

Ubung diesen Beweis um die ausgelassenen Konvergenz-
betrachtungen (

Epsilontik) erg anzen. Wir bezeichnen nun f ur S Nmit p(S, n)


die Anzahl aller Partitionen von n in Teile aus S und mit p
d
(S, n) die Anzahl aller
Partitionen von n in paarweise verschiedene, aus S entnommene Teile. Wenn man
in Satz 2.5 z = 1 setzt, ergibt sich unmittelbar das folgende
Korollar 2.6. Sei S N. Dann gilt f ur [q[ < 1

n=0
p(S, n)q
n
=

nS
1
1 q
n
, (2.3)

n=0
p
d
(S, n)q
n
=

nS
(1 q
n
). (2.4)
Insbesondere erhalten wir im Spezialfall S = N die folgenden Formeln f ur die
Anzahl p(n) aller Partitionen von n sowie die Anzahl p
d
(n) aller Partitionen von
n in lauter verschiedene Teile:
Korollar 2.7. F ur n N gilt

n=0
p(n)q
n
=

nN
1
1 q
n
, (2.5)

n=0
p
d
(n)q
n
=

nN
(1 q
n
). (2.6)
Schlielich bedeute p
d
(r, n) die Anzahl aller Partitionen von n mit genau r
Teilen, die s amtlich von verschiedener Gr oe sind; nat urlich ergibt sich aus (2.2)
im Spezialfall S = N eine erzeugende Funktion f ur diese Zahlen. Man kann aber
auch eine andere, interessantere Identit at beweisen:
Satz 2.8. Es seien r, n N. Dann gilt f ur [q[ < 1
(2.7)

n=0
p
d
(r, n)q
n
=
q
r(r1)/2
(1 q)(1 q
2
) . . . (1 q
r
)
.
XII.3 Eulers Pentagonalzahlen-Theorem 283
Beweis. Sei n = b
1
b
r
mit b
1
< < b
r
. Wir setzen a
i
= b
i
i f ur
i = 1, . . . , r; dann gilt 0 a
1
a
r
. Damit erhalten wir f ur [q[ < 1

n=0
p
d
(r, n)q
n
=

b
1
<<b
r
q
b
1
b
r
=

a
1
=0

a
2
=a
1

a
r
=a
r1
q
(1a
1
)(ra
r
)
= q
1r

a
1
=0

a
2
=a
1

a
r1
=a
r2
q
a
1
a
r1
q
a
r1
_

a
r
=0
q
a
r
_
=
q
r(r1)/2
1 q

a
1
=0

a
r1
=a
r2
q
a
1
a
r2
2a
r1
=
q
r(r1)/2
(1 q)(1 q
2
)

a
1
=0

a
r2
=a
r3
q
a
1
3a
r2
= =
q
r(r1)/2
(1 q)(1 q
2
) . . . (1 q
r
)
.
2
3 Eulers Pentagonalzahlen-Theorem
Mit den Formeln des vorigen Abschnitts hat der Leser das Grund-R ustzeug f ur den
Umgang mit Partitionen erworben. Zu welcher Sch onheit und F ulle die Theorie der
Partitionen heute herangereift ist, kann man aus der Monographie des Partitionen-
GromeistersAndrews [1976] entnehmen. Wir begn ugen uns hier mit einemkurzen
Einblick, den wir wie imwesentlichen schon den vorigenAbschnitt weitgehend
aus Andrews [1979] ubernehmen.
Die ebene Punktmenge Z
n
= {(1, 0), (2, 0), . . . , (n, 0)] l at sich als

diskretes
Zweieck der Seitenl ange n ansprechen; trivialerweise gilt [Z
n
[ = n. Ein diskretes
Dreieck
D
n
:
284 XII Partitionen
der Seitenl ange n hat
[D
n
[ = 1 2 n =
n(n 1)
2
Punkte, und ein diskretes Quadrat hat [Q
n
[ = n
2
Punkte. Wie steht es nun mit den
diskreten F unfecken F
1
, F
2
, . . . aus, die man etwa so zeichnen kann:
n = 5
n = 4
n = 3
n = 2
n = 1
Die eingetragenen Hilfslinien f uhren auf die Pentagonalzahlen
[F
n
[ = (1 2 n) 2[1 2 (n 1)]
=
1
2
n(n 1) n(n 1) =
n(3n 1)
2
.
Diese Pentagonalzahlen treten in dem von Euler [1783] stammenden Pentagonal-
zahlen-Theorem
(3.1)

n=
(1)
n
q
n(3n1)/2
=

n=1
(1 q
n
) f ur [q[ < 1
auf. Eine weitere Identit at von Euler lautet
(3.2) 1

n=1
q
n
2
(1 q)
2
(1 q
2
)
2
. . . (1 q
n
)
2
=

n=1
1
1 q
n
.
XII.3 Eulers Pentagonalzahlen-Theorem 285
Wir stellen uns nun die Frage, ob hinter solchen Identit aten kombinatorische Sach-
verhalte stecken. Als James Joseph Sylvester (1814 1897) in den Jahren 1876 bis
1883 an der neu gegr undeten John Hopkins University in Baltimore arbeitete, wurde
diese Frage zu einem der wesentlichen Themen in der gl anzenden Mathematiker-
gruppe, die sichumihnscharte. Sie hat sichals Leitidee bis heute als auerordentlich
fruchtbar erwiesen, vgl. Andrews [1979]. Wir erproben sie hier in einigen F allen,
bei deren Behandlung sich die kombinatorische Idee des sogenannten Durfee-
Quadrats Durfee geh orte zum Kreis um Sylvester in Baltimore als wirksam
erweist.
Intuitiv gesprochen, ist das Durfee-Quadrat einer Partition das gr ote diskrete
Quadrat, das in die linke obere Ecke des in 2 eingef uhrten Partitionsbildes pat.
Ist beispielsweise n = 17 = 5 4 4 2 1 1, so hat diese Partition das
Partitionsbild
und daher ein Durfee-Quadrat der Seitenl ange 3, welches wir eingezeichnet haben.
Offenbar kann man jede Partition von n mit einem Durfee-Quadrat der Seitenl ange
D durch ein Tripel von Daten kennzeichnen:
die Zahl D;
eine Partition einer Zahl r mit Teilen D, wobei das Bild dieser Partition der
unterhalb des Durfee-Quadrats liegende Teil des Bildes der urspr unglichen
Partition ist (daf ur gibt es p({1, . . . , D], r) M oglichkeiten);
eine Partition einer Zahl s mit Teilen D, wobei die Umklappung des Bildes
dieser Partition der rechts vom Durfee-Quadrat liegende Teil des Bildes der
urspr unglichen Partition ist (mit p({1, . . . , D], s) M oglichkeiten).
Umgekehrt liefert jedes solche Daten-Tripel eine Partition von n = D
2
r s mit
einem Durfee-Quadrat der Seitenl ange D. Mit der Identit at (2.3) k onnen wir nun
unter Verwendung von (2.3) die erzeugende Potenzreihe f ur dieAnzahl d(D, n) der
286 XII Partitionen
Partitionen von n, die ein Durfee-Quadrat der Seitenl ange D besitzen, ausrechnen:

n=0
d(D, n)q
n
=

n=0
q
n

n=D
2
rs
p({1, . . . , D], r)p({1, . . . , D], s)
= q
D
2
_

r=0
q
r
p({1, . . . , D], r)
__

s=0
q
s
p({1, . . . , D], s)
_
=
q
D
2
(1 q)
2
. . . (1 q
D
)
2
Summiert man dies uber D = 0, 1, 2, . . . , so erh alt man trivialerweise die erzeu-
gende Potenzreihe

n=1
1
1q
n
f ur die Partitionszahlen p(n), f ur die wir bereits die
Formel (2.5) kennen. Damit haben wir die Eulersche Identit at (3.2) bewiesen.

Ubung 3.1. Man beweise die auf Augustin-Louis Cauchy (1789 1857) zur uck-
gehende Verallgemeinerung
1

n=1
z
n
q
n
2
(1 q)(1 q
2
) . . . (1 q
n
)(1 zq)(1 zq
2
) . . . (1 zq
n
)
(3.3)
=

n=1
1
1 zq
n
f ur [q[ < 1, z <
1
[q[
der Eulerschen Identit at (3.2).
Hinweis: Man beachte, da nach Satz 2.5 die rechte Seite der Identit at (3.3) die
erzeugende Funktion der Doppelfolge (p(N, r, n))
r,n=0,1,...
ist, und imitiere den
obigen Beweis der Identit at (3.2).
Wir werden nun das Pentagonalzahlen-Theorem (3.1) aus dem folgenden Satz
herleiten:
Satz 3.2. F ur [q[ < 1 und [z[ <
1
[q[
gilt

n=1
(1 zq
n
) =

D=0
z
D
q
D(3D1)
2
(1 zq
2D1
)
(1 zq)(1 zq
2
) . . . (1 zq
D
)
(1 q)(1 q
2
) . . . (1 q
D
)
.
Beweis. Nach (2.2) gilt
(3.4)

n=1
(1 zq
n
) =

n,r=0
p
d
(r, n)z
r
q
n
,
XII.3 Eulers Pentagonalzahlen-Theorem 287
wobei p
d
(r, n) wieder dieAnzahl der Partitionen von n in r paarweise verschiedene
Teile bezeichnet. F ur eine beliebige derartige Partition denken wir uns das Partiti-
onsbild gezeichnet und darin das Durfee-Quadrat eingetragen. Seine Seitenl ange
sei D. Wir benutzen nun die Darstellung des Partitionsbildes als Mosaik aus Durfee-
Quadrat, Partitionsteil unterhalb des Durfee-Quadrats und Partitionsteil rechts vom
Durfee-Quadrat:
Fall 1. Der D-te Teil der Partition (also im Bild die untere Kante des Durfee-
Quadrats) hat die Gr oe D. Da alle Teile verschieden gro sind, mu dann der
unterhalb des Durfee-Quadrats liegende Teil des Partitionsbildes a = r D ver-
schiedene Teile D 1 aufweisen, wogegen der rechts vom Durfee-Quadrat
liegende Bildteil genau D 1 verschiedene Teile besitzt. Bei festem D ist die
erzeugende Potenzreihe f ur diese Partitionen durch

r,n=0
q
n
z
r

D
2
uv=n

Da=r
p
d
({1, . . . , D 1], a, u)p
d
(D 1, v)
= q
D
2
z
D

u,a=0
p
d
({1, . . . , D 1], a, u)q
u
z
a

v=0
p
d
(D 1, v)q
v
gegeben, und dies ist nach den S atzen 2.5 und 2.8 gleich
q
D
2
z
D
(1 zq)(1 zq
2
) . . . (1 zq
D1
)
q
D(D1)/2
(1 q)(1 q
2
) . . . (1 q
D1
)
.
Fall 2. Der D-te Teil der Partition ist gr oer als D. Man erh alt eine zum vorigen
Fall v ollig analoge Beschreibung der auftretenden Partitionen, nur mit Teilen der
Gr oe D bzw. mit D Teilen (statt zuvor D1). Bei festemD ist die erzeugende
Potenzreihe dieser Partitionen also
q
D
2
z
D
(1 zq)(1 zq
2
) . . . (1 zq
D
)
q
D(D1)/2
(1 q)(1 q
2
) . . . (1 q
D
)
.
288 XII Partitionen
Fall 1 kann nur bei D 1 vorkommen, Fall 2 auch bei D = 0. Die Identit at
(3.4) l at sich also wie folgt fortsetzen:
=

D1
z
D
q
D
2
D(D1)/2
(1 zq)(1 zq
2
) . . . (1 zq
D1
)
(1 q)(1 q
2
) . . . (1 q
D1
)
1

D1
z
D
q
D
2
D(D1)/2
(1 zq)(1 zq
2
) . . . (1 zq
D
)
(1 q)(1 q
2
) . . . (1 q
D
)
=

D0
z
D1
q
D(3D1)/2
q
2D1
(1 zq)(1 zq
2
) . . . (1 zq
D
)
(1 q)(1 q
2
) . . . (1 q
D
)

D0
z
D
q
D(3D1)/2
(1 zq)(1 zq
2
) . . . (1 zq
D
)
(1 q)(1 q
2
) . . . (1 q
D
)
=

D0
z
D
q
D(3D1)/2
(1 zq
2D1
)
(1 zq)(1 zq
2
) . . . (1 zq
D
)
(1 q)(1 q
2
) . . . (1 q
D
)
,
wie gew unscht. 2
Wir kommen nun zum Beweis des Pentagonalzahlen-Theorems (3.1). Dazu
setzen wir in Satz 3.2 z = 1 und erhalten
(3.5)

n=1
(1 q
n
) =

D=0
(1)
D
q
D(3D1)/2
_
1 q
2D1
_
.
Es bleibt zu zeigen, da sich dies zu

n=
(1)
n
q
n(3n1)/2
umformen l at. Nun
gilt
(n 1)(3(n 1) 1)
2
2(n 1) 1 =
n(3n 1)
2
;
daher k onnen wir in (3.5) wie folgt weiterrechnen:
= (1 q)

n=1
(1)
n
q
n(3n1)/2

n=2
(1)
n
q
n(3n1)/2
= 1

n=1
(1)
n
q
n(3n1)/2

n=1
(1)
n
q
n(3n1)/2
XII.3 Eulers Pentagonalzahlen-Theorem 289
= 1

n=1
(1)
n
q
(n)(3(n)1)/2

n=1
(1)
n
q
n(3n1)/2
=

n=
(1)
n
q
n(3n1)/2
.
2
Wir wollen nun noch den ber uhmten Beweis von Franklin [1881] f ur das Eu-
lersche Pentagonalzahlen-Theorem kennenlernen. Hierbei wird die Betrachtung
von Partitionsbildern f ur Partitionen von n in paarweise verschiedene Teile eine
besondere Rolle spielen. Da die Teile paarweise verschieden sind, bedeutet f ur
das Partitionsbild, da die Zeilen von oben nach unten immer um mindestens 1
k urzer werden. Dabei interessiert uns die Frage, wie lange die Verk urzung stets
genau 1 betr agt. Solange dies, von der obersten Zeile an gerechnet, anh alt, fassen
wir die rechten Endglieder der betreffenden Zeilen zumsogenannten Trauf unseres
Partitionsbildes zusammen. Unter dem Trauf springt die n achste Zeile wenn es
eine solche gibt um mindestens 2 ein, so da man den Trauf abnehmen kann und
trotzdem immer noch ein Partitionsbild mit lauter ungleichen Teilen beh alt. Dazu
ein Beispiel:
Trauf
Neben dem Trauf wird uns auch noch die unterste Zeile des Partitionsbildes be-
sch aftigen. Ist der Trauf echt k urzer als die unterste Zeile, so wollen wir ihn abneh-
men und als neue Zeile unter die bisher unterste Zeile legen, bildhaft also so:
Dadurch entsteht ein Partitionsbild mit einer Zeile mehr als vorher. Ist der Trauf
dagegen l anger als die unterste Zeile, so nehmen wir die unterste Zeile weg und
290 XII Partitionen
machen sie zum neuen Trauf. Es entsteht ein Partitionsbild, das eine Zeile weniger
hat als vorher und bei dem der Trauf echt k urzer ist als die nunmehr unterste Zeile,
beispielsweise so:
Wir sehen, da die in den beiden F allen vorgenommenen Operationen zueinander
invers sind. Allerdings gibt es f ur jede der beiden Operationen Ausnahmef alle, in
denen sie entweder gar nicht funktionieren oder ein Partitionsbild mit zwei gleichen
Teilen liefern. F ur die Operation

Trauf ansetzen sind dies die F alle, in denen der


Trauf vor der Operation bis in die unterste Zeile reicht (und genauso lang ist), d. h.
die Partitionen mit Teilen m, m1, . . . , 2m1; das Ansetzen der letzten Zeile als
neuer Trauf w urde hier einen

Uberhang liefern und kein Partitionsbild. In diesem


Falle gilt
n = m(m1) (2m1) =
m(3m1)
2
.
F ur die Operation

Trauf abnehmen sind es die F alle, in denen der Trauf genau um


1 k urzer ist als die unterste Zeile und bis zu dieser hinabreicht, d. h. die Partitionen
mit Teilen m 1, m 2, . . . , 2m; hier w urde das Ansetzen des Traufs als neue
letzte Zeile zwei gleich lange Zeilen liefern. In diesem Falle gilt
n = (m1) (m2) 2m =
m(3m1)
2
.
Hat also n keine der beiden Gestalten m(3m1)/2 bzw. m(3m1)/2, so funk-
tionieren im Bereich der Partitionen von n in lauter ungleiche Teile die beiden zu-
einander inversen Operationen; dabei f uhrt jede dieser Operationen eine Partition
mit einer geradenAnzahl von Teilen in eine solche mit einer ungeradenAnzahl von
Teilen uber. Unsere Partitionen ordnen sich also zu Paaren, deren Glieder durch die
beiden Operationen einander wechselseitig zugeordnet sind, und von denen immer
ein Glied eine ungerade, das andere eine gerade Zahl von Teilen hat. Es gibt also
ebenso viele Partitionen von n mit einer geraden Anzahl von lauter verschiedenen
Teilen wie Partitionen von n mit einer ungeraden Anzahl von lauter verschiedenen
Teilen. Bezeichnet G die Menge der geraden und U die der ungeraden nat urlichen
Zahlen, so k onnen wir diesen Sachverhalt wie folgt schreiben:
p
d
(G, n) = p
d
(U, n).
XII.3 Eulers Pentagonalzahlen-Theorem 291
Ist dagegen n = m(3m1)/2, so gibt es genau eine Partition mit mverschiedenen
Teilen, f ur die die Operation

Trauf ansetzen nicht deniert ist; alle ubrigen Parti-


tionen von n in ungleiche Teile ordnen sich kraft der Anwendbarkeit der zueinander
inversen Operationen zu Paaren, in denen immer eine Partition mit einer ungeraden
und eine mit einer geraden Zahl von Teilen beisammen sind; ist m gerade, so gibt
es dabei eine ubersch ussige Partition mit einer geraden Anzahl von verschiedenen
Teilen; ist m ungerade, so uberwiegt das Ungerade. Somit erhalten wir
p
d
(G, n) p
d
(U, n) = (1)
m
f ur n =
m(3m1)
2
.
Analog beweist man dieselbe Formel auch f ur den Fall n = m(3m1)/2. Insge-
samt gilt also
(3.6) p
d
(G, n) p
d
(U, n) =
_
(1)
m
f ur n
_
m(3m1)
2
,
m(3m1)
2
_
0 sonst.
Mit dieser Formel, deren Beweis bereits den wesentlichen Gedanken von Fran-
klin [1881] enth alt, gelingt nun ein abermaliger Beweis des Pentagonalzahlen-
Theorems. Die linke Seite

n=
(1)
n
q
n(3n1)/2
von (3.1) kann n amlich wie
in der Rechnung nach (3.5) als
1

m=1
(1)
m
q
m(3m1)/2

m=1
(1)
m
q
m(3m1)/2
geschrieben werden, was mit (3.6) unmittelbar
1

n=1
[p
d
(G, n) p
d
(U, n)]q
n
ergibt; und die rechte Seite

r=1
(1 q
r
) von (3.1) l at sich wie folgt schreiben:
1

r
1
=0
1

r
2
=0
1

r
3
=0
. . . (1)
r
1
r
2
r
3

q
r
1
2r
2
3r
3

mit der Nebenbedingung, da jeweils nur endlich oft r


k
1 vorkommt, womit dann
r
1
2r
2
3r
3
. . . eine Partition einer Zahl n, und zwar mit lauter verschieden
groenTeilen, darstellt; r
1
r
2
. . . ist dabei jeweils dieAnzahl der Teile, weswegen
wir beim Zusammenfassen nach gleichen Potenzen von q f ur gerade r
1
r
2

eine 1 und f ur ungerade r
1
r
2
eine 1 aufsammeln. Es geht also weiter mit
1

n=1
[p
d
(G, n) p
d
(U, n)]q
n
,
womit die Formel (3.1) abermals bewiesen ist.
XIII Die Abz ahltheorie von Plya
Wann immer in den Wissenschaften digitale, diskrete Ph anomene auftreten, ist die
Kombinatorik aufgefordert, die zugeh origen mathematischen Probleme aufzuwer-
fen oder zu ubernehmen und zu l osen. Dies gilt in besonderem Mae, wo das
Demokritsche Prinzip

Alle Vielfalt entsteht durch vielf altige Zusammenf ugung


einfacher Bausteine sich geltend macht. Ein Paradebeispiel f ur dies Prinzip ist
die Chemie: Die ganze Vielfalt der chemischen Verbindungen entsteht durch Zu-
sammenf ugen von atomaren Bausteinen. Eine ber uhmte Antwort auf die damit
gestellten kombinatorischen Fragen ist die Theorie der Isomeren-Abz ahlung von
Plya [1937]. Ihr mathematischer Gehalt war ubrigens weitgehend schon in der
seinerzeit zu wenig beachteten Arbeit von Redeld [1927] enthalten; ahnlich wie
beim Heiratssatz II.1.1 war die Leistung von Plya auch eine unabh angige Wie-
derentdeckung alterer Resultate in nunmehr glanzvollerer Gestalt. Die Plyasche
Theorie verwendet zwei mathematische Techniken, n amlich
erzeugende Potenzreihen und
endliche Gruppen, insbesondere Permutationsgruppen.
Die Technik der erzeugenden Potenzreihen hat der Leser im vorigen Kapitel in
ihren Grundlagen sowie in einer ihrer Anwendungen bereits kennengelernt. Die
elementare Theorie der Gruppen wollen wir hier als bekannt voraussetzen und f ur
unsere Zwecke zurechtschleifen. Unsere Darstellung folgt dabei weitgehend de
Bruijn [1971].
1 Der Zyklenindex einer Permutationsgruppe
Sei X eine endliche Menge. Bijektive Abbildungen : X X heien bekanntlich
Permutationen von X. Die Permutationen von X bilden mit der Hintereinander-
schaltung als Verkn upfung eine Gruppe, die symmetrische Gruppe S
X
von X. Ist
X = {1, . . . , n], so schreibt man S
n
statt S
{1,...,n]
. Wie wir in Korollar I.2.4 gesehen
haben, gilt [S
n
[ = n'.
Jede Permutation von X besitzt eine eindeutige Zyklenzerlegung, bei der die
1-Zyklen die von festgelassenen Elemente, also die Fixpunkte von , sind. Kom-
men in der Zyklenzerlegung von genau b
1
1-Zyklen, b
2
2-Zyklen, vor, so
XIII.1 Der Zyklenindex einer Permutationsgruppe 293
nennt man die Folge b = (b
1
, b
2
, . . . ) den Typ von . Man schreibt ihn auch als
b() = (b
1
(), b
2
(), . . . ). Nat urlich ist dabei stets [X[ = b
1
2b
2
3b
3
;
insbesondere haben wir also b
k
= 0 f ur k > [X[. Ist G eine Gruppe von Permuta-
tionen von X, dann heit das Polynom
P
G
(z
1
, z
2
, . . . ) =
1
[G[

G
z
b
1
()
1
z
b
2
()
2
. . .
der Zyklenindex von G; es kommen dabei nat urlich nur endlich viele der Unbe-
stimmten z
1
, z
2
, . . . wirklich vor. Bezeichnet a
G
(b
1
, b
2
, . . . ) dieAnzahl der G,
die den Typ (b
1
, b
2
, . . . ) haben, so ist
P
G
(z
1
, z
2
, . . . ) =
1
[G[

b
1
,b
2
,...
a
G
(b
1
, b
2
, . . . )z
b
1
1
z
b
2
2
. . .
Nur die endlich vielen a
G
(b
1
, b
2
, . . . ) mit b
1
2b
2
3b
3
= [X[ k onnen
hierbei ,= 0 sein.
Beispiel 1.1. Sei G = V
4
= {id, (12)(34), (13)(24), (14)(23)]. Die sogenannte
Kleinsche Vierergruppe V
4
operiert regul ar auf der Menge {1, 2, 3, 4] und hat den
Zyklenindex
P
G
=
1
4
_
z
4
1
3z
2
2
_
.
Die Untergruppe U S
4
mit U = {id, (13)(24), (13), (24)] ist zu V
4
isomorph,
operiert aber nicht regul ar (sondern in zwei Bahnen) und hat den Zyklenindex
P
U
=
1
4
_
z
4
1
z
2
2
2z
2
1
z
2
_
.
Dieses Beispiel zeigt, da der Zyklenindex nicht nur von der abstrakt gruppentheo-
retischen Struktur der betrachteten Permutationsgruppe abh angt; technisch ausge-
dr uckt, sind die beiden Gruppen U und V
4
zwar isomorph, nicht aber permutations-
isomorph. Es sei demLeser uberlassen, diesen Begriff vern unftig zu denieren oder
die wichtige Monographie von Wielandt [1964] uber Permutationsgruppen zu kon-
sultieren.

Ubung 1.2. Man bestimmte den Typ der durch 1 . 3, 2 . 4, 3 . 1, 4 . 6,


5 . 5, 6 . 2, 7 . 8, 8 . 7 gegebenen Permutation S
8
sowie den
Zyklenindex der von erzeugten zyklischen Untergruppe von S
8
.
Beispiel 1.3. Sei X die Menge der acht Ecken eines W urfels und G S
X
die
Menge aller derjenigen Permutationen von X, die sich durch Drehungen (nicht
294 XIII Die Abz ahltheorie von Plya
also Spiegelungen) des W urfels bewirken lassen. Sei W
0
eine W urfelseite und
G
W
0
die Menge aller G, die W
0
in sich uberf uhren, also die Ecken von W
0
permutieren. Offenbar ist G
W
0
eine Untergruppe der Ordnung 4 von G. F ur jede der
6 W urfelseiten W sei
W
eine Permutation von G, deren zugeh orige Raumdrehung
W
0
in W uberf uhrt. Jede W
0
in W uberf uhrende Permutation l at sich dann auf
genau eine Weise in der Form
W
, G
W
0
, schreiben. Somit zerf allt G in 6
Linksnebenklassen nach G
W
0
, und wir erhalten [G[ = 24. Wir schreiben nun die
Permutationen aus G samt ihren Typen tabellarisch auf:
Die Drehachse verbindet Drehwinkel Anzahl Typ
die Mitten zweier gegen uberliegen- 3 (0, 4, 0, 0, . . . )
der W urfelseiten
die Mitten zweier gegen uberliegen-

2
,
3
2
2 3 (0, 0, 0, 2, 0, . . . )
der W urfelseiten
die Mitten zweier gegen uberliegen- 6 (0, 4, 0, 0, . . . )
der W urfelkanten
Zwei diagonal gegen uberliegende
2
3
,
4
3
2 4 (2, 0, 2, 0, 0, . . . )
W urfelecken
Das sind 23 verschiedene Permutationen, zu denen noch die Identit at mit dem Typ
(8, 0, 0, . . . ) hinzukommt. Wir erhalten den Zyklenindex
P
G
(z
1
, z
2
, . . . ) =
1
24
_
z
8
1
9z
4
2
6z
2
4
8z
2
1
z
2
3
_
.

Ubung 1.4. Man bestimme den Zyklenindex der Gruppe aller Permutationen der
sechs Seiten bzw. der zw olf Kanten eines W urfels, die sich durch Raumdrehungen
bewirken lassen.

Ubung 1.5. Man bestimme den Zyklenindex der Gruppe aller Permutationen der
acht Seiten bzw. der sechs Ecken bzw. der zw olf Kanten eines Oktaeders, die sich
durch Raumdrehungen bewirken lassen.
Hinweis: Man beziehe die Oktaeder achen auf die Ecken eines passenden W urfels
etc.

Ubung 1.6. Man bestimme den Zyklenindex der Gruppe aller Permutationen der
vier Ecken bzw. der vier Fl achen bzw. der sechs Kanten eines Tetraeders, die sich
durch Raumdrehungen bewirken lassen.
XIII.1 Der Zyklenindex einer Permutationsgruppe 295
Es l age nahe, die analogen

Ubungen auch f ur das Dodekaeder und das Ikosaeder
zu stellen, umdie Behandlung der platonischen K orper vollst andig zu machen, doch
sollen die

Ubungen hier einen m aigen Umfang nicht uberschreiten.
Beispiel 1.7. Wir bestimmendenZyklenindexder symmetrischenGruppe S
n
. Hier-
zu ist die Anzahl a
S
n
(b
1
, b
2
, . . . ) der Permutationen aus S
n
zu ermitteln, die einen
gegebenen Typ (b
1
, b
2
, . . . ) haben. Wir tun dies, indem wir die Platznummern
1, . . . , n in b
1
Einser-, b
2
Zweiergruppen etc. einteilen. Jede Verteilung der Ziffern
1, . . . , n auf die n Pl atze liefert dann eine Permutation aus S
n
in Zyklendarstellung.
Zwei Verteilungen bedeuten dabei dieselbe Permutation, wenn sie innerhalb jeder
Platzgruppe durch zyklische Permutation ineinander ubergehen. Auerdem darf
man die b
k
Platzgruppen der L ange k noch beliebig durcheinanderwirbeln. Dies
liefert
a
S
n
(b
1
, b
2
, . . . ) =
n'
b
1
'2
b
2
b
2
'3
b
3
b
3
' . . .
P
S
n
(z
1
, z
2
, . . . ) =

b
1
2b
2
3b
3
=n
z
b
1
1
z
b
2
2
z
b
3
3
. . .
b
1
'2
b
2
b
2
'3
b
3
b
3
' . . .
Wir erlauben uns noch eine kleine Potenzreihenrechnung, deren formale Berechti-
gung darauf beruht, da alle vorkommenden Zahlen-Additionen und -Multiplika-
tionen in Wahrheit endlich sind. Sei z eine weitere Unbestimmte. Dann gilt

n=0
z
n
P
S
n
(z
1
, z
2
, . . . ) =

n=0
z
n

b
1
2b
2
3b
3
=n
z
b
1
1
z
b
2
2
z
b
3
3
. . .
b
1
'2
b
2
b
2
'3
b
3
b
3
' . . .
=

n=0

b
1
2b
2
3b
3
=n
(zz
1
)
b
1
(z
2
z
2
)
b
2
(z
3
z
3
)
b
3
. . .
b
1
'2
b
2
b
2
'3
b
3
b
3
' . . .
=

(b
1
,b
2
,... )
1
b
1
'
(zz
1
)
b
1
1
b
2
'
_
z
2
z
2
2
_
b
2
1
b
3
'
_
z
3
z
3
3
_
b
3
. . .
=
_

b
1
=0
1
b
1
'
(zz
1
)
b
1
__

b
2
=0
1
b
2
'
_
z
2
z
2
2
_
b
2
__

b
3
=0
1
b
3
'
_
z
3
z
3
3
_
b
3
_
. . .
Dabei ist auf

b
k
= 0 schlielich zu achten, bei der letzten Multiplikation also
nur aus endlich vielen Klammern ein Summand mit einer Nummer > 0 als Faktor
auszuw ahlen. Es geht daher weiter mit
= e
zz
1
e
z
2
z
2
/2
e
z
3
z
3
/3
. . . = e

k=1
z
k
z
k
/k
.
296 XIII Die Abz ahltheorie von Plya
Legt man sich auf [z[ < 1, [z
1
[ < 1, . . . fest, so bekommt diese formale Rechnung
einen handfesten analytischen Sinn.

Ubung 1.8. Man bestimme den Zyklenindex der alternierenden Gruppe A


n
f ur
n = 1, 2, . . .
Hinweis: Eine Permutation aus S
n
geh ort genau dann nicht zu A
n
, wenn die Anzahl
ihrer Zyklen von gerader L ange ungerade ist, d. h. wenn ihr Typ
1 (1)
b
2
b
4

= 0
erf ullt.
2 Das Lemma von Burnside
Die PlyascheAbz ahltheorie verwendet als wesentliches Hilfsmittel das sogenann-
te Lemma von Burnside uber Zyklen- und Fixpunktanzahlen von Permutations-
gruppen, das nach William Burnside (1852 1927) benannt ist, obwohl es nicht
von ihm stammt, sondern bereits Cauchy und Frobenius bekannt war; siehe dazu
Neumann [1979]. Dieses Lemma wollen wir jetzt kennenlernen. Dabei arbeiten
wir mit abstrakten endlichen Gruppen, lassen diese aber zugleich als Permutations-
gruppen wirken. Dergleichen haben wir in gewisser Weise schon in Beispiel 1.3
getan, wo eine Gruppe von 24 Drehungen des Raumes als Permutationsgruppe auf
{1, . . . , 8] wirkte. Den dahinter stehenden allgemeinen Gedanken erfassen wir mit
der folgenden
Denition 2.1. Sei Geine endliche Gruppe und X eine endliche Menge. Es sei ein
Homomorphismus
:
_
G S
X
g .
g
gegeben. Homomorphie bedeutet dabei
()
gh
=
g

h
f ur g, h G,
wobei
g

h
die Vorschrift

erst
h
, dann
g
symbolisiert. Dann sagt man, Gwirke
oder operiere (als Permutationsgruppe) auf X.
Sei e das neutrale Element der Gruppe G. Aus () folgt, da
e
die identischeAb-
bildung auf Xist und da
g
1 =
1
g
f ur alle g Ggilt; diese Tatsachen seien dem
Leser als einfache

Ubung uberlassen. Wir ben otigen die folgenden grundlegenden
Begriffsbildungen f ur Permutationsgruppen; die dort auftretenden Behauptungen
sind wieder eine leichte

Ubung f ur den Leser.
XIII.2 Das Lemma von Burnside 297
Denition 2.2. Die Gruppe Gwirke als Permutationsgruppe auf X. F ur jedes Ele-
ment x X ist
G
x
= {g G [
g
(x) = x]
eine Untergruppe von G, der Stabilisator von x, und f ur jedes g G ist
X
g
= {x X [
g
(x) = x]
die Fixpunktmenge von g. Zwei Punkte x, y X sollen aquivalent heien, wenn es
ein g Gmit
g
(x) = y gibt; man veriziert sofort, da wir es tats achlich mit einer

Aquivalenzrelation zu tun haben. Gilt nun auch


h
(x) = y, so ist
1
g
(
h
(x)) =

1
g
(y) = x, d. h. g
1
h G
x
; das bedeutet, da g und h in derselben Linksneben-
klasse des Stabilisators G
x
liegen. Die ein x X enthaltende

Aquivalenzklasse
x
G
= {
g
(x) [ g G]
wird auch die Bahn (oder der Orbit) von x (unter der Wirkung von G) genannt und
hat somit [x
G
[ = [G[/[G
x
[ Elemente. Die Anzahl der Bahnen von G auf X wird
mit o(G) bezeichnet; wenn o(G) = 1 gilt, sagt man, da Gtransitiv auf X operiert.
Lemma 2.3 (Lemma von Burnside). Die endliche Gruppe Goperiere auf der end-
lichen Menge X. Dann gilt
(2.1) o(G) [G[ =

gG
[X
g
[.
Beweis. Wir zeigen zun achst
(2.2)

gG
[X
g
[ =

xX
[G
x
[ = [G[

xX
1
[x
G
[
.
F ur die erste Gleichheit in (2.2) z ahlt man F = {(g, x) G X [
g
(x) = x]
lediglich auf zwei verschiedene Arten ab; die zweite Gleichheit folgt dann aus
[x
G
[ = [G[/[G
x
[. Wenn man nun X in die Bahnen X
1
, . . . , X
r
(mit r = o(G))
zerlegt und y
G
= x
G
f ur y x
G
beachtet, erh alt man
o(G) = r =
r

i=1
1 =
r

i=1

x
i
X
i
1

x
G
i

xX
1
[x
G
[
,
woraus mit (2.2) unmittelbar die Behauptung folgt. 2
298 XIII Die Abz ahltheorie von Plya
Beispiel 2.4. Wir setzen Beispiel 1.3 fort. Bei den dort betrachteten, durch Dre-
hungen induzierten Permutationen der W urfelecken ergab sich acht mal eine 2-
elementige Fixpunktmenge; hierzu kommen die acht Fixpunkte der identischen
Permutation. Mit (2.1) erhalten wir
24 o(G) = 8 2 8, also o(G) = 1.
In der Tat gibt es nur eine

Aquivalenzklasse, da man jede W urfelecke in jede andere
drehen kann: G operiert transitiv auf den Ecken des W urfels.

Ubung 2.5. Die endliche Gruppe G wirke als transitive Permutationsgruppe auf
der endlichen Menge X. Man deniert dann den Rang r(G) von Gals dieAnzahl der
Bahnen des Stabilisators G
x
auf X; dabei ist x X beliebig. Man zeige zun achst,
da diese Denition sinnvoll ist, also nicht von der Auswahl von x abh angt. Ferner
beweise man mit (2.1) die Formel
(2.3) r(G) [G[ =

gG
[X
g
[
2
und zeige, da G mindestens [X[ 1 xpunktfreie Permutationen enthalten mu.
Wir schweifen ein wenig ab, um eine sch one Anwendung des Lemmas von
Burnside zu zeigen; insbesondere werden wir als Spezialfall einen weiteren Beweis
f ur

Ubung I.3.11 erhalten. Dazu sei Geine Untergruppe der symmetrischen Gruppe
S
n
; ferner bezeichne F
j
die Anzahl der Bahnen von Gauf den geordneten j-Tupeln
verschiedener Elemente aus X = {1, . . . , n] und p
i
die Wahrscheinlichkeit daf ur,
da ein zuf allig gew ahltes Element aus Ggenau i Fixpunkte besitzt; formal ist also
p
i
durch
(2.4) p
i
=

{g G [ [X
g
[ = i]

[G[
erkl art. Schlielich denieren wir noch zwei Polynome wie folgt:
P(x) :=
n

i=0
p
i
x
i
und F(x) :=
n

i=0
F
i
i'
x
i
;
dabei verwenden wir die Konvention F
0
= 1. Dann gilt der folgende Satz, den man
bei Boston et al. [1993] ndet; er ist aber auch ein Spezialfall der Redeld-Plya-
Theorie, der allerdings einen kurzen und eleganten direkten Beweis erlaubt.
Satz 2.6. Mit den eben eingef uhrten Bezeichnungen gilt F(x) = P(x 1). Insbe-
sondere ist die Wahrscheinlichkeit daf ur, da ein zuf allig gew ahltes Element aus G
keine Fixpunkte hat, durch p
0
= F(1) gegeben.
XIII.2 Das Lemma von Burnside 299
Beweis. Sei g G eines der p
i
[G[ Elemente mit genau i Fixpunkten. Dann xiert
g genau i(i 1) . . . (i j 1) geordnete j-Tupel verschiedener Elemente; das gilt
f ur j = 1, . . . , n, wobei sich nat urlich im Fall i < j die Anzahl 0 ergibt, wie es ja
auch sein sollte. Damit liefert das Lemma von Burnside f ur j ,= 0 die Formel
F
j
=
n

i=0
p
i
i(i 1) . . . (i j 1);
f ur j = 0 gilt nat urlich F
0
=

n
i=0
p
i
. Mit dem binomischen Lehrsatz folgt
F(x) =
n

i=0
p
i

n

j=1
_
n

i=0
p
i
i(i 1) . . . (i j 1)
j'
_
x
j
=
n

i=0
p
i
_
1
i

j=1
_
i
j
_
x
j
_
=
n

i=0
p
i
(x 1)
i
= P(x 1).
Insbesondere folgt sofort p
0
= P(0) = F(1). 2
Korollar 2.7. Die Anzahl e
i
(n) der Permutationen in S
n
, die genau i Fixpunkte
haben, ist durch die Formel
(2.5) e
i
(n) =
n'
i'
ni

k=0
(1)
k
k'
gegeben.
Beweis. F ur G = S
n
sind alle F
j
= 1, womit man aus Satz 2.6
P(x) =
n

j=0
(x 1)
j
j'
erh alt. Nach dem binomischen Lehrsatz ist also der Koefzient p
i
von x
i
durch
n

j=i
_
j
i
_
(1)
ji
j'
=
n

j=i
(1)
ji
i'(j i)'
=
1
i'
ni

k=0
(1)
k
k'
gegeben, woraus mit (2.4) sofort die Behauptung folgt. 2
300 XIII Die Abz ahltheorie von Plya
Mehr zu dem hier angerissenen Thema ndet man bei Boston et al. [1993]
sowie in dem sch onen Artikel von Cameron [2001]. Schlielich wollen wir noch in
den beiden folgenden

Ubungen einen Beweis des am Ende von XI.8 erw ahnten
Orbittheorems skizzieren. Dieser fundamentale Satz stammt im Wesentlichen von
Brauer [1941] und wurde dann unabh angig voneinander von Dembowski [1958],
Hughes [1957] und Parker [1957] wiederentdeckt.

Ubung 2.8. Sei ein Automorphismus eines symmetrischen Blockplans . Man


zeige, da die Anzahl der Fixpunkte von mit der Anzahl der Fixbl ocke uberein-
stimmt.
Hinweis: Man uberlege sich zun achst, da sich die Wirkung von auf eine In-
zidenzmatrix von durch zwei Permutationsmatrizen beschreiben l at und setze
die Anzahl von Fixelementen mit der Spur dieser Matrizen in Verbindung; danach
f uhrt etwas Lineare Algebra zum Ziel. Die Einzelheiten kann man beispielsweise
in I.4 von Beth, Jungnickel und Lenz [1999] nachlesen.

Ubung 2.9 (Orbittheorem). Sei G eine Automorphismengruppe eines symmetri-


schen Blockplans . Man zeige mit

Ubung 2.8 und dem Lemma von Burnside,
da die Anzahl der Bahnen von G auf der Punktmenge mit der Anzahl der Bahnen
von G auf der Blockmenge ubereinstimmt. Falls G transitiv operiert, zeige man,
da ferner der Rang von Gauf der Punktmenge mit dem Rang auf der Blockmenge
ubereinstimmt.
3 Der Satz von Plya
Der Satz von Plya arbeitet mit den Begriffen

F arbungen und

Muster. Wir
f uhren diese Begriffe zun achst abstrakt ein, beweisen dann den Satz von Plya,
und exemplizieren schlielich die allgemeine Theorie am Beispiel der F arbungen
eines W urfels mit zwei Farben. Im ubern achsten Abschnitt werden wir dann den
Plyaschen Satz auf das chemische Problemder Isomere vonAlkoholen anwenden.
Denition 3.1. Seien Dund F zwei nichtleere endliche Mengen, die wir als Menge
der

Dinge bzw. der

Farben auffassen. Abbildungen c : D F werden dann


auch als F arbungen bezeichnet, und F
D
ist somit die Menge aller F arbungen. Sei
nun G S
D
. Dann ist durch
(
g
c)(d) = c(g
1
(d)) f ur c F
D
, g G, d D
eine Operation von G auf F
D
deniert. Die Anwendung von g bewirkt also eine

Verschiebung der F arbung c: Man f arbt das Ding d unter der F arbung
g
c wie das
XIII.3 Der Satz von Plya 301
Ding g
1
(d) unter c. Die Bahnen der F arbungen c F
D
unter dieser Operation von
Gwerden als Muster bezeichnet. Man beachte, da dies in der Tat der intuitiven Idee
eines Musters entspricht, bei dem es uns im Alltag etwa beim Teppichkauf nach
einem Musterbuch ja auch nicht auf Verschiebungen oder Drehungen ankommt.
Jede Abbildung w : F Q wird als eine Gewichtung der Farben bezeichnet.
Ist c: D F eine F arbung und w : F Q eine Gewichtung, so heit
w(c) =

dD
w(c(d))
das Gewicht der F arbung c unter der Gewichtung w.

Ubung 3.2. Man zeige, da die eben denierte Abbildung g .


g
von G in S
F
D
homomorph ist und da alle F arbungen, die zum selben Muster m geh oren, unter
jeder Gewichtung wdasselbe Gewicht haben, das wir dann auch das Gewicht w(m)
des Musters m nennen.
Satz 3.3 (Satz von Plya). Seien D und F nichtleere endliche Mengen, und sei
w: F Q eine Gewichtung. Ferner seien G eine Untergruppe von S
D
mit
Zyklenindex P
G
(z
1
, z
2
, . . . ) und M die Menge der zugeh origen Muster in F
D
.
Dann gilt
(3.1)

mM
w(m) = P
G
_

f F
w(f ),

f F
w(f )
2
, . . .
_
.
Beweis. Sei m X := F
D
ein Muster. Vergessen wir X m und wenden das
Lemma 2.3 von Burnside auf m an, so erhalten wir
1 =
1
[G[

gG
[X
g
m[.
Weil alle F arbungen in X
g
m nach

Ubung 3.2 dasselbe Gewicht haben, folgt
daraus durch Multiplikation mit w(m)
w(m) =
1
[G[

gG

cX
g
m
w(c)
und nach Summation uber alle m M
(3.2)

mM
w(m) =
1
[G[

gG

cX
g
w(c).
302 XIII Die Abz ahltheorie von Plya
Nun sehen wir uns die rechte Seite von (3.2) genauer an, insbesondere die innere
Summe. Was bedeutet f ur eine feste Permutation g von D und eine feste F arbung
c: D F die Bedingung c X
g
? Das l at sich unmittelbar aus der Zyklenzer-
legung von g ablesen: c mu auf jedem Zyklus konstant sein. Ist (b
1
, b
2
, . . . ) der
Typ von g, so induziert die Zyklenzerlegung von g eine disjunkte Zerlegung von
D:
D = (U
1
U
b
1
) (V
1
V
b
2
) . . .
wobei die U
i
aus je einem, die V
j
aus je zwei Elementen bestehen, etc. Die F arbun-
gen c X
g
entstehen nun gerade, indemman den Bestandteilen dieser Zerlegung je
eine Farbe zuordnet. Das ergibt Farbenf (U
1
), . . . , f (U
b
1
); f (V
1
), . . . , f (V
b
2
); . . .
und somit ein Gesamtgewicht
w(c) =
_
w(f (U
1
))
1
. . . w(f (U
b
1
))
1
__
w(f (V
1
))
2
. . . w(f (V
b
2
))
2
_
. . .
Wenn wir die Folge f (U
1
), . . . , f (U
b
1
); f (V
1
), . . . , f (V
b
2
); . . . , die ja von der
betrachteten F arbung c X
g
abh angt, in c
11
, . . . , c
1b
1
; c
21
, . . . , c
2b
2
; . . . umbe-
nennen, erhalten wir

cX
g
w(c) =

cX
g
_
w(c
11
)
1
. . . w(c
1b
1
)
1
__
w(c
21
)
2
. . . w(c
2b
2
)
2
_
. . .
Da hierbei alle Farben c
ij
v ollig beliebig aus F gew ahlt werden k onnen, um ins-
gesamt eine F arbung c X
g
zu erhalten, kann man diese Gleichung als

cX
g
w(c) =
_

f F
w(f )
_
b
1
_

f F
w(f )
2
_
b
2
. . .
umschreiben. Damit sind wir praktisch fertig; denn durch Summation uber alle
g G erhalten wir nun die folgende Umformung von (3.2):

mM
w(m) =
1
[G[

gG
_

f F
w(f )
_
b
1
(g)
_

f F
w(f )
2
_
b
2
(g)
. . . ,
wobei (b
1
(g), b
2
(g), . . . ) wieder den Typ von g bezeichnet. Offenbar ist das gerade
die Gleichung (3.1). 2
Beispiel 3.4 (Fortsetzung der Beispiele 1.3 und 2.4). Seien Ddie Menge der sechs
W urfel achen, F = {rot, blau] und w(rot) = w(blau) = 1. Dann wird die linke
Seite von (3.1) gerade dieAnzahl der Rot-Blau-Muster des W urfels, also dieAnzahl
XIII.4 B aume und Str unke 303
der Arten, wie man die W urfel achen rot und blau anmalen kann, wobei Anmalun-
gen, die durch Drehungen ineinander uberf uhrbar sind, nur einfach gez ahlt werden.
Hier ist

f F
w(f ) =

f F
w(f )
2
= = 2.
Man ermittelt nun den Zyklen-Index f ur die W urfelseiten-Permutationen (der dem
Leser als

Ubung 1.4 gestellt war) zu
1
24
_
z
6
1
3z
2
1
z
2
2
6z
2
1
z
4
6z
3
2
8z
2
3
_
.
Nach dem Satz von Plya gibt es daher
1
24
_
2
6
3 2
4
6 2
3
6 2
3
8 2
2
_
=
1
3
(8 6 6 6 4) = 10
Muster. Diese lassen sich in diesemeinfachen Beispiel freilich auch direkt auisten:
Blau-Rot-Muster des W urfels
Alles rot
5 Fl achen rot, 1 Fl ache blau
4 Fl achen rot, 2 benachbarte Fl achen blau
4 Fl achen rot, 2 gegen uber liegende Fl achen blau
3 Fl achen rot, 3 an eine Ecke stoende Fl achen blau
3 Fl achen rot, 2 gegen uber liegende Fl achen und eine diese verbindende
Fl ache blau (

Cardan-Gelenk)
Aus Symmetriegr unden ergeben sich dar uber hinaus noch vier weitere Muster, die
die Liste vollst andig machen, und wir erhalten in der Tat insgesamt zehn Muster.

Ubung 3.5. Man ermittle dieAnzahl der Rot-Blau-Muster bei der F arbung der acht
Ecken bzw. der zw olf Kanten eines W urfels.
4 B aume und Str unke
Bevor wir im n achsten Abschnitt zur Abz ahlung der Alkohole nach Plya kom-
men, wollen wir uns noch zur Vorbereitung etwas mit einer wichtigen Klasse von
Graphen, den sogenannten B aumen, befassen.
304 XIII Die Abz ahltheorie von Plya
Denition 4.1. Ein zusammenh angender Graph G = (V, E) ohne Kreise heit ein
Baum. Jeder Punkt vom Grad 1 in G wird als ein Blatt bezeichnet. Zeichnen wir
in Geinen Punkt w speziell aus, so nennen wir das Paar (G, w) einen Wurzelbaum
oder auch einen Strunk mit Wurzel w. Gibt es in V h ochstens einen Punkt mit einem
Grad > 1, so heit der Wurzelbaum einfach; der BaumGwird dann auch ein Stern
genannt.

Ubung 4.2. Es sei G = (V, E) ein Graph auf n Punkten. Man zeige die folgenden
Aussagen:
(a) Wenn G keine Kreise enth alt, gibt es h ochstens n 1 Kanten.
Hinweis: Man entferne eine Kante e und verwende Induktion.
(b) Wenn G zusammenh angend ist, gibt es mindestens n 1 Kanten.
Hinweis: Man entferne einen Punkt v und verwende Induktion.
(c) Wenn G ein Baum ist, gibt es genau n 1 Kanten.
Beweise f ur diese Aussagen und eine mit ihnen zusammenh angende Charakteri-
sierung der B aume ndet man beispielsweise in 1.2 von Jungnickel [1994].
Wir beschreiben jetzt eine rekursive Methode, mit der man alle Wurzelb aume
erzeugen kann. Seien also G = (V, E) ein Strunk mit Wurzel w, v
0
,= w ein Blatt
dieses Strunkes und G = (V
/
, E
/
) ein Strunk mit Wurzel w
/
, wobei V und V
/
disjunkt sind. Salopp gesprochen identizieren wir nun die Wurzel w
/
des zweiten
Strunkes mit dem Blatt v
0
des Strunkes (G, w).
e
/
0
v
0
e
0
w
Formal: e
0
E sei die eindeutig bestimmte mit v
0
inzidente Kante und e
/
0
E
/
die eindeutig bestimmte mit w
/
inzidente Kante; der andere Endpunkt von e
/
0
heie
v
1
. Wir setzen

V = V (V
/
{w
/
])
XIII.5 Alkohole 305
und

E = E (E
/
{e
/
0
]) {v
0
v
1
].
Dann ist

G = (

V,

E) ein Strunk mit Wurzel w, der aus dem Strunk (G, w) durch
Aufpfropfen des Strunkes (G, w
/
) am Blatt v
0
entstanden ist, wie in der folgenden
Zeichnung. Der Leser m oge dies als leichte

Ubungsaufgabe verizieren.

Ubung 4.3. Man beweise, da es zu jedemStrunk S eine endliche Folge S


0
, . . . , S
n
von Str unken gibt, f ur die folgendes gilt:
S
0
besteht aus zwei Punkten und einer Kante.
F ur j = 1, . . . , n entsteht S
j
aus S
j1
durch Aufpfropfen eines einfachen
Strunks an einem Blatt von S
j1
.
S
n
= S.
5 Alkohole
Unter einemAlkohol (genauer einemAlkoholmolek ul) verstehen wir hier, anschau-
lich gesprochen, ein baumf ormiges, also ringfreies Molek ul, das sich aus folgenden
Bausteinen zusammensetzt:
vierwertigen C-Atomen,
einwertigen H-Atomen,
einer einwertigen OH-Gruppe.
EinAlkohol, dessen OH-Gruppe man abgetrennt hat, ist also einwertig. Wir nennen
das Resultat einen CH-Strunk oder ein Alkylradikal. Aus einemAlkohol kann man
neue Alkohole gewinnen, indem man einige H-Atome durch CH-Str unke ersetzt,
etwa durch den einfachsten, den Einserstrunk:
H
H H C
Man kann, ausgehend vom Null-Alkohol
H O
H
306 XIII Die Abz ahltheorie von Plya
also dem Wasser, jeden Alkohol aufbauen, indem man endlich oft H-Atome durch
Einserstr unke ersetzt. Mit den imvorigenAbschnitt eingef uhrten Begriffen k onnen
wir diesen intuitiven Betrachtungen eine exakte mathematische Form geben:
Denition 5.1. Ein Strunk heit ein Alkohol, wenn jeder seiner Punkte entweder
den Grad 1 oder den Grad 4 hat und die Wurzel ein Blatt ist. Die Wurzel heit
dann die OH-Gruppe, die Punkte des Grades 4 heien die C-Atome, und die von
der Wurzel verschiedenen Bl atter heien die H-Atome des Alkohols.
Es gibt genau einenAlkohol ohne C-Atome, n amlich das Wasser. Jeder Alkohol
mit mindestens einem C-Atom sieht so aus:
()
OH
1 2 3
a a a
C
Hierbei sind a
1
, a
2
, a
3
Alkohole mit gekappter OH-Gruppe, aufgepfropft an den
drei freien Valenzen des untersten C-Atoms. Wir setzen
D = {1, 2, 3] und G = S
3
und interpretieren dies wie folgt. Die zu f arbenden Dinge sind die drei freien Va-
lenzen des untersten C-Atoms; zwei Alkohole () gelten uns sicher dann als gleich,
wenn sie durch Umpfropfen von a
1
, a
2
, a
3
auseinander hervorgehen. Umnun exakt
zu sagen, was unsere Farben sein sollen, denieren wir den Begriff des Alkohol-
musters. Hierzu f uhren wir auf der Menge A aller Alkohole folgendermaen eine
Gewichtsfunktion g ein:
g(a) :=Anzahl der C-Atome in a (f ur a A).
Auerdem denieren wir induktiv eine

Aquivalenzrelation in A. Dazu sei A
n
=
{a [ a A, g(a) n]. InA
0
sei die Gleichheit. Angenommen, ist f ur A
n
schon
deniert. Seien a, a
/
A
n1
. Wir k onnen a und analog a
/
wie in () zeichnen;
dabei sind dann also a
1
, a
2
, a
3
und die analogen Gr oen a
/
1
, a
/
2
, a
/
3
f ur a
/
Alkohole
(mit gekappter OH-Gruppe) aus A
n
. Wir setzen nun a a
/
, wenn es ein S
3
mit a
(1)
a
/
1
, a
(2)
a
/
2
, a
(3)
a
/
3
gibt. Damit ist rekursiv f ur ganz Aerkl art.
Man kann kurz sagen, da zwei Alkohole a und a
/
genau dann aquivalent sind,
wenn sie durch eine Kette von Permutationen jeweils derjenigen drei Valenzen an
einem C-Atom, die nicht zur OH-Gruppe f uhren, auseinander hervorgehen. Weiter
XIII.5 Alkohole 307
stellt man sofort fest, da g auf den

Aquivalenzlassen von konstant ist; diese
Klassen nennen wir auch die Alkoholmuster. Jedes Alkoholmuster m hat also ein
wohlbestimmtes Gewicht g(m).
Wir sagen, einAlkoholmuster msei vomTypN, wennmgar keinC-Atomenth alt
oder einenAlkohol der Form() mit g(a
1
), g(a
2
), g(a
3
) N zumRepr asentanten
hat. Mit M
N
bezeichnen wir die Menge aller Alkoholmuster vom Typ N. Nun
w ahlen wir ein N N und setzen
F = F
N
= {m [ mAlkoholmuster mit g(m) N];
sp ater werden wir N gehen lassen.
Wir haben nun noch die Gewichte der Farben also der Alkoholmuster festzu-
legen. Die in Satz 3.3 kulminierende Plya-Theorie haben wir f ur den Fall rationaler
Gewichte durchgef uhrt. Offenbar kam es f ur das Funktionieren der Theorie aber
nur darauf an, da man Gewichte addieren und multiplizieren kann und die Terme
1/[G[ deniert sind. Die Theorie funktioniert also genau so gut, wenn man die Ge-
wichte der Farben einer beliebigen Q-Algebra entnimmt. Wir w ahlen hier einfach
die Algebra Q[z] der rationalen Polynome in einer Unbestimmten z und setzen
w(m) := z
g(m)
f ur alle Alkoholmuster m.
Da S
3
nach

Ubung 1.7 den Zyklenindex
P
S
3
(z
1
, z
2
, z
3
) =
1
6
(z
3
1
3z
1
z
2
2z
3
)
hat, liefert der Satz von Plya

mM
N
w(m) = 1 zP
S
3
_

mF
N
z
g(m)
,

mF
N
z
2g(m)
,

mF
N
z
3g(m)
_
;
dabei stammt der Summand 1 auf der rechten Seite vom Wasser und der Faktor z
vom untersten C-Atom.
Was passiert nun, wenn man N wachsen l at? Dann kommen rechts hohe z-
Potenzen hinzu, die nach Verarbeitung mit P
S
3
nur hohe z-Potenzen liefern, so
da die Vielfachheiten, mit denen niedrige z-Potenzen auftreten, sich nicht mehr
andern. Wenn wir dieAnzahl der Alkoholmuster vomGewicht n mit
n
bezeichnen,
erhalten wir also eine erzeugende Potenzreihe
a(z) =

m Alkoholmuster
w(m) =

n=0

n
z
n
,
die der (nach Obigem sinnvollen) Funktionalgleichung
a(z) = 1 zP
S
3
_
a(z), a(z
2
), a(z
3
)
_
308 XIII Die Abz ahltheorie von Plya
gen ugt. Potenzreihenansatz und Koefzientenvergleich liefern nun Rekursionen f ur
die
n
:

0

1
z = 1
1
6
z
_
(
0

1
z )
3
3(
0

1
z )(
0

1
z
2
)
2(
0

1
z
3
)
_
und somit

0
= 1 (Wasser)

1
=
1
6
(
3
0
3
2
0
2
0
) = 1 (Methanol)

2
=
1
6
(3
2
0

1
3
0

1
) = 1 (

Athanol)

Ubung 5.2. Man berechne


3
,
4
,
5
und zeichne Strukturformeln der betreffen-
den Alkohole.

Ubung 5.3. Man f uhre die obigen



Uberlegungen mit der alternierenden Gruppe
vom Grade 3 statt mit S
3
durch (

optische Aktivit at).


F ur weitere Untersuchungen verweisen wir auf Plya [1937], de Bruijn [1964]
sowie Plya und Read [1987]. Ganz besonders empfehlen wir auch die beiden
Monographien von Kerber [1991,1999], in denen das Abz ahlen und Konstruieren
von Objekten mittels gruppentheoretischer Methoden ausf uhrlich dargestellt wird.
Die Strunk-Zahlen, also die Anzahlen T
n
der Isomorphieklassen von Str unken auf
n Punkten, die Alkohol-Zahlen sowie die Anzahlen t
n
der Isomorphieklassen von
B aumen auf n Punkten sind f ur kleine n in Kap. XVI 1 tabuliert. Das Problem
der Bestimmung der t
n
sowie der T
n
ist bei Harary [1969, Chapter 15] konzise dar-
gestellt. Wir wollen hier lediglich zwei besonders elegante Resultate ohne Beweis
erw ahnen, die von Plya [1937] bzw. Otter [1948] stammen:
Satz 5.4. Die erzeugende Potenzreihe T (z) =

n=1
T
n
z
n
f ur die Strunkzahlen
gen ugt der Funktionalgleichung
(5.1) T (z) = z exp
_

n=1
1
n
T (z
n
)
_
.
Daraus erh alt man die erzeugende Potenzreihe t (z) =

n=1
t
n
z
n
f ur die Baum-
zahlen gem a der Gleichung
(5.2) t (z) = T (z)
1
2
_
T
2
(z) T (z
2
)
_
.
XIII.6 Die Anzahl der B aume auf n Punkten 309
6 Die Anzahl der B aume auf n Punkten
Da die B aume f ur die Untersuchung der Alkoholzahlen ein entscheidendes Hilfs-
mittel waren und auch sonst h aug eine wichtige Rolle spielen, wollen wir zum
Abschlu dieses Kapitels noch die Anzahl der verschiedenen (aber m oglicherweise
isomorphen) B aume bestimmen, die man auf der Punktemenge {1, . . . , n] bilden
kann. Die entsprechende Formel n amlich n
n2
wird meist Cayley [1889] zuge-
schrieben, stammt aber (in aquivalenter Form) schon von Borchardt [1860]. Es gibt
f ur sie viele Beweise, von denen man drei bei Jungnickel [1994] nachlesen kann;
wir ubernehmen hier lediglich den kombinatorischen Beweis, der auf Pr ufer [1918]
zur uckgeht und ein sehr sch ones Beispiel f ur das wichtige Prinzip des Abz ahlens
durch eine geeignete Bijektion darstellt. Zudem hat er auch noch den Vorzug, eine
explizite Konstruktionsmethode und eine vern unftige Anordnung f ur alle B aume
auf {1, . . . , n] zu liefern.
Es f allt auf, da n
n2
auch die M achtigkeit der Menge W
V
der W orter der L ange
n2 uber einemn-elementigenAlphabet V ist. Daher liegt es nahe, eine geeignete
BijektionzwischenWundder Menge T
V
der B aume auf V zukonstruieren, n amlich
den Pr ufer-Code
V
: T
V
W
V
, den wir rekursiv denieren werden. Da wir dazu
eine Anordnung der Elemente von V ben otigen, setzen wir imfolgenden V als eine
Teilmenge von N voraus.
Es sei also G = (V, E) ein Baum. F ur n = 2, etwa V = {a, b], wird der
einzige Baum auf V (also die Kante ab) auf das leere Wort abgebildet, d.h. wir
setzen dann
V
(G) = ( ). F ur n 3 verwenden wir das

kleinste Blatt von Gund


den restlichen Baum auf n 1 Punkten f ur eine rekursive Denition. Wir setzen
dazu
(6.1) v = v(G) = min{u V : deg
G
(u) = 1]
und bezeichnen mit e = e(G) die eindeutig bestimmte mit v inzidente Kante sowie
mit w = w(G) den anderen Endpunkt von e. Wir k onnen nun annehmen, da wir
bereits das demBaumGv := (V {v], E{e]) durch den Pr ufer-Code auf V {v]
zugeordnete Wort kennen und dann rekursiv
(6.2)
V
(G) := (w,
V{v]
(G v)).
denieren.
Beispiel 6.1. Als Beispiel zeichnen wir f ur n = 6 einige B aume und ihre Pr ufer-
Codes:
310 XIII Die Abz ahltheorie von Plya
2
3
4
6
5
1
1
2
3
4
5
6
6
1
2
3
5
4
1
2
3
4
5
6
1
2
3
4
5 6
1
2
3
4
5
6
(2,3,4,5) (2,3,4,4) (2,3,3,3)
(2,3,2,5) (3,3,4,4) (1,1,1,1)
Wir haben nun zu zeigen, da damit die gew unschte Bijektion erkl art ist. Dazu
ben otigen wir die folgende Hilfsaussage, die es uns erlaubt, das minimale Blatt
eines beliebigen Baumes G auf V aus seinem Pr ufer-Code zu bestimmen.
Lemma 6.2. F ur jeden BaumGauf V sind die Bl atter genau diejenigen Elemente
von V, die nicht in
V
(G) auftreten. Insbesondere gilt daher
(6.3) v(G) = min{u V [ u kommt nicht in
V
(G) vor].
Beweis. Wir uberlegen uns zun achst, da ein Element unur dann in
V
(G) auftreten
kann, wenn es kein Blatt ist. Wenn n amlich u als Koordinate in
V
(G) eingef ugt
wird, mu imzu diesemZeitpunkt betrachteten TeilbaumH das kleinste Blatt v(H)
zu u adjazent sein; w are auch u ein Blatt von G (und daher von H), so k onnte H
als Baum nur aus den beiden Punkten u und v(G) bestehen und h atte damit das
leere Wort als Pr ufer-Code, womit u doch nicht in
V
(G) vork ame. Umgekehrt
sei nun u kein Blatt. Da die rekursive Konstruktion des Pr ufer-Codes von G erst
XIII.6 Die Anzahl der B aume auf n Punkten 311
dann aufh ort, wenn von G nur noch ein Baum auf zwei Punkten ubriggeblieben
ist, mu mindestens eine mit u inzidente Kante w ahrend der Konstruktion entfernt
worden sein; es sei e die erste derartige Kante. Zu diesemZeitpunkt war u noch kein
Blatt, weswegen der andere Endpunkt v von e das kleinste Blatt des betrachteten
Teilbaums gewesen sein mu; nach Denition des Pr ufer-Codes wurde dann aber
u als n achste Koordinate verwendet. 2
Satz 6.3. Der durch (6.1) und (6.2) denierte Pr ufer-Code
V
: T
V
W
V
ist
eine Bijektion.
Beweis. F ur n = 2 ist die Behauptung klar. Es sei also n 3. Wir zeigen zun achst
die Surjektivit at von
V
. Dazu sei w = (w
1
, . . . , w
n2
) ein beliebiges Wort der
L ange n 2 uber V. Wir erkl aren v als das kleinste Element von V, das nicht
als Komponente von w auftritt. Mit Induktion k onnen wir annehmen, da es einen
BaumG
/
auf der Punktemenge V {v] gibt, f ur den
V
(G
/
) = (w
2
, . . . , w
n2
) gilt.
Wir f ugen nun zu G
/
die Kante e = vw
1
hinzu (was von Lemma 6.2 nahegelegt
wird) und erhalten so einen Baum G auf V; man uberlegt sich nun leicht, da
v = v(G) gilt und daher, wie gew unscht,
V
(G) = w.
F ur den Nachweis der Injektivit at seien G und H zwei B aume auf {1, . . . , n],
f ur die
V
(G) =
V
(H) gilt. Es sei v das kleinste Element in V, das nicht in
V
(G)
vorkommt; nach Lemma 6.2 gilt dann v = v(G) = v(H). Daher enthalten sowohl
G als auch H die Kante e = vw, wobei w die erste Komponente von
V
(G) sei.
Somit sind G
/
und H
/
B aume auf V {w], f ur die
V
(G
/
) =
V
(H
/
) gilt. Mit
Induktion folgt G
/
= H
/
und daher auch G = H. 2
Man beachte, da der vorstehende Beweis in Verbindung mit Lemma 6.2 ein
konstruktives Verfahren zur Decodierung des Pr ufer-Codes liefert. Damit haben
wir das gew unschte Resultat bewiesen, wobei sich die zweite Aussage ergibt, weil
man jeden Punkt eines Baumes als Wurzel w ahlen kann:
Korollar 6.4. Sei V eine n-Menge. Dann gibt es genau n
n2
verschiedene B aume
und genau n
n1
verschiedene Wurzelb aume auf der Punktmenge V.
Wir geben nun noch einige

Ubungen zum Pr ufer-Code an:

Ubung 6.5. Man bestimme die B aume auf {1, . . . , n], die zu den folgenden Pr ufer-
Codes geh oren:
(2, 3, . . . , n 2, n 1); (2, 3, . . . , n 3, n 2, n 2);
(3, 3, 4, 5, . . . , n 4, n 3, n 2, n 2); (1, 1, . . . , 1).
312 XIII Die Abz ahltheorie von Plya

Ubung 6.6. Wie kann man aus demPr ufer-Code


V
(G) eines Baumes Gden Grad
eines beliebigen Punktes u bestimmen? Man gebe eine Bedingung daf ur an, da

V
(G) einen Weg bzw. einen Stern beschreibt.

Ubung 6.7. (d
1
, . . . , d
n
) sei eine Folge von positiven ganzen Zahlen. Man zeige,
da es genau dann einen Baum auf n Punkten mit Graden (d
1
, . . . , d
n
) gibt, wenn
d
1
d
n
= 2(n 1) gilt. Ferner konstruiere man einen Baum mit Gradfolge
(1, 1, 1, 1, 2, 3, 3).
Es sei nochmals betont, da wir in diesem Abschnitt zwei B aume auf V als
verschieden angesehen haben, wenn ihre Kantenmengen verschieden sind. Wie im
vorigen Abschnitt erw ahnt, fragt man auch nach der Anzahl t
n
der Isomorphie-
typen von B aumen auf n Punkten. Wir wollen zu diesem schwierigeren Problem
wenigstens noch ein Beispiel angeben; zur Frage, wie man zwei B aume (mit ausge-
zeichneter Wurzel) auf Isomorphie testet, verweisen wir auf Campbell und Radford
[1991].
Beispiel 6.8. Wir bestimmen alle Isomorphietypen von B aumen auf sechs Punkten
sowie die Anzahl der B aume des jeweiligen Typs. Man erh alt genau sechs Isomor-
phietypen, f ur die wir bereits in Beispiel 6.1 jeweils einen Repr asentanten angege-
ben haben. Im folgenden bezeichnen wir die dort gezeichneten B aume der Reihe
nach mit T
1
, . . . , T
6
. Sei nun T ein beliebiger Baum auf {1, . . . , 6]. Dann sind die
zu T isomorphen B aume die Bilder von T unter einer Permutation S
6
=: G;
es gibt also genau

T
G

=
[G[
[G
T
[
=
6'
[G
T
[
derartige B aume, vergleiche Denition 2.2. Imeinzelnen erhalten wir die folgenden
Stabilisatoren und Bahnl angen [T
G
[:
T
1
: zyklische Gruppe der Ordnung 2 (Spiegeln, insbesondere Vertauschen der
Bl atter des Baumes), 360 isomorphe B aume;
T
2
: zyklische Gruppe der Ordnung 2 (Vertauschen der beiden unteren Bl atter),
360 isomorphe B aume;
T
3
: symmetrische Gruppe S
3
(auf den drei unteren Bl attern), 120 isomorphe
B aume;
T
4
: zyklische Gruppe der Ordnung 2 (Vertauschen der beiden unteren

Aste), 360
isomorphe B aume;
T
5
: direktes Produkt von drei zyklischen Gruppen der Ordnung 2 (Spiegeln, also
Vertauschen der beiden Zentren und der beiden Blattpaare, sowieVertauschen
der Bl atter des

oberen bzw.

unteren Blattpaares), 90 isomorphe B aume;


XIII.6 Die Anzahl der B aume auf n Punkten 313
T
6
: symmetrische Gruppe S
5
(auf den f unf Bl attern), 6 isomorphe B aume.
Insgesamt ergeben sich also 360360120360906 = 1296 = 6
4
B aume
auf sechs Punkten, in

Ubereinstimmung mit Korollar 6.4.
XIV Kombinatorische Betrachtungen topologischen
Ursprungs
In diesem Kapitel wollen wir einige Proben kombinatorischen Denkens kennenler-
nen, die ihren Ursprung in topologischen Fragestellungen haben, n amlich
das K onigsberger Br uckenproblem,
die Eulersche Polyederformel,
den F unffarbensatz,
S atze uber Hamiltonsche Kreise,
das Spernersche Lemma,
den Satz von Helly.
Der Wert dieser kombinatorischen Ergebnisse wird durch innermathematische An-
wendungen demonstriert. Aus dem Polyedersatz leiten wir die f unf platonischen
K orper ab und aus dem Spernerschen Lemma den Brouwerschen Fixpunktsatz, der
seinerseits wieder eine F ulle von weiteren Anwendungen besitzt.
Wir bewegen uns in diesemKapitel mit kombinatorischen R ustzeug imBereich
der Geometrie. Hierzu w are es streng genommen erforderlich, die Grundlagen f ur
die geometrischen Betrachtungen exakt aufzubauen. So m uten wir beispielswei-
se eigentlich an mehreren Stellen den Jordanschen Kurvensatz, das Theorem von
Schoenies und das Kuratowskische Planarit atskriterium heranziehen oder vor-
weg etwas uber simpliziale Zerlegungen beweisen. Um jedoch im kombinatori-
schen Rahmen zu bleiben, stellen wir uns in Sachen Geometrie auf einen naiv-
anschaulichen Standpunkt. Der Leser m oge sich darauf verlassen, da sich die
weggelassenen geometrischen Details nachtragen lieen.
1 Das K onigsberger Br uckenproblem
ImJahre 1736 begr undete Leonhard Euler (1707 1783) die Graphentheorie, indem
er ein Problem l oste, von dem ein Spezialfall damals anscheinend Tagesgespr ach
XIV.1 Das K onigsberger Br uckenproblem 315
war: das K onigsberger Br uckenproblem. F ur n ahere historische Informationen ver-
weisen wir auf Wilson [1986] sowie auf Biggs, Lloyd und Wilson [1976]. Die
Geographie der ostpreuischen Stadt K onigsberg sah damals f ur unsere Zwecke
vereinfacht ungef ahr so aus:
Grne Brcke
Kttelbrcke
Krmerbrcke
Schmiedebrcke
K
n
e
i
p
h
o
f
H
o
n
i
g
b
r

c
k
e
H
o
h
e
B
r

c
k
e
H
o
l
z
b
r

c
k
e
Das Problem lautet: Kann man einen Rundgang machen, bei dem man jede der
siebenK onigsberger Br uckengenaueinmal uberschreitet? Indemmanjedes der vier
Territorien auf einen Punkt zusammenzieht, gelangt man zu folgendem Graphen:
Nun sieht man, da ein Rundgang jedes Territorium ebensooft verl at wie er es
betritt. Wenn dabei jedesmal eine andere Br ucke ben utzt werden soll, ist ein Rund-
gang nur m oglich, wenn von jedem Territorium eine gerade Anzahl von Br ucken
ausgeht. Dies ist in K onigsberg ganz und gar nicht der Fall, also ist ein solcher
Rundgang nicht m oglich.
316 XIV Kombinatorische Betrachtungen topologischen Ursprungs
Genauer h atten wir eben von einem

Multigraphen sprechen sollen, da hier


parallele Kanten also zwei Kanten mit denselben Endpunkten vorliegen, womit
man die Kantenmenge E also nicht einfach als eine Menge von 2-Teilmengen
der Punktemenge V ansehen kann. Formal kann man dies wie folgt erfassen: Ein
Multigraph G ist ein Paar (V, E) von Mengen zusammen mit einer Abbildung
von E in die Menge der 2-elementigen Teilmengen von V. Man nennt wieder V
die Menge der Punkte und E die Menge der Kanten von G; f ur jedes e E sind
dann die beiden Punkte in (e) die Endpunkte der Kante e. Die in II.2 f ur Graphen
eingef uhrtenBegriffe ubertragensichunmittelbar auf Multigraphen. Dar uberhinaus
sei ein Eulerscher Weg bzw. ein Eulerscher Kreis einWeg bzw. Kreis, der jede Kante
von G genau einmal enth alt. Mit diesen Begriffen k onnen wir nun das Ergebnis
von Euler formulieren.
Satz 1.1 (Satz von Euler). Ein zusammenh angender Multigraph G besitzt genau
dann einen Eulerschen Kreis, wenn jeder Punkt von G geraden Grad hat.
Beweis. Die Notwendigkeit der angegebenen Bedingung folgt wie im Beispiel des
K onigsberger Br uckenproblems und sei dem Leser als

Ubung uberlassen. Umge-
kehrt habe nun jeder Punkt von G geraden Grad. Man gehe von einem beliebigen
Punkt v aus und spaziere solange wie m oglich l angs immer neuer Kanten weiter,
bis man nicht mehr auf diese Weise weiterkann. Da alle Grade gerade sind, ist man
wieder bei v angelangt und hat einen Rundgang gemacht; es gibt also Kreise in G.
Sei nun
C : v
0
e
1
v
1
e
2
v
2
v
n1
e
n
v
n
= v
0
ein Kreis von maximaler L ange n. Angenommen, C enth alt noch nicht alle Kan-
ten des Graphen, so verbinde man einen Endpunkt einer unverbrauchten Kante
mit einem Punkt aus C und achte darauf, wann man dabei zum ersten Mal einen
Punkt aus dem Rundgang trifft; das geht wegen des Zusammenhangs von G. So
erh alt man eine an einem Punkte des Kreises h angende, von diesem aber nicht ver-
wendete Kante. Man ben utzt sie, um in dem nach Elimination der Kanten von C
verbleibenden Multigraphen in dem offenbar wieder jeder Punkt geraden Grad
hat nach dem vorigen Rezept einem Rundgang zu machen, der sich anschlieend
als zus atzlicher Kreis in den gegebenen Kreis einf ugen l at. Dies widerspricht der
Maximalit at des Kreises C, also hatte dieser bereits s amtliche Kanten verbraucht.
2
Wir haben uns bei diesemBeweis absichtlich mit einer verbalen Skizze begn ugt,
weil sich der

Ubergang zu einer formalisierten Darstellung von selbst versteht.
Wichtiger ist, da dieser Beweis gleichzeitig einen effektivenAlgorithmus zur Kon-
struktion eines Eulerschen Kreises liefert; man sieht leicht, da man ein Verfahren
XIV.2 Der Eulersche Polyedersatz 317
der (offenbar bestm oglichen) Komplexit at O([E[) erh alt, wobei wir die in II.3
eingef uhrte Notation verwenden.
2 Der Eulersche Polyedersatz
Betrachten wir einmal die f unf sogenannten platonischen Polyeder (oder platoni-
schen K orper):
Tetraeder Wrfel Oktaeder Dodekaeder Ikosaeder
F ur jedes dieser Polyeder wollen wir folgende Zahlen ermitteln:
f =Anzahl der Fl achen (

faces),
e =Anzahl der Kanten (

edges),
v =Anzahl der Ecken (

vertices);
anschlieend bilden wir die Wechselsumme f e v. Es ergibt sich folgende
Tabelle:
Polyeder f e v f e v
Tetraeder 4 6 4 2
W urfel 6 12 8 2
Oktaeder 8 12 6 2
Dodekaeder 12 30 20 2
Ikosaeder 20 30 12 2
Man macht die Beobachtung, da die Wechselsumme in all diesen F allen denselben
Wert 2 besitzt. Ein Gesetz k undigt sich an, das von Euler [1752/53] allgemein her-
ausgearbeitet wurde, vielleicht aber bereits Ren Descartes (15961650) teilweise
bekannt war. Es ist nicht auf die platonischen K orper beschr ankt, sondern gilt ganz
allgemein f ur Polyeder oder, was topologisch dasselbe ist, f ur Kurvennetze auf der
Kugel ache. F ur andere geschlossene Fl achen (beispielsweise den Torus) gelten
ahnliche Gesetze. F ur die Kugel haben wir den folgenden Sachverhalt:
Satz 2.1 (Eulerscher Polyedersatz f ur die Kugel). Ein Kurvennetz zerlege die Ku-
gel ache so, da f Fl achenst ucke, e Kurvenst ucke und v Ecken entstehen. Dann
hat die Wechselsumme f e v den Wert 2.
318 XIV Kombinatorische Betrachtungen topologischen Ursprungs
Beweis. Wir denken uns das Kurvennetz schrittweise durch eine Abfolge folgender
Operationen aufgebaut, wobei man zuvor noch als ersten Schritt eine Ecke setzt.
(a) Unterteilung eines Kurvenst ucks durch eine neue Ecke;
(b) Verbindung zweier schon vorhandener Ecken durch eine Kurve, die sonst
keines der schon vorhandenen Kurvenst ucke trifft;
(c) Ansetzen eines neuen Kurvenst ucks mit neuem Endpunkt an eine schon vor-
handene Ecke.
Nach dem ersten Schritt also dem Setzen der Anfangsecke hat man f = v = 1,
e = 0, also die Wechselsumme 2. Bei (a) und (c) steigen v und e um je 1, so da
die Wechselsumme sich nicht andert. Bei (b) steigen f und e um je 1, so da die
Wechselsumme sich ebenfalls nicht andert. W ahrend des ganzen Aufbaus unseres
Kurvennetzes beh alt also die Wechselsumme den nach dem ersten Schritt bereits
eingestellten Wert 2; sie hat diesen Wert also auch, wenn das Kurvennetz vollendet
ist. 2
H aug wird der Eulersche Polyedersatz 2.1 auch als ein Satz uber planare Gra-
phen formuliert. Dabei heit ein Graph planar, wenn man seine Punkte und Kanten
so in die Ebene zeichnen kann (wobei die Kanten als Kurven realisiert werden), da
keine zus atzlichen Schnittpunkte entstehen; man kann zeigen, da man dabei sogar
lediglich Strecken ben otigt. Ein planarer Graph kann also als Kurvennetz in der
Ebene angesehen werden; jede konkrete Realisierung eines planaren Graphen in
dieser Formheit ein ebener Graph. Das ist imGrunde dasselbe wie ein Kurvennetz
auf der Kugel, wie die stereographische Projektion von einem Punkt einer Kugel
auf eine sie nicht schneidende Ebene zeigt. Wenn wir die Punkte und Strecken von
G weglassen, zerf allt die Ebene in Gebiete. In dieser Intrepretation liest Satz 2.1
sich dann wie folgt:
Satz 2.2 (Eulerscher Polyedersatz). G sei ein zusammenh angender ebener Graph
mit n Punkten, m Kanten und f Gebieten. Dann gilt n mf = 2.

Ubung 2.3. Man betrachte auf der Torus ache Kurvennetze der folgenden Typen:
Dreieckszerlegungen
Viereckszerlegungen
Sechseckszerlegungen
und bestimme jedesmal f, e, v und die Wechselsumme.
XIV.2 Der Eulersche Polyedersatz 319

Ubung 2.4. Man baue auf der Torus ache ein Kurvennetz schrittweise wie im
Beweis von Satz 2.1 auf und zeige, da die Wechselsumme den Wert 0 besitzt, falls
die Fl achenst ucke deformierte Polygone sind.
Wir zeigen nun die wohl ber uhmteste Anwendung von Satz 2.1, die bereits im
klassischen Griechenland bekannt war. Dazu heie ein Polyeder regul ar, wenn es
nat urliche Zahlen n und k gibt, so da
jede Fl ache ein regul ares n-Eck ist und
von jeder Ecke genau k Kanten ausgehen.
Satz 2.5. Die einzigen regul aren Polyeder im dreidimensionalen Raum sind die
f unf platonischen K orper.
Beweis. Wir bekommen jede Kante zweimal, wenn wir entweder jeder Fl ache ihre
n Randkanten oder aber jeder Ecke die k von ihr ausgehenden Kanten zuordnen;
also gelten die Gleichungen
2e = nf = kv.
Zusammen mit Satz 2.1 ergibt sich
2 = f e v =
2e
n
e
2e
k
= e
_
2
n
1
2
k
_
,
also
2
n
1
2
k
> 0
und folglich
()
1
n

1
k
>
1
2
.
Aus geometrischen Gr unden mu n, k 3 gelten und dann wegen () auch
n, k 5. Im Fall n = 3 erh alt man f ur k = 3 das Tetraeder, f ur k = 4 das
Oktaeder und f ur k = 5 das Ikosaeder. Ist n 4, folgt aus () sogar k = 3 und
man erh alt f ur n = 4 den W urfel und f ur n = 5 das Dodekaeder. 2
Als zweite Anwendung des Eulerschen Polyedersatzes diesmal in der Formu-
lierung von Satz 2.2 zeigen wir, da planare Graphen nu verh altnism aig wenige
Kanten enthalten k onnen. Daf ur ben otigen wir noch zwei Begriffe. Eine Kante e
eines zusammenh angenden Graphen Gheit eine Br ucke, wenn das Entfernen von
e den Zusammenhang zerst ort. Die Taillenweite eines Graphen, der Kreise enth alt,
ist die k urzeste L ange eines Kreises.
320 XIV Kombinatorische Betrachtungen topologischen Ursprungs
Satz 2.6. G sei ein zusammenh angender planarer Graph auf n Punkten. Wenn G
kreisfrei ist, hat G genau n 1 Kanten, und wenn G Taillenweite g hat, hat
G h ochstens g(n 2)/(g 2) Kanten.
Beweis. Die erste Aussage gilt nach

Ubung XIII.4.2. Sei also Gein zusammenh an-
gender ebener Graph mit n Punkten und m Kanten, dessen Taillenweite g ist.
Dann gilt n 3. Wir verwenden Induktion uber n; der Induktionsanfang n = 3
ist dabei trivial. Wir nehmen zun achst an, da G eine Br ucke e enth alt. Durch
Entfernen von e zerf allt G also in zwei zusammenh angende Untergraphen G
1
und
G
2
auf disjunkten Punktemengen; die Punkte- bzw. Kantenzahl von G
i
sei n
i
bzw.
m
i
(i = 1, 2), also n = n
1
n
2
und m = m
1
m
2
1. Da e eine Br ucke
war, enth alt mindestens einer dieser beiden Graphen einen einfachen Kreis. Wenn
sowohl G
1
als auch G
2
Kreise enthalten, haben beide mindestens Taillenweite g,
und mit Induktion folgt
m = m
1
m
2
1
g((n
1
2) (n
2
2))
g 2
1 <
g(n 2)
g 2
.
Wenn dagegen einer der beiden Untergraphen, etwa G
2
, kreisfrei ist, gilt m
2
=
n
2
1; ahnlich wie eben folgt dann
m = m
1
m
2
1
g(n
1
2)
g 2
n
2
<
g(n 2)
g 2
.
Ab jetzt k onnen wir also annehmen, da G keine Br ucke enth alt; dann liegt jede
Kante von Gin genau zwei Gebieten. Wenn wir dieAnzahl der Gebiete, deren Rand
ein Kreis aus i Kanten ist, mit f
i
bezeichnen, ergibt sich
2m =

i
if
i

i
gf
i
= gf,
da jeder Kreis mindestens g Kanten enth alt. Mit Satz 2.2 folgt
m2 = n f n
2m
g
, also m
g(n 2)
g 2
.
2
Korollar 2.7. G sei ein zusammenh angender planarer Graph auf n 3 Punkten.
Dann hat G h ochstens 3n 6 Kanten, und es gibt Punkte vom Grad 5.
Beweis. Die erste Behauptung ergibt sich unmittelbar aus Satz 2.6, da G falls es
uberhaupt Kreise gibt mindestens Taillenweite 3 hat. Falls nun alle Punkte von
G Grad 6 h atten, m usste es mindestens 6n/2 = 3n Kanten geben. 2
XIV.2 Der Eulersche Polyedersatz 321
Beispiel 2.8. Der vollst andige Graph K
5
ist nach Korollar 2.7 nicht planar, da ein
planarer Graph auf f unf Punkten h ochstens neun Kanten haben kann. Der unten
gezeichnete vollst andige bipartite Graph K
3,3
hat Taillenweite 4 und ist somit nach
Satz 2.6 nicht planar, da er mehr als acht Kanten hat.
K
3,3
Der Petersen-Graph

Ubung 2.9. Man zeige, da der oben gezeichnete Petersen-Graph nicht planar ist
und die symmetrische Gruppe S
5
als Automorphismengruppe zul at.
Hinweis: Man kann die Punkte von G so mit den 2-Teilmengen von {1, . . . , 5]
identizieren, da zwei Punkte genau dann adjazent sind, wenn die entsprechenden
2-Teilmengen disjunkt sind.

Ubung 2.10. G sei ein planarer Graph auf n Punkten. Wir bezeichnen mit n
d
die
Anzahl der Punkte vom Grad h ochstens d. Man beweise
n
d

n(d 5) 12
d 1
und wende diese Formel f ur d = 5 und d = 6 an.
Schlielich wollen wir noch ohne Beweis einen der ber uhmtesten S atze der Gra-
phentheorie angeben, n amlich die Charakterisierung der planaren Graphen nach
Kuratowski [1930]. F ur den elementaren, aber recht umfangreichen Beweis sei
auf Harary [1969], Aigner [1984], Thomassen [1981] oder die Monographie von
Nishizeki [1988] verwiesen. Zun achst noch zwei Begriffe! Eine Unterteilung eines
Graphen G ist ein Graph H, der durch mehrfache Anwendung der folgenden Ope-
ration aus G erhalten werden kann: Man ersetze eine Kante e = ab durch einen
322 XIV Kombinatorische Betrachtungen topologischen Ursprungs
einfachen Weg (a, x
1
, . . . , x
n
, b), wobei alle x
i
neue Punkte sind. Zwei Untertei-
lungen desselben Graphen G werden hom oomorph genannt.
Satz 2.11 (Satz von Kuratowski). Ein Graph G ist genau dann planar, wenn er
keinen zu K
5
oder K
3,3
hom oomorphen Untergraphen enth alt.
Wir haben in diesemAbschnitt wie angek undigt alle topologischen Details
weggelassen. Wer sich eine genauere Einf uhrung planarer Graphen w unscht, kann
diese beispielsweise imauch sonst sehr empfehlenswerten Buch von Diestel [2000]
nden.
3 Der F unffarbensatz
Wir denken uns eine Kugel ache (oder auch die Ebene) durch ein Netz von Kurven
so in Teil achen zerlegt, da nie mehr als drei Fl achen einen Punkt gemeinsam
haben; man spricht dann auch von einer (zul assigen) Landkarte, Grenzlinen und
L andern. Es soll also nicht wie das an einer Stelle in den USA(Utah, Arizona, New
Mexico, Colorado) der Fall ist Vierl anderecken geben. Wir nehmen f unf verschie-
dene Farben und malen die L ander so an, da an keiner Grenzlinie gleiche Farben
aufeinanderstoen; das ist eine (zul assige) F arbung. Es stellt sich die Frage, ob das
immer geht. Die Antwort lautet

Ja, und dies ist der sogenannte F unffarbensatz


von Heawood [1890], den wir in diesemAbschnitt beweisen werden.
Zun achst wollen wir unser Problem graphentheoretisch umformulieren; dazu
zwei Denitionen. Eine (zul assige) F arbung eines Graphen G = (V, E) ordnet
jedem Punkt derart eine Farbe zu, da adjazente Punkte stets verschieden gef arbt
sind; formal haben wir es also mit einer Abbildung von V in eine Menge F von
Farben zu tun, die der genannten Bedingung gen ugt. Die chromatische Zahl (G)
ist als die minimale Anzahl von Farben in einer F arbung von G erkl art.
Beispiel 3.1. Ein Graph G hat genau dann chromatische Zahl 2, wenn man die
Punktemenge von G so in zwei Teilmengen S und T zerlegen kann, da keine
Kante beide Endpunkte in S oder beide Endpunkte in T hat. Die Graphen G mit
(G) = 2 sind also genau die bipartiten Graphen.
Was hat dies nun mit dem F arben von Landkarten zu tun? Wir bilden dazu aus
der gegebenen Landkarte einen Graphen G = (V, E), dessen Punkte die L ander
sind; dabei seien zwei Punkte (also zwei L ander) genau dann adjazent, wenn sie
eine gemeinsame Grenzlinie haben. Offenbar ist G planar; man sieht das, indem
man jeder Fl ache einen Punkt in ihrem Inneren zuordnet und die Adjazenz durch
Verbindungsstrecken realisiert. Dann entspricht jede F arbung der Landkarte einer
XIV.3 Der F unffarbensatz 323
F arbung des Graphen G, und der F unffarbensatz wird zu der Aussage, da planare
Graphen stets (G) 5 erf ullen.
Beispiel 3.2. Zum

Aufw armen beweisen wir zun achst den analogen Sechsfar-


bensatz. Sei also Gein planarer Graph. Nach Korollar 2.7 gibt es einen Punkt v mit
Grad h ochstens 5. Mit Induktion k onnen wir annehmen, da Gv mit sechs Farben
zul assig gef arbt werden kann. Dann bleibt f ur die F arbung von v noch mindestens
eine Farbe ubrig, die an keinem der Nachbarn von v auftritt, womit wir auch G
zul assig f arben k onnen.
Der k urzeste und eleganteste Beweis des F unffarbensatzes stammt vonThomas-
sen [1994] und zeigt eine viel st arkere Aussage; wir ben otigen daf ur noch einige
Denitionen. Zun achst verallgemeinern wir den Begriff der zul assigen F arbung,
indem wir jedem Punkt v eine eigene als Farbliste bezeichnete Menge F(v) und
dann jeweils aus dieser Menge eine Farbe f (v) zuordnen; adjazente Punkte sol-
len dabei wieder verschieden gef arbt sein. Jeder derartige Abbildung f heit eine
(zul assige) Listenf arbung (englisch:

list coloring). Der fr uhere F arbungsbegriff


ist also der Spezialfall, in dem alle Punkte dieselbe Farbliste haben. Ein Graph
G wird k-w ahlbar (englisch:

k-choosable) genannt, wenn es f ur jede Auswahl


von Farblisten F(v) der M achtigkeit k eine zul assige Listenf arbung gibt. Die
Auswahlzahl (englisch:

k-choosability oder

list coloring number) ch(G) ist als


das minimale k erkl art, f ur das G k-w ahlbar ist. Trivialerweise gilt stets
(3.1) ch(G) (G).
Im allgemeinen hat man dabei nicht Gleichheit:
Beispiel 3.3. Wir betrachten den bipartiten Graphen G = K
3,3
, der nach Beispiel
3.1 chromatische Zahl 2 hat. Wenn wir den drei Punkten in einer der beiden Klassen
der Bipartition von G jeweils die Farblisten {1, 2], {1, 3] und {2, 3] zuordnen, gibt
es keine zul assige Listenf arbung; in der Tat gilt ch(K
3,3
) = 3. Die Einzelheiten
seien dem Leser als

Ubung uberlassen.
Es gibt sogar bipartite Graphen mit beliebig groer Auswahlzahl; siehe Erd os,
Rubin und Taylor [1980]. Um so bemerkenswerter ist der folgende Satz von Tho-
massen [1994], der den F unffarbensatz auf Listenf arbungen verallgemeinert. Zuvor
noch zwei Begriffe. Es sei C ein Kreis in einem Graphen G = (V, E). Eine Sehne
von C ist eine Kante e E, die zwei nicht aufeinander folgende Punkte des Krei-
ses verbindet. Wir setzen nun G als eben voraus. Dann heit G trianguliert oder
auch eine Triangulation, wenn jede beschr ankte Fl ache als Rand ein Dreieck also
einen Kreis der L ange 3 hat; man beachte, da nichts f ur das eindeutig bestimmte
unendliche Gebiet verlangt wird.
324 XIV Kombinatorische Betrachtungen topologischen Ursprungs
Satz 3.4. Es sei G ein planarer Graph. Dann gilt ch(G) 5.
Beweis. Sei also jedem Punkt v von G eine Farbliste F(v) der M achtigkeit 5
zugeordnet. Wir k onnen G als in der Ebene gezeichnet annehmen. Dabei sei
C : v
1
v
2
v
3
v
p1
v
p
= v
1
der Kreis, der die durch die gegebene ebene Realisierung von G eindeutig be-
stimmte unendliche Fl ache berandet. Falls G noch nicht trianguliert ist, kann man
durch Hinzuf ugen geeigneter neuer Kanten aus Geine ebene Triangulation herstel-
len. Dadurch wird eine f ur die gegebenen Farblisten zul assige F arbung allenfalls
schwieriger. Wir k onnen also im folgenden o.B.d.A. voraussetzen, da eine Trian-
gulation mit auerem Randkreis C vorliegt. Wir erschweren unsere Aufgabe nun
noch etwas mehr, indem wir die Farben der Punkte v
1
und v
2
vorschreiben und f ur
alle Punkte v C {v
1
, v
2
] lediglich [F(v)[ 3 verlangen. Dieser Trick wird es
uns erlauben, die Existenz einer zul assigen F arbung mit Induktion uber die Anzahl
n der Punkte von G zu beweisen.
Der Induktionsanfang p = n = 3, also G = C, ist trivial, da ja f ur den
Punkt v
3
noch mindestens eine der drei gegebenen Farben zul assig ist. F ur den
Induktionsschritt (in dem notwendigerweise n 4 gilt) unterscheiden wir zwei
F alle. Im ersten Fall nehmen wir an, da C eine Sehne e = vw hat. Dann enth alt
C{e] genau zwei Kreise C
1
und C
2
(mit gemeinsamer Kante e); dabei gelte etwa
v
1
v
2
C
1
. Wir k onnen nun die Induktionsannahme zun achst auf C
1
anwenden
und eine zul assige F arbung f
1
des durch C
1
berandeten Teilgraphen nden, f ur
die v
1
und v
2
die vorgeschriebenen Farben annehmen. Danach wenden wir die
Induktionsannahme auf C
2
an und nden nun eine zul assige F arbung f
2
des durch
C
2
berandeten Teilgraphen, f ur die v und w die durch f
1
vorgegebenen Farben
annehmen. Insgesamt ergibt sich so die gesuchte zul assige F arbung f ur G.
Es bleibt der zweite Fall, in dem der Randkreis C keine Sehne besitzt. Wir
betrachten die Nachbarn von v
p
und ordnen sie in ihrer nat urlichen Reihenfol-
ge um v
p
herum an; wir erhalten o.B.d.A. im Uhrzeigersinn der Reihe nach
v
1
, u
1
, . . . , u
k
, v
p1
, wobei alle u
i
im Inneren von C liegen. Da G trianguliert ist,
mu
W : v
1
u
1
u
2
u
k
v
p1
ein Weg in Gsein; weil C keine Sehnen besitzt, ist C

:= W(C{v
p
]) ein Kreis,
der denTeilgraphen Gv
p
berandet. Wir w ahlen nun zwei von der vorgeschriebenen
Farbe f (v
1
) verschiedene Farben in F(v
p
) und entfernen sie aus allen Farblisten
F(u
i
) (i = 1, . . . , k), die danach jeweils noch M achtigkeit 3 haben. Wir k onnen
nun die Induktionsannahme auf C

und die modizierten Farblisten anwenden und


eine hierf ur zul assige F arbung f des durch C

berandeten Teilgraphen G v
p
nden, f ur die v
1
und v
2
die vorgeschriebenen Farben annehmen. Danach k onnen
XIV.3 Der F unffarbensatz 325
v
v
2
v
1
v
p
v
p1
w
C
1
e
C
2
v
2
v
1
v
p
v
p1
W
u
1
u
k
C*
Zu Fall 1 Zu Fall 2
wir abschlieend auch f ur v
p
eine zul assige Farbe w ahlen, da mindestens eine der
zuvor aus F(v
p
) gew ahlten Farben von f (v
p1
) verschieden sein mu. 2
Korollar 3.5 (F unffarbensatz). Es sei Gein planarer Graph. Dann gilt (G) 5.
2
Vielleicht das ber uhmteste Problem der Graphentheorie war die weit uber hun-
dert Jahre offene Frage, ob es auch mit vier Farben geht. Dieses sogenannte Vier-
farbenproblem wurde im Oktober 1852 von Francis Guthrie gestellt und dann von
Augustus de Morgan (1806 1871) in einem Brief an Sir William Rowan Hamilton
(1805 1865) wohl erstmals schriftlich xiert; 1878 wurde es von Arthur Cayley
(1821 1895) der London Mathematical Society pr asentiert und dadurch wesent-
lich bekannter. Ein Jahr sp ater publizierte der englische Rechtsanwalt und Ma-
thematiker Alfred Bray Kempe [1879,1879/80] einen

Beweis f ur die Richtig-


keit der Vierfarbenvermutung, in dem aber Heawood [1890] einen irreparablen
Fehler entdeckte; allerdings konnte Heawood den Beweis modizieren und so
den F unffarbensatz erhalten. Danach haben sich noch viele bedeutende Mathe-
matiker mit dem Vierfarbenproblem besch aftigt, so etwa Heffter [1891], Birkhoff
[1912,1913,1930,1934], Birkhoff und Lewis [1946] und Ore [1967]. 1976 k undig-
ten schlielich Kenneth Appel und Wolfgang Haken einen Beweis an, der sich auf
die alten Ideen von Kempe sowie auf Vorarbeiten von Heinrich Heesch st utzte und
nach l angeren theoretischen Vorbereitungen die computergest utzte Erledigung
von 1482 Einzelf allen (den

unvermeidbaren Kongurationen) erforderte; siehe


326 XIV Kombinatorische Betrachtungen topologischen Ursprungs
Appel und Haken [1977], Appel, Haken und Koch [1977] sowie Haken [1977].
Die Diskussion um diesen Beweis hielt lange an, weswegen die Autoren schlie-
lich eine 741 Seiten lange algorithmische Version pr asentierten, in der auch etliche
kleinere Fehler korrigiert und weitere unvermeidbare Kongurationen hinzugef ugt
wurden; siehe Appel und Haken [1989]. Vor einigen Jahren haben dann Robertson,
Sanders, Seymour und Thomas [1997] einen auf denselben Ideen basierenden, aber
viel k urzeren und leichter verizierbaren Beweis angegeben, womit das Vierfarben-
problem nun endg ultig zu einem Satz geworden ist:
Satz 3.6 (Vierfarbensatz). Sei G ein planarer Graph. Dann gilt (G) 4.
Eine Skizze des neuen Beweises sowie eine Diskussion von Querbez ugen zwi-
schen dem Vierfarbensatz und anderen Zweigen der Mathematik ndet man bei
Thomas [1998]. Man k onnte nun hoffen, diesen Satz vielleicht auch ganz anders
in den Griff zu bekommen, indem man ein entsprechendes Analogon von Satz 3.4
beweist. Leider geht das nicht, da es planare Graphen gibt, die nicht 4-w ahlbar sind;
das erste derartige Beispiel stammt von Voigt [1993].
Nat urlich kann man das F arbungsproblemf ur alle erdenklichen Fl achen stellen,
denn dort lassen sich ja auch Landkarten zeichnen. Die chromatische Zahl (F)
einer solchen Fl ache ist wieder die Minimalzahl an Farben, die man braucht, um
jede zul assige Landkarte auf F so zu f arben, da an keiner Grenzlinie gleiche Far-
ben aufeinanderstoen. Fat man beispielsweise die orientierbaren geschlossenen
Fl achen insAuge, so bedient man sich des Klassikationstheorems, welches besagt,
da sich jede solche Fl ache topologisch als eine Kugel ache mit einer gewissen
Anzahl g von Henkeln darstellen l at. Man nennt g das Geschlecht der Fl ache F.
So haben etwa die Kugel selbst das Geschlecht g = 0 und der Torus das Geschlecht
g = 1. Heawood [1890] stellte die Formel
(3.2) (F) =
_
7

1 48g
2
_
auf und bewies sie f ur g = 1, indem er (Torus) = 7 zeigte; f ur g = 0 lie-
fert Formel (3.2) ebenfalls den korrekten Wert, n amlich (F) = 4. F ur alle
g 1 wurde die Formel (3.2) 1968 durch Ringel und Youngs [1968] bewiesen;
an den Vorarbeiten waren Terry und Welch mageblich mitbeteiligt. Ringel hatte
schon fr uher die chromatische Zahl f ur s amtliche geschlossenen nichtorientierba-
ren Fl achen bestimmt; starke Vereinfachungen erfolgten 1968 durchYoungs; siehe
Ringel [1959,1971,1974].

Ubung 3.7. Man gebe auf demTorus eine zul assige Landkarte an, die mit weniger
als sieben Farben nicht zul assig f arbbar ist.
XIV.4 Hamiltonsche Kreise 327
Mehr uber F arbungen von Graphen, die auf Fl achen eingebettet sind, ndet
man bei Mohar und Thomassen [2001]. Das Standardwerk uber F arbungsprobleme
allgemein ist Jensen und Toft [1995]. Ein interessanter

Ubersichtsartikel uber Li-
stenf arbungen stammt von Woodall [2001].
4 Hamiltonsche Kreise
1856 stellte Sir William Rowan Hamilton (1805 1865), dessen Name auch durch
den Satz von Cayley-Hamilton, die Quaternionen und den Hamilton-Operator in
der Mechanik bekannt ist, ein kleines Gesellschaftsspiel vor: Man fahre s amtliche
Ecken eines Dodekaeders, oder auch eines Ikosaeders, l angs der Kanten dieses
Polyeders ab, ohne eine Ecke zweimal zu ber uhren; siehe Hamilton [1856,1858].
Die folgende Abbildung gibt eine L osung:
Allgemein nennt man einen Kreis, der jeden Punkt eines gegebenen Graphen G
genau einmal enth alt, einen Hamiltonschen Kreis f ur G; jeder Graph, der einen
solchen Kreis besitzt, heit ein Hamiltonscher Graph.

Ahnlich wird ein Weg, der
jeden Punkt von G genau einmal enth alt, ein Hamiltonscher Weg f ur G genannt.
Beispiel 4.1. Offenbar ist der vollst andige Graph K
n
auf n Punkten Hamiltonsch;
in der Tat liefert hier jede Permutation der Punkte einen Hamiltonschen Kreis,
weswegen K
n
genau n' Hamiltonsche Kreise enth alt.

Ubung 4.2. Man formuliere den Begriff

Graph des d-dimensionalen W urfels


pr azise und zeige, da dieser Graph Hamiltonsch ist.
Hinweis: Man arbeite mit Induktion nach d.
328 XIV Kombinatorische Betrachtungen topologischen Ursprungs
Am liebsten h atte man nun wie im Fall Eulerscher Kreise eine notwendige
und hinreichende Bedingung f ur die Existenz von mindestens einem Hamilton-
schen Kreis in einem gegebenen Graphen G. Obwohl Eulersche und Hamilton-
sche Kreise ahnlich klingende Denitionen haben, bestehen aber zwischen beiden
Begriffen groe Unterschiede. Insbesondere kennt man keine befriedigende Kenn-
zeichnung der Hamiltonschen Graphen. In der Tat gibt die Komplexit atstheorie
Anla zu der Vermutung, da es eine

gute Kennzeichnung dieser Graphen auch


gar nicht geben kann, da die Frage, ob ein Graph Hamiltonsch ist, zu den sogenann-
ten NP-vollst andigen Problemen geh ort; n aheres dazu ndet man beispielsweise
bei Jungnickel [1994]. Dagegen sind viele hinreichende Bedingungen f ur die Exi-
stenz eines Hamiltonschen Kreises bekannt; die meisten dieser Bedingungen sind
Aussagen uber die Grade des zugrundeliegenden Graphen. Wir wollen in diesem
Abschnitt einige derartige Kriterien kennenlernen.
Wir beginnen mit einem allgemeinen Ergebnis von Bondy and Chvtal [1976],
aus dem sich viele konkrete Bedingungen ableiten lassen. Dazu ben otigen wir die
folgende Konstruktion. Sei G ein Graph auf n Punkten. Falls G nicht-adjazente
Punkte u und v mit deg u deg v n enth alt, f ugen wir die Kante uv zu G hinzu.
Dieser Proze wird solange durchgef uhrt, bis wir einen Graphen [G] erhalten, in
dem f ur je zwei nicht-adjazente Punkte x und y stets deg x deg y < n gilt; [G]
heit der Abschlu von G. Der Leser m oge sich als

Ubung davon uberzeugen, da
[G] eindeutig bestimmt ist.
Satz 4.3. Ein Graph G ist genau dann Hamiltonsch, wenn sein Abschlu [G] Ha-
miltonsch ist.
Beweis. Wenn G Hamiltonsch ist, gilt dies trivialerweise auch f ur [G]. Sei also
umgekehrt [G] Hamiltonsch. Da [G] aus G durch sukzessives Hinzuf ugen von
Kanten gem a der oben beschriebenen Konstruktion entsteht, reicht es zu zeigen,
da ein derartiger Schritt keinen Einu darauf hat, ob die betrachteten Graphen
Hamiltonsch sind. Seien also nicht-adjazente Punkte u und v von G mit deg u
deg v n gegeben; H sei derjenige Graph, der durch Hinzuf ugen der Kante uv
aus G ensteht. Angenommen, H ist Hamiltonsch, aber G nicht. Dann gibt es in
H einen Hamiltonschen Kreis, der notwendigerweise die hinzugef ugte Kante uv
enth alt, weswegen G einen Hamiltonschen Weg (x
1
, x
2
, . . . , x
n
) mit x
1
= u und
x
n
= v enthalten mu. Wir betrachten nun die Mengen
X = {x
i
[ vx
i1
E und 3 i n 1]
sowie
Y = {x
i
[ ux
i
E und 3 i n 1].
XIV.4 Hamiltonsche Kreise 329
x
1
=u
x
n
=v
x
2
x
3
x
i 2
x
i 1
x
i
x
i +1
x
n2
x
n1
x
1
= u
x
n
= v
x
2
x
3
x
i 2
x
i 1
x
i
x
i +1
x
n2
x
n1
Da u und v in G nicht adjazent waren, gilt
[X[ [Y[ = deg u deg v 2 n 2.
Folglich gibt es einen Index i mit 3 i n 1, f ur den sowohl vx
i1
als auch
ux
i
Kanten von G sind. Dann ist aber (x
1
, x
2
, . . . , x
i1
, x
n
, x
n1
, . . . , x
i
, x
1
) ein
Hamiltonscher Kreis in G, ein Widerspruch. 2
Imallgemeinen wird es kaumleichter sein, zu entscheiden, ob [G] Hamiltonsch
ist. Wenn aber beispielsweise [G] ein vollst andiger Graph ist, mu nach Satz 4.3
auch G Hamiltonsch sein. Damit erhalten wir unmittelbar zwei klassische hinrei-
chende Bedingungen f ur die Existenz eines Hamiltonschen Kreises, die von Ore
[1960] bzw. Dirac [1952] stammen.
Korollar 4.4. Gsei ein Graph auf n 3 Punkten. Wenn f ur nicht-adjazente Punkte
u und v stets deg u deg v n gilt, ist G Hamiltonsch. 2
Korollar 4.5. G sei ein Graph auf n 3 Punkten. Wenn jeder Punkt von G min-
destens den Grad
n
2
hat, ist G Hamiltonsch. 2

Ubung 4.6. Man bestimme die minimale Kantenzahl eines Graphen G auf sechs
Punkten, f ur den [G] der K
6
ist.

Ubung 4.7 (Ore 1961). Gsei ein Graph mit n 3 Punkten und mKanten, f ur den
m
1
2
(n 1)(n 2) 2 gilt. Man zeige, da G Hamiltonsch ist.
Hinweis: Man verwende Korollar 4.4.
330 XIV Kombinatorische Betrachtungen topologischen Ursprungs
Schlielich zeigen wir mit mit denselben Methoden wie imBeweis von Satz 4.3
aber mit etwas mehr Aufwand noch das folgende Resultat von Chvtal [1972]:
Satz 4.8. G sei ein Graph auf n 3 Punkten mit Gradfolge d
1
d
2
d
n
.
Dann ist G Hamiltonsch, falls die folgende Bedingung erf ullt ist:
(4.1) d
i
i = d
ni
n i f ur alle i < n/2.
Beweis. Angenommen, Gist nicht Hamiltonsch; nachSatz 4.3ist alsoauch[G] nicht
Hamiltonsch. Falls m oglich, erweitern wir [G] durch sukzessives Hinzunehmen
neuer Kanten solange, wie die Nicht-Existenz von Hamiltonschen Kreisen erhalten
bleibt. Da bei diesen Operationen die Grade allenfalls wachsen, sieht man sofort,
da die Bedingung (4.1) auch f ur den so entstandenen Graphen gilt. Wir k onnen also
o.B.d.A. annehmen, da Gselbst abgeschlossen ist und da das Hinzunehmen einer
beliebigen weiteren Kante zu G mindestens einen Hamiltonschen Kreis erzeugt.
Daher sind wie im Beweis von Satz 4.3 je zwei nicht-adjazente Punkte von H
durch einen Hamiltonschen Weg verbunden.
Wir w ahlen nun zwei nicht-adjazente Punkte u und v von Gderart, da deg u
deg v maximal ist. Da G abgeschlossen ist, gilt deg u deg v < n; wir k onnen
dabei deg v deg u annehmen, womit k := deg u < n/2 folgt. Wie imBeweis von
Satz 4.3 betrachten wir nun einen Hamiltonschen Weg (x
1
, x
2
, . . . , x
n
) mit x
1
= u
und x
n
= v sowie die dort denierten Mengen X und Y. Dann gilt X Y = , da
wir sonst wieder einen Hamiltonschen Kreis erhalten w urden. F ur jeden der k 1
Punkte x
i
Y ist also vx
i1
keine Kante von G; da wir u so gew ahlt hatten, da
deg u deg v maximal war, mu dabei stets deg x
i1
deg u = k sein. Daher
enth alt Gmindestens k Punkte vomGrad k, weswegen insbesondere d
k
k gilt.
Nach (4.1) folgt d
nk
n k, es gibt also mindestens k 1 Punkte vom Grad
n k. Mindestens einer von diesen Punkten nennen wir ihn w ist nicht zu u
adjazent; dann gilt aber deg u deg w n. Widerspruch! 2
Chvtal [1972] hat auch gezeigt, da sein Satz 4.8 in einem starken Sinn best-
m oglich ist. Dazu nennen wir eine Folge a
1
a
2
a
n
von nat urlichen Zahlen
Hamiltonsch, wenn jeder Graph auf n 3 Punkten mit Gradfolge d
1
d
2
d
n
Hamiltonsch ist, falls nur d
i
a
i
f ur i = 1, . . . , n gilt. Chvtal hat nun die
Hamiltonschen Folgen uber die Bedingung (4.1) charakterisieren k onnen:
Satz 4.9. Eine Folge a
1
a
2
a
n
von nat urlichen Zahlen ist genau dann
Hamiltonsch, falls die folgende Bedingung erf ullt ist:
a
i
i = a
ni
n i f ur alle i < n/2.
XIV.5 Das Spernersche Lemma 331
Wie Satz 4.8 zeigt, ist diese Bedingung hinreichend; f ur die Notwendigkeit
verweisen wir auf die Originalarbeit oder auf Diestel [2000]. Weitere Konsequenzen
von Satz 4.3 ndet man bei Bondy and Chvtal [1976]; zu empfehlen ist auch der

Ubersichtsartikel von Chvtal [1985] uber Hamiltonsche Kreise.


5 Das Spernersche Lemma
Im Jahre 1911 publizierte Luitzen Egbertus Jan Brouwer (1881 1966) seinen
ber uhmten Fixpunktsatz, nach dem jede stetige Abbildung einer Vollkugel beliebi-
ger endlicher Dimension mindestens einen Fixpunkt besitzt. Der Beweis ist f ur die
Dimension 1 mittels des Zwischenwertsatzes leicht zu f uhren. F ur h ohere Dimen-
sionen erfordert der von Brouwer angegebene Beweis relativ umfangreiche theore-
tische Vorbereitungen. Deshalb erregte der junge Emanuel Sperner (1905 1980)
betr achtliches Aufsehen, als er 1928 ein rafniertes, aber schnell und direkt zu be-
weisendes Lemma vorlegte, aus dem sich sowohl der Brouwersche Fixpunktsatz
als auch der Brouwersche Satz von der Invarianz der Dimension ebenfalls schnell
herleiten lassen; siehe Sperner [1928b].
In diesem Abschnitt werden wir das Spernersche Lemma das nicht mit dem
gleichnamigen, ebenfalls aus dem Jahr 1928 stammenden Satz II.2.7 verwechselt
werden sollte formulieren und beweisen, wobei wir das typisch Geometrische in-
tuitiv behandeln; vergleiche auch Lubell [1966]. Anschlieend skizzieren wir einen
Beweis des Brouwerschen Fixpunktsatzes, siehe Brouwer [1911]; dieser Satz hat
weitreichende Anwendungen, beispielsweise in der mathematischen

Okonomie.
Das Spernersche Lemma bildet auch die Grundlage f ur die algorithmische Erfas-
sung von Fixpunkten.
Umdas Spernersche Lemma formulieren zu k onnen, ben otigen wir noch einige
Begriffe. Wir erinnern zun achst daran, da eine Teilmenge S R
n
konvex heit,
wenn sie mit je zwei Punkten x und y auch die gesamte Verbindungsstrecke xy
enth alt; formal:
(5.1) x, y S [0, 1] = x (1 )y S.
Unter einem Simplex der Dimension n versteht man nun ein konvexes Polyeder im
R
n
, das innere Punkte besitzt, und unter diesen Einschr ankungen minimale Ecken-
zahl hat. F ur n = 1 sind die Simplexe Intervalle, f ur n = 2 Dreiecke, f ur n = 3
Tetraeder. F ur beliebiges n kann man ein Simplex der Dimension n auch als die kon-
vexe H ulle von n 1 Punkten

in allgemeiner Lage denieren; diese Punkte sind


die Ecken des Simplexes. Diese Denition setzt nur voraus, da wir uns in einem
R
m
mit m n benden. W ahlt man unter den n 1 Ecken eines n-dimensionalen
Simplex d 1 Ecken aus, so erh alt man eine d-dimensionale Seite des gegebenen
332 XIV Kombinatorische Betrachtungen topologischen Ursprungs
n-dimensionalen Simplexes. Man sagt, sie liege den nicht ausgew ahlten Ecken ge-
gen uber. Unter einer simplizialen Zerlegung eines n-dimensionalen Simplexes
verstehen wir eine endliche Menge von paarweise verschiedenen n-dimensionalen
Simplexen
1
, . . . ,
r
, die die beiden folgenden Bedingungen erf ullt:
=
1

r
;
f ur j ,= k ist
j

k
eine (eventuell leere) Seite von
j
wie von
k
.
In der Ebene R
2
entsprechen die simplizialen Zerlegungen im wesentlichen den
triangulierten ebenen Graphen und sehen also wie folgt aus:
Das Maximumder Durchmesser (bez uglich der gew ohnlichen euklidischen Metrik)
der
j
nennt man die Feinheit der simplizialen Zerlegung. Man zeigt leicht, da ein
Simplex beliebig feine simpliziale Zerlegungen besitzt. Nach diesen Vorbeitungen
k onnen wir nun das folgende Resultat von Sperner [1928b] formulieren:
Lemma 5.1 (Spernersches Lemma). Sei
1
, . . . ,
r
eine simpliziale Zerlegung
eines n-dimensionalen Simplexes . Jedem Punkt, der als Ecke eines Simplexes

j
auftritt, sei eine der Zahlen 0, . . . , n als seine Marke zugeordnet, wobei die
beiden folgenden Bedingungen erf ullt seien:
(a) An den n 1 Ecken von stehen die Marken 0, 1, . . . , n in irgendeiner
bijektiven Zuordnung.
(b) Ist eine Seite S eines
j
in einer Seite F von enthalten, so kommen an
den Ecken von S nur Marken vor, die auch an Ecken von F vorkommen.
Dann gibt es einen Index j, f ur den die Ecken von
j
in bijektiver Zuordnung mit
den Marken 0, 1, . . . , n versehen sind.
Beweis. Ein
j
mit der gesuchten Eigenschaft nennen wir gut. Es gen ugt zu be-
weisen, da die Anzahl der guten
j
stets ungerade ist. Wir verwenden hierzu
Induktion nach der Dimension n des zerlegten Simplexes. F ur n = 1 ist die Be-
hauptung richtig, wie die folgende Abbildung illustriert:
0 0 0 1 1 1 1
XIV.5 Das Spernersche Lemma 333
Man mu n amlich, um von der Marke 0 zur Marke 1 zu wandern, ungerade oft
die Marke wechseln. Angenommen, die Aussage sei bis zur Dimension n 1
gesichert. Dann denken wir uns nunmehr eine simpliziale Zerlegung
1
, . . . ,
r
des n-dimensionalen Simplexes gegeben und eine Markierung der als Ecken
von Simplexen
j
auftretenden Punkte mit Marken 0, . . . , n durchgef uhrt, wie es
unser Lemma verlangt. Wir betrachten jetzt alle diejenigen (n 1)-dimensionalen
Simplexe , die als Seiten von Simplexen
j
auftreten. Wir nennen ein solches
sch on, wenn seine n Ecken gerade die Marken 1, . . . , n tragen. Ein gutes
j
hat
offenbar genau eine sch one Seite der Dimension n 1. Einem unguten
j
fehlt
mindestens eine der Marken 0, 1, . . . , n. Fehlt eine Marke > 0, so besitzt
j
keine sch one Seite. Fehlt ausschlielich die Marke 0, so kommt genau eine der
Marken 1, . . . , n an zwei Ecken von
j
vor, die andern genau einmal, womit
j
genau zwei sch one Seiten hat. Z ahlt man also f ur jedes
j
dessen sch one Seiten, so
ergibt sich eine Gesamtzahl, die sich von der Anzahl der guten
j
umeinVielfaches
von 2 unterscheidet. Bedenkt man, da dabei jede sch one Seite, die innere Punkte
von enth alt, genau zweimal gez ahlt wird, so sieht man, da die Anzahl der
guten
j
modulo 2 mit der Anzahl der sch onen Seiten auf dem Rande von
ubereinstimmt. Es kann aber uberhaupt nur eine (n 1)-dimensionale Seite von
sch one Seiten irgendwelcher
j
enthalten, n amlich diejenige, an deren n Ecken
die Marken 1, . . . , n stehen. In dieser Seite von sind nun die sch onen Simplexe
die

guten von einer Dimension tiefer, deren Anzahl nach der Induktionsannahme
ungerade ist. 2
Wir deuten nun noch an, wie man mittels des Spernerschen Lemmas 5.1 den
Fixpunktsatz von Brouwer [1911] beweist. Aus der Topologie wei man, da man
hierbei die Vollkugel durch eine beliebige zu ihr hom oomorphe Menge ersetzen
darf, etwa durch ein n-dimensionales Simplex . Wir betrachten also eine stetige
Abbildung : und suchen einen Fixpunkt von , d. h. einen Punkt
x mit (x) = x. Bekanntlich kann man jedem Punkt des R
n
seine n 1
baryzentrischen Koordinaten bez uglich der Ecken x
0
, . . . , x
n
von zuordnen,
d.h., man kann x in der Form
x =
n

i=0

i
x
i
mit
n

i=0

i
= 1
schreiben; hierbei liegt x genau dann in , wenn
i
0 f ur alle i gilt; siehe
beispielsweise Lenz [1975,XXII.2]. Manversieht nunjede Ecke x
i
mit der Marke i
(i = 0, . . . , n); kommt dann eine Marke j nicht an den Ecken einer gegebenen
Seite von vor, so haben alle Punkte imInneren dieser Seite in der entsprechenden
Koordinate
j
den Eintrag 0. Nun sei W
j
die Menge aller Punkte in , deren j-
te baryzentrische Koordinate
j
bei Anwendung von nicht steigt. Dann geh ort
334 XIV Kombinatorische Betrachtungen topologischen Ursprungs
diejenige Ecke von , die die Marke tr agt, sicher zu W

; allgemeiner ist jede


Seite von in der Vereinigung derjenigen W

enthalten, f ur welche die Marke


an einer Ecke dieser Seite steht. Ferner ist W
0
W
n
gerade die Menge der
Fixpunkte von . Nun bilden wir eine simpliziale Zerlegung
1
, . . . ,
r
von
und schreiben
an die alten Ecken von die alten Marken sowie
an jede neue Ecke e eines
j
jeweils eine derjenigen Marken , f ur welche
e W

gilt.
Man kann dies nun offenbar so durchf uhren, da die Bedingung (b) im Sperner-
schen Lemma erf ullt ist; damit k onnen wir dieses Lemma anwenden und gewinnen
so ein
j
, dessen Ecken in s amtliche W

hineinragen. Indem wir immer feinere


simpliziale Zerlegungen von in dieser Weise ben utzen und zu einem H aufungs-
punkt der dabei entstehenden Folge guter Simplexe ubergehen, gelangen wir zu
einem Punkt von W
0
W
1
W
n
, also einem Fixpunkt von . 2

Ubung 5.2. Man w ahle eine konkrete simpliziale Zerlegung eines konkreten Drei-
ecks und schrafere f ur eine konkrete, den Forderungen des Spernerschen Lemmas
gen ugende Eckenmarkierung s amtliche guten Teildreiecke.
6 Der Satz von Helly
Im diesemAbschnitt wollen wir den Satz von Eduard Helly (1884 1943) uber den
Durchschnitt konvexer Teilmengen des n-dimensionalen Raumes R
n
beweisen, der
bereits 1913 aufgestellt, aber erst in Helly [1923] publiziert wurde. Wir werden
dabei dem besonders einfachen Beweis von Edmonds [2001] folgen.
Satz 6.1 (Satz von Helly). Es sei S ein endliches System von konvexen Teilmengen
des R
n
, das leeren Durchschnitt hat. Dann gibt es ein Teilsystem von h ochstens
n 1 Mengen aus S, dessen Durchschnitt bereits leer ist.
Wir wollen zun achst an einige bekannte Begriffe aus der Theorie konvexer
Mengen erinnern. Eine afne Hyperebene ist eine Teilmenge des R
n
der Form
H
s,
:= {x R
n
[ s
T
x = ] (s R
n
{0]).
Allgemeiner ist ein afner Unterraum eine Teilmenge U R
n
mit der Eigenschaft
x (1 )y U f ur alle R und alle x, y U.
XIV.6 Der Satz von Helly 335
Die afnen Halbr aume zu einer afnen Hyperebene H = H
s,
sind die abgeschlos-
senen Mengen
H

= {x R
n
[ s
T
x ] bzw. H

= {x R
n
[ s
T
x ];
auerdem ben otigen wir noch die zugeh origen offenen Mengen
H
<
= {x R
n
[ s
T
x < ] bzw. H
>
= {x R
n
[ s
T
x > ].
Ein Polyeder ist ein Schnitt endlich vieler afner Halbr aume. Allgemein wird auch
der Schnitt eines afnen Unterraums mit einemafnen Halbraumals ein Halbraum
bezeichnet; f ur unsere Zwecke wollen wir hier auch die leere Menge und den
gesamten RaumR
n
als Halbr aume ansehen. Bekanntlich sind alle eben denierten
Typen von Mengen konvex, wie man leicht aus den Denitionen nachrechnet. Als
Hintergrund sei beispielsweise auf Kapitel 2 von Jungnickel [1999b] verwiesen, wo
man die wichtigsten Tatsachen uber konvexe Mengen und Polyeder nden kann.
Das folgende Resultat ist der Schl ussel zum Edmondsschen Beweis des Satzes
von Helly:
Lemma 6.2 (Redundanzlemma von Edmonds). Es seien H eine afne Hyper-
ebene imR
n
und H

ein zugeh origer afner Halbraum. Ferner sei R


/
eine endliche
Menge von Halbr aumen im R
n
, f ur die der Durchschnitt
_
RR
/ R zu H disjunkt
ist. Dann tritt einer der beiden folgenden F alle ein:
(a) Das Mengensystem R := R
/
{H

] hat leeren Durchschnitt.


(b) H

ist redundant f ur R
/
, d.h., der Durchschnitt
_
RR
/ Rist inH
<
enthalten.
Beweis. Wir betrachten den Durchschnitt P :=
_
RR
/ R, der nat urlich eine kon-
vexe Teilmenge des R
n
(sogar ein Polyeder) ist. Ferner seien
P
<
:= H
<
P sowie P
>
:= H
>
P.
Nach Voraussetzung gilt P H = , weswegen P die disjunkte Vereinigung von
P
<
und P
>
ist. Weil P konvex ist, ist dies nur m oglich, wenn eine der beiden
Mengen P
<
und P
>
leer ist: Andernfalls w urde n amlich die Verbindungsstrecke
xy eines Punktes x P
<
mit einem Punkt y P
>
, die ja ganz in P enthalten
ist, die Hyperebene H schneiden. Falls nun P
<
leer ist, tritt die Alternative (a) der
Behauptung ein, und falls P
>
leer ist, die Alternative (b). 2
Wir kommen nun zum Beweis des Satzes von Helly. Zun achst uberlegen wir
uns, da es ausreicht, Satz 6.1 in dem Spezialfall zu beweisen, in dem alle Mengen
in S Halbr aume sind. Daraus folgt der Satz n amlich sofort f ur Mengensysteme S,
336 XIV Kombinatorische Betrachtungen topologischen Ursprungs
deren Mitglieder Polyeder sind, da ja Polyeder ihrerseits endliche Schnitte von
Halbr aumen sind. Hat man den Satz nun f ur Polyeder, schliet man mit dem fol-
genden indirekten Beweis auf beliebige Systeme S von konvexen Mengen. Ange-
nommen, der Schnitt von je n 1 Elementen von S w are nichtleer. Dann w ahle
man in jedem derartigen Schnitt einen Punkt, was eine endliche Menge M liefert,
und deniere ein neues System S
/
, das f ur jede Menge S S die konvexe H ulle
S
/
der Punkte in M S enth alt. Da bekanntlich jedes S
/
ein Polyeder (sogar ein
Polytop, also ein beschr anktes Polyeder) ist, k onnen wir den Satz von Helly auf S
/
anwenden. Nach Konstruktion haben aber je n 1 Teilmengen von S
/
einen nicht-
leeren Schnitt, da sie jedenfalls s amtlich denjenigen Punkt enthalten, den wir im
Schnitt der entsprechenden Mengen aus S gew ahlt haben; das ist der gew unschte
Widerspruch.
Es bleibt also nur noch der Spezialfall zu untersuchen, in dem alle Mengen in S
Halbr aume sind. Der Satz gilt trivialerweise, falls in S die leere Menge vorkommt
oder alle Mengen in S der gesamte R
n
sind; man beachte, da dies f ur n = 0 der
Fall sein mu. Andernfalls gibt es in S einen Halbraum, dessen Rand Dimension
< n hat; o.B.d.A. kann man annehmen, da es sich umeinen afnen HalbraumH

handelt, dessen Rand also die afne Hyperebene H ist. Wir denieren nun zwei
neue Mengensysteme:
S
/
:= S {H

] sowie S
0
:= {H S [ S S
/
].
Falls nun das System S
0
nichtleeren Schnitt hat, gilt dies trivialerweise auch f ur
das urspr ungliche System S. Ab jetzt sei also
_
SS
0
S = . Mit Induktion uber
n k onnen wir den Satz von Helly auf S
0
anwenden. Es gibt also ein h ochstens
n-elementiges Teilsystem R
/
von S
/
, f ur das H
_
SR
/ S = gilt. Nun bringen
wir das Rendundanzlemma 6.2 ins Spiel und stehen somit vor einer der beiden
folgenden Alternativen:
(a) Das h ochstens (n 1)-elementige Mengensystem R := R
/
{H

] hat
leeren Durchschnitt.
(b) H

ist redundant f ur R
/
, es ist also
_
RR
/ R in H
<
enthalten.
Im Fall (a) haben wir mit R das gew unschte Teilsystem von S gefunden und sind
fertig. Sei also ab jetzt H

redundant f ur R
/
; trivialerweise ist H

dann auch
redundant f ur das R
/
umfassende SystemS
/
. Nun k onnen wir eine zweite Induktion
anwenden, n amlich uber die M achtigkeit der betrachteten Mengensysteme; man
beachte dabei, da das SystemS
/
leeren Durchschnitt haben mu, weil andernfalls
auch S nichtleeren Durchschnitt h atte. Folglich existiert ein h ochstens (n 1)-
elementiges TeilsystemRvon S
/
S, das bereits leeren Durchschnitt hat, und wir
sind ebenfalls fertig. 2
XIV.6 Der Satz von Helly 337
Der eben durchgef uhrte Beweis f ur den Satz von Helly ist nicht nur kurz und ele-
gant, sondern erlaubt auch eine weit reichende Verallgemeinerung auf sogenannte

orientierte Matroide; siehe dazu Edmonds [2001].


XV Spiele auf Graphen
In diesem Kapitel wollen wir einige kombinatorische Aspekte der Spieltheorie,
eines Zweiges der mathematischen

Okonomie, darstellen. Wir werden sogenann-
te Baumspiele betrachten und das Kuhnsche Gleichgewichts-Theorem sowie die
Theorie der Kerne und Grundy-Funktionen bei Spielen vomTyp Nimkennenlernen.
Hiermit sind die kombinatorischen Reize der mathematischen

Okonomie keines-
wegs ersch opft; die Theorie der Spiele und linearen Programme f uhrt auf Untersu-
chungen uber Polyeder in hochdimensionalen R aumen, bei denen algorithmisch-
kombinatorische Fragen (Simplexalgorithmus, die Ellipsoidmethode von Khachian
[1979] sowie Varianten des Algorithmus von Karmarkar [1984]) im Zentrum des
Interesses stehen. Der an Polytopen interessierte Leser sei auf Gr unbaum [1967],
Ziegler [1995] und das Pionier-Werk Rademacher und Steinitz [1934] verwiesen.
Es sei noch erw ahnt, da in der Theorie der okonomischen Gleichgewichte der
Brouwersche Fixpunktsatz eine groe Rolle spielt; seine kombinatorischen Aspek-
te haben wir bereits in Kap. XIII.6 dargestellt.
1 Baumspiele
Um ein sogenanntes Baumspiel graphisch darzustellen, denken wir uns

Etagen
Nr. 0, 1, 2, . . . , N etwa in Form aufsteigend einander folgender horizontaler Li-
nien bereitgestellt. Sodann best ucken wir jede Etage mit endlich vielen Punkten,
wobei die 0-te Etage genau einen Punkt erh alt. Schlielich verbinden wir jeden
dieser Punkte durch eine Kante mit keinem, einem oder mehreren Punkten der
n achsth oheren Etage, und zwar so, da jeder Punkt der n achsth oheren Etage von
genau einem Punkt der vorigen Etage aus erreicht wird. Das Ergebnis nennen wir
einen Spielbaum mit N 1 Etagen; in der Sprache von XIII.4 handelt es sich
n amlich einfach um einen Wurzelbaum, f ur den die Punkte gem a ihrem Abstand
zur Wurzel in Etagen zusammengefat worden sind. Demzufolge nennen wir den
einzigen Punkt der 0-ten Etage die Wurzel. Diejenigen Punkte, von denen keine
Verbindung mehr h oher steigt, heien die Spitzen; zu den Spitzen geh oren sicher
die s amtlichen Punkte der obersten Etage Nr. N, es kann aber auch Spitzen in nied-
rigeren Etagen geben. Jede Spitze ist auf genau einem Weg von der Wurzel aus
erreichbar. Ein solcher Spielbaum sieht also etwa so aus:
XV.1 Baumspiele 339
Etage N
Etage N 1
Etage k
Etage 0
Etage 2
Etage 1
Etage k 1
_
_
Wir k onnen nun Spiele mit n Spielern 1, . . . , n auf dem Baum S denieren. Dazu
beschriften wir jede Spitze von S mit einem n-Tupel von reellen Zahlen und jeden
Punkt, der keine Spitze ist, mit einem der Symbole 1, . . . , n. Das zugeh orige Spiel
wird folgendermaen gespielt: Der Spieler, dessen Nummer an der Wurzel von S
steht, w ahlt eine von der Wurzel zu einem Punkt in der Etage Nr. 1 f uhrende Kante
aus; der obere Punkt dieser Kante darf dabei eine Spitze sein. In diesem Falle endet
das Spiel mit einer Auszahlung an die n Spieler gem a dem dort angeschriebenen
n-Tupel; negative Komponenten bedeuten dabei, da der betreffende Spieler zur
Kasse gebeten wird. Ist der gew ahlte Punkt dagegen keine Spitze, so tr agt er die
Nummer eines Spielers, der nun eine zu einemPunkt in der zweiten Etage f uhrende
Kante w ahlt, und so weiter. In jedemFalle endet das Spiel nach maximal N

Z ugen
mit einer Auszahlung. Es ist klar, da man beispielsweise das Schachspiel (mit
einer gegebenen, hinreichend groen Maximalzahl von Z ugen) theoretisch als ein
derartiges Baumspiel darstellen k onnte. Einfacher ginge dies f ur Spiele wie etwa

M uhle oder N-maliges

Knobeln.
Unter einer Strategie des Spielers k versteht man eine Abbildung , die jedem
mit k beschrifteten Punkt des Spielbaums genau eine der von diesem Punkt aus
in die n achsth ohere Etage f uhrenden Kanten zuordnet. Wir bezeichnen mit
k
die
Menge aller Strategien f ur den Spieler k (k = 1, . . . , n). Hat jeder Spieler k seine
Strategie
k

k
gew ahlt, so ist durch das n-Tupel (
1
, . . . ,
n
) der Spielverlauf
samt den End-Auszahlungen
A
1
(
1
, . . . ,
n
), . . . , A
n
(
1
, . . . ,
n
)
eindeutig bestimmt. Es ist klar, da die Mengen
1
,
2
im Falle des Schachspiels
astronomischen Umfang haben. Ein n-Tupel (
1
, . . . ,
n
) von Strategien heit ein
Gleichgewicht, wenn f ur jedes k und jedes
k
A
k
(
1
, . . . ,
k1
, ,
k1
, . . . ,
n
) A
k
(
1
, . . . ,
k1
,
k
,
k1
, . . . ,
n
)
gilt, wenn sich also kein Spieler durch

Anderung seiner Strategie verbessern kann,
sofern nur die ubrigen Spieler an ihren Strategien festhalten. Dann gilt der folgende
Satz von Kuhn [1950]:
340 XV Spiele auf Graphen
Satz 1.1 (Gleichgewichts-Theorem von Kuhn). Jedes Baumspiel besitzt minde-
stens ein Gleichgewicht.
Beweis. Wir wenden Induktion nach der Anzahl N der von der Wurzel verschie-
denen Etagen an. Ist N = 0, so hat jeder Spieler k nur eine Strategie
k
, n amlich
die Auszahlung hinzunehmen, da hier die Wurzel zugleich die Spitze ist. Trivia-
lerweise ist dies (
1
, . . . ,
n
) ein Gleichgewicht. Angenommen, der Satz ist f ur
alle Baumspiele mit N Etagen bereits bewiesen. Wir betrachten nun ein Spiel
mit N 1 Etagen. Seien k
0
der Spieler, dessen Nummer an der Wurzel unseres
Spielbaums S steht, und
1
, . . . ,
r
die von der Wurzel ausgehenden Kanten. Zu
jedem = 1, . . . , r geh ort ein Baumspiel mit h ochstens N Etagen, n amlich das
Teilspiel, dessen Wurzel das obere Ende von

ist. Nach Induktionsannahme be-


sitzt jedes Teilspiel Nr. ein Gleichgewicht (
()
1
, . . . ,
()
n
). F ur jedes k ,= k
0
kann
Spieler k die Strategien
(1)
k
, . . . ,
(r)
k
zu einer neuen Strategie
k
im Gesamtspiel
zusammenfassen, indem er einfach ihre

disjunkte Vereinigung bildet. Dagegen


mu der an der Wurzel sitzende Spieler k
0
sich im ersten Spielzug f ur eine Kante

0
und damit f ur das Teilspiel
0
entscheiden. Naheliegenderweise wird er das
so tun, da er in einemTeilspiel landet, f ur das seine Auszahlung unter allen f ur ihn
m oglichen Auszahlungen A
k
0
(
()
1
, . . . ,
()
n
), = 1, . . . , r, maximal wird. Seine
Strategie
k
0
imGesamtspiel besteht also aus

0
an der Wurzel und jeweils
()
k
0
im
Teilspiel Nr. , wobei nat urlich die F alle ,=
0
uber ussigenAufwand darstellen.
Man sieht nun leicht ein, da (
1
, . . . ,
n
) ein Gleichgewicht f ur das Gesamtspiel
darstellt. 2
Beschr ankt man sich auf 2-Personen-Nullsummenspiele, also den Fall n = 2
und Komponentensumme 0 bei allen Auszahlungspaaren, so f uhrt die Aussage

(
1
,
2
) ist ein Gleichgewicht auf eine Minimaxaussage:
A
1
(
1
,
2
) = max{A
1
(,
2
) [
1
]
und
A
1
(
1
,
2
) = A
2
(
1
,
2
) = max{A
2
(
1
, ) [
2
]
= min{A
1
(
1
, ) [
2
]
liefern zusammen
() min{A
1
(
1
, ) [
2
] = A(
1
,
2
) = max{A
1
(,
2
) [
1
].
Andererseits gilt f ur beliebige
/

1
und
/

2
die Absch atzung
min{A
1
(
/
, ) [
2
] A
1
(
/
,
/
) max{A
1
(,
/
) [
1
],
XV.2 Das klassische Nim-Spiel 341
also
max

min

A
1
(, ) min

max

A
1
(, ),
und () besagt gerade, da hier Gleichheit mit dem Wert A(
1
,
2
) eintritt. Eben
dies ist der Inhalt der sogennaten Minimax-Aussage. Satz 1.1 impliziert also ein
Minimaxtheorem f ur 2-Personen-Nullsummen-Baumspiele. Der Beweis eines Mi-
nimaxtheorems f ur sogenannte gemischte Erweiterungen beliebiger 2-Personen-
Nullsummenspiele (von Neumann [1928]) markiert den Beginn der modernen ma-
thematischen

Okonomie; einige B ucher zu diesem Gebiet sind von Neumann und
Morgenstern [1944], Burger [1959], Debreu [1959] und Cassels [1981]. Dieser Be-
weis ist durchWahrscheinlichkeits- und Konvexit atsbetrachtungen gekennzeichnet,
die man ubrigens auch zumVariieren von Satz 1.1 (

Zufallsz uge) verwenden kann,


ohne da dabei schon das von Neumannsche Minimaxtheorem herausk ame.
2 Das klassische Nim-Spiel
Im Rest dieses Kapitels betrachten wir eine Klasse von 2-Personen-Nullsummen-
spielen, von denen viele sich theoretisch als Baumspiele darstellen lassen, zweck-
m aigerweise aber mit Hilfe anderer Graphen untersucht werden. Dabei bietet sich
die zwanglose M oglichkeit, auch unendliche Graphen in die Theorie einzubeziehen.
Die Auszahlungen sind durch die Angaben

Gewinn und

Verlust ersetzt, gefragt


wird nach Gewinnstrategien.
Die hier betrachtete Klasse von Spielen enth alt das klassische Nim-Spiel als
Spezialfall. Wir beginnen daher mit der Besprechung von mehr oder minder klas-
sischen Spielen dieses Typs und gehen erst im n achsten Abschnitt zur allgemei-
nen Theorie der Gewinnstrategien uber, f ur die die Begriffe

Kern und

Grundy-
Funktion charakteristisch sind.
Zun achst einmal eine einfacheVariante des Nim-Spiels, die folgende Spielregel
hat: Vor einem Haufen von f unf Streichh olzern stehen zwei Spieler. Sie nehmen
abwechselnd Streichh olzchen weg, und zwar jedesmal nach Belieben eines oder
zwei. Wer abr aumt, ist Sieger. Dies Spiel l at sich bequemals Baumspiel darstellen:
Spieler 1
Spieler 1
Spieler 1
Spieler 2
Spieler 2
1
1
1 1
1 1 1
1
1 1 1 1 2
2
2
2
2 2 2
Hierbei sind die Kanten mit der Anzahl der jeweils entfernten Streichh olzer be-
342 XV Spiele auf Graphen
schriftet; an den mit bezeichneten Spitzen gewinnt Spieler 1, an den mit 2 be-
zeichneten Spieler 2. Spieler 1 kann sicher gewinnen, wenn er mit der Wegnahme
von zwei Streichh olzern beginnt.

Ubung 2.1. Man stelle die Spielb aume und eventuelle Gewinnstrategien bei eini-
gen einfachen Varianten dieses Spiels dar.
Nun kommen wir zum klassischen Nim-Spiel mit der folgenden Spielregel:
N Streichh olzer sind auf drei nichtleere Haufen verteilt. Zwei Spieler ziehen ab-
wechselnd. Ein Zug besteht darin, von einem der drei Haufen, soweit er noch
nicht leer ist, einen Teil der dort liegenden H olzchen (mindestens eins, eventuell
alle) wegzunehmen. Wer abr aumt, gewinnt. Offenbar ist der jeweilige Zustand des
Spiels durch einen Punkt x = (n
1
, n
2
, n
3
) Z
3

gekennzeichnet: auf Haufen 1


liegen genau n
1
, auf Haufen 2 genau n
2
, auf Haufen 3 genau n
3
H olzchen. Man
beginnt in einem Punkte (N
1
, N
2
, N
3
) mit N
1
, N
2
, N
3
> 0. Ein Zug besteht darin,
eines der n
i
> 0 um mindestens 1 herabzusetzen. Es gewinnt, wer zuerst (0, 0, 0)
erreicht. Somit lassen sich alle diese Spiele bequem simultan durch einen Graphen
mit der Eckenmenge Z
3

darstellen.
Denition 2.2. Eine Menge K Z
3

heit ein Kern, falls sie folgende Bedingun-


gen erf ullt:
(a) (0, 0, 0) K;
(b) Von einem (n
1
, n
3
, n
3
) K kann nach keinem (m
1
, m
2
, m
3
) K gezogen
werden.
(c) Von jedem(n
1
, n
2
, n
3
) , K kann nach mindestens einem(m
1
, m
2
, m
3
) K
gezogen werden.
Es ist klar, da die Existenz eines Kernes K
im Fall (N
1
, N
2
, N
3
) , K dem Spieler, der als erster am Zug ist,
im Fall (N
1
, N
2
, N
3
) K dem Spieler, der als zweiter am Zug ist,
eine Gewinnstrategie er offnet, die darin besteht, stets in K hineinzuziehen und
dadurch den Gegner zu zwingen, K stets zu verlassen, womit er dann (0, 0, 0) nie
erreichen kann.
Satz 2.3. Beim klassischen Nim-Spiel gibt es genau einen Kern.
Beweis. Wir zeigen zun achst, da es h ochstens einen Kern geben kann. Angenom-
men, es gibt zwei verschiedene Kerne K und L, etwa x
(1)
KL. Man kann dann
wegen Bedingung (c) f ur L von x
(1)
zu einem x
(2)
L ziehen; dabei gilt nach
XV.2 Das klassische Nim-Spiel 343
Bedingung (b) f ur K sogar x
(2)
L K. Danach kann man analog von x
(2)
zu
einem x
(3)
K L ziehen usw. Andererseits ist man aber wegen der Endlichkeit
des Spieles irgendwann gezwungen, nach (0, 0, 0) K L zu ziehen. Dies ist ein
Widerspruch.
Es bleibt zu zeigen, da es wirklich einen Kern gibt; wie wir sehen werden,
l at sich dieser sogar explizit angeben. F ur jedes x = (n
1
, n
2
, n
3
) schreibe man
die Komponenten dyadisch hin:
n
1
= a
0
a
1
2
1
a
r
2
r
n
2
= b
0
b
1
2
1
b
r
2
r
n
3
= c
0
c
1
2
1
c
r
2
r
mit r Z

, a
0
, . . . , c
r
{0, 1]. Wir zeigen, da
K = {(n
1
, n
2
, n
3
) [ a

ist f ur = 1, . . . , r gerade]
ein Kern ist. Offenbar gilt (0, 0, 0) K. Ist x = (n
1
, n
2
, n
3
) K, so kann man
nur aus K herausziehen. Denn

zu ziehen bedeutet, ein n

herabzusetzen, und dies


bewirkt, wenn man beispielsweise n
2
herabsetzt, da an mindestens einer Stelle
ein b

= 1 durch b

= 0 ersetzt wird; dabei wird dann aber a

, welches
vorher wegen x K gerade war, ungerade. Sei nun x = (n
1
, n
2
, n
3
) , K. Im
Schema
a
0
a
1
. . . a
r
b
0
b
1
. . . b
r
c
0
c
1
. . . c
r
ist mindestens eine Spaltensumme a

= 1 oder = 3. Wir suchen uns das


gr ote solche und haben in dieser Spalte mindestens eine 1, etwa c

= 1. Wir
entschlieen uns, n
3
= c
0
c
1
2
1
c
r
2
r
zu senken. Hierbei stehen uns alle

Anderungen der c
1
, . . . , c

zur Verf ugung, bei denen c

in 0 verwandelt und die


c
0
, . . . , c
1
beliebig ver andert oder belassen werden. Offenbar k onnen wir, wenn
wir das geschickt machen, alle Spaltensummen in gerade Zahlen verwandeln, also
nach K gelangen. 2

Ubung 2.4. Man formuliere die auf Satz 2.3 beruhende Gewinnstrategie explizit.
Zur Vertiefung sei die Lekt ure von S. 340ff. in Beck, Bleicher und Crowe [1969]
empfohlen. ImHinblick auf eine Szene in einemseinerzeit bekannten franz osischen
Film heit ein Nim-Spiel mit vier Haufen bei diesen Autoren das

Marienbad-
Spiel.

Ubung 2.5. Man andere das klassische Nim-Spiel ab, indemman nur zwei Haufen
zul at, und formuliere hierf ur eine Gewinnstrategie.
344 XV Spiele auf Graphen

Ubung 2.6. Man zeige, da es zu jeder nat urlichen Zahl n genau eine nat urliche
Zahl k mit n =
_
1
2
k(1

5)
_
oder n =
_
1
2
k(3

5)
_
gibt.

Ubung 2.7. Man betrachte die folgende Spielregel: Gegeben sind zwei nicht-leere
Haufen von Streichh olzern. Zwei Spieler ziehen abwechselnd. Ein Zug besteht
darin, da man entweder von einem nichtleeren Haufen beliebig viele dort vorhan-
dene H olzchen wegnimmt oder von beiden, als nichtleer vorausgesetzten Haufen
die gleiche Anzahl von dort vorhandenen H olzchen wegnimmt. Wer abr aumt, hat
gewonnen.
Man bilde rekursiv folgende Folge von Punkten x
(k)
= (a
k
, b
k
) Z
2

:
x
(0)
= (0, 0)
a
n
= min(N {a
0
, b
0
, . . . , a
n1
, b
n1
])
b
n
= a
n
n
und beweise unter Ben utzung von

Ubung 2.6
a
n
=
_
1
2
n(1

5)
_
, b
n
=
_
1
2
n(3

5)
_
.
Man zeige, da {x
(0)
, x
(1)
, . . . ] im zu Denition 2.2 analogen Sinn ein Kern ist.
3 Spiele vom Typ Nim auf Graphen
Wir wollen nun den hinter der Analyse des Nim-Spiels steckenden allgemeinen
Gedanken pr aziser herausarbeiten. Dies geschieht, indem wir die vorher schon an-
gedeutete graphentheoretische Darstellung des Nim-Spiels verallgemeinern. Hier-
bei verwenden wir die bereits in II.3 eingef uhrten gerichteten Graphen, die hier
allerdings auch unendlich sein d urfen. Es ist also V eine eventuell unendliche
nichtleere Menge von Punkten und E eine eventuell unendliche nichtleere Men-
ge von B ogen e = ab. F ur jedes v V bezeichnen wir mit A(v) die Menge der
von v aus erreichbaren Punkte und mit N(v) = {w [ vw E] die Menge der von
v aus in einem Schritt erreichbaren Punkte, also der Nachbarpunkte von v. Liegt
v V auf keiner Kante, so heit v ein isolierter Punkt; ist v nicht isoliert, aber
N(v) = , so heit v ein Endpunkt unseres Digraphen G = (V, E). Wir nennen G
kreisfrei, wenn es in G keine gerichteten Kreise gibt.
Denition 3.1. Ein kreisfreier Digraph G = (V, E) heit ein Spielgraph, wenn
f ur jedes v V die Menge A(v) endlich ist.
XV.3 Spiele vom Typ Nim auf Graphen 345
Zu jedem Spielgraphen G = (V, E) und zu jedem Nicht-Endpunkt v
0
V
geh ort ein Spiel vom Typ Nim auf G gem ass folgender Spielregel R(v
0
): Zwei
Spieler 1 und 2 ziehen abwechselnd. Ein Zug besteht darin, von einem v A(v
0
)
zu einem w N(v) A(v
0
) zu gehen. Spieler 1 zieht als erster, und zwar von v
0
aus. Wer zuerst einen Endpunkt von G erreicht, hat gewonnen. Weil A(v
0
) endlich
ist und es keine gerichteten Kreise gibt, erreicht man garantiert nach endlich vielen
Schritten einen Endpunkt von G, wie immer man auch zieht.
Wir verallgemeinern nun Denition 2.2 wie folgt:
Denition 3.2. Sei G = (V, E) ein Spielgraph. Eine Menge K V heit ein
Kern, wenn gilt:
(a) K enth alt alle Endpunkte von G;
(b) N(v) K = f ur alle v K;
(c) N(v) K ,= f ur alle v V K.
Es ist wieder klar, wie man mittels eines Kerns K Gewinnstrategien deniert. Ist
v
0
K, so kann Spieler 2 sicher gewinnen, denn Spieler 1 mu mit demersten Zug
K verlassen und Spieler 2 kann dann nach K zur uckziehen, und so weiter. Das geht
solange, bis Spieler 2 einen Endpunkt alle Endpunkte sind ja in K, und A(v
0
) ist
endlich erwischt. Ist dagegen v
0
/ K, so kann Spieler 1 sicher gewinnen, indem
er stets nach K zieht und dadurch, sofern noch kein Endpunkt erreicht wurde, den
Spieler 2 zwingt, K zu verlassen, wo aber alle Endpunkte liegen. Nun gilt das
folgende Analogon von Satz 2.3:
Satz 3.3. Zu jedem Spielgraphen G gibt es genau einen Kern.
Beweis. Ganz analog zumVorgehen bei Satz 2.3 zeigt man, da es h ochstens einen
Kern geben kann. F ur die Existenz gehen wir diesmal mittels einer induktiven
Konstruktion vor, ein deutlicher Unterschied zum konkreten Fall des klassischen
Nim, wo wir den Kern explizit hinschreiben konnten.
Hierbei beachten wir, da es f ur jedes v V unter den von v in die Menge der
Endpunkte f uhrenden Wegen einen l angsten geben mu, weil A(v) ja endlich ist.
Sei L
n
die Menge aller derjenigen v, f ur die so ein l angster Weg aus h ochstens n
B ogen besteht. Dann gilt L
0
L
1
und L
0
L
1
= V. Ist v L
n
, so
gilt offenbar N(v) L
n1
. Wir denieren nun rekursiv
K
0
= L
0
= Menge aller Endpunkte;
K
1
= K
0
{v L
1
[ N(v) K
0
= ];
K
2
= K
1
{v L
2
[ N(v) K
1
= ] etc.
346 XV Spiele auf Graphen
und setzen K = K
0
K
1
. . . Wir zeigen, da K ein Kern ist. Nach Denition
enth alt K alle Endpunkte. Sei nun v K K
0
, etwa v K
n
K
n1
. Dann gilt
v L
n
K
n1
und somit N(v) K
n1
= . G abe es ein w N(v) K, m usste
daher w K K
n1
gelten, also w K
m
K
m1
f ur ein m n. Nach Denition
der K
i
erfordert dies aber w L
m
L
m1
, imWiderspruch zu N(v) L
n1
. Somit
erf ullt K Bedingung (b) in Denition 3.2. Schlielich sei v , K, etwa v L
n
K.
Angenommen, es w are N(v) K = . Dann folgt N(v) K
n1
= und damit
v K
n
K, ein Widerspruch. Also erf ullt K auch Bedingung (c) und ist in der
Tat ein Kern. 2
Es fragt sich nun, ob und wie man den Kern eines Spielgraphen wie beimklas-
sichen Nim-Spiel konkret gewinnen kann. Hierbei hilft der Begriff der Grundy-
Funktion, der auf Grundy [1939] zur uckgeht; siehe auch Grundy und Smith [1956].
Denition 3.4. Sei G = (V, E) ein Spielgraph. Eine Grundy-Funktion f ur G ist
eine Abbildung g: V Z

= {0, 1, . . . ], die f ur jedes v V die folgende


Bedingung erf ullt:
() g(v) = min
_
Z

g(N(v))
_
.
Satz 3.5. Sei g eine Grundy-Funktion f ur den Spielgraphen G = (V, E). Dann ist
K = {v V [ g(v) = 0] der Kern des Graphen.
Beweis. Ist v ein Endpunkt von G, so gilt N(v) = , also Z

g(N(v)) = Z

und
somit g(v) = 0, also v K. Aus g(v) = 0 folgt g(w) > 0 f ur alle w N(v); also
gilt N(v) K = f ur alle v K. Ist schlielich g(v) ,= 0, so gilt insbesondere
0 g(N(v)), weswegen es in N(v) ein w mit g(w) = 0 gibt; also ist w K f ur
alle v V K. 2

Ubung 3.6. Wir betrachten ein Nim-Spiel mit einemeinzigen Streichholz-Haufen,


von dem bei jedem Zug 1 bis n H olzchen weggenommen werden d urfen. Der
zugeh orige Graph G = (V, E) ist durch
V = Z

und E = {(v, w) [ v Z

, w Z

{v 1, . . . , v n]]
gegeben. Man zeige, da
g(v) = m f ur v m (mod n 1), 0 m n,
eine Grundy-Funktion auf G ist, stelle den zugeh origen Kern auf und formuliere
die Gewinnstrategien.
XV.3 Spiele vom Typ Nim auf Graphen 347

Ubung 3.7. Wir betrachten das klassische Nim-Spiel mit drei Streichholz-Haufen.
Der zugeh orige Spielgraph G = (V, E) ist durch V = Z
3

und
E = {(v, w) [ v, w Z
3

, w entsteht aus v dadurch,


da man genau eine Komponente echt herabsetzt]
gegeben. Man gebe eine Grundy-Funktion auf G an.
Es liegt nahe, sich ein Nim-Spiel mit d Streichholz-Haufen als ein Komposi-
tumvon d Nim-Spielen mit je einemHaufen vorzustellen. Diesen Gedanken wollen
wir nun in der Sprache der Spielgraphen erfassen. Seien dazu G
1
= (V
1
, E
1
), . . . ,
G
d
= (V
d
, E
d
) Spielgraphen. Wir bilden einen neuen Spielgraphen G = (V, E)
auf dem cartesischen Produkt V = V
1
V
d
. Das Kantenziehen in V be-
schreiben wir verbal: Von v = (v
1
, . . . , v
d
) ziehen wir genau dann einen Bogen
nach w = (w
1
, . . . , w
d
), wenn sich v und w in genau einer Komponente, etwa der
j-ten, unterscheiden und in G
j
ein Bogen von v
j
nach w
j
f uhrt. Es sei dem Leser
uberlassen, E formal hinzuschreiben. Wir zeigen nun, da G = (V, E) in der Tat
ein Spielgraph ist. Sei dazu v

= (v

1
, . . . , v

d
) V beliebig und v = (v
1
, . . . , v
d
)
von v

aus in G erreichbar. Dann ist v


i
f ur i = 1, . . . , d von v

i
aus aus erreichbar;
hierf ur gen ugt es, sich klarzumachen, da ein Weg in Gvon v

nach v stets dadurch


entsteht, da man Wege von v

i
nach v
i
(i = 1, . . . , d) geeignet nach V verlegt
und verschr ankt. Also sind von v

aus nur endlich viele Punkte in G erreichbar.

Ahnlich sieht man auch, da G kreisfrei ist. Wir nennen G die cartesische Summe
von G
1
, . . . , G
d
.
Satz 3.8. Seien G
j
= (V
j
, E
j
) (j = 1, . . . , d) Spielgraphen und G = (V, E)
ihre cartesische Summe. Gibt es auf jedem G
j
eine Grundy-Funktion, so existiert
auch auf G eine Grundy-Funktion.
Beweis. F ur j = 1, . . . , d sei g
j
: V
j
Z

die auf G
j
gegebene Grundy-Funktion.
F ur jedes v = (v
1
, . . . , v
d
) V entwickeln wir die Zahlen g
j
(v
j
) dyadisch:
g
j
(v
j
) =

n=0
a
(j)
n
2
n
f ur j = 1, . . . , d.
Hierbei gilt stets a
(j)
n
{0, 1] und h ochstens endlich oft a
(j)
n
= 1. Sei
a
n
a
(1)
n
a
(d)
n
(mod 2), a
n
{0, 1].
Auch hier kommt h ochstens endlich oft a
n
= 1 vor. Wir setzen nun
g(v) :=

n=0
a
n
2
n
.
348 XV Spiele auf Graphen
Somit entsteht g(v), indem man die dyadischen Entwicklungen der g(v
j
) kompo-
nentenweise modulo 2 addiert.
Wir behaupten, da dieses g eine Grundy-Funktion auf G ist. Sei also v =
(v
1
, . . . , v
d
) V und w N(v). Dann gilt auf jeden Fall g(w) ,= g(v), da beim

Ubergang von v zu w genau eine Komponente von v abge andert wird, etwa v
j
.
Dabei erf ahrt g
j
(v
j
) eine echte

Anderung; also gibt es mindestens ein n, f ur das
a
(j)
n
echt ge andert wird, w ahrend alle anderen a
(i)
n
gleichbleiben, womit sich a
n
echt andert. Insbesondere gilt g(w) > 0, wenn g(v) = 0 ist.
Sei nun g(v) > 0. Wir haben zu zeigen, da g(w) bei passender Wahl von
w N(v) jeden Wert von 0 bis g(v) 1 annimmt. Wir entwickeln g(v) wie oben
dyadisch. Um dann einen Wert g(w) =

n=0
b
n
2
n
< g(v) zu erreichen, w ahlen
wir k als denmaximalenIndex, f ur denb
k
,= a
k
gilt. Wegen

n=0
b
n
2
n
< g(v) mu
dann a
k
= 1 und b
k
= 0 sein. Es gibt dann mindestens ein j mit a
(j)
k
= 1; wir den-
ken uns so ein j festgehalten. Dann ist g
j
(v
j
) > 0. Also kann man durch

Ubergang
von v
j
zu einempassenden w
j
in der Nachbarschaft N
j
(v
j
) von v
j
in G
j
f ur g
j
(w
j
)
jeden Wert von 0 bis g
j
(v
j
) 1 erreichen; insbesondere ergeben sich alle Werte
von 0 bis 2
k
1. Somit kann man die Folge (a
(j)
0
, a
(j)
1
, . . . , a
(j)
n
, . . . ) in jede belie-
bige 0-1-Folge mit unver anderten Komponenten a
(j)
n
ab Nr. k 1 (einschlielich)
uberf uhren. Daraus folgt sofort, da man durch

Ubergang zu passenden w N(v)
die Folge (a
0
, a
1
, . . . , a
n
, . . . ) in jede beliebige 0-1-Folge (b
0
, b
1
, . . . , b
n
, . . . ) mit

n=0
b
n
2
n
< g(v) uberf uhren kann, was zu zeigen war. 2
Man bemerkt die

Ahnlichkeit dieses Beweises mit der im Beweis von Satz 2.3
angewendetenSchluweise. Zusammenmit Satz 3.5ergebensichGewinnstrategien
f ur Nim-Spiele mit beliebig vielen Streichholz-Haufen, im Verein mit

Ubung 3.6
auch f ur den Fall, da man die Anzahl der wegzunehmenden H olzchen beschr ankt.
Der Gedanke der Grundy-Funktion bildet den Einstieg in eine noch wesentlich
allgemeinere Theorie. Der interessierte Leser sei hierf ur auf Berge [1958], Smith
[1966], Varvak [1968,1970] und Tucker [1980] verwiesen.
Wir haben in diesem Kapitel mit kombinatorischen Methoden einige der am
einfachsten zu behandelnden Spiele analysiert. Inzwischen hat sich die Kombina-
torische Spieltheorie zu einem bl uhenden, wesentlich tiefergehenden Forschungs-
zweig entwickelt, der sich die mathematische Analyse von 2-Personen-Nullsum-
menspielen, die keine Zufallselemente involvieren, zum Ziel setzt. Die moderne
Entwicklung dieses Gebiets ist weitgehend John Horton Conway zu verdanken,
und sein Buch Conway [1976] ist die erste wichtige Monographie zumThema. Die
Standardreferenz f ur die Kombinatorische Spieltheorie ist das ebenso sch one wie
monumentale Werk von Berlekamp, Conway und Guy [1982], ein Klassiker, den
man gar nicht genug empfehlen kann. Selbst so schwierige Spiele wie das japa-
XV.3 Spiele vom Typ Nim auf Graphen 349
nische Go-Spiel k onnen mit Hilfe der Kombinatorischen Spieltheorie wenigstens
teilweise behandelt werden; hierzu ndet man bei Berlekamp undWolfe [1994] eine
Untersuchung der Endspiel-Phase des Go. Insbesondere erlaubt sie es oft, Spielstel-
lungen und Z uge exakt zu bewerten, was bereits eine ausgesprochen nichttriviale
Aufgabe ist. Abschlieend sei noch auf zwei interessante Sammlungen von aktu-
ellen Artikeln zur Kombinatorischen Spieltheorie verwiesen, die von Nowakowski
[1997,2003] herausgegeben worden sind.
XVI Spezielle Folgen von ganzen Zahlen
Es gibt eine ganze Reihe ber uhmter Folgen ganzer Zahlen; jede dieser Folgen hat
ihre eigene Theorie, die oft mit einem konkreten Anla und Autor beginnt und stets
einige der folgenden Elemente enth alt:
Rekursionsformeln;
erzeugende Potenzreihen und Funktionen;
numerische Berechnungen und Tabellen;
asymptotische Absch atzungen.
In diesem Kapitel fassen wir f ur die in Tabelle 1 in ihren Anf angen tabulierten
Zahlenfolgen sowie f ur einige Doppelfolgen die betreffenden Theorien zu einem
lockeren Informationsb undel zusammen. Dabei werden in einigen F allen Resul-
tate aus fr uheren Kapiteln ubernommen; insbesondere werden wir hier nichts zu
den Strunkzahlen, den Alkoholzahlen und den Baumzahlen sagen, die wir ja be-
reits in Kapitel XIII diskutiert haben. F ur eine enzyklop adische Darstellung von
Zahlenfolgen vergleiche man Sloane [1973] sowie Sloane und Plouffe [1995].
1 Die Fibonacci-Zahlen
In seinem Liber Abaci (Fibonacci [1202], erweiterte Ausgabe mit Unterst utzung
von Kaiser Friedrich II. von Hohenstaufen 1228) stellte Leonardo von Pisa (=
Fibonacci, um1170bis nach1240), der bedeutendste europ aische Mathematiker der
Epoche von 1200 bis 1500, folgendeAufgabe: Das Weibchen eines Kaninchenpaars
wirft von der Vollendung des zweiten Lebensmonats an allmonatlich ein neues
Kaninchenpaar. Man berechne die Anzahl F
n
der Kaninchenpaare im Monat n,
wenn im Monat 0 genau ein neugeborenes Kaninchenpaar vorhanden ist.
Diese Aufgabe stellt eines der altesten Beispiele zur mathematischen Popula-
tionsdynamik und damit zur Biomathematik dar. Die Rekursion f ur die Folge
F
0
, F
1
, . . . der Fibonacci-Zahlen lautet
F
n2
= F
n
F
n1
(n = 0, 1, . . . )
XVI.1 Die Fibonacci-Zahlen 351
1
1
1
1
1
1
-
1
1
1
2
2
2
1
2
2
0
1
1
1
3
6
3
2
5
3
1
2
2
1
4
2
4
5
5
1
5
5
2
4
5
2
5
1
2
0
8
1
4
5
2
7
1
3
9
1
1
3
6
7
2
0
1
3
4
2
2
0
3
1
1
8
0
2
0
2
8
6
7
5
0
4
0
2
1
1
3
2
8
7
7
1
5
5
7
9
4
8
7
4
1
1
8
4
0
3
2
0
3
4
4
2
9
4
1
4
0
2
2
4
7
3
8
1
1
5
1
9
9
2
3
9
3
6
2
8
8
0
5
5
1
4
3
0
2
1
1
4
7
3
0
4
3
3
8
7
2
8
6
5
5
1
4
7
1
0
3
6
2
8
8
0
0
8
9
4
8
6
2
1
1
5
9
7
5
4
2
4
3
9
7
9
2
7
1
9
1
5
5
3
1
0
6
1
1
3
9
9
1
6
8
0
0
1
4
4
1
6
7
9
6
6
7
8
5
7
0
5
6
4
8
9
0
7
4
1
1
8
4
2
4
4
3
6
2
3
5
1
2
4
7
9
0
0
1
6
0
0
2
3
3
5
8
7
8
6
4
2
1
3
5
9
7
7
7
5
9
2
1
6
6
4
2
4
7
6
6
1
2
8
3
2
5
5
1
1
3
6
2
2
7
0
2
0
8
0
0
3
7
7
2
0
8
0
1
2
2
7
6
4
4
4
3
7
1
0
1
7
7
5
5
9
6
3
1
3
1
2
4
8
6
3
7
4
9
6
1
3
0
1
1
4
8
7
1
7
8
2
9
1
2
0
0
6
1
0
7
4
2
9
0
0
1
9
0
8
9
9
3
2
2
1
3
5
1
0
9
2
7
4
3
4
4
6
4
3
2
9
7
3
1
1
0
5
0
0
3
1
5
9
1
5
1
3
0
7
6
7
4
3
6
8
0
0
0
9
8
7
2
6
7
4
4
4
0
1
3
8
2
9
5
8
5
4
5
1
7
6
1
6
4
8
0
6
4
3
5
7
8
3
8
7
8
1
1
3
2
8
0
9
2
7
7
4
1
F
i
b
o
n
a
c
c
i
-
Z
a
h
l
e
n
C
a
t
a
l
a
n
-
Z
a
h
l
e
n
B
e
l
l
-
Z
a
h
l
e
n
P
a
r
t
i
t
i
o
n
s
-
z
a
h
l
e
n
M

n
a
g
e
-
Z
a
h
l
e
n
S
t
r
u
n
k
-
Z
a
h
l
e
n
A
l
k
o
h
o
l
-
Z
a
h
l
e
n
B
a
u
m
-
z
a
h
l
e
n
n
n
!
T
a
b
e
l
l
e

1
.

E
i
n
i
g
e

b
e
r

h
m
t
e

Z
a
h
l
e
n
f
o
l
g
e
n
352 XVI Spezielle Folgen von ganzen Zahlen
mit den Anfangsbedingungen F
0
= F
1
= 1. Damit berechnet man m uhelos
F
0
F
1
F
2
F
3
F
4
F
5
F
6
F
7
F
8
F
9
F
10
1 1 2 3 5 8 13 21 34 55 89
Die erzeugende Potenzreihe (z) = F
0
F
1
z F
2
z
2
berechnet sich zu
(z) = 1 z

n=0
F
n2
z
n2
= 1 z

n=0
F
n1
z
n2

n=0
F
n
z
n2
= 1 z(z) z
2
(z),
also
(1.1) (z) =
1
1 z z
2
.
Die zu 1 z z
2
= 0 reziproke quadratische Gleichung z
2
z 1 = 0 hat die
L osungen

1
=
1

5
2
und
2
=
1

5
2
.
Daher gelten

2
= 1,
1

2
= 1 und
1

2
=

5,
so da man nach leichter Rechnung unter Verwendung von Formel XII.(1.1)
(z) =
1
1 z z
2
=
1
(1
1
z)(1
2
z)
=
1

5
_

1
1
1
z


2
1
2
z
_
=
1

5
_

n=0
(
1
z)
n

n=0
(
2
z)
n
_
=
1

n=0
_

n1
1

n1
2
_
z
n
XVI.2 Die Rencontres-Zahlen 353
und dann durch Koefzientenvergleich die schon von Fibonacci angegebene Formel
F
n
=
1

5
__
1

5
2
_
n1

_
1

5
2
_
n1
_
erh alt. Die obigen Reihen sind s amtlich f ur [z[ < 1 konvergent.
2 Die Mnage-Zahlen
Wir wiederholen das bereits in I.3 erarbeitete Ergebnis. Um einen Tisch sind 2n
St uhle im Kreis angeordnet; n Ehepaare betreten den Raum, und die n Damen
nehmen so Platz, da zwischen je zwei Damen genau ein Stuhl frei bleibt, wof ur
es 2n' M oglichkeiten gibt. Die Anzahl der bei gegebener Sitzordnung der Damen
verbleibenden M oglichkeiten, auf den n noch freien St uhlen so Platz zu nehmen,
da kein Herr neben seiner Ehefrau sitzt, ist durch die n-te Mnage-Zahl
U(n) =
n

i=0
(1)
i
2n
2n i
_
2n i
i
_
(n i)'
gegeben. Einige numerische Werte kann man der in 1 angegebenen Tabelle ent-
nehmen.
3 Die Rencontres-Zahlen
Auch hier geben wir eine kurze Wiederholung bereits erarbeiteter Resultate. Wir
betrachten nPl atze und npaarweise verschiedene Gegenst ande. JedemPlatz ordnen
wir bijektiv einen Gegenstand als f ur diesen Platz

verboten zu. Gesucht ist die


Anzahl D(n) derjenigen Verteilungen der Gegenst ande auf die Pl atze, bei denen
kein Platz mit dem f ur ihn verbotenen Gegenstand belegt ist. Nimmt man etwa
die Pl atze 1, . . . , n und die Gegenst ande 1, . . . , n, so wird nach der Anzahl D(n)
der xpunktfreien Permutationen aus S
n
gefragt. Die Zahl D(n) heit auch die
n-te Rencontres-Zahl. Diese Bezeichnung l at sich aus der folgenden zahmen es
gibt frivolere Einkleidung des Problems ableiten: n Ehepaare veranstalten einen
gemeinsamenBall; D(n) ist dieAnzahl derjenigenTanz-Paarungen, bei denenkeine
Dame mit ihrem Ehemann tanzt.
Wir haben bereits allgemeiner die Anzahl e
i
(n) derjenigen Permutationen in
S
n
bestimmt, die genau i Fixpunkte (= rencontres) haben. Nach

Ubung I.3.11 bzw.
Korollar XIII.2.7 gilt
e
i
(n) =
n'
i'
ni

k=0
(1)
k
k'
.
354 XVI Spezielle Folgen von ganzen Zahlen
Wir gebennocheine vonEuler stammende Rekursionf ur die Rencontres-Zahlen
D(n) an:
(3.1) D(n 1) = n (D(n) D(n 1)) (n = 1, 2, 3, . . . )
mit den Anfangsbedingungen D(0) = 1 und D(1) = 0. Man sieht (3.1) wie folgt
ein. Es gibt n M oglichkeiten f ur die Auswahl des Wertes i := (n 1). Falls
wir noch (i) = n 1 w ahlen, induziert eine xpunktfreie Permutation auf
{1, . . . , n] {i], wof ur es D(n1) M oglichkeiten gibt. Falls wir dagegen ein j ,= i
mit (j) = n 1 w ahlen und somit eine Kette j . n 1 . i erhalten, k onnen
wir (j) durch i ersetzen; das liefert eine xpunktfreie Permutation auf {1, . . . , n],
wof ur es D(n) M oglichkeiten gibt. Man berechnet nun m uhelos die Werte
D(0) D(1) D(2) D(3) D(4) D(5) D(6) D(7)
1 0 1 2 9 44 265 1854

Ubung 3.1. Man beweise die folgende alternative Rekursionsformel:


D(n) = nD(n 1) (1)
n
(n = 1, 2, . . . ).
4 Die Partitionszahlen
Sei p(n) die n-te Partitionszahl, also die Anzahl aller Partitionen der Zahl n, siehe
Kapitel XII. Wir setzen k unstlich p(0) = 1. Nach Korollar XII.2.7 ist die f ur [z[ < 1
konvergente erzeugende Potenzreihe der Folge p(0), p(1), . . . durch die Formel
(4.1) P(z) =

n=0
p(n)z
n
=

k=1
1
1 z
k
gegeben. F ur rekursive Berechnungen ist es zweckm aiger, f ur beliebige n, k 0
die Anzahl p(k, n) der Partitionen von n mit genau k Teilen zu betrachten. Hierbei
setzt man k unstlich p(0, 0) = 1 sowie p(0, n) = 0 f ur n 1. Die erzeugende
Potenzreihe der p(k, n) hat nach Satz XII.2.5 die Gestalt
(4.2) P(z, q) =

n=0

k=0
p(k, n)q
k
z
n
=

j=1
1
1 qz
j
und ist f ur [z[ < 1, [q[ <
1
[z[
konvergent, woraus sich f ur q = 1 sofort wieder (4.1)
ergibt. F ur die p(k, n) gewinnen wir nun leicht die Rekursionsformel
(4.3) p(k, n k) =
k

j=1
p(j, n).
XVI.4 Die Partitionszahlen 355
Man braucht hierzu nur die Partitionen von n in h ochstens k Teile nach der Anzahl j
der Teile zu klassizieren und einer Partition n = n
1
n
j
mit n
1
n
j
von n die Partition nk = (n
1
1) (n
j
1) 1 1 (mit k j Einsen
am Schlu) von nk in k Teile zuzuordnen. Man erh alt so bijektiv alle Partitionen
nk = m
1
m
k
mit m
1
m
k
, klassiziert nach der Anzahl der Einsen
am rechten Ende. Mittels (4.3) berechnet man leicht die in Tabelle 2 angegebenen
Werte p(k, n) f ur kleine k und n:
Tabelle 2. Die Partitionszahlen p(k, n)
n 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
k
0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
2 0 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 10
3 0 0 0 1 1 2 3 4 5 7 8 10 12 14 16 19 21 24 27 30 33 37
4 0 0 0 0 1 1 2 3 5 6 9 11 15 18 23 27 34 39 47 54 64 72
5 0 0 0 0 0 1 1 2 3 5 7 10 13 18 23 30 37 47 57 70 84 101
6 0 0 0 0 0 0 1 1 2 3 5 7 11 14 20 26 35 44 58 71 90 110
7 0 0 0 0 0 0 0 1 1 2 3 5 7 11 15 21 28 38 49 65 82 105
8 0 0 0 0 0 0 0 0 1 1 2 3 5 7 11 15 22 29 40 52 70 89
Die Partitionszahlen p(n) sind nun die Spaltensummen dieser Tabelle:
p(n) =
n

k=0
p(k, n).
Einige numerische p(n)-Werte ndet man in der in 1 angegebenen Tabelle.
Man kann sich auch f ur die Anzahl p(k, n) der Partitionen von n in h ochstens
k Teile interessieren. Nat urlich gelten f ur k 2
p(k, n) =
k

j=0
p(j, n) (4.4)
sowie
p(k, n) = p(k, n) p(k 1, n). (4.5)
Aus (4.3) und (4.5) ergibt sich die folgende Rekursionsformel f ur die p(k, n):
(4.6) p(k, n) = p(k 1, n) p(k, n k) (1 k n)
356 XVI Spezielle Folgen von ganzen Zahlen
mit den Anfangsbedingungen p(k, 0) = 1 f ur k = 1, 2, . . . sowie p(0, n) = 0
f ur n = 1, 2, . . . . Man kann (4.6) nat urlich auch direkt einsehen, da eine Partition
von n mit genau k Teilen durch Wegnahme je einer Einheit aus jedem Teil zu einer
Partition von n k mit h ochstens k Teilen wird und diese Zuordnung offenbar
bijektiv ist. Mit (4.6) berechnet man leicht die in Tabelle 3 angegebenen Werte
p(k, n) f ur kleine n.
Tabelle 3. Die Partitionszahlen p(k, n)
n 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
k
0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
2 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10
3 1 1 2 3 4 5 7 8 10 12 14 16 19 21 24 27 30 33 37
4 1 1 2 3 5 6 9 11 15 18 23 27 34 39 47 54 64 72 84
5 1 1 2 3 5 7 10 13 18 23 30 37 47 57 70 84 101 119 141
6 1 1 2 3 5 7 11 14 20 26 35 44 58 71 90 110 136 163 199
7 1 1 2 3 5 7 11 15 21 28 38 49 65 82 105 131 164 201 248
8 1 1 2 3 5 7 11 15 22 29 40 52 70 89 116 146 186 230 288
9 1 1 2 3 5 7 11 15 22 30 41 54 73 94 123 157 201 252 318
Nach Satz XII.2.2 stimmt p(k, n) mit der Anzahl der Partitionen von nmit lauter
Teilen k uberein, also mit p(S, n) f ur S = {1, . . . , k]. Mit Korollar XII.2.6 erh alt
man daher unmittelbar die folgende erzeugende Potenzreihe:

n=0
p(k, n)z
n
=
k

j=1
1
1 z
j
.
5 Die Catalan-Zahlen
F ur jede nat urliche Zahl n bezeichne C(n) die Anzahl der M oglichkeiten, ein Pro-
dukt von n Zahlen zu klammern. Man nennt C(n) die n-te Catalan-Zahl, nach
Catalan [1838]. Eine Klammerung von n Faktoren entspricht unmittelbar eindeu-
tig einem Baumdiagramm wie in Kapitel XV mit n Spitzen und lauter Zweier-
Verzweigungen. Wir geben ein Beispiel f ur n = 7:
XVI.5 Die Catalan-Zahlen 357
a
1
a
2
a
3
a
4
a
5
a
6
a
7
bedeutet die Klammerung
(((a
1
a
2
)a
3
)((a
4
a
5
)a
6
))a
7
.
C(n) z ahlt also auch die Baumdiagramme dieses Typs mit n Spitzen. In beiden
Interpretationen ergibt sich unmittelbar die Rekursionsformel
(5.1) C(n) =
n1

k=1
C(k)C(n k)
mit den Anfangsbedingungen C(0) = 0 und C(1) = 1. In der Sprechweise der
Klammerungen mu man n amlich im letzten Schritt ein geklammertes Produkt aus
k Zahlen mit einem solchen aus n k Zahlen zusammenf ugen. Als n achstes sehen
wir uns die erzeugende Potenzreihe
G(z) =

n=0
C(n)z
n
=

n=1
C(n)z
n
an. Mit (5.1) berechnet man
G(z)
2
=
_

k=1
C(k)z
k
__

j=1
C(j)z
j
_
=

n=2
_
n1

k=1
C(k)C(n k)
_
z
n
=

n=2
C(n)z
n
= G(z) z,
also G(z)
2
G(z) z = 0. Diese quadratische Gleichung ergibt
(5.2) G(z) =
1
2
(1

1 4z);
358 XVI Spezielle Folgen von ganzen Zahlen
die Entscheidung f ur das Minuszeichen vor der Wurzel f allt dabei aufgrund der
Anfangsbedingung C(0) = G(0) = 0. Die Funktion (5.2) besitzt die Potenzrei-
henentwicklung
(5.3) G(z) =

n=1
1
n
_
2n 2
n 1
_
z
n
,
woraus
(5.4) C(n) =
1
n
_
2n 2
n 1
_
=
1
2n 1
_
2n 1
n 1
_
(n = 1, 2, . . . )
folgt. Einige numerische C(n)-Werte enth alt die Tabelle in 1.

Ubung 5.1. Man beweise die Formel (5.4) mit Induktion.

Ubung 5.2. Man zeige, da C(n) f ur n 2 auch gleich der Anzahl aller Triangu-
lierungen eines regul aren (n 1)-Ecks durch eckenverbindende Sehnen ist.

Ubung 5.3. Man zeige f ur n 2: Bei einer Abstimmung zwischen zwei Kandida-
ten in einem Wahlkreis mit 2(n 1) Stimmen herrsche Stimmengleichheit; dann
gibt es genau C(n) Reihenfolgen der Ausz ahlung, bei denen der erste Kandidat nie
in der Hinterhand ist.
6 Die Bell-Zahlen
Die n-te Bell-Zahl B(n) gibt die Anzahl der disjunkten Zerlegungen einer n-ele-
mentigen Menge in nichtleere Teilmengen an. Man setzt k unstlich B(0) = 1 und
hat selbstverst andlich B(1) = 1 sowie B(2) = 2. Fast ebenso selbstverst andlich
ist die Rekursionsformel
(6.1) B(n 1) =
n

k=0
_
n
k
_
B(k).
Sie beruht darauf, da man in einer (n1)-elementigen Menge eine disjunkte Zer-
legung in zwei Schritten durchf uhren kann, indemman zun achst eine Teilmenge M
von k n Elementen auszeichnet, die einen fest gew ahlten Punkt nicht enth alt, ihr
Komplement als erste Komponente der Zerlegung nimmt und dann eine disjunkte
Zerlegung von M bildet.
XVI.7 Die Stirling-Zahlen zweiter Art 359
Wir bilden die erzeugende Potenzreihe f ur die Folge
B(0)
0'
,
B(1)
1'
, . . . und erhalten
mit (6.1) f ur
(z) =

n=0
B(n)
n'
z
n
die Ableitung

/
(z) =

n=1
B(n)
(n 1)'
z
n1
=

n=0
B(n 1)
n'
z
n
=

n=0
z
n
n'
n

k=0
_
n
k
_
B(k) =

n=0
n

k=0
z
n
B(k)
(n k)' k'
=

k=0
z
k
B(k)
k'

j=0
z
j
j'
= e
z
(z),
was mit (0) = 1 auf (z) = e
e
z
1
f uhrt. Man rechnet weiter und erh alt
(z) =
1
e

k=0
e
kz
k'
=
1
e

k=0
1
k'

n=0
(kz)
n
n'
=

n=0
z
n
n'
_
1
e

k=0
k
n
k'
_
.
Durch Koefzientenvergleich folgt
B(n) =
1
e

k=0
k
n
k'
.
7 Die Stirling-Zahlen zweiter Art
Seien n eine nat urliche Zahl und X eine n-elementige Menge. Mit S(n, k) be-
zeichnen wir die Anzahl aller Zerlegungen von X in genau k disjunkte nichtleere
Teilmengen. Wir setzen k unstlich
S(0, 0) = 1 sowie S(0, 1) = S(0, 2) = = 0.
Die Zahlen S(n, k) heien die Stirling-Zahlen zweiter Art; durch Summation uber
k erh alt man nat urlich die Bell-Zahlen:
(7.1) B(n) =
n

k=1
S(n, k).
360 XVI Spezielle Folgen von ganzen Zahlen
Manndet leicht eine Rekursionsformel f ur die Stirling-ZahlenzweiterArt, n amlich
(7.2) S(n 1, k) = S(n, k 1) kS(n, k)
f ur n = 0, 1, . . . ; k = 1, 2, . . . Dazu hat man nur die Zerlegungen von {0, 1, . . . , n]
danach aufzuteilen, ob sie den Teil {0] enthalten oder ob 0 zu einem der k Teile
einer Zerlegung von {1, . . . , n] geh ort. Ebenso einfach einzusehen ist die alternative
Rekursionsformel
(7.3) S(n 1, k) =
n

j=0
_
n
j
_
S(j, k 1)
f ur n = 0, 1, . . . ; k = 1, 2, . . . Sie beruht auf der Gewinnung einer Zerlegung von
{0, 1, . . . , n] in folgenden zwei Schritten:
Festlegung des 0 enthaltenden Teils mit n1j Elementen durch Fixierung
einer Teilmenge von {1, . . . , n] mit n j Elementen, wof ur es
_
n
nj
_
=
_
n
j
_
M oglichkeiten gibt;
Zerlegung der Restmenge von j Elementen in k 1 Teile.
Zusammen mit den offensichtlichen Anfangswerten
S(1, 0) = 0, S(1, 1) = 1, S(1, 2) = S(1, 3) = = 0;
S(2, 0) = 0, S(2, 1) = 1, S(2, 2) = 1, S(2, 3) = = 0;
S(3, 0) = S(4, 0) = = 0
kann man nun mittels (7.2) oder (7.3) leicht eine Tabelle der ersten S(n, k) aufstel-
len.
Mit Induktion nach n erhalten wir die explizite Formel
(7.4) S(n, k) =
1
k'
k

j=0
(1)
kj
_
k
j
_
j
n
.
In der Tat: F ur n = 0 lautet die rechte Seite
1
k'
k

j=0
1
j
(1)
kj
_
k
j
_
=
(1 1)
k
k'
,
was f ur k = 0 als 1 gelesen werden darf und f ur k > 0 den Wert 0 ergibt, und f ur
n > 0, k = 0 ist die rechte Seite von (7.4) gleich 0 = S(n, k). Angenommen, man
XVI.7 Die Stirling-Zahlen zweiter Art 361
hat (7.4) f ur n und s amtliche k = 0, 1, . . . ; dann liefert (7.2) f ur k 1
S(n 1, k) = kS(n, k) S(n, k 1)
=
k
k'
k

j=0
(1)
kj
_
k
j
_
j
n

1
(k 1)'
k1

j=0
(1)
k1j
_
k 1
j
_
j
n
=
1
(k 1)'
k

j=0
(1)
kj
j
n
__
k
j
_

_
k 1
j
__
=
1
(k 1)'
k

j=0
(1)
kj
j
n
_
k 1
j 1
_
=
1
k'
k

j=0
(1)
kj
_
k
j
_
j
n1
wie behauptet.
Tabelle 4. Die Stirling-Zahlen zweiter Art
n 0 1 2 3 4 5 6 7 8 9 10
k
0 1 0 0 0 0 0 0 0 0 0 0
1 0 1 1 1 1 1 1 1 1 1 1
2 0 0 1 3 7 15 31 63 127 255 511
3 0 0 0 1 6 25 90 301 966 3025 9330
4 0 0 0 0 1 10 65 350 1701 7770 34105
5 0 0 0 0 0 1 15 150 1050 6951 42525
6 0 0 0 0 0 0 1 21 266 2646 22827
7 0 0 0 0 0 0 0 1 28 462 5880
8 0 0 0 0 0 0 0 0 1 36 750
Wir bestimmen jetzt noch zwei erzeugende Potenzreihen. Als erstes halten wir
ein k 0 fest und beweisen
(7.5)

n=0
S(n, k)
n'
z
n
=
(e
z
1)
k
k'
.
362 XVI Spezielle Folgen von ganzen Zahlen
F ur k = 0 ist dies richtig. Angenommen, es stimmt bis k 1. Dann rechnen wir
die Ableitung von A
k
(z) :=

n=0
S(n,k)
n'
z
n
aus und ben utzen (7.2):
A
/
k
(z) =

n=0
S(n 1, k)
n'
z
n
= k

n=0
S(n, k)
n'
z
n

n=0
S(n, k 1)
n'
z
n
= kA
k
(z) A
k1
(z)
= kA
k
(z)
(e
z
1)
k1
(k 1)'
.
Diese Differentialgleichung besitzt die den Anfangsbedingungen A
k
(0) = 0 =
S(0, k) gen ugende L osung A
k
(z) =
(e
z
1)
k
k'
, wie man sofort nachrechnet. Da sie
nach einem bekannten Satz die einzige derartige L osung der Differentialgleichung
ist, gilt (7.5).
Zweitens halten wir n 0 fest und interessieren uns zun achst f ur denAusdruck

k=0
S(n, k)z
k
,
der wegen S(n, n 1) = S(n, n 2) = = 0 einfach ein Polynom vom Grade
n ist. Hier hat sich nun herausgestellt, da man zu einem glatten Ergebnis kommt,
wenn man z
k
durch das Polynom
(z)
k
:= z(z 1) . . . (z k 1)
mit den Nullstellen 0, 1, . . . , k 1 ersetzt; die ungew ohnlich anmutende Schreib-
weise (z)
k
ist dabei traditionell ublich. Wir geben zun achst einen kombinatorischen
Beweis f ur die Identit at
(7.6) j
n
=
j

k=0
_
j
k
_
k'S(n, k) =
j

k=0
(j)
k
S(n, k)
an. Dazu beachten wir, da j
n
die Anzahl aller Abbildungen von {1, . . . , n] in
{1, . . . , j] ist. Diese Abbildungen teilen wir nach den dabei auftretenden Werte-
mengen und diese wiederum nach ihren M achtigkeiten k ein. Es gibt dabei
_
j
k
_
M oglichkeiten, eine k-elementige Wertemenge W {1, . . . , j] auszusuchen; eine
Abbildung mit genau dieser Wertemenge W wird hergestellt, indemman {1, . . . , n]
in k nichtleere Mengen disjunkt zerlegt und sie zu Konstanzgebieten unserer Ab-
bildung macht. Hierzu sind die k Elemente von W irgendwie auf die k Bestandteile
XVI.8 Die Stirling-Zahlen erster Art 363
unserer Zerlegung zu verteilen, wof ur es k' M oglichkeiten gibt. Damit ist (7.6)
bewiesen. Nun zeigen wir
(7.7)

k=0
S(n, k)(z)
k
=
n

k=0
S(n, k)(z)
k
= z
n
.
Hier stehen links und rechts je ein PolynomvomGrade n bzw. = n. Das Polynom
(z)
k
hat die Nullstellen 0, 1, . . . , k 1. Setzt man links in (7.7) z = j ein, so bleibt
nur

j
k=0
S(n, k)(j)
k
ubrig, was nach (7.6) den Wert j
n
hat. Also stimmen die
Polynome auf den beiden Seiten von (7.7) an den n 1 verschiedenen Stellen
0, 1, . . . , n uberein, womit beide Polynome identisch sind.
8 Die Stirling-Zahlen erster Art
Seien n eine nat urliche Zahl und X eine n-elementige Menge. Mit (n, k) bezeich-
nenwir dieAnzahl derjenigenPermutationenvonX, die ingenauk Zyklenzerfallen.
Wir setzen k unstlich (0, 0) = 1 und (n, 0) = 0 = (0, k) (n, k = 1, 2, . . . ).
Die Zahlen (n, k) werden als die absoluten Stirling-Zahlen erster Art bezeichnet.
Wir uberlegen uns als erstes die Rekursionsformel
(8.1) (n 1, k) = (n, k 1) n(n, k)
f ur n = 0, 1, . . . ; k = 1, 2, . . . Hierzu hat man lediglich die in genau k Zyklen
zerfallenden Permutationen von {0, 1, . . . , n] danach aufzuteilen, ob sie (0) als
Zyklus enthalten bzw. ob 0 an irgendeiner Stelle in einen Zyklus einer in genau k
Zyklen zerfallenden Permutation von {1, . . . , n] eingereiht wird. Die Zahlen
s(n, k) = (1)
nk
(n, k)
werden als die Stirling-Zahlen erster Art bezeichnet. Sie gen ugen offensichtlich
der Rekursionsformel
(8.2) s(n 1, k) = s(n, k 1) ns(n, k)
f ur n = 0, 1, . . . ; k = 1, 2, . . . mit den Anfangsbedingungen s(0, 0) = 1 und
s(n, 0) = 0 = s(0, k) (n, k = 1, 2, . . . ). Hieraus berechnet man leicht die in
Tabelle 5 angegebenen Werte f ur kleine n.
364 XVI Spezielle Folgen von ganzen Zahlen
Tabelle 5. Die Stirling-Zahlen erster Art
n 0 1 2 3 4 5 6 7 8 9 10
k
0 1 0 0 0 0 0 0 0 0 0 0
1 0 1 1 2 6 24 120 720 5040 40320 362880
2 0 0 1 3 11 50 274 1764 13068 109584 1026576
3 0 0 0 1 6 35 225 1624 13132 118124 1172700
4 0 0 0 0 1 10 85 735 6769 67284 723680
5 0 0 0 0 0 1 15 175 1960 22449 269325
6 0 0 0 0 0 0 1 21 322 4536 63273
7 0 0 0 0 0 0 0 1 28 546 9450
8 0 0 0 0 0 0 0 0 1 36 870
9 0 0 0 0 0 0 0 0 0 1 45
Mit den bereits im vorigen Abschnitt eingef uhrten Polynomen (z)
k
erh alt man
die Identit at
(8.3)

k=0
s(n, k)z
k
=
n

k=0
s(n, k)z
k
= (z)
n
,
die wir mit Induktion nach n beweisen. F ur n = 0 ergibt sich auf beiden Seiten von
(8.3) der Wert 1. Angenommen, man ist bis n fertig. Dann gilt wegen (8.2)
n1

k=0
s(n 1, k)z
k
=
n1

k=1
(s(n, k 1) ns(n, k))z
k
= z
n

k=0
s(n, k)z
k
n
n

k=0
s(n, k)z
k
= (z n)(z)
n
= (z)
n1
.
Ferner gilt
(8.4)

k=0
s(n, k)n
k
=

k=0
(n, k) = n'
Die rechte Gleichung ist trivial, weil dort nur die Permutationen aus S
n
nach ihrer
Zyklenzahl aufgeteilt werden. Der Rest folgt aus (8.3) f ur z = n.
Die Identit aten (7.7) und (8.3) zeigen zusammen genommen, wie man die
beiden Basen {1, z, z
2
, z
3
, . . . ] bzw. {1, (z)
1
, (z)
2
, (z)
3
, . . . ] f ur den Vektorraum
XVI.9 Die Gau-Koefzienten 365
der Polynome (etwa uber R) ineinander transformieren kann; die Stirling-Zahlen
k onnen also auch als die bei diesen Transformationen auftretenden Skalarfaktoren
erkl art werden.

Ubung 8.1. Man beweise die Formel


(8.5)
n

k=m
S(n, k)s(k, m) =
mn
.
Schlielich bestimmen wir noch eine erzeugende Potenzreihe, wobei wir ein
k 0 festhalten:
(8.6)

n=k
s(n, k)
n'
z
n
=
(log(1 z))
k
k'
.
Zum Beweis uberlegen wir uns zun achst, da die rechte Seite von (8.6) der Koef-
zient von x
k
in der Potenzreihendarstellung von (1 z)
x
ist:
(1 z)
x
= e
x log(1z)
=

k=0
1
k'
(log(1 z))
k
x
k
.
Andererseits gilt wegen (8.3)
(1 z)
x
=

n=0
_
x
n
_
z
n
=

n=0
1
n'
(x)
n
z
n
=

n=0
z
n
n'
n

r=0
s(n, r)x
r
=

r=0
x
r

n=r
s(n, r)
z
n
n'
,
womit sich (8.6) durch Koefzientenvergleich ergibt.
9 Die Gau-Koefzienten
Seien n, k nicht-negative ganze Zahlen mit k n und q eine Primzahlpotenz.
Mit
_
n
k
_
q
bezeichnet man die Anzahl der k-dimensionalen Unterr aume eines n-
dimensionalen Vektorraums uber dem endlichen K orper GF(q) mit q Elementen.
Die Zahlen
_
n
k
_
q
heien die Gau-Koefzienten.
Wie bereits in

Ubung IX.9.9 erw ahnt, kann man die Gau-Koefzienten leicht
direkt berechnen:
(9.1)
_
n
k
_
q
=
(q
n
1)(q
n1
1) . . . (q
nk1
1)
(q
k
1)(q
k1
1) . . . (q 1)
.
366 XVI Spezielle Folgen von ganzen Zahlen
Der Beweis von (9.1) ist ebenfalls leicht: Sei W ein n-dimensionaler Vektorraum
uber GF(q). Dann ist die Anzahl der geordneten k-Tupel aus linear unabh angigen
Elementen von W genau (q
n
1)(q
n
q) . . . (q
n
q
k1
), da man zun achst die erste
Komponente beliebig aus denq
n
1Vektoren ,= 0 ausw ahlen kann; danach ist ein 1-
dimensionaler Unterraumvon W verboten, weswegen man die zweite Komponente
auf genau q
n
q Arten w ahlen kann, und so weiter. Nun bestimmt jedes k-Tupel
einen eindeutigen k-dimensionalen Unterraum von W; umgekehrt geh ort jeder sol-
che Unterraum U zu genau (q
k
1)(q
k
q) . . . (q
k
q
k1
) derartigen k-Tupeln,
da dies die Anzahl der geordneten k-Tupel aus linear unabh angigen Elementen von
U ist. Damit erh alt man nach K urzen von q-Potenzen die gew unschte Formel
(9.1).
Man kann die Gau-Koefzienten auch mit der folgenden Rekursionsformel
ausrechnen:
(9.2)
_
n
k
_
q
=
_
n 1
k
_
q
q
nk
_
n 1
k 1
_
q
.
Zum Beweis von (9.2) seien V ein n-dimensionaler Vektorraum uber GF(q) und
W ein (n 1)-dimensionaler Unterraum. Der erste Term auf der rechten Seite ist
die Anzahl der Unterr aume der Dimension k, die in W enthalten sind. Jeder andere
k-dimensionale Unterraum U von V schneidet W in dem (k 1)-dimensionalen
Unterraum U
/
= U W. Andererseits liegt jeder solche Unterraum U
/
in genau
q
n
q
k1
q
k
q
k1
Unterr aumen der Dimension k von V, von denen genau
q
n1
q
k1
q
k
q
k1
in W
enthalten sind. Damit kann jeder (k 1)-dimensionale Unterraum U
/
von W zu
exakt q
nk
Unterr aumen U der Dimension k erweitert werden, die nicht in W
liegen, was den zweiten Term auf der rechten Seite von (9.2) erkl art.
Es ist klar, da die Gau-Koefzienten ganzzahlig sind, auch wenn sie in Formel
(9.1) als Br uche erscheinen. Daher ist es eine naheliegende Idee, diese Ausdr ucke
als Polynome in der Unbestimmten q anzusehen; man spricht dann von den Gau-
Polynomen. Formal deniert (9.1) nat urlich zun achst nur eine rationale Funktion
in q; da diese rationale Funktion aber f ur unendlich viele ganzzahlige Werte von q
(n amlich f ur alle Primzahlpotenzen q) eine ganze Zahl ergibt, mu es sich in der Tat
um ein Polynom handeln. Alternativ kann man die Identit at (9.2) f ur eine rekursive
Denition der Gau-Polynome verwenden; dabei deniert man die Anfangswerte
als die Polynome
_
n
0
_
q
=
_
n
n
_
q
:= 1 f ur n = 0, 1, 2, . . .
Dieser Ansatz zeigt nochmals, da hier in der Tat Polynome vorliegen.

Ubung 9.1. Man berechne einige kleinere Gau-Polynome


_
n
k
_
q
explizit, etwa f ur
n 6.
XVI.9 Die Gau-Koefzienten 367
Setzt man in das Gau-Polynom
_
n
k
_
q
den Wert q = 1 ein, so erh alt man gerade
den Binomialkoefzienten
_
n
k
_
. Das ist zwar der Formel (9.1) nicht unmittelbar zu
entnehmen, folgt aber, wenn man die Gau-Koefzienten wirklich als Polynome in
q schreibt. Am leichtesten schliet man dies aus der Rekursion (9.2), die f ur q = 1
per Induktion direkt in die bekannte Rekursion I.(2.2) f ur die Binomialkoefzienten
ubergeht; trivialerweise sind auch die Anfangswerte korrekt.
Man paraphrasiert den eben beschriebenen bemerkenswerten Zusammenhang,
indem man sagt, da die Gau-Koefzienten ein q-Analogon der Binomialkoef-
zienten sind. Ein hochinteressantes Teilgebiet der Kombinatorik besch aftigt sich
mit q-Analoga, die klassischen Resultaten uber Mengen entsprechende Resultate
uber endlicheVektorr aume zuordnen und/oder klassische Familien von Zahlen bzw.
Polynomen entsprechend verallgemeinern. Beispielsweise gilt ein q-Analogon des
Spernerschen Lemmas II.2.7; wir verweisen hierf ur und f ur einige weitere q-
Analoga auf van Lint und Wilson [2001]. Dort ndet man als Theorem 24.1
auch das folgende interessante Resultat, das die Koefzienten der Gau-Polynome
kombinatorisch interpretiert, indem es einen Zusammenhang zu den in Kapitel XII
betrachteten Partitionsbildern herstellt.
Satz 9.2. Man schreibe das Gau-Polynom
_
n
k
_
q
explizit als
_
n
k
_
q
=
k(nk)

h=0
a
h
q
h
.
Dann ist der Koefzient a
h
gerade die Anzahl derjenigen Partitionen von h, deren
Partitionsbild in ein Rechteck der Gr oe k (n k) pat.
F ur q = 1 liefert Satz 9.2 noch das folgende interessante Korollar:
Korollar 9.3. DieAnzahl aller Partitionennat urlicher Zahlen, derenPartitionsbild
in ein Rechteck der Gr oe k (n k) pat, ist genau
_
n
k
_
.
Nachwort
Wir hoffen, da unsere Leser einen einigermaen repr asentativen Eindruck von
der Vielfalt der Kombinatorik erhalten haben sowohl was die Themen angeht,
als auch hinsichtlich der Methoden und da wir auch etwas von der Sch onheit
dieser Disziplin transportieren konnten. Wie schon im Vorwort voller Bedauern
festgestellt, muten wir auf vieles verzichten, was ebenfalls wichtig und reizvoll
gewesen w are. Die Kombinatorik ist nach wie vor ein bl uhendes und explosiv
wachsendes Gebiet: Jedes Jahr kommen Hunderte von neuen Arbeiten und eine
gar nicht so kleine Anzahl von B uchern hinzu. Dabei haben sowohl die groen
vereinheitlichenden Theorien wie einzelne Perlen und Kuriosit aten ihren Platz,
und manches mag auch schlicht uber ussig sein. Nicht alles, was man zeigen kann,
verdient es auch, gezeigt zu werden! Das ist eine Frage des guten (oder eben weniger
guten) Geschmacks, zu dessen Entwicklung wir hoffentlich ein wenig beitragen
konnten.
Wie gesagt, gerne h atten wir unseren Lesern aus der F ulle wichtiger und elegan-
ter Resultate noch das eine oder andere vorgetragen. Doch irgendwann mu man
ein Ende nden, wie uns schon Theodor Fontane in seinem klassischen Roman
Efe Briest nahelegt, wenn er mit den folgenden unsterblichen Worten schliet:
Ach, Luise, la das ist ein zu weites Feld.
Literaturverzeichnis
Wir geben im folgenden abgesehen von den im Text zitierten Referenzen auch
eine Anzahl einschl agiger Lehrb ucher und Monographien an. In Anbetracht der
F ulle der vorhandenen Literatur kann es sich dabei nur um eine notwendigerweise
subjektive Auswahl handeln. Wie schon im Vorwort zur ersten Auage erw ahnt,
haben wir zwecks Pege des Familiensinns unter den Mathematikern soweit
m oglich und tunlich die Autoren mit Vornamen und Lebensdaten ausgestattet. Wir
hoffen, da uns dabei keine gr