Beruflich Dokumente
Kultur Dokumente
Axiomatische Mengenlehre
Vo r w o r t . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Zur Notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1. Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Die Axiome von ZFC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Mengen und Klassen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Echte Klassen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
Elementare Interpretationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
Einfache Folgerungen aus den Axiomen . . . . . . . . . . . . . . . . . . . . 37
Die Tragweite der Epsilon-Sprache . . . . . . . . . . . . . . . . . . . . . . . . 37
Die natürlichen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
Rekursion auf ω . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
Dedekind-Strukturen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
Die ganzen, rationalen und reellen Zahlen . . . . . . . . . . . . . . . . . . 46
Mathematik im Rahmen von ZFC . . . . . . . . . . . . . . . . . . . . . . . . . 50
Zur Verwendung des Auswahlaxioms . . . . . . . . . . . . . . . . . . . . . . 50
Elementare Mächtigkeitstheorie . . . . . . . . . . . . . . . . . . . . . . . . . . 52
Endlichkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
Abzählbarkeit und Überabzählbarkeit . . . . . . . . . . . . . . . . . . . . . . 56
2. Ordinalzahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
Wohlordnungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
Die Konstruktion von Wohlordnungen . . . . . . . . . . . . . . . . . . . . 61
Die Hartogs-Wohlordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
Der Wohlordnungssatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
Fixpunktsätze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
Ordinalzahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
Ordinale Induktion und Rekursion . . . . . . . . . . . . . . . . . . . . . . . . 70
Die von Neumann-Hierachie . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
Die Rolle des Fundierungsaxioms . . . . . . . . . . . . . . . . . . . . . . . . . 73
Die Rangfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
Das Zurückschneiden von Klassen . . . . . . . . . . . . . . . . . . . . . . . . 77
Das Kollektionsschema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
Ordinalzahlarithmetik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
Lange abzählbare Wohlordnungen . . . . . . . . . . . . . . . . . . . . . . . . 82
Paarungsfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
Endliche Mengen und Folgen von Ordinalzahlen . . . . . . . . . . . . 86
3. Kardinalzahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
Kardinalzahlen und Mächtigkeiten . . . . . . . . . . . . . . . . . . . . . . . . 89
Die Konfinalität . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
Elementare Kardinalzahlarithmetik . . . . . . . . . . . . . . . . . . . . . . . 94
Teilmengen bestimmter Größe . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
Die Gimelfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
Allgemeine Summen und Produkte . . . . . . . . . . . . . . . . . . . . . . . . 100
Zur Berechnung der Exponentiation . . . . . . . . . . . . . . . . . . . . . . . 103
2 . A b s c h n i t t M o d e l l e d e r M e n g e n l e h r e . . . . . . . . . . . . . . . . 207
1. Klassenmodelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209
Relative Konsistenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209
Das Kontinuumsproblem und das Auswahlaxiom . . . . . . . . . . . . . 210
Klassen, Modelle, Relativierung . . . . . . . . . . . . . . . . . . . . . . . . . . 213
Klassenmodelle und relative Konsistenzbeweise . . . . . . . . . . . . . . 215
Transitive Klassenmodelle und absolute Formeln . . . . . . . . . . . . . 217
Innere Modelle von ZF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225
Σ0 -Aussonderung und Kollektionsschema . . . . . . . . . . . . . . . . . . . 226
Ein Kriterium für innere Modelle von ZF . . . . . . . . . . . . . . . . . . 230
Allgemeine Klassenmodelle und ihre Transitivierung . . . . . . . . . 232
Die relative Konsistenz des Fundierungsaxioms . . . . . . . . . . . . . . 233
Die relative Konsistenz von ∃x x = { x } . . . . . . . . . . . . . . . . . . . . . 234
Unmögliche relative Konsistenzbeweise . . . . . . . . . . . . . . . . . . . . 236
Einige Mengenmodelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
A n h ä n g e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 403
2. Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 415
3. Notationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 417
4. Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 419
„Axiom“ ist ein Schlüsselbegriff der modernen Mathematik. Er wird immer dort
verwendet, wo eine tragende Struktur des mathematischen Denkens durch ein
kompaktes System von Aussagen erfasst werden soll. Wir sprechen von den Axi-
omen der Geometrie, der Zahlentheorie, von den Gruppen- und Vektorraum-
axiomen, von den Axiomen für lineare Ordnungen, Verbände und Boolesche
Algebren − und schließlich, auf die Mathematik als Ganzes blickend, von den
Axiomen der Mengenlehre. Die axiomatische Methode ermöglicht einen syste-
matischen, hierarchischen und kumulativen Aufbau der Mathematik und hebt
ihre Klarheit und Genauigkeit noch einmal auf eine neue Stufe. Schwindelerre-
gende Gebäude werden mit ihren Definitionen, Sätzen und Beweisen aus weni-
gen Axiomen errichtet, die in einer von der Logik regierten Sprache formuliert
werden. Jeder neue Steinblock setzt nahtlos auf den alten auf. Neue Begriffe
werden aus alten Begriffen geschmiedet, neue Sätze klären unter Einsatz bereits
bewiesener Sätze begriffliche Zusammenhänge und suggerieren neue Definitio-
nen. Dieses Vorgehen sichert der Mathematik große Stabilität, kühle Schönheit
und kraftvolle Eigendynamik, und sie präsentiert sich dadurch als eine zeitlose,
offene und unabhängige Schatzkammer des wissenschaftlichen Geistes.
In diesem Buch wird ein starkes mengentheoretisches Axiomensystem be-
trachtet und im Detail analysiert, nämlich die Zermelo-Fraenkel-Axiomatik
ZFC. Dieses System ermöglicht den Aufbau der gesamten modernen, mit un-
endlichen Objekten sehr freizügig umgehenden Mathematik. Damit kommt den
Axiomen von ZFC eine ganz andere Bedeutung zu als etwa den Axiomen der
Gruppentheorie. Denn die Gruppentheorie wird letztendlich innerhalb einer,
oft naiven, mengentheoretischen Umgebung betrieben, während ZFC ein
System ist, auf das sich ein Mathematiker letztendlich stützt, wenn er natürliche
Zahlen, Gruppen, Vektorräume und vieles mehr betrachtet und die Zusammen-
hänge zwischen abstrakten Strukturen verstehen will. Die Existenz einer relativ
einfachen Axiomatik, innerhalb derer die ganze Mathematik abgebildet werden
kann, ist verblüffend. Die Entwicklung der axiomatischen Mengenlehre ist ein
Triumph der Mathematik des 20. Jahrhunderts, und das Resultat ist eine der er-
staunlichsten Theorien, die die Wissenschaft hervorgebracht hat. Ein Kind der
Moderne mit romantischen Wurzeln, geboren im Umfeld von Widersprüchen
und Unsicherheiten. Kühn, selbstbewusst, reflektiert.
Sowohl die Möglichkeiten als auch die Grenzen der Theorie ZFC wurden
intensiv untersucht, und von beiden Unternehmungen will dieses Buch berich-
ten. Während die Theoreme von ZFC die Faszination des Unendlichen schü-
ren, indem sie uns die Tiefen des Mengenuniversums zeigen, so sind es gerade
die nachweisbaren Limitationen des Systems, die ein neues Nachdenken über
„Axiom“, über „Wahrheit“ und über „Mathematik“ anregen. Nur bei wenigen,
die die Ergebnisse der metamathematischen Untersuchung der erfolgreichsten
mathematischen Basistheorie durchdacht haben, hält sich ein naiver mathema-
tischer Wahrheitsbegriff. Die Mengenlehre verändert den Blick auf die Mathe-
matik. Ein fundamentales Konstrukt wie das klassische Kontinuum, interpre-
tiert durch die Menge der reellen Zahlen, erscheint als Rätsel, als ungenügend
verstanden und beschrieben, solange nicht ZFC durch zusätzliche Axiome ver-
vollständigt oder durch ein gänzlich anderes System ersetzt wird.
Das Buch zerfällt in zwei Teile. Im ersten Abschnitt betrachten wir das System
ZFC und die Rolle, die die einzelnen Axiome darin spielen. Wir deuten an, wie
sich die Mathematik mengentheoretisch interpretieren lässt und entwickeln die
Mengenlehre als eine eigenständige mathematische Theorie, die vor allen Din-
gen die Phänomene des Unendlichen und die Struktur unendlicher Objekte zu
ergründen sucht. Viele Probleme, die sich im Laufe der Untersuchung stellen,
können wir lösen. Jedoch sind es vor allem zwei elementare Fragen, die sich einer
Beantwortung entziehen, und die nicht nur als Schönheitsfehler, sondern als
wirklicher Stachel zurückbleiben. Die erste und wichtigste ist die Cantorsche
Frage nach der Mächtigkeit des Kontinuums:
Ist jede Menge von reellen Zahlen abzählbar oder gleichmächtig zu den reellen Zahlen?
Die zweite Frage, die in der Entwicklung der Mengenlehre des 20. Jahrhunderts
eine ebenso wichtige Rolle gespielt hat, ist die Suslinsche Frage nach der ord-
nungstheoretischen Charakterisierung des Kontinuums:
Sind die reellen Zahlen bis auf Isomorphie die einzige dichte, vollständige und
unbeschränkte Ordnung, in der jede Menge von disjunkten Intervallen abzählbar ist?
Im zweiten Abschnitt zeigen wir, dass diese beiden Fragen im Rahmen von ZFC
nicht beantwortbar sind. Die Kontinuumshypothese und die Suslin-Hypothese,
die obige Fragen jeweils mit einem „ja“ beantworten, sind unabhängig von ZFC:
Sie sind weder beweisbar noch widerlegbar (es sei denn, ZFC ist widersprüch-
lich). Wir stellen zwei verschiedene Methoden vor, mit denen derartige Unab-
hängigkeitsresultate gewonnen werden können, nämlich die Methode der inne-
ren Modelle von Gödel und die Erzwingungsmethode von Cohen. Dabei ent-
decken wir neue, zum Teil miteinander unverträgliche „Axiome“, die ein helles
Licht auf bestimmte Bereiche eines ihnen entsprechenden Mengenuniversums
werfen.
Den Begriff eines Klassenmodells und die zugehörige Methode der relativen Wider-
spruchsfreiheitsbeweise entwickeln wir im zweiten Abschnitt unabhängig vom Modellbe-
griff der mathematischen Logik. In der Untersuchung von Gödels Klassenmodell brau-
chen wir den Begriff der Definierbarkeit, den Begriff eines elementaren Submodells und
zuweilen auch elementare Ketten von Submodellen. Die Konstruktion von Ultrapotenzen
stellen wir im Text vor, da wir eine spezielle Klassenvariante verwenden. Eine wichtige
Rolle spielen zudem die Gödelschen Unvollständigkeitssätze. Sie werden eingesetzt, um zu
zeigen, dass wir bestimmte relative Widerspruchsfreiheitsbeweise nicht führen können.
Speziell sind sie im Umfeld der großen Kardinalzahlaxiome von Bedeutung.
Die Kenntnis der Inhalte eines Buches wie der „Einführung in die Mengen-
lehre“ des Autors zusammen mit einem Grundwissen der mathematischen Logik
sind die beste Voraussetzung, um verstehen zu können, was in diesem Buch be-
handelt wird. Der Autor hat sich zum Einen bemüht, den Text als eine Fortset-
zung der „Einführung in die Mengenlehre“ erkennbar zu machen − und in die-
sem Sinne ist er der versprochene Band II. Zum Anderen sollte die Darstellung
auch weitgehend für sich stehen können, was Wiederholungen im ersten Ab-
schnitt mit sich bringt. Dadurch können auch Leser hinzukommen, die, mit all-
gemeiner mathematischer Erfahrung ausgestattet, die Mengenlehre bislang nur
naiv verwendet haben, oder bei denen eine Beschäftigung mit der Mengenlehre
als Theorie bereits längere Zeit zurückliegt. Ein gelegentlicher Blick in die „Ein-
führung in der Mengenlehre“ sei zur Ergänzung empfohlen, auch im Hinblick
auf eine historisch-genetische Darstellung, die in dieser „Axiomatischen Men-
genlehre“ nicht verfolgt wird.
Das Buch will denjenigen Antworten und Anregungen geben, die mit Nach-
druck fragen: Wie sieht die mengentheoretische Fundierung der Mathematik
und die Dynamik einer entsprechenden Axiomatik genau aus? Wie können wir
mit mathematischen Methoden die Grenzen der Beweiskraft eines derartig star-
ken Systems bestimmen? Wem diese Fragen zu architektonisch, zu kühl oder zu
übermächtig erscheinen, der wird hier wahrscheinlich weniger finden als in den
leichtfüßigeren und wärmeren einführenden Lehrbüchern. Die Legitimation
dieser Fragen werden aber wohl alle gelten lassen, und für viele sind es Fragen
mit großer Weite und Faszinationskraft.
Neben dem Selbststudium mag sich das Buch auch für den Universitätsbe-
trieb eignen, als Begleittext für Vorlesungen und als Quelle für Seminarvorträge.
Es deckt den Themenkatalog einer universitären Abschlussprüfung in der Men-
genlehre ab, und versammelt mehr, als in zwei Semestern im Rahmen von vier-
stündigen Vorlesungen des Hauptstudiums üblicherweise gelehrt wird. Die des-
kriptive Mengenlehre wird hier allerdings nicht behandelt.
Der Autor hofft, mit der „Einführung in die Mengenlehre“, den „Reellen Zah-
len“ und der vorliegenden „Axiomatischen Mengenlehre“ dem der deutschen
Sprache mächtigen Leser eine Reihe miteinander verwandter, aber auch in sich
geschlossener Texte vorzulegen, die sich Grundlagenfragen der Mathematik in
inhaltlich und methodisch vielfältiger Weise widmen. Der Reichtum des mathe-
matischen Denkens soll spürbar werden, der Zauber der Unendlichkeit, die
Kraft des menschlichen Geistes. Der Stoff aus dem die Träume sind ist keines-
wegs abschließend behandelt und erforscht, und nichts wäre erfreulicher, als
wenn durch das Unterfangen ein individuell ausgeprägtes Interesse geweckt und
vermehrt würde, den aufregenden und geheimnisvollen Fragen weiter nachzu-
gehen, die die Mathematik stellt, wenn sie anfängt, über sich selbst nachzuden-
ken. Diese Fragen führen von der Mathematik aus auch zur Philosophie, Ge-
schichte und Didaktik.
Der Leser findet ein umfangreiches und kommentiertes Literaturverzeichnis
in der „Einführung in die Mengenlehre“. Ausgewählte Literaturangaben finden
sich zudem im Anhang. Ingesamt sind die hier präsentierten Inhalte weitestge-
hend als „Experten-Folklore“ zu bezeichnen, als weit verbreitetes Wissen unter
Mengentheoretikern. Der Autor erhebt keinerlei Anspruch auf Urheberschaft
oder Originalität, er möchte vorhandenes Wissen sammeln, ordnen, darstellen
und verbreiten. Die Darstellung kümmert sich im Unterschied zur „Einführung
in die Mengenlehre“ nicht so sehr darum, wer wann was in welcher Form zuerst
gemacht hat. Das vorliegende Lehrbuch haben neben zahlreichen Originalar-
beiten, Überblicksartikeln und Büchern vor allem auch diejenigen geprägt, die
ihr Wissen durch ihre Vorlesungen, Seminare und Diskussionen an mich weiter-
gegeben haben. Allen voran möchte ich hier Dieter Donder danken. Vieles in
diesem Buch habe ich von ihm gelernt und von ihm übernommen.
Dem Begriff „Axiom“ liegen das griechische Verb αξιu όω (gesprochen: axio-o)
u ίωµα (axioma) zugrunde, denen eine vielschichtige Bedeutung
und Substantiv αξ
zukommt:
u όω
αξι
„ich halte für würdig, erachte als angemessen, fordere,
verlange, halte für recht, bitte, glaube, urteile, halte dafür “
u ίωµα
αξ
„Ehre, Würde, Einschätzung, starke Position“
;
Schließlich ist das Verb αγω (ago) in der Bedeutung von „ich wiege, setze in
Bewegung“ die gemeinsame Wurzel von αξι u όω und αξ
u ίωµα. Hier sind wir dann
auch beim indo-europäischen Stamm ag- angelangt, den wir nicht weiter zu-
rückführen können.
Die Wortfelder von „Einschätzung“ und „Werturteil“ sind also in der etymo-
logischen Bedeutung von „Axiom“ vorhanden, es finden sich aber keinerlei An-
klänge von „offensichtlich, evident, trivial, definitiv, einfach“. Dagegen liegen
„wahr, wichtig, richtig, adäquat, korrekt, geglaubt“ im näheren semantischen
Umfeld. Die Teilbedeutung von „ich fordere“ unterstützt zwar die Lesart von
Axiomen als bloßen Postulaten, unterdrückt aber für sich genommen die ande-
ren Bedeutungsschichten zu stark.
Die Wortbedeutung erlaubt es also, ein Axiom als das Ergebnis eines unter
Umständen sehr verwickelten Prozesses zu sehen, der viele verschiedene
Aspekte involvieren kann. Unterstützt wird diese Sicht durch den noch weiter
gehenden Rückgang zu „ich wiege“. Der Pfad von „wiegen“ zu „urteilen, als kor-
rekt, angemessen, wahr einschätzen“ ist nicht weiter überraschend.
Frei, aber keineswegs gezwungen können wir aus moderner mathematischer
u όω also als „ich studiere grundlegende mathematische Prinzi-
Sicht das Verb αξι
pien und beurteile sie − je nach Grundhaltung − als korrekt, geeignet, angemes-
sen, würdig, wahr“ lesen. Ein Axiom ist dann das Ergebnis von Untersuchungen,
die mathematisch einfach oder schwierig sein können, und die Proklamation ei-
nes Axioms oder eines Systems von Axiomen kann mit einer komplizierten Be-
gründung und längeren Vorgeschichte einhergehen.
Diese Sicht wollen wir nun noch durch einen Blick auf die hellenistische Ma-
thematik untermauern.
;
κοναὶ εννοιαι (kovai ennoiai), also „gemeinsame Gedanken,
allgemeine Einsichten“.
Die Euklid-Kommentare legen zuweilen nahe, dass Euklid αξι u ώµατα (axio-
mata) für seine dritte Kategorie benutzt hat. Entsprechend findet sich in Über-
setzungen häufig „Axiome“ als Bezeichnung für die dritte Gruppe.
Einige Beispiele für Euklids Kategorien sind:
(1) Definitionen. Einige Definitionen sind kurze intuitive Beschreibungen wie
etwa „Ein Punkt ist das, was keine Teile hat.“ oder „Die Enden einer Linie
sind Punkte.“ Daneben finden sich Definitionen im üblichen Sinne, etwa
die Definition eines Kreises und die seines Mittelpunkts.
(2) Postulate. Das erste Postulat ist: „Gefordert soll sein, dass man von jedem
Punkt nach jedem Punkt die Strecke ziehen kann.“ Die Liste endet mit
dem berühmten fünften Postulat über die Existenz eines Schnittpunkts
von zwei nicht parallelen Linien.
(3) allgemeine Einsichten/Axiome. Beispiele sind die Transitivität der Gleich-
heitsrelation oder der Grundsatz „Das Ganze ist Größer als der Teil.“
Damit sind Euklids „Axiome“, wenn wir die dritte Kategorie überhaupt in die-
ser Weise angemessen übersetzen, eher „logische Axiome“ oder „Denkgesetze“,
während die heutigen in der Mathematik als Axiome bezeichneten theoriebil-
denden Aussagen der zweiten Euklidischen Kategorie der Postulate zugehören.
Unterstützt durch philosophische Analysen des Diskutierens, wo „Hypothese“,
„Definition“, „Forderung“, „Axiom“ fast gleichwertig für die einen rationalen
Diskurs ermöglichenden Übereinkünfte der Gesprächsteilnehmer verwendet
wurden, sind die drei Euklidischen Kategorien oft zusammengeworfen und ver-
mischt worden. Die aus heutiger Sicht sehr feine Unterscheidung zwischen ma-
thematischer Theorie und reiner Logik wurde dadurch wieder verdeckt. Warum
sich in der Mathematik „Axiom“ gegenüber „Aitema“ durchgesetzt hat, ist eine
schwierige Frage. Die unangemessen erscheinende Willkürlichkeit von bloßen
„Forderungen“ spielte neben Einflüssen der philosophischen Begriffsausbildung
vielleicht eine wichtige Rolle.
In der philosophischen Tradition wird der Begriff „Axiom“ seit Aristoteles mit
dem Begriff „Evidenz“ verlinkt: Die angenommenen Grundsätze können nicht
mehr weiter aufgelöst, verfeinert, aus anderen Grundsätzen hergeleitet werden,
und dies ist auch kein Nachteil, denn diese Grundsätze sind selbstverständlich,
für jedermann einleuchtend, indiskutabel, evident. Ist die Bevorzugung von
„Axiom“ gegenüber „Aitema“ in der Mathematik etymologisch gut begründet,
so erscheint der Zukauf der Evidenz heute als eine Hypothek, die die Mathema-
tik belastet hat und zum Teil noch immer belastet.
Es gibt in den „Elementen“ keinen Hinweis darauf, dass Euklid seine Postulate
als „evident“ betrachtet hat. Das Gleiche gilt für viele seiner Kommentatoren. In
dem sehr einflussreichen sieben Jahrhunderte nach Euklid verfassten Kommen-
tar von Proklus Diadochus findet sich folgende Diskussion der drei Euklidischen
Kategorien:
„Sodann teilt Euklid auch noch die allgemeinen Prinzipien selbst in die Definitionen (Hy-
pothesen), die Postulate und die Axiome. Das alles ist nämlich voneinander verschieden,
und Axiom, Postulat und Definition sind nicht dasselbe, wie irgendwo der gefeierte Ari-
stoteles sagt; wenn vielmehr das, was als Prinzip angenommen wird, auch dem Lernenden
einleuchtet und an sich evident ist, so handelt es sich um ein Axiom, wie z.B. bei dem Satz:
Sind zwei Größen einer dritten gleich, so sind sie auch unter sich gleich. Wenn aber der
Hörer das Verständnis einer Behauptung als von sich aus einleuchtend nicht schon in sich
hat, die Behauptung aber gleichwohl aufgestellt wird und er die Annahme zugibt, dann
handelt es sich um eine Definition. Dass z.B. der Kreis eine Figur ist von der und der Be-
schaffenheit, das tragen wir nicht im Vorhinein (a priori) und ohne Belehrung als Gemein-
begriff in uns; wenn wir es aber hören, so geben wir es ohne Beweis zu. Wenn aber die Be-
hauptung noch unbekannt ist und die Annahme gleichwohl erfolgt, obwohl der Lernende
sie nicht zugibt, dann, sagt er, sprechen wir von einem Postulat, wie z.B. bei dem Satz, dass
alle rechten Winkel einander gleich sind. Den Beweis liefern dann alle diejenigen, die sich
viel Mühe gaben mit der Erledigung eines Postulates, da sie überzeugt waren, dass nie-
mand ohne weiteres es zugeben könne.“ (zitiert nach [ Becker 1975, S. 100 ] )
Hiernach sind also nur die allgemein akzeptierten Grundsätze der dritten Kate-
gorie „evident“, und ihre Übersetzung als „Axiome“ mag dazu beigetragen ha-
ben, dass auch der mathematische Begriff „Axiom“, der später auch die Euklidi-
schen Postulate bezeichnet, mit „evident“ in Verbindung gebracht worden ist.
Bei Proklus sind die „Forderungen“ gerade diejenigen Aussagen, deren Vermitt-
lung am schwersten ist.
Die Evidenzforderung an ein Axiom oder ein System von Axiomen erscheint
damit als eine Zutat, die für die Mathematik nicht angemessen ist. Sie wider-
spricht sowohl der etymologischen Wurzel (αξι u όω) und Urwurzel (αγω)
; von
„Axiom“, als auch dem bei Euklid und seinen Kommentatoren dokumentierten
Verständnis der griechischen Mathematik. Sie schlich sich über philosophische
Umwege in die Geometrie ein, wurde dann aber durch die Entdeckung der
nichteuklidischen Geometrien wieder vertrieben. Und auch bei einem Rückzug
auf ein umfassenderes mengentheoretisches System, das die Entwicklung der
unterschiedlichsten mathematischen Theorien erlaubt, ist sie, nun auf die Axi-
ome der Mengenlehre angewendet, wieder zweifelhaft. Bereits bei den einfachen
mengentheoretischen Axiomen können wir die Evidenzfrage stellen: Warum
sollte es evident sein, dass zu je zwei Mengen a und b die Paarmenge { a, b } exi-
stiert? Noch deutlicher wird dies bei einem kritischen Axiom wie dem Potenz-
mengenaxiom. Warum sollte es beispielsweise evident sein, dass die Menge aller
Teilmengen der natürlichen Zahlen eine Menge ist? In beiden Fällen trifft die
Beschreibung eines Axioms als Ergebnis eines mathematischen Untersuchungs-,
Abwägungs- und Beurteilungsprozesses besser zu.
Wird von Axiomen als einer Kombination wichtiger Struktureigenschaften gesprochen
wie im Falle der Gruppenaxiome, so kommt die Evidenzfrage ohnehin gar nicht erst auf.
Was noch bleibt, ist die Zahlentheorie, die ein „psychologisch eindeutiges“ Modell ver-
folgt. Aber selbst die Evidenz der einfacheren der Peano-Axiome ist schwer zu beurteilen,
weil jeder, der mit ihnen in Berührung kommt, schon relativ viel Arithmetik kennen ge-
lernt hat und damit den Abwägungsprozess selber durchführen kann. Das entscheidende
erststufige Induktionsschema dürfte heute nur von wenigen Lernenden wie auch erfahre-
nen Mathematikern als „evident“ bezeichnet werden. Und der Satz, dass es bis auf Iso-
morphie nur eine Peano-Struktur gibt, ist ein Satz aus der Mengenlehre und sein Beweis
verlässt das Reich der reinen Zahlentheorie.
Kriterien
Nach welchen Kriterien wird eine Aussage zu einem Axiom ernannt? Und
speziell für die Mengenlehre: Wie können die Axiome von ZFC und Erweite-
rungen von ZFC begründet werden? Muss ein Axiom von einem Lernenden
nach kurzem oder längerem Nachdenken akzeptiert werden oder genügt es,
wenn es die besten Forscher nach einem abwägenden Forschungsprozess von
mehreren Generationen als „angemessen, für recht, würdig, wahr“ erachten?
Welche Rolle spielt die Intuition und das Wissen der nicht auf Grundlagenfra-
gen spezialisierten Mathematiker?
Bleiben wir bei der Intuition der nichtspezialisierten Mathematiker stehen, so
ist eine allgemein akzeptierte Erweiterung von ZFC für die nähere Zukunft nicht
in Sicht. Weiter hat sich auch unter den Mengentheoretikern noch keine so
starke Kraft für eine bestimmte Erweiterung von ZFC ergeben, dass die entspre-
chende Skepsis und Gegenkraft als vernachlässigbare Größe erscheinen würde.
Und auch bei einer großen Einigkeit einer Spezialistengruppe würde ein
„Glaube“ an diese und jene neue Axiome wohl mit einer relativ komplexen und
ungewöhnlichen Begründung einhergehen, die vielen Mathematikern als autori-
tärer Schamanismus erscheinen würde. Aber die Komplexität und Neuartigkeit
einer Argumentation spricht nicht gegen sie, und die einfache Vermittelbarkeit
ist ein problematisches Kriterium, das ein Mathematiker ja auch für seine eigene
Spezialisierung nicht einfordern würde.
Alle Entwicklungen zur Erweiterung der axiomatischen Mengenlehre sind
noch recht jung. Es wäre schon viel erreicht, wenn die gefundenen Erweite-
rungsmöglichkeiten von ZFC um das quasivollständige Axiom „V = L“, um die
großen Kardinalzahlaxiome, um kombinatorische Prinzipien und um die durch
die Erzwingungsmethode motivierten Axiome größere Verbreitung finden wür-
den als bislang. Dieser Text will diesem Ziel dienen und nicht einer vorschnellen
Antwort auf einige der tiefsten Fragen, die die Mathematik überhaupt stellen
kann.
Das erste Kapitel endet mit einer kurzen Diskussion des Mächtigkeitsbegriffs
und des Auswahlaxioms. Beide Themen werden im weiteren Verlauf in eigenen
Kapiteln aufgegriffen und vertieft.
Das zweite Kapitel widmet sich den Wohlordnungen und den Ordinalzahlen.
Wir stellen die elementaren Konstruktionsmöglichkeiten für Wohlordnungen
vor und diskutieren einige Anwendungen der Hartogs-Wohlordnung, ein-
schließlich eines Beweises des Wohlordnungssatzes. Anschließend motivieren
wir den modernen Begriff einer Ordinalzahl nach von Neumann und Zermelo
anhand des abstrakten Konzeptes einer „Ordinalzahldefinition“. Ausführlich
wird der Rekursionssatz für Ordinalzahlen behandelt, stellvertretend für Rekur-
sionen entlang beliebiger Wohlordnungen. Danach wenden wir uns dem Fun-
dierungsaxiom zu und klären seine Bedeutung innerhalb des axiomatischen Ge-
bäudes. Es ermöglicht die Ausschöpfung des Universums durch eine kumulative
Hierarchie, ein uniformes Zurückschneiden von echten Klassen und einen Be-
weis des Kollektionsschemas. Das Kapitel schließt mit einer kompakten Darstel-
lung der Ordinalzahlarithmetik, der Angabe einiger konkreter Wohlordnungen
auf den natürlichen Zahlen, sowie der Konstruktion von Paarungsfunktionen auf
den Ordinalzahlen und ihren Verallgemeinerungen.
Die Kardinalzahlen und ihre Arithmetik bilden das Thema des dritten Kapi-
tels. Wir führen die elementaren Operationen ein und besprechen den Begriff
der Konfinalität in verschiedenen äquivalenten Fassungen. Weiter untersuchen
wir die Exponentiation und allgemeine Summen und Produkte.
Das vierte Kapitel behandelt die wohlfundierten Relationen, die den Wohl-
ordnungsbegriff verallgemeinern. Es schließt sich damit nahtlos an das zweite
Kapitel an und kann auch unmittelbar danach gelesen werden. Wir beweisen die
Sätze über wohlfundierte Induktion und Rekursion und geben einige Anwen-
dungen. Anschließend besprechen wir den Mostowski-Kollaps, der es uns in vie-
len Fällen erlaubt, eine beliebige wohlfundierte Relation in die vertraute Epsi-
lon-Relation umzuwandeln. Die für sich interessante Konstruktion wird im
zweiten Abschnitt an verschiedenen Stellen eine wichtige Rolle spielen.
Das längere fünfte Kapitel stellt ausgewählte Themen der unendlichen Kom-
binatorik vor. Wir besprechen fast disjunkte Familien, stationäre Mengen,
Bäume, Partitionen, und einiges andere mehr. Ein Schwerpunkt liegt auf Fragen,
die die erste überabzählbare Kardinalzahl ω1 betreffen. Wir lernen eine Fülle
von Aussagen kennen, die wir in ZFC nicht beweisen und modulo der Konsistenz
großer Kardinalzahlaxiome auch nicht widerlegen können.
Ein klassisches Thema der Mengenlehre ist die Fokussierung des Auswahl-
axioms. Im sechsten Kapitel stellen wir eine Liste von äquivalenten Versionen
zusammen und untersuchen den Einsatz des Axioms und seiner Varianten. Wei-
ter klären wir logische Zusammenhänge, die unter verschiedenen schwachen
Formen des Auswahlaxioms bestehen.
Ungewöhnlich ist vielleicht das siebte Kapitel, das sich mit der endlichen
Mengenlehre beschäftigt. Wir geben verschiedene äquivalente Axiomatisierun-
gen einer Welt, in der jede Menge endlich ist. Weiter untersuchen wir den Zu-
sammenhang der endlichen Mengenlehre mit der Zahlentheorie. Die beiden
Theorien erweisen sich als gegenseitig ineinander interpretierbar.
sion der wohlfundierten Relationen kennen gelernt haben, spielt hier eine wich-
tige Rolle. Es ergibt sich ein ganz neuer Blick auf messbare Kardinalzahlen und
stärkere große Kardinalzahlprinzipien. Eine Schlüsselrolle kommt dabei dem
Begriff einer elementaren Einbettung zu, die auf dem ganzen Universum defi-
niert ist und Werte in einem inneren Modell annimmt.
Im fünften Kapitel stellen wir die Cohensche Erzwingungsmethode vor und
konstruieren ein Modell, in dem die Kontinuumshypothese verletzt ist. Genauer
zeigen wir, dass wir die Kardinalität des Kontinuums modulo der Einschrän-
kung, die der Satz von König-Zermelo vorgibt, beliebig einstellen können. Die
Flut möglicher Werte führt die Hilflosigkeit der Theorie ZFC hinsichtlich der
Frage nach der Mächtigkeit der reellen Zahlen dramatisch vor Augen. Die Me-
thode ist zudem so allgemein, dass sie eine Fülle von Konsistenzresultaten liefert,
darunter auch diejenigen, für die wir das konstruktible Universum L verwendet
haben. Weiter ist die Methode geeignet, um Modelle zu konstruieren, in denen
das Auswahlaxiom verletzt ist. Dadurch können wir nachweisen, dass für gewisse
Argumente die Verwendung des Auswahlaxioms unerlässlich ist.
Das sechste Kapitel behandelt die Booleschen Modelle, bei denen die Wahr-
heitswerte „wahr“ und „falsch“ durch die Elemente einer beliebigen vollständi-
gen Booleschen Algebra ersetzt werden. Dieser Ansatz wirft ein ganz eigenes
methodisches Licht auf die Erzwingungsmethode.
Unser letztes Hauptziel, nämlich die Konstruktion eines Modells, in dem die
Suslin-Hypothese gültig ist, erreichen wir im siebten und letzten Kapitel. Wir
iterierten die Modellerweiterung der Erzwingungsmethode ins Transfinite und
erhalten dadurch ein Modell, in dem das Martinsche Axiom gültig ist. Aus die-
sem Axiom kann die Suslin-Hypothese einfach gefolgert werden.
Zur Erleichterung der Lektüre wurden einige Anhänge verfasst. Der erste
stellt die wichtigsten Begriffe und Operationen mit Klassen zusammen und ist
insbesondere für die Leser von Interesse, die die „Einführung in die Mengen-
lehre“ nicht zur Hand haben. Daneben sind wichtige Begriffe und Sachverhalte
über Äquivalenzrelationen, partielle und lineare Ordnungen sowie Filter und
Ideale in knapper Form zusammengestellt.
Axiomatische Mengenlehre
Extensionalitätsaxiom (Ext)
Zwei Mengen sind genau dann gleich, wenn sie die gleichen Elemente haben.
∀x, y. x = y ↔ ∀z. z P x ↔ z P y
Paarmengenaxiom (Pa)
Zu je zwei Mengen x, y existiert eine Menge z, die genau x und y als
Elemente hat.
∀x, y ∃z ∀u. u P z ↔ u = x ∨ u = y
Vereinigungsmengenaxiom (Ver)
Zu jeder Menge x existiert eine Menge y, deren Elemente genau die
Elemente der Elemente von x sind.
∀x ∃y ∀z. z P y ↔ ∃u. u P x ∧ z P u
Potenzmengenaxiom (Pot)
Zu jeder Menge x existiert eine Menge y, die genau die Teilmengen von x
als Elemente besitzt.
∀x ∃y ∀z. z P y ↔ ∀u. u P z → u P x
Aussonderungsschema (Aus)
Zu jeder Eigenschaft ϕ und jeder Menge x gibt es eine Menge y, die genau
die Elemente von x enthält, auf die ϕ zutrifft.
∀x, p1 , . . . , pn ∃y ∀u. u P y ↔ u P x ∧ ϕ(u, p1 , . . . , pn )
Ersetzungsschema (Ers))
Das Bild einer Menge unter einer Funktion ϕ ist eine Menge.
∀p1 , . . . , pn . ∀u ∃! v ϕ(u, v, p1 , . . . , pn ) →
∀x ∃y ∀v. v P y ↔ ∃u. u P x ∧ ϕ(u, v, p1 , . . . , pn )
Unendlichkeitsaxiom (Un)
Es gibt eine Menge x, die die leere Menge als Element enthält und die mit
jedem ihrer Elemente y auch diejenige Menge z als Element enthält, deren
Elemente genau die Elemente von y sowie y selbst sind.
∃x. ( ∃y. yPx ∧ ∀z z¸y) ∧ ∀yPx ∃zPx ∀u. uPz ↔ uPy ∨ u = y
Fundierungsaxiom (Fun)
Jede nichtleere Menge x hat ein Element y, das mit x kein Element
gemeinsam hat.
∀x. ∃y y P x → ∃y P x ∀z P y z ¸ x
Auf etwa einer Buchseite lässt sich also eine Axiomatisierung für die unendli-
che Mengenlehre angeben, die als Fundament für die gesamte moderne Mathe-
matik dienen kann und, in Folge breiter Akzeptanz, auch dient. Die Geschichte
hinter dieser Seite ist dabei ebenso komplex wie die in ihr verdichtete Informa-
tion. Der Mengenbegriff musste entdeckt und in seinem mathematischen Reich-
tum erkannt werden. Eine umgangssprachliche Axiomatisierung der Mengen-
lehre musste gefunden werden. Die mathematische Logik musste soweit entwik-
kelt werden, dass sie die Präzisierung der Axiomatik leisten konnte. Der Men-
genbegriff musste in seiner interpretativen Kraft erkannt werden, denn es war zu
Beginn weder klar noch intendiert, dass sich jedes mathematische Objekt als
Menge auffassen lässt. Hinzu kommt die allgemeine Verbreitung und Diskussion
des Systems, bei der auch die Stimmung und Grundhaltung einer Epoche eine
wichtige Rolle gespielt hat. Kurz: Obiges System und seine Akzeptanz ist das Er-
gebnis eines verwickelten wissenschaftlichen, historischen und auch soziologi-
schen Prozesses, und das „Wiegen“, das am Ende des etymologischen Pfades von
„Axiom“ steht, ist hier besonders greifbar. Ein Großteil der historisch einflus-
sreichen Dokumente stammt dabei aus dem späten 19. und frühen 20. Jahrhun-
dert und liegt zudem im Original auf Deutsch vor, sodass der Leser dieses Textes
ohne größere zeitliche und sprachliche Hindernisse zurückblicken kann, wenn er
das System aus kultureller und damit letztendlich auch mathematischer Sicht
besser verstehen möchte. Wir blicken in diesem Buch nach vorne und verweisen
den Leser auf die „Einführung“ für einen Zugang zur Mengenlehre, der die an-
dere Blickrichtung zu integrieren versucht hat.
Obige Axiomatik bezeichnen wir mit ZFC für „Zermelo-Fraenkel-Axiomatik
mit Auswahlaxiom“. Das „C“ steht hierbei für das Auswahlaxiom (AC), engl.
„axiom of choice“. ZF sei die Axiomatik ZFC ohne das Auswahlaxiom. Symbo-
lisch schreiben wir:
ZFC = (Ext) + (LM) + (Pa) + (Ver) + (Pot) + (Aus) + (Ers) + (Un) + (Fun) + (AC),
ZF = ZFC − (AC).
Das Unendlichkeitsaxiom des Systems ist bereits auf die Definition einer Ordinalzahl
nach von Neumann und Zermelo zugeschnitten. (Vgl. Zermelos ursprüngliches Axiom
(Un) und die Diskussion zu Zermelos Zahlreihe in der „Einführung“, 3.1; dort hatten wir
obiges Axiom mit (Un2) bezeichnet.)
Einige Axiome von ZFC sind redundant. So folgt die Existenz der leeren
Menge aus dem Aussonderungsschema und das Aussonderungsschema selbst
lässt sich, wie wir sehen werden, aus dem Ersetzungsschema herleiten. Dennoch
hat das Aussonderungsschema seinen festen Platz in der Theorie. Es ist leicht
verständlich und wird von Beginn an gebraucht, während die Kraft des stärkeren
Ersetzungsschemas erst später ans Licht kommt.
Die Redundanzen in unserem System halten sich andererseits auch wieder in
Grenzen. Wir werden im zweiten Abschnitt bei der Diskussion des Reflexions-
prinzips zeigen, dass sich ZFC nicht endlich axiomatisieren lässt, d.h. es gibt kein
zu ZFC äquivalentes System, das aus einer endlichen Liste von Axiomen besteht
(vorausgesetzt, ZFC ist widerspruchsfrei).
Im ersten Abschnitt des Buches untersuchen wir die Axiomatik ZFC und ach-
ten dabei auch auf den Einsatz und das Zusammenspiel der einzelnen Axiome.
Wir werden dabei aber keineswegs genau mitschreiben, welche Axiome für wel-
che Konstruktionen und Argumente letztendlich gebraucht werden. Lediglich
das Ersetzungsschema, das Fundierungsaxiom und das Auswahlaxiom werden in
der Diskussion besonders hervorgehoben, und der reduzierte Grundstock unse-
rer Axiomatik ist damit die Theorie
Z = ZFC − (Ers) − (Fun) − (AC),
also die formalisierte Form von Zermelos erster Axiomatik von 1908 ohne das dor-
tige Auswahlaxiom. Die formalisierte originale Zermelo-Axiomatik bezeichnen
wir in diesem Buch mit ZC, sodass also ZC = Z + (AC) = ZFC − (Ers) − (Fun).
Die Axiome von ZFC nennen wir auch die Basisaxiome der Mengenlehre.
Diese Wortwahl deutet bereits auf mögliche Erweiterungen des Systems hin, und
im Laufe unserer Untersuchungen werden wir auch eine Reihe von interessanten
und sich zum Teil widersprechenden Aussagen kennen lernen, um die ZFC er-
weitert werden könnte. Diese Aussagen nennen wir „Prinzipien“, „Vermutun-
gen“, „Hypothesen“ und zum Teil auch „Axiome“, ohne dadurch anzudeuten,
dass wir sie tatsächlich in unser System mit aufnehmen oder den Basisaxiomen
gleichstellen wollen. In vielen Fällen haben auch die Mathematiker, die diese
Prinzipien entdeckten und zuerst untersuchten, keine Tendenz ausgesprochen.
Entsprechend soll z. B. mit der Bezeichnung „Suslin-Hypothese“ nicht sugge-
riert werden, dass Suslin diese Aussage für richtig hielt. Eine Ausnahme bildet die
Kontinuumshypothese, die von Cantor als wahr eingeschätzt wurde.
Alle Objekte der Theorie sind Mengen. „Für alle x“ bedeutet also „für alle
Mengen x“, und „sei x eine Menge“ ist nur eine Sprechweise für ein beliebiges
Objekt x der Theorie. Wir nutzen aber an vielen Stellen die sog. Klassensprech-
weise, die uns den Komfort des mengentheoretischen Denkens und Notierens
auf sprachlicher Ebene zur Verfügung stellt und so das Manipulieren von P-For-
meln in vielen Fällen überflüssig macht.
Definition (Klassen)
Sei ϕ(x) eine Formel (mit Parametern). Dann heißt der Ausdruck
{ x | ϕ(x) } (Klassennotation)
die Klasse aller Mengen x, auf die die Eigenschaft ϕ zutrifft.
Offiziell sind Klassen also nichts anderes als formale Ausdrücke, die durch eine
Formel der P-Sprache bestimmt sind. Wir werden sehen, wie wir Formeln, die
Klassenausdrücke der Form { x | ϕ(x) } beinhalten, in reine P-Formeln umwan-
deln können. Intuitiv sind Klassen beliebig große sprachlich definierte Teilberei-
che des Objektuniversums, und diese Sicht möchten wir beim Leser letztendlich
auch unterstützen. Zuvor müssen wir aber die Verwendung von Klassen in einer
formal korrekten Weise einführen.
Seien A = { x | ϕ(x) } und B = { x | ψ(x) } Klassen, a eine Menge, und sei χ(x) eine
Formel. Dann definieren wir:
a PA als ϕ(a) (P-Relation zwischen Menge und Klasse)
A=B als ∀x. x P A ↔ x P B (Gleichheit zweier Klassen)
a=A als ∀x. x P a ↔ x P A (Gleichheit von Menge und Klasse)
A=a als a = A (Gleichheit von Klasse und Menge)
A Pa als ∃x P a x = A (P-Relation zwischen Klasse und Menge)
A PB als ∃x. x P B ∧ x = A (P-Relation zwischen zwei Klassen)
∀x P A χ(x) als ∀x. x P A ∧ χ(x)
∃x P A χ(x) als ∃x. x P A ∧ χ(x) (beschränkte Klassenquantoren)
Diese Ausdrücke können wir nun frei verwenden, ohne die P-Sprache zu ver-
lassen. Ist A = { x | ϕ(x) }, so bedeutet die neue P-Formel „x P A“ per Definition
nichts anderes als ϕ(x). Wir lesen „xPA“ als „x ist ein Element der Klasse A“. Gilt
x P A, so ist x ein Objekt der Theorie, also eine Menge.
Mit Klassen lassen sich mengentheoretische Operationen durchführne, ohne
dabei die definierenden Formeln zu erwähnen. Klassen tendieren dazu, sich zu
verselbstständigen, und dies ist gewollt. Zum Beispiel definieren wir für beliebige
Klassen A und B:
A ⊆ B als ∀x P A x P B, (A ist Teilklasse von B)
Dann können wir zum Beispiel beweisen:
(+) Für alle Klassen A und B gilt: A = B ↔ A ⊆ B ∧ B ⊆ A.
Diese Aussage ist „offiziell“ das rein logisch beweisbare Theoremschema:
(+)′ Für alle Formeln ϕ(x) und ψ(x) gilt:
∀x (ϕ(x) ↔ ψ(x)) ↔ ∀x (ϕ(x) → ψ(x)) ∧ ∀x (ψ(x) → ϕ(x)).
Formulierungen der Form (+) wird man schnell lieb gewinnen und man wird
dann auf die oftmals schwerfälligen Übersetzungen der Form (+)′ verzichten
wollen. Ein Beispiel ist die Transitivität der Teilklassen-Relation:
A ⊆ B ∧ B ⊆ C → A ⊆ C.
Wir definieren noch einige häufig verwendete Operationen für beliebige
Klassen A, B:
Beweis
Sei A = { x | x P a } die durch ϕ(x) = „x P a“ (mit a als Parameter) definierte
Klasse. Nach Definition von a = A ist zu zeigen: ∀x. x P a ↔ x P A.
Dies ist aber trivial, da x P A nach Definition identisch ist mit x P a.
Das Extensionalitätsaxiom führt weiter dazu, dass die Klassenlesart von Men-
gen die Gleichheit nicht abschwächt. Sind nämlich a und b Mengen, so können
wir „a = b“ lesen als { x | x P a } = { x | x P b }, was nach Definition der Gleichheit
von Klassen gleichbedeutend ist mit ∀x. x P a ↔ x P b. Nach dem Extensionali-
tätsaxiom ist dies aber gleichwertig zu a = b. Insgesamt sind alle möglichen Les-
arten von a = b und aP b − z.B. als a = { x | xP b } und { x | x P a } P b − gleichwer-
tig zu den originalen P-Formeln.
Definitionen, Notationen und Ergebnisse über Klassen übertragen sich damit
automatisch auf Mengen. Haben wir zum Beispiel A ⊆ B wie oben für Klassen
definiert, so haben wir auch die Teilmengenrelation a ⊆ b eingeführt. Denn ist
wieder A = { x | ϕ(x) } und B = { x | ψ(x) }, so ist nach Definition A ⊆ B gleichwertig
zu ∀x. ϕ(x) → ψ(x). Für die Klassen a = { x | x P a } und b = { x | x P b } ist damit
a ⊆ b eingeführt als ∀x. x P a → x P b.
Wir haben gesehen, dass jede Menge als eine Klasse aufgefasst werden kann.
Umgekehrt sind viele Klassen auch Mengen:
Eine suggestive Lesart für „A ist eine Menge“ erhalten wir durch Betrachtung
der umfassendsten Klasse überhaupt:
Es gilt nun:
Beweis
„A ist eine Menge“ gdw ∃a a = A gdw ∃a. a = a ∧ a = A gdw
∃a. a P V ∧ a = A gdw A P V.
Wir können nun viele Axiome von ZFC so lesen, dass sie behaupten, dass be-
stimmte Klassen Mengen sind:
Auch das Unendlichkeitsaxiom besitzt, wie wir sehen werden, eine äquivalente
Formulierung der Form „A P V“. Wir können es zum Beispiel notieren als
{ x | x ist eine endliche Ordinalzahl } P V (Unendlichkeitsaxiom)
Damit bleibt nur noch das Auswahlaxiom unter den Existenzaxiomen von ZFC
übrig. Dieses Axiom besitzt nun aber keine Formulierung der Form „A P V“ für
eine bestimmte Klasse A (es sei denn, wir ergänzen ZFC um ein regulierendes
Axiom wie „V = L“, vgl. Kapitel 2.2). Das Auswahlaxiom ist damit ein ausgezeich-
netes Existenzaxiom des Systems.
Ist A = { x | ϕ(x) }, so bedeutet die Aussage „A P V“, dass alle Objekte des Uni-
versums mit der Eigenschaft ϕ ein neues Objekt des Universums bilden. In der
Sprechweise von Cantor: Die Zusammenfassung aller x mit der Eigenschaft ϕ(x)
liefert ein Ganzes, eine konsistente Vielheit. Viele Axiome von ZFC sind damit
Instanzen des allgemeinen Komprehensionsschemas, das jede Zusammenfas-
sung erlaubt:
Komprehensionsschema (Kom)
Für jede Formel ϕ(x) (mit Parametern) gilt: { x | ϕ(x) } P V.
Die naive Mengenlehre lässt sich formalisieren als (Ext) + (Kom), evtl. erwei-
tert um das Auswahlaxiom und weiter dann um das Fundierungsaxiom. Das Phä-
nomen der echten Klassen − bei Cantor „inkonsistente Vielheiten“ genannt −,
zeigt die Widersprüchlichkeit des vollen Komprehensionsschemas:
Echte Klassen
Echte Klassen existieren aus rein logischen Gründen. Das wichtigste Beispiel
ist hier:
Definition (Russell-Zermelo-Klasse, R)
Wir definieren:
R = { x | x ¸ x }.
Die Klasse R heißt die Russell-Zermelo-Klasse oder kurz Russell-Klasse.
Während wir den Buchstaben V in diesem Text durchgehend für das mengentheoreti-
sche Universum verwenden, ist der Buchstabe R nur im Umfeld der Diskussion der ech-
ten Klassen fest belegt. Wir verwenden ihn später z. B. auch für Relationen.
Beweis
Für alle Mengen x gilt nach Definition von R:
(+) x P R gdw x ¸ x.
Annahme, R ist eine Menge. Dann gilt also nach (+) für x = R:
R P R gdw R¸ R,
Widerspruch.
Das Argument ist rein logisch und verwendet keine Axiome von ZFC. Die
Aussage „R ist keine Menge“ lautet formal:
¬ ∃x ∀y. y P x ↔ ¬ (y P y).
Diese Aussage ist in der reinen Logik beweisbar. Denn gäbe es ein solches x, so
hätten wir xPx ↔ ¬ (xPx). Für dieses Argument wird nicht einmal das Extensio-
nalitätsaxiom bemüht, und weiter auch nicht das tertium non datur der Logik,
und die Argumentation ist damit vollkommen unstrittig. Statt der P-Relation
kann hier ein beliebiges zweistelliges Relationssymbol p eingesetzt werden.
In der Intuition von ZFC ist der durch eine echte Klasse bezeichnete Teilbe-
reich des Universums zu groß, um eine Menge sein zu können. (Eine Präzisie-
rung und Rechtfertigung dieser Intuition werden wir bei der Diskussion des
Fundierungsaxioms und der Vα -Hierarchie geben.) Dass R eine echte Klasse
ist, bedeutet bei dieser Lesart, dass es auch ohne Rückgriff auf das Fundie-
rungsaxiom unbeschränkt viele Mengen x gibt mit x ¸ x.
Nach dem Aussonderungsschema ist dann weiter auch das Universum V eine
echte Klasse. Denn andernfalls wäre { x P V | x ¸ x } = R als Aussonderung einer
Menge wieder eine Menge. Ein anderes Argument benutzt das Fundierungs-
und Paarmengenaxiom, um zu zeigen, dass die Klasse V keine Menge ist. Nach
diesen Axiomen gilt x ¸ x für alle x, da sonst die Menge { x } kein P-minimales
Element besitzen würde. Es gilt dann also V = { x | x = x } = { x | x ¸ x } = R, und
damit ist V keine Menge.
Die Klasse R ist also eine echte Klasse in jeder Axiomatik der P-Sprache, und
die Klasse V ist eine echte Klasse in einem schwachen Fragment von ZFC. Dass
V eine echte Klasse ist, lässt sich nicht mehr rein logisch zeigen. Dies folgt erst
aus der Interpretation von echten Klassen als „zu großen“ Zusammenfassungen:
Das Universum V umfasst, unabhängig von der Gültigkeit des Fundierungsaxi-
oms, die Klasse R, und ist also erst recht keine Menge. Mögliche andere Inter-
pretationen von „echte Klasse“ könnten im Umfeld von „unabgeschlossen“, „ge-
nerierend“, „negativ“ liegen, und es sind dann interessante Theorien denkbar, in
denen das Universum V im Gegensatz zu seinem Teilbereich R ein Objekt der
Theorie ist. Sicher gilt dann V = V und damit V P V.
Übung
Die Klassen A = { x | es gibt kein y mit x P y P x }, B = { x | es gibt keine
y1 , y2 mit x P y1 P y2 P x }, usw. sind echt.
[ Ähnlich wie für die Russell-Zermelo-Klasse ohne Verwendung von Axiomen. ]
Satz (Projektionssatz)
Sei ϕ(x, y) eine funktionale Formel wie im Ersetzungsschema, und weiter
sei ϕ injektiv, d. h. für alle x1 , x2 , y gelte: ϕ(x1 , y) und ϕ(x2 , y) impliziert x1 =
x2 . Sei A eine echte Klasse, und sei B ⊇ { y | ∃x P A ϕ(x, y) }. Dann ist B
echt.
Beweis
Annahme, B P V. Dann ist auch C = { y | ∃x P A ϕ(x, y) } P V (nach (Aus)).
Wir definieren eine Formel ψ(y, x) durch:
ψ(y, x) = „(y P C ∧ ϕ(x, y)) ∨ (y ¸ C ∧ x = ∅)“.
Aufgrund der Injektivitätsvoraussetzung ist dann ψ(y, x) eine funktionale
Formel. Wegen C P V ist also { x | ∃y P C ψ(y, x) } P V nach (Ers). Also ist
A = { x | ∃y P C ϕ(x, y) } = { x | ∃y P C ψ(y, x) } P V,
im Widerspruch zur Voraussetzung an A.
Elementare Interpretationen
Aus dem Begriff des geordneten Paares lässt sich nun der Relationsbegriff und
weiter der Funktionsbegriff gewinnnen. Eine Klasse R heißt relationale Klasse
oder kurz Relation, falls jedes Element von R ein geordnetes Paar ist. Mit anderen
Worten: Es gilt R ⊆ V × V. Statt (a, b) P R schreiben wir auch a R b (Infix-Nota-
tion).
Funktionsangabe
Wir schreiben F : A → B, falls A = dom(F) und rng(F) ⊆ B.
Ist F : A → B, so heißt B ein Wertevorrat für F. (Ein Wertevorrat ist bei unserer
Fassung des Fuktionsbegriffs nicht eindeutig.)
Sind F : A → B und G : B → C, so sei
G + F = { (a, G(F(a)) | a P A }
die Verknüpfung von F und G. Weiter sei
F|C = { (a, b) P F | a P C }
die Einschränkung von F auf eine Klasse C, und es sei IdA = { (a, a) | a P A } die
Identität auf A. Für a P V sei ida = Ida .
Eine Folge der Form 〈x a | a P A〉 ist nichts anderes als die Funktion F : A → V
mit F(a) = xa für alle a P A.
Eine Funktion F heißt injektiv, falls aus F(a) = F(b) stets a = b folgt. Ist F injek-
tiv, so ist F −1 eine Funktion, die sog. Umkehrfunktion. Eine Funktion F : A → B
heißt surjektiv (bzgl. B), falls rng(F) = B gilt, und bijektiv (bzgl. B), falls F injektiv
und surjektiv ist.
Für beliebige Klassen A, B setzen wir:
A
B = { f | f : A → B }. (Klasse aller Funktionen von A nach B)
Der Begriff der funktionalen Klasse liefert eine elegante und suggestive For-
mulierung des Ersetzungsschemas. Wir können es nun notieren als:
Ersetzungsschema (Ers)
Sei F : V → V eine Funktion. Dann gilt F″a P V für jede Menge a.
Es gilt F″a = { F(b) | bPa }. In dieser Schreibweise wird die „Ersetzung“ beson-
ders deutlich. Wir ersetzen jedes b in a durch F(b). Dabei ist F eine sprachlich ge-
gebene Funktion. Ist f P V eine Funktion und a eine Menge, so lässt sich f ″a P V
ohne Verwendung von (Ers) zeigen ((!), vgl. auch (iii) der Übung unten).
Der Projektionssatz über echte Klassen lässt sich nun so formulieren: Ist F in-
jektiv und A eine echte Klasse, so ist jede Klasse B ⊇ F″A echt.
Die Existenzaxiome von ZFC werden eingesetzt, um zu zeigen, dass wir den
Bereich der Mengen durch einfache Operationen nicht verlassen. Beispiele sind:
Übung
Zeigen Sie, dass für alle Mengen a, b gilt:
(i) > a P V, falls a ≠ ∅, a ∪ b P V, a ∩ b P V
(ii) a × b P V
(iii) a bPV
(iv) dom(a) P V, rng(a) P V, falls a Relation
[ zu (i): Sei b P a beliebig. Dann gilt > a = { x P b | ∀c P a x P c }. Weiter ist
a ∪ b = Í { a, b }, a ∩ b = > { a, b }.
zu (ii) und (iii): Wir schreiben a × b = { p P c | ϕ(p) } und a b = { f P d | ψ(f ) } für
geeignete Mengen c und d und Eigenschaften ϕ und ψ. Aus (Aus) folgt dann die
Behauptung.]
Nach Definition ist > ∅ = V, sodass die Voraussetzung in (i) notwendig ist.
Mengenbeschränkung
Die Mengenbeschränkung wie im Beweis von a × b P V und a b P V wird
häufig verwendet, um zu zeigen, dass eine Klasse A = { x | ϕ(x) } eine Menge
ist. Mit Hilfe der Existenzaxiome (Pa), (Ver), (Pot), … finden wir eine
hinreichend große Menge b, für die wir A ⊆ b zeigen können. Dann folgt
A P V aus der Instanz des Aussonderungsschemas für die Formel
„x P b ∧ ϕ(x)“.
Übung
Gleichwertig zum Ersetzungsschema über den restlichen Axiomen ist die
Aussage:
„Sei F : V → V eine Funktion. Dann gilt F|a P V für alle a P V.“
kutieren werden, können wir axiomatisch rechtfertigen und die rekursiv definier-
ten Objekte durch P-Formeln charakterisieren. Ausdrücke wie „n = m! “ oder
auch „x = sin(1/3)“ sind letztendlich Formeln ϕ(n, m) und ψ(x) der Epsilon-Spra-
che. Die Rückführung kann, soweit es überhaupt von Interesse ist, den Maschi-
nen überlassen bleiben. Wichtig ist nur, dass wir logisch untadelig vorgehen,
denn nur so erhalten wir den angestrebten Grad an Genauigkeit und Sicherheit.
Diese Korrektheit ist keineswegs beschwerlich. Wir folgen dem sympathischen
Prinzip, neue Begriffe aus alten zu gewinnen, und das ist nichts, was der Mengen-
lehre eigen wäre. Im Gegensatz zu anderen mathematischen Gebieten müssen in
der Mengenlehre aber auch die einfachsten Objekte wie die Zahlen und die ein-
fachsten Begriffe wie die der Relation und der Funktion begründet und durch
Mengen interpretiert werden.
Was erlaubt ist und was nicht, lernt man durch Beobachtung und Reflexion. In
der Mengenlehre darf man viel, das Arbeiten ist frei. Nur einige wenige Dinge
verlangen Vorsicht. Wir müssen z. B. immer beachten, dass Klassen keine Ob-
jekte der Theorie sind und nicht entsprechend verwendet werden dürfen. Doch
auch hier bekommt man schnell einen Blick für das Mögliche und Erlaubte.
Beispiel
Wenn wir sagen: „Für alle x existiert ein y mit χ(x, y)“, so heißt das, dass wir
die Aussage ∀x ∃y χ(x, y) der P-Sprache betrachten und beweisen wollen.
Wenn wir dagegen sagen:
Wir müssen also erstens angeben, wie wir ψ(y) aus ϕ(x) konstruieren
(effektiv auf dem Papier), und zweitens müssen wir ein Argument dafür
geben, dass die P-Aussage (+) in ZFC beweisbar ist, egal, welche Formel
ϕ(x) zu Beginn vorlag. Behauptungen über Klassen haben in ZFC notwendig
einen konstruktiven Charakter.
Obwohl die natürlichen Zahlen ein Anfangsstück der Ordinalzahlen sein wer-
den, ist es instruktiv, sie vorab zu definieren. Dieses Vorgehen beleuchtet die Axi-
ome und ist ein Paradebeispiel für die eine nichttriviale mengentheoretische In-
terpretation von mathematischen Objekten.
Definition (induktiv)
Eine Klasse A heißt induktiv, falls gilt :
(i) ∅PA.
(ii) Für alle x P A ist auch x ∪ { x } P A.
Es ist leicht zu sehen, dass diese Definition nicht von der speziellen Wahl der
induktiven Grundmenge x0 abhängt. Weiter ist ω selbst eine induktive Menge.
Beispiele
Einige Elemente von ω sind:
0 := ∅
1 := { 0 }
2 := 1 ∪ { 1 } = { 0, 1 },
3 := 2 ∪ { 2 } = { 0, 1, 2 }, …
17 := 16 ∪ { 16 } = { 0, 1, 2, …, 16 }, …
Hier sind 0, 1, 2, 3, … neue Konstanten, mit denen wir unsere Epsilon-
Sprache erweitern, oder alternativ Abkürzungen für bestimmte Formeln.
So ist zum Beispiel „x P 2“ die Formel „x = 0 ∨ x = 1“, die wir als P-Formel
ausschreiben können:
∀y y ¸ x ∨ ∃y. y P x ↔ ∀z z ¸ y.
Definition (Nachfolgerfunktion S, n + 1)
Die Nachfolgerfunktion S : ω → ω ist definiert durch S(n) = n ∪ { n } für alle
n P ω. Statt S(n) schreiben wir auch n + 1.
Beweis
A ist induktiv, also gilt A = ω.
Beweis
Sei B = { n P A | n ⊆ A }. Dann ist B induktiv (!). Also ist ω = B ⊆ A.
Wir führen nun noch eine Ordnung auf ω ein. Hierzu definieren wir:
Eine transitive Klasse A „kennt“ also die Elemente aller ihrer Elemente. Stei-
gen wir in A die P-Relation hinab, so sind alle Mengen, die wir dabei antreffen,
Elemente von A. Ist z. B. d P c P b P a P A, so ist d P A. Der Transitivität werden
wir noch häufig begegnen. Im Kontext von ω ist von Bedeutung:
Übung
(i) Sei x induktiv. Dann ist { y P x | y ⊆ x und y ist transitiv } induktiv.
(ii) ω ist transitiv und jedes Element von ω ist transitiv.
Die Transitivität von ω und aller nPω ermöglicht eine einfache Definition der
Ordnung auf den natürlichen Zahlen:
Übung
(i) Für alle n P ω ist n = { m P ω | m < n } ⊆ ω.
(ii) < ist transitiv und irreflexiv auf ω (ohne Verwendung von (Fun)).
(iii) Für alle n P ω − { 0 } gibt es genau ein m P ω mit n = m + 1.
(iv) Für alle n, m P ω mit n < m ist n + 1 ≤ m.
(v) < ist eine lineare Ordnung auf ω.
(vi) Ist x ⊆ ω transitiv, so ist x P ω oder x = ω.
Die starke Induktion ist damit also die Induktion entlang < mit Rückgriff auf
sämtliche Vorgänger: „aus m P A für alle m < n folgt n P A“. Wir erhalten:
Beweis
Sei B = ω − A. Annahme, A hat kein kleinstes Element. Für alle nPω gilt dann:
n ⊆ B impliziert n P B.
Also ist B = ω und damit A = ∅, Widerspruch.
Wir können die natürlichen Zahlen auch ohne Verwendung des Unendlich-
keitsaxioms als Klasse definieren, und das Unendlichkeitsaxiom dann einsetzen,
um zu zeigen, dass diese Klasse eine Menge ist.
In der Sprechweise des nächsten Kapitels besagt nat(x): „x ist eine von Neu-
mann-Zermelo-Ordinalzahl und kleiner als die erste Limesordinalzahl.“ In der
Tat ist die allgemeine Ordinalzahldefinition die Motivation für diese Formel.
Eine gleichwertige symmetrische Formulierung von nat(x) lautet: „x ist transi-
tiv, durch P linear geordnet, und jede nichtleere Teilmenge von x besitzt sowohl
ein P-minimales als auch ein P-maximales Element“.
Die Aussage „Ω P V“ ist über einem schwachen Fragment von ZFC − (Un)
gleichwertig zum Unendlichkeitsaxiom, und weiter ist Ω dann identisch mit der
Menge ω:
Beweis
zu (a):
Ω ist eine induktive Klasse, also gilt (Un), falls Ω eine Menge ist.
zu (b):
Wir arbeiten in Z. Obige Ergebnisse über ω sind in Z beweisbar.
Es gilt ω ⊆ Ω, da nat(n) für alle n P ω gilt. Sei umgekehrt x eine Menge
mit nat(x). Wir zeigen, dass x P ω. Wir setzen hierzu:
n = x ∩ ω.
Dann ist n transitiv. Also gilt n P ω oder n = ω. Der Fall n = ω ist
unmöglich, da sonst n ⊆ x kein P-maximales Element besitzen würde.
Also ist nPω.
Wir zeigen, dass x = n gilt. Andernfalls ist x − n ⊆ x nichtleer.
Sei also m das P-kleinste Element von x − n. Dann ist jedes k P m ein
Element von n, d. h. es gilt m ⊆ n. Umgekehrt ist auch jedes k P n ein
Element von m, da nach Linearität der P-Ordnung auf x sonst m P k
oder m = k und damit m P n gelten würde. Insgesamt ist also n = m.
Dann ist aber n = m P x, also n P x ∩ ω = n, Widerspruch.
Rekursion auf ω
Der Satz ist ein Spezialfall des allgemeinen Rekursionssatzes für Ordinalzah-
len, den wir im nächsten Kapitel kennen lernen werden.
Beweis
Wir nennen eine Funktion f eine n-Approximation (der Rekursion gemäß G),
falls gilt:
(i) dom(f ) = n, n P ω,
(ii) für alle m < n ist f(n) = G(f|n).
Eine Induktion nach n P ω zeigt:
(++) Es existiert genau eine n-Approximation.
Denn ∅ ist die eindeutige 0-Approximation, und ist f die eindeutige
n-Approximation, so ist f ∪ { (n, G(f )) } die eindeutige (n + 1)-Approxima-
tion. Wir können also setzen:
F(n) = G(„die eindeutige n-Approximation“) für alle n P ω.
Dann gilt die Rekursionsgleichung (+), wie eine Induktion nach n P ω zeigt.
Ist F′ eine weitere Funktion, die (+) erfüllt, so zeigt eine erneute Induktion,
dass F(n) = F′(n) für alle n P ω gilt. Also ist F = F′.
Der Beweis des Rekursionssatzes lässt sich in der Theorie Z durchführen. (Dass
für jede Funktion H : ω → V und jedes nPω die Einschränkung H|n eine Menge
ist, zeigt man durch Induktion nach n.) Das Ersetzungsschema wird aber ge-
braucht, um zu zeigen, dass die konstruierte Funktion F : ω → V eine Menge ist.
Beispiel
Wir diskutieren den Rekursionssatz und die Rolle des Ersetzungsschemas
an einem Beispiel. Wir betrachten die informal präsentierte Rekursion:
F(0) = ω, F(n + 1) = P(F(n)) für alle n P ω.
F(n) ist also das Resultat der n-maligen Anwendung der Potenzmengenope-
ration auf ω. Wir schreiben auch P n (ω) anstelle von F(n). Dann ist also
F = { (n, F(n)) | n P ω } = 〈P n (ω) | n P ω〉.
In ZFC − (Ers) kann man nicht zeigen, dass die Klasse F eine Menge ist.
Dies wird aus den Modellkonstruktionen des zweiten Abschnitts folgen.
Die informale Angabe der Rekursion können wir leicht in die allgemeine
Form „F(n) = G(F|n)“ des Rekursionssatzes bringen. Wir definieren hierzu
eine funktionale Klasse G : V → V durch
falls x = 0
{
ω,
G(x) = P(x(n)), falls x ist eine Funktion auf n + 1 P ω
∅, sonst
Der Rekursionssatz liefert uns eine funktionale Klasse F mit F(n) = G(F|n)
für alle n P ω. Offenbar gilt dann wie gewünscht F(0) = ω und F(n + 1) =
P(F(n)) für alle n P ω. Die Funktion G ist also die „offizielle“ Grundlage
der Rekursion. Informal präsentierte Rekursionen sind aber oft viel besser
lesbar, und auf die explizite Angabe von G kann in der Regel verzichtet
werden.
Funktionale Klassen sind durch Formeln definiert, und der Beweis des
Rekursionssatzes zeigt, wie wir eine F definierende Formel aus einer G
definierenden Formel konstruieren können. Für unser Beispiel lässt sich die
folgende Formel ϕ(n, x) in zwei Variablen n und x und dem Parameter ω
zur Definition von F = 〈P n (ω) | n P ω〉 verwenden:
ϕ(n, x) = „ nPω ∧ ∃g. g ist Funktion auf n + 1 = { 0, …, n }
∧ g(0) = ω
∧ (∀m < n g(m + 1) = P(g(m)))
∧ x = g(n)“.
Die Formel ϕ(n, x) besagt, dass die Menge x aus ω durch n-malige
Anwendung der Potenzmengenoperation entsteht. Es gilt
F = { (n, x) | ϕ(n, x) }.
Die Ausdrücke „x = P n (ω)“ und „y P P n (ω)“ können wir also frei verwen-
den, als Abkürzungen der Formeln ϕ(x, n) bzw. ∃x. ϕ(x, n) ∧ y P x der
Epsilon-Sprache. Analoge Überlegungen gelten für alle anderen Rekursio-
nen.
Dedekind-Strukturen
Wir wollen nun noch die gewonnene Struktur ω der natürlichen Zahlen cha-
rakterisieren. Hierzu definieren wir:
Definition (Dedekind-Struktur)
Seien x eine Menge, f : x → x eine Funktion, und sei e P x.
Dann heißt 〈x, f, e〉 eine Dedekind-Struktur (oder auch Peano-Struktur),
falls gilt:
(D1) e ¸rng(f ).
(D2) f ist injektiv.
(D3) Für alle y ⊆ x gilt: Ist e P y und f ″y ⊆ y, so ist y = x.
f heißt die Nachfolgerfunktion und e das Anfangselement der Struktur.
Übung
Sei 〈x, f, e〉 eine Dedekind-Struktur. Zeigen Sie:
(i) rng(f ) = x − { e }, (ii) f(a) ≠ a für alle a P x.
Beweis
Wir definieren i : ω → x rekursiv durch:
i(0) = e, i(S(n)) = f(i(n)) für alle n P ω.
Es ist nur noch zeigen, dass die Funktion i : ω → x bijektiv ist. Sei hierzu
y = rng(i). Dann ist e P y und f ″y ⊆ y, also ist y = x nach (D3). Also ist
i : ω → x surjektiv. Es bleibt also zu zeigen:
( + ) i : ω → x ist injektiv.
Beweis von ( + )
Annahme nicht. Dann existiert
n = min({ k P ω | es gibt ein m ≠ k mit i(k) = i(m) }).
Sei m P ω, m ≠ n, mit i(n) = i(m). Dann gilt n < m. Insbesondere ist
m ≠ 0 und folglich gibt es ein m′ mit m = S(m′). Es gilt
i(n) = i(m) = i(S(m′)) = f(i(m′)) ≠ e
nach (D1), also ist n ≠ 0. Sei also n = S(n′). Dann gilt
f(i(n′)) = i(S(n′)) = i(n) = f(i(m′)).
Also gilt i(n′) = i(m′) nach (D2), im Widerspruch zu n′ ≠ m′, n′ < n und
der minimalen Wahl von n.
Der Satz bedeutet nicht, dass es nur eine absolut gültige Interpretation der Eigenschaf-
ten (D1) − (D3) geben kann: Unter schwachen Voraussetzungen lässt sich ein Modell von
ZFC konstruieren, dessen − innerhalb des Modells bis auf Isomorphie eindeutig be-
stimmte − Dedekind-Struktur nicht isomorph zu 〈ω, S, 0〉 ist.
Aus den natürlichen Zahlen lassen sich nun schrittweise der Ring der ganzen
Zahlen Z, der Körper der rationalen Zahlen Q, und schließlich der Körper der
reellen Zahlen R konstruieren. Damit sind dann die wichtigsten Grundobjekte
der Mathematik als Mengen axiomatisch eingeführt.
Wir setzen zunächst:
Z = ω2 /,,
wobei die Äquivalenzrelation , definiert ist durch:
(n, m) , (n′, m′), falls n + m′ = n′ + m für alle n, m, n′, m′ P ω.
Wir schreiben suggestiv und ungefährlich auch n − m anstelle von (n, m)/,,
und weiter n anstelle von n − 0 sowie − n anstelle von 0 − n. Damit gilt also für
alle nP ω:
Beweisskizze
Wir dürfen annehmen, dass jeder angeordnete Körper K den Körper Q
umfasst. Denn zunächst identifizieren wir 0 Pω mit 0PK, 1 Pω mit 1P K,
2 Pω mit 1 + 1PK, 3 Pω mit 1 + 1 + 1P K, usw. Dann können wir die Menge
aller ± n/m P K, n, m P ω, m ≠ 0 mit Q identifizieren. Ist weiter K archime-
disch geordnet, so ist Q dicht in K, d. h. für alle x < y in K gibt es ein q P Q
mit x < q < y.
Seien also K1 , K2 vollständig angeordnete Körper. Dann ist Q jeweils dicht,
und wir können den gesuchten Isomorphismus f : K1 → K2 definieren
durch
f(x) = „das K2 -Supremum von { q P Q | q < x in K1 }“ für alle x P K1 .
Bereits an dieser Stelle sollte deutlich geworden sein, dass und wie die Mathe-
matik als Mengenlehre aufgefasst werden kann. Wir können Zahlen, Funktionen
und Relationen und alle zugehörigen mathematischen Operationen mengenthe-
oretisch interpretieren. Die Axiome erlauben uns großzügig die Bildung neuer
Strukturen, etwa die Bildung von Produkt- und Funktionenräumen wie R × R
und R R. Schon lange vor der Mengenlehre wurden geometrische Gebilde alge-
braisch interpretiert, und damit haben auch sie ein Abbild im Mengenuniversum.
Die Mengenlehre ist damit nicht nur eine mathematische Theorie mit eigenen
Fragen und einer eigenen Dynamik, sondern sie beleuchtet und präzisiert auch
die Grundlagen der Mathematik. Ein weiter Weg führt von Cantors Untersu-
chung von „Linearen Punktmannigfaltigkeiten“ (Teilmengen von R) zum heuti-
gen flexiblen iterativen Mengenbegriff, der „Mengen von Mengen“, „Mengen
von Mengen von Mengen“ usw. bildet und nutzt, um mathematisches Denken als
P-Struktur abzubilden, etwa in der Definition von (a, b) als { { a }, { a, b } }, von
0 als ∅, 1 als { 0 }, 2 als { 0, 1 }, …, n als { 0, …, n − 1 }. Keine griechischen Säulen,
sondern sachliche Stahlkonstruktionen mit großer Tragkraft.
Beweis
(i) Â (iii):
Sei M = { { i } × M i | i P I }. Dann erfüllt M die Voraussetzungen von
(AC). Eine Auswahlmenge für M gemäß (AC) ist ein Element von
× i P I M i, denn sie hat die Form { (i, x i) | i P I } mit xi P M i für alle i P I.
(iii) Â (ii):
Wir wenden (iii) an auf die Folge 〈x | x P M〉. Jedes f P ×x P M x ist dann
eine Funktion von M nach Í M mit f(x) P x für alle x P M.
(ii) Â (i):
Sei M eine Menge paarweise disjunkter nichtleerer Mengen. Sei
f : M → Í M wie in (ii). Dann ist rng(f ) eine Auswahlmenge für M.
Definitionen der Form „ein …“ können wir damit axiomatisch wie folgt recht-
fertigen. Gegeben seien eine „Vorratsmenge“ M und eine „Indexmenge“ I. (Ist
lediglich eine Folge 〈Ni | i P I〉 gegeben, so setzen wir M = Íi P I Ni .) Wir defi-
nieren nun eine Funktion f auf I informal durch:
(+) f(i) = „ein x P M mit ϕ(x, i)“ für alle i P I,
wobei die Formel ϕ(x, i) auch Parameter enthalten kann. Diese Definition können
wir formal rechtfertigen, wenn es für alle iPI ein xPM gibt mit ϕ(x, i). Denn sei:
M i = { x P M | ϕ(x, i) } für alle i P I.
Nach Voraussetzung sind alle Mengen M i nichtleer, und damit existiert nach (iii)
des Satzes ein fP ×iPI M i . Die informale Definition (+) ist damit letztendlich nur
eine suggestive und lesbare Form von: „Sei f P ×i P I M i .“
Übung
Obige Argumentation verwendet die Folge 〈M i | i P I〉.
Zeigen Sie ohne Verwendung von (Ers), dass diese Folge existiert.
Übung
Die folgenden Aussagen sind äquivalent zu (AC) in ZF:
(i) Jede Äquivalenzrelation auf einer Menge besitzt ein vollständiges
Repräsentantensystem.
(ii) Für alle surjektiven Mengen M N und alle g : M → N gibt es ein
h : N → M mit g + h = idN .
(iii) Für alle Mengen A, B, C, alle f : A → C und alle surjektiven
g : B → C existiert ein h : A → B mit f = g + h.
(iv) Sei M eine Menge, und sei R ⊆ M2 derart, dass es für alle x P M ein
y P M gibt mit x R y. Dann existiert ein f : M → M, sodass x R f(x)
für alle x P M gilt.
Elementare Mächtigkeitstheorie
Gilt |M| ≤ |N|, so sagen wir, dass die Mächtigkeit von M kleinergleich der Mäch-
tigkeit von N ist. Analoge Sprechweisen gelten für |M| = |N| und |M| < |N|. Ein
Objekt |M|P V, die Mächtigkeit von M, haben wir dabei noch nicht definiert.
Die drei Mächtigkeitsrelationen sind Klassenrelationen auf dem Universum.
Man sieht leicht ein, dass ≤ reflexiv und transitiv ist, dass = eine Äquivalenzrela-
tion ist, und dass < irreflexiv ist. Die erste Hürde, die bei der Untersuchung der
drei Mächtigkeitsrelationen auftaucht, ist die Antisymmetrie von ≤ bzgl. der
Gleichmächtigkeit oder gleichwertig (!) die Transitivität von <. Diese Hürde
wird durch den Satz von Cantor-Bernstein übersprungen. Wir geben zwei Be-
weise und zeigen dabei auch eine Klassenversion des Satzes.
Beweis
Es genügt, die folgende Inklusionsform zu beweisen:
(+) Seien A, B, C paarweise disjunkt mit |A ∪ B ∪ C| = |A|.
Dann gilt |A ∪ B ∪ C| = |A ∪ B|.
Beweis hierzu: Seien g1 : M → N und g2 : N → M injektiv. Seien
A = rng(g2 + g1 ), B = rng(g2 ) − A, C = N − rng(g2 ).
Dann ist M = A ∪ B ∪ C und |M| = |A|. Ist h : A ∪ B ∪ C → A ∪ B
bijektiv, so ist g2 − 1 + h : M → N bijektiv.
Beweis von (+): Sei f : A ∪ B ∪ C → A bijektiv. Wir setzen:
Z = > { D ⊆ A ∪ C | C ⊆ D, f ″D ⊆ D }.
Dann gilt C ⊆ Z, f ″Z ⊆ Z, und genauer f ″Z = Z − C. Also ist
f|Z : Z → Z − C bijektiv, und damit ist h = f|Z ∪ idA ∪ B − Z eine
Bijektion von A ∪ B ∪ C nach A ∪ B.
Obigen Beweis können wir nicht direkt übernehmen: Der Schnitt über alle
Teilklassen D ⊆ A ∪ C ist nicht durchführbar, da wir über Klassen nicht quantifi-
zieren dürfen.
Beweis
Wie für Mengen genügt es, die Aussage (a) zu zeigen. Wir setzen:
C* = { x PA ∪ C | es gibt eine Folge 〈x0 , …, xn 〉 mit:
x0 P C, x i + 1 = F(x i ) für alle i < n, xn = x }.
Dann gilt F″C* = C* − C (!) und H = F|C* ∪ IdA ∪ B − C* ist wie gewünscht.
Dieser Beweis verwendet die natürlichen Zahlen, greift aber nicht auf das Un-
endlichkeitsaxiom zurück. Denn „n ist eine natürliche Zahl“ und „es gibt eine
Folge 〈x1 , …, xn 〉“ lässt sich ohne Verwendung von ω in der P-Sprache ausdrük-
ken (siehe die Formel nat(x) oben). Zum Beweis des Satzes genügen elementare
Axiome, die die Existenz von ∅ und x ∪ { y } für alle Mengen x und y sichern. Wir
kommen im Kapitel über endliche Mengenlehre darauf zurück.
Beide Beweise konstruieren dieselbe Funktion:
Übung
Für Mengen A, B, C gilt C* = Z, wobei die Menge Z wie im ersten Beweis
und die Menge C* wie im zweiten Beweis definiert ist.
Übung
Es gibt ein bijektives F : V → V × V.
[ Id V × V : V × V → V und H : V → V × V mit H(x) = (x, ∅) sind injektiv. ]
Aufgrund des konstruktiven Charakters von Sätzen über Klassen lässt sich aus
dem zweiten Beweis eine Formel gewinnen, die ein bijektives F : V × V → V mit
Hilfe der beiden Injektionen IdV × V und H definiert. Es ist eine gute Übung her-
auszufinden, wie die Funktion F in diesem Fall aussieht.
Zahlreiche weitere Beispiele lassen sich angeben: Ist A eine Klasse und exi-
stiert ein injektives G : V → A, so liefert die Klassenversion des Satzes von Can-
tor-Bernstein eine Bijektion F : V → A, denn für alle Klassen A ist die Identität
auf A eine Injektion von A nach V.
Endlichkeit
Wir betrachten die folgenden natürlichen Ansätze, den Begriff der Endlich-
keit zu fassen:
Die Formen (b) und (c) machen keinen Gebrauch von ω. Wir zeigen in Z:
Beweis
(i) Â (ii):
Durch Induktion nach n P ω zeigt man: n ist Tarski-endlich.
(ii) Â (i):
Sei A = { y ⊆ x | es gibt ein n P ω mit |y| = |n| } . Nach
Voraussetzung existiert ein maximales z P A. Dann ist aber z = x (!).
Nach Definition von A gibt es also ein n P ω mit |x| = |n|.
Eine natürliche Variante der Tarski-Endlichkeit ist der folgende auf Russell
zurückgehende Begriff:
Definition (Russell-endlich)
Eine Menge x heißt Russell-endlich, falls für jedes dynamische A ⊆ P(x) gilt,
dass x P A. Dabei heißt A ⊆ P(x) dynamisch, falls ∅ ein Element von A ist
und zudem die folgende Bedingung erfüllt ist:
Für alle y P A mit y ≠ x gibt es ein a P x − y mit y ∪ { a } P A.
In der Axiomatik Z lässt sich die Äquivalenz dieser Variante zur Tarski-End-
lichkeit zeigen:
Übung
Für alle x sind (mit einem Beweis in Z) äquivalent:
(i) x ist Tarski-endlich.
(ii) x ist Russell-endlich.
[ (i) Â (ii): Sei A ⊆ P(x) dynamisch, und sei z maximal in A. Dann ist z = x.
(ii) Â (i): Sei A ⊆ P(x) nichtleer. Sei B = { z | es gibt ein y P A mit z ⊆ y }.
Annahme, A hat kein maximales Element. Dann ist B dynamisch. Also gilt x P B
und damit x P A nach Definition von B, Widerspruch. ]
Übung
Beweisen Sie diese Aussagen. Für welche Implikation wird das Auswahl-
axiom verwendet?
Es gilt nun:
Beweis
Sei x P Fin, und sei
A = { y ⊆ x | y P E }.
Nach Voraussetzung (i) ist A nichtleer. Wegen x Tarski-endlich gibt es ein
⊆-maximales z P A. Nach Voraussetzung (ii) ist dann aber offenbar z = x.
Also gilt x P E.
Beweis
Sei f eine Funktion auf M. Dann ist
D = { x P M | x ¸ f(x) } P P(M)
kein Element von rng(f ), denn wäre D = f(y) für ein y P M, so gilt
y P D gdw y ¸ f(y) gdw y ¸ D,
Widerspruch.
Aus der Konstruktion von R gewinnen wir (mit Hilfe des Satzes von Cantor-
Bernstein) ohne größere Schwierigkeiten:
(#) |R| = |P(N)|.
Im Licht dieser Gleichmächtigkeit ist eine reelle Zahl eine Teilmenge der natür-
lichen Zahlen (und umgekehrt). Der Satz von Cantor liefert:
Alternativ kann man das Argument des Beweises des Satzes von Cantor direkt
auf R anwenden, indem man in der bekannten Weise die Nachkommastellen ei-
ner abzählbaren Folge von reellen Zahlen in Dezimaldarstellung diagonalisiert.
Wegen der Wichtigkeit des Ergebnisses geben wir zwei weitere Beweise.
Schließlich folgt die Überabzählbarkeit von R auch sofort aus dem Baireschen
Kategoriensatz:
Für alle xP R ist { x } nirgendsdicht, und damit ist jede abzählbare Menge reel-
ler Zahlen mager. Die Überabzählbarkeit von R folgt damit sofort aus folgendem
Satz:
Beweis
Sei 〈Nn | n P ω〉 eine Folge nirgendsdichter Teilmengen von ] a, b [ .
Wir können leicht rekursiv eine ⊆-absteigende Folge 〈In | n P ω〉 von
abgeschlossenen nichtleeren Intervallen definieren mit
In ∩ Nn = ∅ für alle n P ω.
Dann ist jedes x P >n P ω In ≠ ∅ ein Element von ] a, b [ − Ín P ω Nn .
Wir werden die Theorie der Mächtigkeiten erst wieder aufgreifen, wenn wir
die Ordinalzahlen − das „Rückgrat der Mengenlehre“ − zur Verfügung haben.
Der Begriff der Wohlordnung bildet zusammen mit dem Begriff der Mächtigkeit
das Herz der Cantorschen Mengenlehre. Ist „Mächtigkeit“ elementarer, so stellt
sich in der durchgeführten Theorie der Wohlordnungsbegriff als der feinere und
stärkere heraus. Deswegen geht in der axiomatischen Mengenlehre die Untersu-
chung von Wohlordnungen und Ordinalzahlen der Untersuchung von Mächtig-
keiten und Kardinalzahlen voran.
Wohlordnungen
Wir werden gleich sehen, dass die Klasse WO aller Wohlordnungen eine
echte Klasse ist. Diese Reichhaltigkeit der Wohlordnungen ist bereits in einer
schwachen Teiltheorie von ZF beweisbar.
Oft schreiben wir auch einfach M statt 〈M, <〉, um die Notation zu vereinfa-
chen. Eine von M abhängige Ordnungsrelation ist dann stillschweigend mit da-
bei. Teilmengen von M ererben die Ordnung von M, soweit nichts anderes ge-
sagt wird: Ist M eine Wohlordnung und N ⊆ M, so ist N wohl geordnet durch die
Relation < ∩ N2 . Statt < ∩ N2 schreiben wir auch <|N. Wichtige Teilordnun-
gen sind die Anfangsstücke von Wohlordnungen: Für alle x P M heißt
Mx = { y P M | y < x }
das durch x gegebene Anfangsstück von M. Die Struktur 〈∅, ∅〉 ist eine Wohlord-
nung und ein Anfangsstück jeder nichtleeren Wohlordnung. Für jedes x ist wei-
ter 〈{ x }, ∅〉 eine Wohlordnung.
Seien M und N Wohlordnungen. Ein f : M → N heißt ordnungstreu, falls für
alle x,yP M mit x < y gilt, dass f(x) < f(y). Automatisch folgt dann für alle x, yP M
aufgrund der Linearität der Ordnung: Ist f(x) < f(y), so ist x < y.
Ist ein ordnungstreues f : M → N zudem bijektiv, so heißt f ein Ordnungs-
isomorphismus. Zwei Wohlordnungen M und N heißen gleichlang, in Zeichen
M ; N, falls ein Ordnungsisomorphismus f : M → N existiert. M heißt kür-
zer als N, in Zeichen M f N, falls ein y P N existiert mit M ; Nx .
Beweis
Für (a) beobachten wir: Gibt es ein x mit f(x) < x, so gibt es ein kleinstes x*
mit f(x*) < x*. Dann gilt f(f(x*)) < f(x*) nach Ordnungstreue, im Widerspruch
zur Minimalität von x*. Die anderen Aussagen können mit Hilfe von (a)
und der Wohlordnungseigenschaft bewiesen werden.
Beweis
Wir setzen f = { (x, y) P M × N | M x ; Ny }. Dann gilt:
(i) f : dom(M) → rng(f) ist ein Ordnungsisomorphismus.
(ii) dom(f) ist gleich M oder ein Anfangsstück von M.
(iii) rng(f) ist N oder ein Anfangsstück von N.
(iv) dom(f) = M oder rng(f ) = N.
Damit bezeugt f oder f − 1 , dass M ; N oder M f N oder N f M.
Wegen der Irreflexivität von f schließen sich die drei Fälle aus.
Beweis
Andernfalls existiert ein kleinstes x P M mit ¬ ϕ(x). Dann gilt aber ϕ(y) für
alle y < x, also gilt ϕ(x) nach (+), Widerspruch.
Wir werden die Rekursion unten in Klassenform für die Ordinalzahlen bewei-
sen, und verzichten deswegen auf einen Beweis an dieser Stelle, um Wiederho-
lungen zu vermeiden.
Zum Beweis des obigen Rekursionssatzes muss i. A. das Ersetzungsschema verwendet
werden. Dies ist nicht notwendig, wenn wir eine Menge U angeben können derart, dass
F(x) P U für alle x P M gilt. Vgl. hierzu den Beweis des Rekursionssatzes unten.
Enderweiterungen
Ist 〈M, <〉 eine Wohlordnung und ist y eine Menge mit y¸ M, so ist die Ender-
weiterung N von M um y, in Zeichen N = M + { y }, definiert durch
N = M ∪ { y },
<N = <M ∪ { (x, y) | x P M }.
Das Element y ist das größte Element der Wohlordnung N und es gilt Nx = M.
Die Konstruktion zeigt, dass es in WO keine maximalen Elemente bzgl. f gibt.
Für jede Menge N können wir uniform eine Menge y mit y ¸ N definieren:
Unter dem Fundierungsaxiom können wir y = N setzen. Ohne Rückgriff auf das
Fundierungsaxiom ist die Menge y = { z P x | z ¸ z } geeignet.
Amalgamierungen
Die Relationen < sind wohldefiniert auf W− und W. Leicht zu sehen sind die
folgenden Eigenschaften der beiden Amalgamierungen:
Hat also Γ kein f-größtes Element, so sind W− und W gleichlang. Hat Γ ein
f-größtes Element M, so ist W− gleichlang zu M und W ist gleichlang zu jeder
Enderweiterung von M und ein Element. Schließlich gilt: Ist Γ eine Kette von
Wohlordnungen, so sind W− und Í Γ gleichlang.
Ist Γ abgeschlossen unter Anfangsstücken, d. h. ist M x P Γ für alle M P Γ und
alle x P M, so ist !+ (Γ) = Γ/;.
Die Amalgamierung liefert:
Beweis
Annahme, WO ist eine Menge. Sei dann W die Amalgamierung von WO.
Dann gilt M f W für alle M P WO. Wegen W P WO also W f W,
Widerspruch.
Zum Beweis dieses Satzes genügt eine schwache Axiomatik. Wir brauchen we-
der (AC), (Ers) noch (Fun).
Die Hartogs-Wohlordnung
Ein wichtiger Spezialfall der Amalgamierung ist die Konstruktion von langen
Wohlordnungen nach Hartogs:
Definition (Hartogs-Wohlordnung)
Sei M eine Menge, und sei Γ = { 〈N, <〉 P WO | N ⊆ M }. Dann heißt !(Γ)
die Hartogs-Wohlordnung von M.
Beweis
zu (i):
Für alle N/; P W ist WN/; = { N′/; P W | N′/; <W N/; },
und die Funktion f : N → WN/; mit
f(x) = Nx /; für alle x P N
ist ein Ordnungsisomorphismus.
zu (ii):
Annahme, es gibt ein injektives g : W → M. Sei 〈N, <〉 die durch g
induzierte Wohlordnung auf N = rng(g). Dann sind W und N gleich-
lang, und es gilt N/; P W. Nach (i) sind also W und das Anfangsstück
WN/; von W gleichlang, Widerspruch.
gleichung |W| ≤ |P n (M)|. Verwendet man in der Konstruktion von W nur die
Wohlordnungs-Relationen < ⊆ M × M ⊆ P 2 (M) anstelle der geordneten Paare
〈N, <〉, so kann man hier W ⊆ P 4 (M) erreichen. Denn dann ist Γ ⊆ P 3 (M), und
damit ist W = Γ/; ⊆ P 4 (M).
Der Wohlordnungssatz
Satz (Wohlordnungssatz)
Jede Menge M lässt sich wohlordnen.
Beweis
Sei 〈W, <W 〉 die Hartogs-Wohlordnung von M. Wir definieren durch
Rekursion entlang a P W mit Hilfe von (AC) solange möglich:
f(a) = „ein x P M − { f(b) | b <W a }“ falls { f(b) | b <W a } ≠ M.
Dann existiert ein erstes nicht definiertes f(a*), denn andernfalls wäre
f : W → M injektiv. Nach Konstruktion ist dann f : Wa* → M bijektiv
und induziert damit eine Wohlordnung auf M.
Fixpunktsätze
Als ein weiteres Beispiel für eine Rekursion entlang der Hartogs-Wohlord-
nung beweisen wir den folgenden Fixpunktsatz:
Beweis
Sei 〈W, <W 〉 die Hartogs-Wohlordnung von P. Wir definieren eine Folge
〈xa | a P W〉 durch Rekursion entlang der Wohlordnung <W wie folgt:
Dann gibt es ein <W -kleinstes a* mit xa* + 1 = xa* , da andernfalls 〈xa | a P W〉
injektiv wäre. Nach Konstruktion gilt xa* ≥ y und f(xa* ) = xa* . Damit ist a* ein
Fixpunkt von f oberhalb von y.
Der Beweis ist in ZF − (Ers) durchführbar. Das Argument zeigt auch, dass der
Satz richtig bleibt, wenn „jede linear geordnete Teilmenge besitzt ein Supre-
mum“ durch „jede wohl geordnete Teilmenge besitzt ein Supremum“ ersetzt
wird. Diese Voraussetzung genügt, um den Limesschritt der obigen Rekursion
durchführen zu können.
Der Fixpunktsatz kann Maximalprinzipien wie das Zornsche Lemma ersetzen,
falls das Auswahlaxiom nicht gebraucht wird, und falls auf den Einsatz der Theo-
rie der Wohlordnungen verzichtet werden soll.
Beweis
Die Menge P′ = { x P P | y ≤ x, x ≤ f(x) } mit der von P ererbten Ordnung
erfüllt die Voraussetzungen des Fixpunktsatzes von Bourbaki.
Die leere Menge ist eine linear geordnete Teilmenge von P. Da ihr Supremum existiert,
hat P ein kleinstes Element 0P . Sicher gilt 0P ≤ f(0P ), und damit hat jede monotone Funk-
tion auf P mindestens einen Fixpunkt.
Ordinalzahlen
Definition (Ordinalzahldefinition)
Eine funktionale Klasse F : WO → V heißt eine Ordinalzahldefinition, falls
für alle M, N P WO gilt:
(+) F(M) = F(N) gdw M und N sind gleichlang.
Die Elemente des Wertebereichs von F heißen F-Ordinalzahlen. Eine
Ordinalzahldefinition G heißt repräsentierend, falls für alle M P WO gilt:
(++) G(M) ist eine zu M gleichlange Wohlordnung.
Gleichwertig zu (++) ist, wie man sich leicht klarmacht, die Bedingung:
(++)′ G(M) P WO und G(G(M)) = G(M).
Wir suchen eine kanonische repräsentierende Ordinalzahldefinition. Die er-
ste Beobachtung ist, dass wir eine repräsentierende Ordinalzahldefinition G aus
einer beliebigen Ordinalzahldefinition F gewinnen können. Wir schreiben
hierzu die F-Ordinalzahlen gemäß F mit kleinen griechischen Buchstaben und
definieren eine relationale Klasse < auf den F-Ordinalzahlen durch
α < β, falls M kürzer als N ist,
wobei M, N beliebig sind mit F(M) = α und F(N) = β. Dies ist wohldefiniert.
Zu (ii): Wäre α Pα, so gilt β Pβ für ein β Pα − nämlich für β = α. Dann ist aberPnicht ir-
reflexiv auf α, im Widerspruch zur Voraussetzung, dass P eine lineare Ordnung auf α ist.
Korollar
On ist eine echte Klasse.
Beweis
Andernfalls sei α = Í On. Dann ist α P On und weiter α ∪ { α } P On,
also α P Í On = α. Also gilt α P α, Widerspruch.
Eine verwandte Argumentation ist: Wäre On eine Menge, so wäre nach obigen
Eigenschaften On transitiv und durchPwohl geordnet. Also wäre On selbst eine
Ordinalzahl, d. h. On P On, Widerspruch.
Insgesamt ist die <-Relation eine relationale Klasse auf On, die die Ordinal-
zahlen linear ordnet. Weiter gilt die Wohlordnungseigenschaft für On, d.h. jede
nichtleere Teilklasse besitzt ein <-kleinstes Element.
Wir definieren:
Wie üblich sind die Begriffe Minimum, Supremum und striktes Supremum für
die lineare Ordnung < auf On definiert. Die Minima und Suprema können wir
durch einfache mengentheoretische Operationen ermitteln, wie der folgende
einfach zu beweisende Satz zeigt:
Der Repräsentationssatz
Beweis
Es genügt, für alle N P WO zu zeigen:
(+) Für alle x P N existiert genau ein α P On mit Nx ; α.
Dies zeigen wir durch Induktion nach x P N. Für alle y < x können wir nach
Induktionsvoraussetzung definieren:
F(y) = „das eindeutige α P On mit Ny ; α“.
Mit Hilfe von (Ers) ist M = { F(y) | y < x } eine Menge. Wir setzen nun
γ = strsup(M).
Dann ist Nx ; γ. Die Eindeutigkeit ist klar.
Charakterisierungen
Es gibt eine Vielzahl von Charakterisierungen der Ordinalzahlen, und wir be-
enden diesen Zwischenabschnitt mit einigen äquivalenten Formulierungen.
Übung
Die folgenden Aussagen sind äquivalent für alle x:
(i) x ist eine Ordinalzahl.
(ii) x ist transitiv und wird durch P linear geordnet (mit (Fun)).
(iii) x ist transitiv und wird durch ⊂ wohl geordnet.
(iv) x ist transitiv und wird durch ⊂ linear geordnet (mit (Fun)).
(v) x ist durch P wohl geordnet und für alle y P x gilt
y = { zPx | zPx }
d. h. y ist das durch y gegebene Anfangsstück von x.
(vi) x ist transitiv, alle Elemente von x sind transitiv, und jede nichtleere
Teilmenge von x besitzt ein P-minimales Element.
(vii) x ist transitiv, alle Elemente von x sind transitiv (mit (Fun)).
(viii) x ist transitiv und für alle y ⊂ x gilt: Ist y transitiv, so ist y P x.
Die Klasseninduktion für Ordinalzahlen ergibt sich wieder direkt aus der
Eigenschaft, dass nichtleere Klassen von Ordinalzahlen ein kleinstes Element
besitzen:
Rekursion
Wir zeigen nun den Rekursionssatz für On (und reichen damit auch den Be-
weis des Rekursionssatzes für Wohlordnungen nach).
Beweis
Sei ϕG (α, x) die folgende Formel:
„α P On und es gibt eine Folge f = 〈xβ | β < α 〉 mit:
(i) für alle β < α ist xβ = G(f|β), (ii) x = G(f )“.
Wir zeigen:
(+) F = { (α, x) | ϕG (α, x) } ist eine funktionale Klasse und es gilt (#).
Zum Beweis von (+) nennen wir eine Folge 〈xβ | β < α〉 wie in (i) eine
α-Approximation der Rekursion mit G, und zeigen durch Induktion über
αPOn:
(++) Es gibt genau eine α-Approximation f α = 〈xβ | β < α〉.
Beweis von (++)
Zur Eindeutigkeit:
Sind 〈xβ | β < α〉 und 〈yβ | β < α〉 α-Approximationen, so zeigt eine
einfache Induktion über β, dass xα = xβ für alle β < α gilt.
Zur Existenz:
f0 = ∅ ist die eindeutige 0-Approximation. Ist fα die eindeutige
α-Approximation, so ist fα + 1 = fα ∪ { (α, G(fα )) } die eindeutige
α + 1-Approximation. Im Limesschritt λ wird nun entscheidend das
Ersetzungsschema verwendet. Wir setzen:
fλ = Íα < λ f α,
wobei fα die eindeutige α-Approximation ist für alle α < λ.
Formal ist also fλ = Í H″a, wobei H die funktionale Klasse ist, die
jedem α < λ die eindeutige α-Approximation zuordnet, und jedem
anderen x die leere Menge.
Aus (++) folgt, dass F = { (α, x) | ϕG (α, x) } eine funktionale Klasse ist. Eine
einfache Induktion nach α P On zeigt, dass (#) gilt.
Ist F′ eine weitere funktionale Klasse mit (#), so zeigt eine abschließende
Induktion nach α P On, dass F(α) = F′(α) für alle α P On gilt.
Es ist instruktiv, sich die effektive Umwandlung von Formeln an einem Bei-
spiel klar zu machen. Wir betrachten hierzu die kumulative von Neumann-Hier-
archie 〈Vα | α P On〉:
Ist F die Lösung der Rekursionsgleichung „F(α) = G(F|α) für alle α P On“,
so gilt F(0) = ∅, F(α + 1) = P(F(α)) für alle α P On und F(λ) = Íα < λ F(α)
für alle Limiten λ. Wie üblich schreiben wir Vα statt F(α).
Formeln wie „x = Vα “, „x P Vα “ usw. können wir nun frei verwenden,
ohne dabei die P-Sprache der Mengenlehre zu verlassen. Gleiches gilt für
„x P V* “, denn dies ist die Formel „es gibt ein α P On mit x P Vα “.
Die Formel „x = Vω “ ist zum Beispiel äquivalent zur folgenden Formel
ϕ(x) mit ω als Parameter:
„es gibt eine Funktion f mit:
dom(f) = ω, f(0) = ∅, f(n + 1) = P(f(n)) für alle n P ω, x = Í rng(f)“.
Die Formel ϕ(x) kann nun mit einigem Aufwand als P-Formel ausgeschrie-
ben werden.
Hat man diese Möglichkeit der Auflösung einer Rekursion einmal verinner-
licht, wird man gerne zu Ausdrücken wie „x = Vω “ und den zugehörigen oft infor-
mal − d.h. ohne Erwähnung der funktionalen Klasse G − präsentierten Rekursio-
nen zurückkehren wollen. Alles bleibt wie gehabt, aber wir haben die Rekursion
im axiomatischen Rahmen streng gerechtfertigt. Insgesamt ist dies ein Triumph
der Ausdruckskraft der P-Sprache unter den ZFC-Axiomen. Der Beweis zeigt,
dass wir mit dem Ersetzungsschema ein starkes Axiomenschema brauchen, um
die Rekursion formal abzusichern. Mit anderen Worten: Das Ersetzungsschema,
das in der ursprünglichen Axiomatik von Zermelo ja noch fehlte, findet man un-
weigerlich, wenn man die von Cantor eingeführte transfinite Rekursion nicht
nur intuitiv, sondern als beweisbaren Satz begreifen möchte.
Beweis
Wir definieren rekursiv für n < ω:
x0 = x
Í xn für alle n P ω.
xn + 1 =
Dann ist y = Ín P ω xn wie gewünscht.
Beweis
Sei x P A beliebig. Ist x ∩ A = ∅, so ist x P-minimal. Andernfalls sei
y = t. c.(x) ∩ A. Nach (Fun) besitzt y ein P-minimales Element z.
Dann gilt z P A und z ∩ A = ∅, also ist z ein P-minimales Element von A.
Der Umweg über den transitiven Abschluss ist in der Tat notwendig:
Übung
Geben Sie eine Klasse A, ein x P A und ein P-minimales Element y von
x ∩ A an derart, dass y nicht P-minimal in A ist.
Satz (Hierarchiesatz)
Es gilt V = V*, d. h. für alle x existiert ein α P On mit x P Vα .
Beweis
Sei A = V − V*. Annahme, A ≠ ∅. Sei dann x P A P-minimal in A.
Dann gilt aber x ⊆ V*. Für alle y P x sei also
F(y) = „das kleinste α P On mit y P Vα “.
Sei α* = supy P x F(y) (nach (Ers)). Dann gilt x ⊆ Vα* , also ist x P Vα* + 1 .
Damit ist x P V*, Widerspruch.
Übung
In ZF − (Fun) + „V = V* “ gilt das Fundierungsaxiom.
Damit haben wir im Rahmen unserer Axiomatik ein geordnetes Bild des Uni-
versums entwickelt: Das Universum V „entsteht“ aus der leeren Menge durch
iterierte Anwendung der Potenzmengenbildung und Vereinigung entlang der
Ordinalzahlen. Die Klasse V* = Íα P On Vα können wir ohne Fundierungsaxiom
definieren, aber erst mit diesem Axiom können wir V = V* zeigen und damit ein
geordnetes Bild des Universums entwerfen. Es ist oft gesagt worden, dass die
Gleichung „V = V*“ die intendierte Semantik der axiomatischen Mengenlehre
darstellt. Es ist bemerkenswert, dass ein Axiomensystem existiert, dessen Mit-
glieder nicht über Wohlordnungen und Ordinalzahlen sprechen, das aber eine
ausschöpfende transfinite Klassenhierarchie in sich trägt. Das Fundierungs-
axiom spielt hier eine Schlüsselrolle, und es ist deswegen ein allgemein akzeptier-
tes Axiom der Mengenlehre.
Wir verweisen den Leser in diesem Zusammenhang auch auf [ Scott 1974 ] für
eine gleichwertige Axiomatisierung der Mengenlehre, die die Intuition „V = V* “
direkter beschreibt.
Ein Prinzip, das dem Fundierungsaxiom widerspricht, diskutieren wir kurz am Ende
des Kapitels über wohlfundierte Relationen. Dieses Prinzip, das sog. Antifundierungs-
axiom, lässt sich aber letztendlich auch wieder innerhalb von ZFC durch geeignete Mo-
dellkonstruktionen analysieren, und sprengt in diesem Sinne die Interpretationskraft von
ZFC nicht.
Der Beweis der Gleichung „V = V*“ verwendet an keiner Stelle das Auswahl-
axiom. Die Vα -Hierarchie schöpft also das Universum aus, egal, ob wir die Exi-
stenz von abstrakten Auswahlmengen fordern oder nicht. Im entscheidenden
Nachfolgerschritt von Vα nach Vα + 1 sammeln wir alle Teilmengen von Vα , die
das Universum zu bieten hat. Darin ist keine Aussage enthalten, wie viele oder
welche Teilmengen im Universum existieren. Die Idee, in einer Hierarchiekon-
struktion statt „allen Teilmengen“ nur all diejenigen Teilmengen aufzunehmen,
deren Existenz von den Axiomen explizit gefordert wird, führt zu Gödels kon-
Beweis
A ist Menge gdw es gibt ein α P On mit A P Vα gdw es gibt ein α P On mit
A ⊆ Vα gdw A ist beschränkt in der Vα -Hierarchie.
Übung
In ZF − (Fun) gilt: Ist A ⊆ V* unbeschränkt, so ist A eine echte Klasse.
Übung
In ZFC − (Fun) sind äquivalent:
(i) (Fun).
(ii) Es gibt kein f : ω → V mit f(n + 1) P f(n) für alle n P ω.
[ Im Beweis von (ii) Â (i) wird das Auswahlaxiom gebraucht. ]
Die Rangfunktion
In ZFC ist die Rangfunktion auf ganz V definiert, und wir wollen dies immer
annehmen, wenn wir nicht explizit das Fundierungsaxiom betrachten.
Die Rangfunktion ist ein Maß für die Komplexität einer Menge. Wir erschlie-
ßen diese Funktion durch eine Reihe von Übungen.
Übung
Für alle α P On und alle x, y gilt:
(i) rang(α) = rang(Vα ) = α
(ii) x ⊆ y impliziert rang(x) ≤ rang(y)
(iii) x P y impliziert rang(x) < rang(y)
(iv) t. c.(x) ⊆ Vrang(x) und damit also rang(t. c.(x)) = rang(x)
(v) rang(x) = strsup y P x rang(y) (= sup y P x rang(y) + 1).
Übung
Sei F : V → On eine funktionale Klasse mit F(x) = strsupy P x F(y) für alle x.
Dann ist F(x) = rang(x) für alle x.
Übung
Für alle x gilt rang″t. c.(x) = rang(x).
Für jedes x hat also t. c.(x) ⊆ Vrang(x) keine Lücken in der Vα -Hierarchie bis
hinauf zu rang(x). Diese Eigenschaft charakterisiert die Rangfunktion:
Übung
Sei F : V → On, und es gelte F″t. c.(x) = F(x) für alle x.
Dann gilt F(x) = rang(x) für alle x.
Übung
Sei x eine transitive Menge. Wir definieren rekursiv für alle α P On:
A 0 = ∅, A α + 1 = P(A α ) ∩ x, A λ = Íα < λ A α.
Dann gilt:
(a) A α = Vα ∩ x für alle α P On
(b) A α = x für alle α ≥ rang(x)
(c) A α + 1 − A α ≠ ∅ für alle α < rang(x)
Speziell lässt sich der Rang einer Menge y aus ihrem transitiven Abschluss
x = t. c.(y) errechnen: Der Rang von y ist gleich dem Rang von x, und dieser ist
das kleinste α mit A α = x. Anders formuliert: Für die Komplexität einer Menge
x spielen nur die Mengen in t. c.(x) eine Rolle.
Übung
Äquivalent zu (Fun) über ZF ist die Aussage:
Für alle x gibt es ein f : x → On, sodass für alle y, z P x gilt:
y P z impliziert f(y) < f(z).
Ist A eine nichtleere Klasse, so ist Acut eine nichtleere Menge, denn es gilt
cut
A ⊆ Vα + 1 für α = min({ α P On | es gibt ein x P A mit rang(x) = α }, und
Acut enthält alle rangminimalen Elemente von A (und damit mindestens ein
Element von A). Genauer gilt Acut = (Vα + 1 − Vα ) ∩ A, wobei α minimal ist
mit Vα + 1 ∩ A ≠ ∅.
Beim Arbeiten mit Äquivalenzrelation auf echten Klassen sind die Äquivalenz-
relationen oft selbst echte Klassen, und wir können dann nicht frei mit ihnen
operieren. Die Schnitt-Methode liefert eine Möglichkeit, die Äquivalenzklassen
zu Mengen zurückzuschneiden, ohne ihre charakteristische Information zu ver-
lieren. Die so gestutzten Äquivalenzklassen können so als abstrakte (Rechen-)
Zeichen verwendet werden:
Beweis
Für alle x P A sei F(x) = { z P A | x , z } cut . Dann ist F wie gewünscht:
Übung
Für eine relationale Klasse R sind dom(R) und rng(R) wie für Mengen-
relationen definiert, d. h. dom(R) = { x | es gibt ein y mit (x, y) P R } und
rng(R) = { y | es gibt ein x mit (x, y) P R }.
Sei nun E ⊆ V2 eine relationale Klasse. Dann gibt es relationale Klassen L
und R mit den Eigenschaften:
(i) Für alle x ist { y | y L x } eine Menge und es gilt rng(L) = rng(E).
(ii) Für alle x ist { y | x R y } eine Menge und es gilt dom(R) = dom(E).
Das Kollektionsschema
Eine weitere Anwendung des Zurückschneidens von echten Klassen ist das
folgende Kollektionsschema, das eine Alternative zum Ersetzungsschema dar-
stellt. Wir werden es im nächsten Abschnitt gewinnbringend verwenden.
Kollektionsschema (Kol)
Für jede Formel ϕ(u, v, p1 , …, pn ) gilt:
∀x, p1 , …, pn ∃y ∀u P x. ∃v ϕ(u, v, p1 , …, pn ) → ∃v P y ϕ(u, v, p1 , …, pn ).
Das Kollektionsschema liefert uns also für jede Menge x eine Menge y, die für
alle u P x einen Zeugen für die Eigenschaft ϕ(u, v) als Element enthält, falls es
überhaupt irgendeinen solchen Zeugen gibt. Alle derartigen Zeugen bilden i. A.
eine echte Klasse C = { v | es gibt ein u P x mit ϕ(u, v) }, aber durch das Kollekti-
onsschema können wir die Klasse C so zu einer Menge y beschränken, dass sich
für jedes u P x mindestens ein Zeuge in y befindet, wenn es überhaupt einen zu u
gehörigen Zeugen gibt.
Selbst unter (AC) gibt es keinen unmittelbaren Beweis für diese Zeugenbeschränkung.
Wir können nicht einfach setzen:
f(u) = „ein v mit ϕ(u, v)“ für alle u P v, y = rng(f ),
denn das Auswahlaxiom erlaubt uns nur aus Mengen zu wählen, und die von u abhängigen
Klassen { v | ϕ(u, v) } sind im Allgemeinen echt.
Satz
Das Kollektionsschema ist in ZF beweisbar.
Beweis
Sei ϕ(u, v) eine Formel wie im Kollektionsschema (wir unterdrücken die
Parameter). Sei x eine beliebige Menge. Wir setzen:
y = Íu P x { v | ϕ(u, v) } cut.
Die Menge y existiert nach Ersetzungsschema, denn es gilt y = Í H″x für
die funktionale Klasse H : V → V mit H(u) = { v | ϕ(u, v) } cut für alle u.
Weiter ist y wie gewünscht, denn ist { v | ϕ(u, v) } ≠ ∅, so ist auch
{ v | ϕ(u, v) } cut ≠ ∅.
Umgekehrt gilt:
Übung
In ZF − (Ers) + (Kol) gilt das Ersetzungsschema.
[ Der Beweis verwendet eine schwache Form der Aussonderung. Anders als das
Ersetzungsschema impliziert das Kollektionsschema das Aussonderungsschema nicht.]
Wir werden im Kapitel über wohlfundierte Relationen noch einmal auf das
Fundierungsaxiom zurückkommen, und insbesondere eine Induktion und Re-
kursion über die Relation P diskutieren und beweisen.
Ordinalzahlarithmetik
Definition (Ordinalzahlarithmetik)
Wir definieren rekursiv für α, β P On und Limiten λ:
α + 0 = α, α + (β + 1) = (α + β) + 1, α + λ = sup β < λ α + β,
α ⋅ 0 = 0, α ⋅ (β + 1) = (α ⋅ β) + α, α ⋅ λ = sup β < λ α ⋅ β,
α 0 = 1, α β + 1 = α β ⋅ α, αλ = sup β < λ α β .
Die Addition und Multiplikation ist nicht kommutativ. Es gilt das Distributiv-
gesetz α(β + γ) = αβ + αγ, dagegen ist i.A. (α + β)γ ≠ αγ + βγ. Für die Exponentia-
tion gilt αβ + γ = αβ + αγ und (αβ )γ = αβγ , dagegen ist i. A. (αβ)γ ≠ αγ βγ .
Alle drei Operationen lassen sich auch ohne die Verwendung von Rekursion
einführen: Die Addition lässt sich über die Summe zweier Wohlordnungen defi-
nieren, die Multiplikation über die Produktbildung, und die Exponentiation
über die natürliche Exponentiation zweier Wohlordnungen nach Hausdorff und
Hessenberg:
Es gilt
o. t.(〈S, <S 〉) = α + β, o. t.(〈P, <P 〉) = α ⋅ β, o. t.(〈E, < E 〉) = α β ,
wie man unschwer durch Induktion nach β bei fest gehaltenem α zeigt.
Beweis
(i) Â (ii): Für alle 2 ≤ γ < λ gilt λ ≤ γ λ = sup β < λ γ β ≤ (i) λ.
(ii) Â (iii): Ist trivial.
(iii) Â (i): Sei 2 ≤ γ < λ mit λ = γ λ . Dann ist λ additiv abgeschlossen, da
α + α ≤ 2α + 2α = 2α + 1 ≤ γ α + 1 < γ λ = γ für alle α < λ.
Weiter ist λ multiplikativ abgeschlossen, denn für alle α < λ ist
α ⋅ α ≤ 2α ⋅ 2α = 2α + α ≤ γ α + α < α λ = λ.
Seien nun α, β < λ. Dann ist
α β ≤ (γ α )β = γ α ⋅ β ≤ γ λ = λ.
Definition (ε-Zahl)
Eine Ordinalzahl α > ω heißt eine Epsilon-Zahl, falls α = ω α .
Zum Beweis wählt man α1 maximal, sodass ηα1 ≤ γ. Nun wählt man ν1 maximal
mit ηα1 ν1 ≤ γ. Analog seien nun α2 und ν2 maximal, sodass ηα1 ν1 + ηα2 ν2 ≤ α.
Iteration dieses Verfahrens liefert die Darstellung (#). Die Eindeutigkeit ist klar.
Übung
Zwei Zahlen γ und δ in Normaldarstellung (zu einer gemeinsamen Basis η)
können ihrer Größe nach verglichen werden, indem man ihre Exponenten
und Koeffizienten in der offensichtlichen Weise von links nach rechts
auswertet.
so dargestellten Zahlen wie folgt: Hat n weniger Faktoren als m, so sei n <* m.
Haben n und m gleichviele Faktoren, so entscheidet die Größe des ersten unter-
schiedlichen Faktors. So ist 3 <* 2 ⋅ 2 und 2 ⋅ 2 ⋅ 5 <* 2 ⋅ 3 ⋅ 3. Die Ordnung <*
beginnt mit der Reihe der Primzahlen 2, 3, 5, …, gefolgt von 4, 6, 10, …
Übung
(i) Für alle n ≥ 1 gilt o. t.({ m | m <* 2n + 1 }) = ωn .
(ii) Es gilt o. t.(〈M, <*〉) = ωω .
Der Leser vergleiche die Ordnung <* mit der exponentiellen Ordnung < E
auf E = { f P ω ω | f(n) ≠ 0 für höchstens endlich viele n }, die wir als Ordnung
auf N = ω − { 0 } auffassen können, wenn wir ein f P E mit Πn P ω pn f(n) P N iden-
tifizieren, wobei 〈pn | n P ω〉 die monotone Aufzählung aller Primzahlen ist,
also p0 = 2, p1 = 3, usw. (Hier ist wie üblich Πn P ω 0 = 1.) Auch diese Ordnung
hat, wie wir wissen, den Typ ωω .
Sei ε0 die erste ε-Zahl, also ε0 = supn P ω x n , wobei x0 = ω und xn + 1 = ωxn für alle
n P ω. Ist α < ε0 und α = ωα 1 n1 + ... + ωα k nk die Cantorsche Normaldarstellung
von α zur Basis ω, so ist α 1 < α. Diese Eigenschaft ermöglicht uns, α < ε1 durch
eine natürliche Zahl n zu kodieren. Hierzu sei wieder 〈pn | n P ω〉 die monotone
Aufzählung aller Primzahlen.
Eine rekursive Kodierung aller Ordinalzahlen unterhalb von ε0 durch natürli-
che Zahlen erhalten wir wie folgt:
Es gilt c(n) = ωc(0) e0 # ωc(1) e1 # ... # ωc(k) ek für die Hessenberg-Summe # (s. u.).
Es ist instruktiv, die ersten Werte c(0), c(1), c(2), … zu berechnen. Es gilt:
Übung
Es gilt c + b = id|ε0 und b + c = id|ω.
Die Funktion b ist also eine bijektive Kodierung der Ordinalzahlen unterhalb
von ε0 durch natürliche Zahlen, und c ist die zugehörige Dekodierung.
Paarungsfunktionen
Die funktionale Klasse Γ ist eine Bijektion von On × On nach On. Daneben ist
auch Γ|α2 : α2 → α bijektiv für viele Ordinalzahlen α. Neben 0 und 1 sind dies
genau die multiplikativ abgeschlossenen unendlichen Zahlen:
Beweis
Vorab halten wir fest: Es gilt Γ(0, α) = Γ″ α2 für alle α. Mit g(α) = Γ(0, α)
gilt
g(0) = 0, g(α + 1) = g(α) + α + α + 1, g(λ) = supα < λ g(α).
Weiter ist Γ(0, λ) ≤ λ gleichwertig zu Γ(0, λ) = λ.
Die Äquivalenz von (i) und (ii) ist klar.
zu (ii) Â (iii):
Offenbar ist λ ein Limes. Für alle α < λ ist α + α ≤ g(α + 1) ≤ g(λ) ≤ λ,
also ist λ additiv abgeschlossen. Weiter ist λ auch multiplikativ
abgeschlossen, denn für alle α < λ lässt sich α × α unter der multiplikati-
ven Ordnung ordnungstreu in die Γ-Aufzählung von λ × λ einbetten
(betrachte das Segment { (β, γ) | α ≤ β < α + α, γ < α } von λ × λ).
zu (iii) Â (ii):
Der Fall λ = ω ist klar. Sei also λ > ω. Sei α < λ. Dann gibt es ein additiv
abgeschlossenes β mit α < β < λ. Dann ist g(α) ≤ β ⋅ β < λ, da sich die
Γ-Ordnung auf α × α ordnungstreu in die multiplikative Ordnung auf
β × β einbetten lässt (die Γ-Ordnung auf dem Produkt α × α besteht aus
α-vielen Summanden der Länge kleinergleich α + α + 1 < β). Also ist
g(λ) = supα < λ g(α) ≤ λ.
Aus der Cantorschen Normaldarstellung zur Basis ω erhalten wir eine weitere
Paarungsfunktion, die uns Paarungsbijektionen für alle additiv abgeschlossenen
Ordinalzahlen liefert und in diesem Sinne der Γ-Funktion überlegen ist:
Die funktionale Klasse & : On2 → On ist bijektiv und monoton in beiden Ar-
gumenten. Leicht zu sehen ist weiter:
Übung
Es gibt eine funktionale Klasse P : On → V mit: Für alle α ≥ ω ist P(α) eine
Bijektion von α2 nach α.
Die Hessenberg-Summe ist keine Bijektion, aber dennoch nützlich und natür-
lich: Wir ordnen die Summanden zweier Zahlen in Normaldarstellung nach ab-
fallenden Exponenten, und summieren dann mit der üblichen Addition auf.
Beispiele
ω2 # ω4 # ω3 # ω4 = ω4 ⋅ 2 + ω3 + ω2
ω2 + ω4 + ω3 + ω4 = ω4 ⋅ 2.
Übung
(i) Die Hessenberg-Summe # ist kommutativ und assoziativ.
(ii) Für alle α, β P On ist α + β ≤ α # β.
(iii) Für alle γ P On ist { (α, β) | α # β = γ } endlich.
(iv) # ist streng monoton in der zweiten Kompoente, d. h. für alle α, β, γ
mit β < γ ist α # β < α # γ.
(v) Ist F : On2 → On kommutativ und streng monoton, so gilt
F(α, β) ≥ α # β für alle α, β.
Übung
Für alle α 0 , …, α n P On gilt:
α 0 # … # α n = sup({ o. t.( Íi ≤ n a i ) | a i ⊆ On, o. t.(a i ) = α i für alle i ≤ n }).
Eine endliche Menge von Ordinalzahlen können wir mit einer strikt aufstei-
genden endlichen Folge von Ordinalzahlen identifizieren. Unter dieser Identifi-
kation ist also < ω [ On ] eine Teilklasse von < ω On. Umgekehrt ist eine endliche
Folge von Ordinalzahlen eine endliche Teilmenge von On2 , die wir durch Kodie-
rung mit Hilfe von Γ oder & als eine endliche Menge von Ordinalzahlen auffas-
sen können. Die Klassenversion des Satzes von Cantor-Bernstein liefert also eine
Bijektion zwischen < ω [ On ] und < ω On.
Wir geben nun noch einfache Bijektionen von < ω [On] nach On und von < ω On
nach On an.
Nach dem Satz über die Cantorsche Normalform zur Basis 2 ist die funktio-
nale Klasse Γ fin : < ω [ On ] → On bijektiv. Es gilt Γ fin (0) = 0 und Γ fin ({ 0 }) = 1.
Die Klasse < ω On aller endlichen Folgen von Ordinalzahlen können wir analog
zu On2 behandeln:
Übung
Bestimmen Sie diejenigen α P On, für die gilt:
(i) Γ fin |< ω [ α ] : <ω
[ α ] → α ist bijektiv,
(ii) Γ seq |< ω α : <ω
α → α ist bijektiv,
<ω
wobei [ α ] = { x ⊆ α | x ist endlich } und < ω α = { f : n → α | n P ω }.
Innerhalb der Klasse der Ordinalzahlen können wir die Sprungstellen der
Mächtigkeit auszeichnen:
Definition (Nachfolgeroperation κ+ )
Für κ P Kard sei
κ + = „das kleinste µ P Kard mit κ < µ“.
In ZFC ist die Existenz von Nachfolgerkardinalzahlen einfach zu zeigen. Denn für eine
Kardinalzahl κ sei µ = |P(κ)|. Dann ist µ eine Kardinalzahl größer als κ, und dann existiert
auch eine kleinste Kardinalzahl, die größer als κ ist.
Weiter gilt:
Definition (Aleph-Reihe)
Es sei 〈ℵα | α P On〉 die monotone Aufzählung aller unendlichen Kardinal-
zahlen, d. h. wir definieren rekursiv:
ℵ0 = ω, ℵα + 1 = (ℵα )+ , ℵλ = supα < λ ℵα .
Statt ℵα schreiben wir gleichwertig auch ω α .
Die Konfinalität
Die Konfinalität einer Limesordinalzahl λ gibt an, wie schnell wir λ durch
kleinere Ordinalzahlen erreichen können. Wir führen hierzu einige Begriffe und
Sprechweisen ein.
Anders formuliert: Die monotone Aufzählung 〈αβ | β < γ〉 ist der eindeutige
Ordnungsisomorphismus zwischen γ = o. t.(A) und A.
Hier steht cf für engl. cofinality. Offenbar gilt immer cf(λ) ≤ λ, denn 〈α | α < λ〉
ist strikt aufsteigend konfinal in λ.
Lemma (Kopplungslemma)
Sei λ eine Limesordinalzahl, und sei 〈αβ | β < δ〉 aufsteigend konfinal in λ.
Dann ist cf(λ) = cf(δ).
Beweis
Offenbar ist δ ein Limes.
zu cf(λ) ≤ cf(δ):
Sei 〈βγ | γ < cf(δ)〉 s. a. k. in δ. Dann ist 〈αβγ | γ < cf(δ)〉 a. k. in λ. Also ist
cf(λ) ≤ cf(δ).
zu cf(δ) ≤ cf(λ):
Sei 〈ηξ | ξ < cf(λ)〉 s. a. k. in λ. Für ξ < cf(λ) sei:
γ(ξ) = „das kleinste β < δ mit ηξ ≤ αβ “.
Dann ist die Folge 〈γ(ξ) | ξ < cf(λ)〉 aufsteigend konfinal in δ und damit
cf(δ) ≤ cf(λ).
Insbesondere ist also cf(ℵλ ) = cf(λ) für jede Limesordinalzahl λ, denn die Folge
〈ℵα | α < λ〉 ist s. a. k. in ℵλ .
Beweis
zu (i):
Die Aussage ist eine Umformulierung der Definition.
zu (ii):
Wir setzen
µ = min({ |A| | A ⊆ λ, sup(A) = λ }).
Wegen |A| ≤ o. t.(A) für alle A ⊆ λ gilt µ ≤ cf(λ). Für die andere
Ungleichung sei A ⊆ λ mit sup(A) = λ und |A| = µ. Sei f : µ → A
bijektiv. Wir definieren rekursiv für β < µ:
αβ = „das kleinste α P A mit α ≥ f(β) und α > αγ für alle α < β“.
Wegen β < µ ≤ cf(λ) ist 〈αγ | γ < β〉 beschränkt in λ, also existiert αβ .
Dann ist 〈αβ | β < µ〉 s. a. k. in λ. Also ist cf(λ) ≤ µ.
zu (iii):
Sei 〈αβ | β < cf(λ)〉 s. a. k. in λ. Dann ist cf(cf(λ)) = cf(λ) nach dem
Kopplungslemma.
zu (iv):
Offenbar ist cf(λ) ≥ ω. Nach (ii) ist cf(λ) eine Kardinalzahl und nach
(iii) ist cf(λ) regulär.
Definition (µ-zerlegbar)
Seien κ, µ Kardinalzahlen. κ heißt µ-zerlegbar, falls eine Zerlegung
〈xα | α < µ〉 von κ existiert mit |xα | < κ für alle α < µ.
Wir zeigen:
Beweis
zu µ ≤ cf(κ):
Sei 〈αβ | β < cf(κ)〉 s. a. k. in κ. Wir setzen:
y β = αβ − Íγ < β αγ für alle β < cf(κ).
Dann ist 〈yβ | β < cf(κ)〉 eine Folge paarweise disjunkter Mengen mit
Vereinigung κ. Streichen von leeren Mengen liefert eine Zerlegung von
κ der Länge ≤ cf(κ).
zu cf(κ) ≤ µ:
Sei 〈xα | α < µ〉 eine Zerlegung von κ mit |xα | < κ für alle α < µ.
Wir setzen:
ηα = o. t.(xα ) für alle α < µ.
Ist ηα = κ für ein α < µ, so ist cf(κ) ≤ |xα | < µ und wir sind fertig. Es
gelte also ηα < κ für alle α < µ. Sei
η* = supα < µ ηα ≤ κ.
Dann gilt:
κ = |Íα < µ xα | ≤ |µ × η*| P { µ, |η*| }.
Also ist κ = µ oder κ = |η*| = η*. Im ersten Fall ist cf(κ) ≤ κ = µ. Im
zweiten Fall ist { ηα | α < µ } ⊆ κ unbeschränkt in κ, also cf(κ) ≤ µ.
Beweis
Sei A ⊆ κ+ mit |A| ≤ κ. Wir zeigen, dass sup(A) < κ+ ist.
Für jedes β P A sei, mit (AC),
fβ = „ein injektives f : β → κ “.
Sei g : A → κ injektiv. Wir definieren h : sup(A) → κ × κ durch:
h(γ) = (g(β), fβ (γ)), wobei β = min(A − (γ + 1)) für alle γ < sup(A).
Dann ist h injektiv, also |sup(A)| ≤ |κ × κ| = |κ|.
Elementare Kardinalzahlarithmetik
Die Addition und die Multiplikation von Kardinalzahlen ist kommutativ, asso-
ziativ, und es gelten die Distributivgesetze. Für die Exponentiation gelten die üb-
lichen Rechenregeln:
(κ ⋅ µ)λ = κλ ⋅ µλ , (κ µ ) λ = κµ ⋅ λ , κ µ ⋅ κ λ = κ µ + λ .
Diese Regeln beweist man leicht durch direkte Konstruktion von Bijektionen.
Weiter gilt:
|P(κ)| = 2κ für alle κ.
Wegen |R| = |P(ω)| ist also |R| = 2ω . Mit dem Satz von Cantor erhalten wir:
Korollar
Für alle κ ist κ < 2κ .
Wir werden später zeigen, dass (GCH) in ZFC nicht widerlegbar und (CH) in
ZFC nicht beweisbar ist. Beide Hypothesen sind unabhängig von ZFC.
Im Gegensatz zur Exponentiation ist die Addition und Multiplikation von un-
endlichen Kardinalzahlen trivial. Hierzu zeigen wir vorab:
Beweis
Annahme nicht für ein minimales κ ≥ ω. Sei 2 ≤ γ < κ mit γ κ > κ.
Wegen γ κ = supα < κ γ α existiert ein γ < α < κ mit γ α ≥ κ.
Dann gilt (mit Ordinalzahlexponentiationen):
||γ||α| | = |γ α | ≥ κ > α ≥ |α|,
im Widerspruch zur Minimalität von κ (denn 2 ≤ |γ| < |α| und |α| ≥ ω).
Zum Zusatz: ω ist offenbar
κ
multiplikativ abgeschlossen. Für Kardinalzahlen
κ > ω gilt κ = ωκ = ωω , also ist κ multiplikativ abgeschlossen nach dem
Charakterisierungssatz für multiplikativ abgeschlossene Ordinalzahlen.
Hier und im Folgenden verwenden wir, dass für die Ordinalzahlexponentiation stets
gilt, dass |αβ | = ||α||β| |. Dieses nichttriviale Ergebnis hatten wir aus der direkten Dar-
stellung der Ordinalzahlexponentiation von Hausdorff und Hessenberg gewonnen.
Beweis
Es genügt zu zeigen, dass κ ⋅ κ = κ für alle Kardinalzahlen κ ≥ ω gilt. Aber
Γ|κ2 : κ2 → κ ist bijektiv, da κ multiplikativ abgeschlossen ist.
Beweis
Sei κ = |α| ⋅ |β|. Dann ist ω ≤ κ ≤ αβ . Mit Ordinalzahlexponentiationen
gilt dann:
κ = |κ| ≤ |α β | ≤ |(2α )β | = |2α ⋅ β | = |2κ | = |κ| = κ.
Beispiele
(a) [ ω1 ]ω ist die Menge aller abzählbar unendlichen Teilmengen von ω1 .
(b) [ ω1 ]< ω ist die Menge aller endlichen Teilmengen von ω1 .
(c) [ ω1 ]≤ ω ist die Menge aller abzählbaren Teilmengen von ω1 .
Beweis
zu |[ x ]µ | ≤ κ µ :
Wir definieren h : [ x ]µ → µ x durch:
h(y) = „ein bijektives f : µ → x“ für alle y ⊆ x mit |y| = µ.
Dann ist h injektiv, und damit |[ x ]µ | ≤ |µ x| = κµ .
zu κµ ≤ |[ x ]µ |:
Es gilt µ κ ⊆ [ µ × κ ]µ . Damit erhalten wir:
κµ = |µ κ| ≤ |[ µ × κ ]µ | = |[ κ ]µ | = |[ x ]µ |.
Definition (κ< λ )
Für alle Kardinalzahlen κ, λ sei κ < λ = sup µ < λ κ µ .
Satz
Für alle x und κ, λ P Kard mit |x| = κ ≥ λ ≥ ω gilt |[ x ] < λ | = κ < λ .
Beweis
Wegen [ x ] < λ = ͵ < λ [ x ] µ und |[ x ] µ | = κ µ gilt
κ < λ = sup µ < λ κ µ ≤ |[ x ]< λ |.
Die andere Ungleichung folgt aus
|͵ < λ [ x ] µ | ≤ |λ × κ < λ | = κ < λ .
Die Gimelfunktion
Satz
Sei κ ≥ ω eine Kardinalzahl. Dann gilt κ < κcf(κ) .
Beweis
Wegen κ ≤ κcf(κ) genügt es κ ≠ κcf(κ) zu zeigen. Sei also 〈fα | α < κ〉 eine
Folge von Funktionen fα : cf(κ) → κ. Wir finden ein g : cf(κ) → κ mit
g ≠ fα für alle α < κ. Dies genügt.
Sei hierzu 〈αβ | β < cf(κ)〉 s. a. k. in κ. Wir definieren für β < cf(κ):
g(β) = „das kleinste Element von κ − { ϕα (β) | α < αβ }“.
Ein solches g existiert, da |{ fα (β) | α < αβ }| ≤ |αβ | < κ. Dann ist g ≠ fα für
alle α < κ, denn für alle α < κ existiert ein β < cf(κ) mit α < αβ , und dann ist
g(β) ≠ fα (β) nach Definition von g.
Korollar
Seien κ, µ Kardinalzahlen mit κ ≥ 2, µ ≥ ω. Dann gilt µ < cf(κ µ ).
Beweis
Sei τ = κ µ . Annahme, cf(τ) ≤ µ. Dann ist
τ cf(τ) ≤ τ µ = κ µ ⋅ µ = κ µ = τ,
im Widerspruch zu τ < τ cf(τ) nach dem obigen Satz.
Übung
Für alle Kardinalzahlen µ ≥ ω ist µ ≠ 2cf(µ) .
Ist also 2ω = ℵλ für einen Limes λ, so gilt cf(λ) > ω nach dem Korollar. Damit
sind ℵω , ℵo + ω , usw. als mögliche Werte für 2ω ausgeschlossen. Dagegen ist z. B.
2ω = ℵω1 immer noch möglich. Mit der Erzwingungsmethode kann man zeigen,
dass die möglichen Werte von 2ω alle unendlichen Nachfolgerkardinalzahlen
und alle Limeskardinalzahlen mit überabzählbarer Konfinalität sind. Damit
können wir in ZFC nicht mehr über 2ω herausfinden als cf(2ω ) ≠ ω.
Definition (Gimelfunktion)
Für eine Kardinalzahl κ ≥ ω sei g (κ) = κ cf(κ) .
Beispiele
(a) ℵ0 ist ein starker Limes.
(b) Unter (GCH) ist jede Limeskardinalzahl ein starker Limes.
(c) Ist κ0 ≥ ω und κn + 1 = 2κn für alle n P ω, so ist κ = supn κn ein starker
Limes.
Beweis
Sei 〈xα | α < cf(κ)〉 eine Zerlegung von κ mit |xα | < κ für alle α < cf(κ).
Dann gilt (mit 2|xα | < κ für die erste Ungleichung):
2κ = |κ 2|
= |Í x
α < cf(κ) α
2|
= |× α < cf(κ) x 2|α
Insgesamt haben wir also: Ist κ cf(κ) < 2κ , so ist κ eine singuläre Limeskardinal-
zahl und es gibt ein µ < κ mit 2µ ≥ κ.
Diese Überlegungen führen zur singulären Kardinalzahlhypothese. Sei κ ≥ ω
eine singuläre Limeskardinalzahl. Dann ist 2cf(κ) ≠ κ. Ist nun 2cf(κ) > κ, so ist
2 cf(κ) ≤ κ cf(κ) ≤ (2 cf(κ) )cf(κ) = 2cf(κ) ,
also fällt die Gimelfunktion an der Stelle κ mit der Exponentiation zur Basis 2 an
der Stelle cf(κ) zusammen. Der andere Fall führt zu folgender Hypothese, die
eine schwache Form von (GCH) für die betrachteten singulären Limeskardinal-
zahlen ist :
Modulo großer Kardinalzahlen ist (SCH) unabhängig von ZFC. (SCH) gilt in
jedem Modell von (GCH) und ist daher relativ konsistent zu ZFC. Die Vernei-
nung von (SCH), d.h. die Existenz eines singulären κ mit 2cf(κ) < κ und κcf(κ) ≥ κ++ ,
ist dagegen eine sehr starke Hypothese, für deren Realisierung in einem Modell
wir große Kardinalzahlen brauchen.
Wir führen nun noch eine Summation und Produktbildung über beliebige In-
dexmengen ein.
Beweis
Seien M = Íi P I κi × { i } und N = ×i P I µi . Die Ungleichung |M| ≤ |N|
ergibt sich aus der Injektivität von f : M → N mit f((α, i))(i) = α + 1 und
f(α, i)(j) = 0 für i ≠ j. Um |M| < |N| zu zeigen, sei f : M → N injektiv. Wir
definieren g P N „diagonal“ durch
g(i) = „das kleinste β P µi mit: β ≠ f((α, i))(i) für alle α P κi “.
Ein solches β existiert, da κi < µi nach Voraussetzung.
Dann ist g ¸ rng(f ) und damit f nicht surjektiv.
Übung
Zeigen Sie mit Hilfe des Satzes von König-Zermelo:
(i) κ < 2κ für alle κ,
(ii) κ < κcf(κ) für alle κ ≥ ω,
(iii) µ < cf(κ µ ) für alle κ ≥ 2, µ ≥ ω.
Wir wenden uns nun der Aufgabe zu, allgemeine Summen und Produkte zu
berechnen. Der Hauptsatz über die Summenberechnung ist:
Satz (Summenformel)
Sei 〈κi | i P I〉 eine unendliche Folge von Kardinalzahlen mit κi > 0 für alle
i P I. Dann gilt ∑ i P I κi = |I| ⋅ κ, wobei κ = supi P I κi .
Beweis
zu ≤:
Es gilt ∑ i P I κi ≤ |I × κ| = |I| ⋅ κ.
zu ≥:
Es gilt |I| ≤ ∑ i P I 1 ≤ ∑ i P I κi . Nach Definition von κ ist aber auch
κ ≤ ∑ i P I κi , und damit ist
|I| ⋅ κ = max(|I|, κ) ≤ ∑ i P I κi .
Eine einfache Produktformel existiert in ZFC nicht. Für spezielle Folgen kön-
nen wir aber eine nützliche Regel aufstellen:
Beweis
zu ≤ :
Es gilt ∏ α < µ κα ≤ ∏ α < µ κ ≤ κµ .
zu ≥ :
Sei 〈xγ | γ < µ〉 eine Zerlegung von µ mit sup xγ = µ für alle γ < µ.
Zur Existenz einer derartigen Zerlegung:
Ist g : µ ⋅ µ → µ bijektiv, so definiert xγ = g″({ γ } × µ) für alle γ < µ
eine Zerlegung wie gewünscht.
Aufgrund der Assoziativität und Kommutativität des Produkts gilt dann:
(+) ∏ α < µ κα = ∏ γ < µ ∏ α P x γ κα ≥ ∏ γ < µ κ = κ µ .
Die Ungleichung gilt wegen sup α P xγ κ α = κ.
Ist 〈αi | i < cf(λ)〉 s. a. k. in λ, so gilt ∏ i < cf(λ) καi = κcf(λ) nach der Produktformel
für die Kardinalzahl cf(λ). Damit gilt stets:
(#) κ cf(λ) ≤ ∏ α < λ κα ≤ κ |λ| .
Folgende Fälle der Produktformel sind in ZFC beweisbar:
Beweis
zu (i): Wir argumentieren wie im Beweis der Produktregel für Kardinal-
zahlen, verwenden aber die Paarungsfunktion &|λ2 : λ2 → λ zur
Definition der Zerlegung 〈xγ | γ < λ〉. Aufgrund der Monotonie-
Eigenschaften von & gilt sup x γ = λ für alle γ < λ, und damit bleibt die
Produktberechnung (+) gültig.
zu (ii): Sei 〈κα | α < λ〉 schwach aufsteigend gegen κ. Wegen λ abzählbar
ist cf(λ) = ω. Sei also 〈αn | n < ω〉 s. a. k. in λ. Dann ist
∏ α < λ κα ≥ ∏ n < ω κ αn = κ ω = κ|λ| ,
wobei im vorletzten Schritt die Produktregel für ω verwendet wird.
Die Argumentation mit Paarungsfunktionen wie im Beweis von (i) können wir
nicht weiter ausreizen:
Übung
Ist λ eine Limesordinalzahl und g : λ2 → λ eine Bijektion, die monoton in
beiden Argumenten ist, so ist λ additiv abgeschlossen.
Tarski-Vermutung (TV)
Die Produktregel gilt für alle Limesordinalzahlen λ.
Es zeigt sich: (SCH) impliziert (TV), aber (TV) ist modulo großer Kardinal-
zahlen unabhängig von ZFC. Genauer existieren Modelle von ¬ (TV), in denen
die Produktregel für den ersten möglichen Fall λ = ω1 + ω falsch ist.
Nach der Diskussion der Berechnung von Summe und Produkt zeigen wir nun
noch einige Formeln für die Exponentiation κλ unendlicher Kardinalzahlen. In
diesem Kontext ist die Aleph-Notation bequem.
Beweis
zu (i):
2ℵβ ≤ ℵℵ ℵα ℵβ
α ≤ (2 )
β
= 2ℵα ⋅ ℵβ = 2ℵβ .
zu (ii):
Für jedes f : ℵβ → ℵα ist rng(f) beschränkt in ℵα , da ℵα regulär.
Also gilt ℵβ ℵα = Íγ < ℵα ℵβ γ. Somit ℵℵα ≤ ∑ γ < ℵα |γ| .
β ℵβ
Andererseits gilt
∑γ < ℵα |γ|ℵβ = ℵα ⋅ sup γ < ℵα |γ|ℵβ ≤ ℵα ⋅ ℵℵ ℵβ
α = ℵα .
β
zu (iii):
Nach (ii) gilt ℵℵ
α + 1 = ℵα + 1 ⋅ sup γ
β
< ℵα + 1 |γ|ℵβ = ℵα + 1 ⋅ ℵℵ
α .
β
zu (iv):
Wie in (ii), denn ℵβ < cf(ℵα ) folgt rng(f) beschränkt in ℵα für alle
Funktionen f : ℵβ → ℵα .
zu (v):
Sei 〈αδ | δ < cf(α)〉 s.a.k. in ℵα . Dann gilt:
ℵℵ
α
β
≤ (∏ δ < cf(α) ℵαδ )ℵβ = ∏ δ < cf(α) ℵℵ
αδ
β
≤ (ℵℵ β cf(α)
α ) = ℵℵ
α
β ⋅ cf(ℵα )
= ℵℵ
α .
β
Wir verwenden diese Formeln für den Beweis des folgenden Satzes von Jech
(1973), der eine rekursive Berechnung von ℵℵ
α bei fest gehaltenem β ermög-
β
licht:
Beweis
zu (1): Ist klar nach (i) aus dem Satz oben.
zu (2): Dies folgt mit ℵℵ ℵβ ℵβ
α ≤ (ℵγ )
β
= ℵℵ ℵβ
γ ≤ ℵα .
β
Bemerkung
Aus dem Satz folgt, dass die Werte von ℵℵ
α in drei Typen zerfallen:
β
ℵℵ
α = 2
β ℵβ
oder
ℵℵ
α = ℵα oder
β
ℵℵ cf(ℵγ )
α = ℵγ
β
für ein γ ≤ α mit cf(ℵγ ) ≤ ℵβ < ℵγ .
(iii) ℵℵ
α = ℵβ + 1 ,
β
falls ℵα ≤ ℵβ
Als Anwendung zeigen wir, dass die Produktformel für Anfangsstücke der
Aleph-Reihe gilt:
Beweis
Wir zeigen die Aussage des Satzes durch Induktion über alle Limesordinal-
zahlen λ ≥ ω. Dabei verwenden wir:
(#) ℵcf(λ)
λ ≤ ∏ β < λ ℵβ ≤ ℵ|λ|
λ
Induktionsanfang λ = ω:
Es gilt ∏ n < ω ℵn = ℵωω nach der Produktregel für ω.
Induktionsschritt von λ nach λ + ω :
ℵ|λ|
λ + ω ≤ ( ∏ n < ω ℵλ + n )
|λ|
= ∏ n < ω ℵ|λ|
λ+n
= ℵ|λ|
λ ⋅ ∏ n < ω ℵλ + n
= I. V. ∏ β < λ ℵβ ⋅ ∏ n < ω ℵλ + n
= ∏ β < λ + ω ℵβ
2. Fall: ℵ|λ|
λi < ℵλ für alle i < cf(λ).
Es gilt cf(ℵλ ) = cf(λ) ≤ |λ|. Also gilt ℵ|λ| cf(λ)
λ = ℵλ nach dem
rekursiven Berechnungssatz. Aus (#) folgt die Behauptung.
Übung
Sei (TV) falsch, und sei λ die kleinste Limesordinalzahl, für die die
Produktregel verletzt ist. Dann gilt λ = |λ| + ω.
Die tragende Eigenschaft der Induktion und der Rekursion über Wohlordnungen
ist die Existenz kleinster Elemente in nichtleeren Teilmengen. Wir wollen nun auf
die Linearität und sogar auf die Transitivität der Ordnung verzichten, und einen
allgemeinen Strukturbegriff einführen, für den Induktion und Rekursion möglich
sind. Ein Beispiel ist uns de facto schon begegnet: Mit Hilfe des Fundierungsaxi-
oms und des Satzes, dass jede nichtleere Klasse ein P-minimales Element besitzt,
konnten wir zeigen, dass die von Neumann-Zermelo-Hierarchie das Universum
ausschöpft. Die P-Relation ist weder linear noch transitiv, aber sie erlaubt immer
noch die Argumentation über ein „minimales Gegenbeispiel“.
Die E-Extension eines x P A kann eine echte Klasse sein. Ist zum Beispiel
A = On + On = On × { 0 } ∪ On × { 1 } und E die Summenordnung auf A (d. h.
(α, i) E (β, j), falls i < j oder i = j und α < β), so ist extE ((0, 1)) = On × { 0 } eine
echte Klasse. Diese Situation ist in vielen Fällen hinderlich, da wir nicht über
Klassen quantifizieren dürfen. Wir werden sie im Folgenden ausschließen, in-
dem wir fordern, dass die Extensionsoperation immer eine Menge liefert:
Für die P-Relation auf V ist extP (y) = y, und damit ist das Fundierungsaxiom
gleichwertig zur Aussage, dass Peine fundierte Relation auf V ist. Trivialerweise
ist die P-Relation auch wohlfundiert.
Wie für die P-Relation existieren minimale Elemente automatisch auch für
nichtleere Klassen. Um dies zu zeigen, brauchen wir wieder einen transitiven ex-
tensionalen Abschluss.
Definition (E-transitiv)
Sei E eine V-relationale Klasse auf A. Eine Klasse B ⊆ A heißt E-transitiv,
falls für alle x P B gilt, dass extE (x) ⊆ B.
In der Tat ist t.c.E (x) die ⊆-kleinste x umfassende E-transitive Menge. Im Falle
E =P ist E-transitiv unser altes transitiv und es gilt t.c.P (x) = t.c.(x), denn dann ist
x0 = x und xn + 1 = Íy P xn extP (y) = Íy P xn y = Í xn für alle n P ω.
Ist E eine transitive Relation auf A, so ist t. c.E (x) = extE (x) für alle x P A. Die
Abschluss-Operation gibt uns eine einfache Möglichkeit, V-relationale Klassen
zu transitivieren:
Offenbar ist E′ eine V-relationale Klasse auf A, und E′ ist transitiv: Aus x E′ y
und y E′ z folgt immer x E′ z. Weiter ist E′ die kleinste transitive Oberklasse von E.
Wir können E′ auch wie folgt über die Verknüpfung von Relationen darstellen:
E′ = Ín P ω En , wobei
E1 = E und En + 1 = E + En = { (x, y) | es gibt ein z mit (x, z) P E und (z, y) P En }
Ist E eine echte Klasse, so sind alle En echte Klassen und obige Rekursion über
n P ω ist dann durch unsere Rekursionssätze nicht abgedeckt. Formal korrekt
können wir für alle 1 ≤ n P ω uniform (durch eine bestimmte Formel ϕ(x, y, n))
Klassen En definieren durch:
En = { (x, y) | es gibt eine Folge 〈x i | i ≤ n〉 mit
x0 = x, xn = y und x i E x i + 1 für alle i < n }.
Dann gilt E1 = E und En + 1 = E + En für alle n P ω, und wir können erneut set-
zen:
E′ = Ín P ω En = { (x, y) | es gibt ein 1 ≤ n < ω mit (x, y) P En }.
Wir werden gleich zeigen, dass die Klasse E′ immer noch fundiert ist. Vorab
definieren wir:
Offenbar ist ein xPB genau dann ein E′-minimales Element von B, wenn x ein
minimales Element von B in der transitiven Erweiterung von E ist. Damit ist die
Definition konsistent mit der E′-Notation für die transitive Erweiterung.
Ist z. B. E = { (n, n + 1) | n P ω } und B die Menge der geraden Zahlen, so ist
jedes n P B minimal in B. Die transitive Erweiterung E′ ist in diesem Fall die
P-Relation auf ω, und 0 ist das eindeutige E′-minimale Element von B.
Wir können nun folgende Verallgemeinerung des Satzes über die Existenz von
P-minimalen Elementen in nichtleeren Klassen zeigen:
Beweis
Wir zeigen zunächst, dass B ein E-minimales Element besitzt. Sei hierzu
x P B beliebig. Ist x ein E-minimales Element von B, so sind wir fertig.
Andernfalls existiert ein E-minimales Element y der nichtleeren Menge
t. c.E (x) ∩ B. Dann ist aber y ein E-minimales Element von B.
Um ein E′-minimales Element von B zu finden, setzen wir:
C = B ∪ { a P A | es gibt ein b P B mit b P t. c.E (a) }.
Nach dem bereits Gezeigten existiert ein E-minimales x P C.
Dann gilt:
(+) x ist ein E′-minimales Element von C.
existiert also ein y P extE (x) mit z P t. c.E (y). Wegen z P C gilt y P C nach
Definition von C. Dann gilt aber y P extE (x) ∩ C = ∅, Widerspruch.
Nun ist aber x P B, denn andernfalls existiert ein b P B mit b P t. c.E (x),
und wegen B ⊆ C gilt dann b P t. c.E (x) ∩ C, im Widerspruch zu (+).
Insgesamt ist dann also x ein E′-minimales Element von B ⊆ C.
Satz
Sei E eine V-relationale Klasse auf A, und sei
W = { x P A | E ist wohlfundiert auf t. c.E (x) }.
Dann ist W eine E-transitive Klasse und E ist wohlfundiert auf W.
Weiter ist W die größte Teilklasse von A mit diesen Eigenschaften.
Beweis
W ist E-transitiv:
Sei x P W, und sei y P A mit y E x. Dann ist E wohlfundiert auf t. c.E (x),
also auch wohlfundiert auf t. c.E (y) ⊆ t. c.E (x). Also ist y P W.
E ist wohlfundiert auf W:
Sei z eine nichtleere Teilmenge von W, und sei x P z beliebig.
Ist x E-minimal in z, so sind wir fertig. Andernfalls ist t. c.E (x) ∩ z eine
nichtleere Teilmenge von t. c.E (x), hat also wegen x P W ein E-minima-
les Element y. Dieses y ist dann auch ein E-minimales Element von z.
zur Maximalität von W:
Sei W′ eine E-transitive Teilklasse von A, und sei E wohlfundiert auf
W′. Sei x P W′ beliebig. Wegen W′ E-transitiv ist dann t. c.E (x) ⊆ W′.
Da E wohlfundiert auf W′ ist, ist E auch wohlfundiert auf t. c.E (x) ⊆ W′.
Also ist x P W nach Definition von W.
Ein kleineres technisches Problem dieser Definition ist: Die A α können echte Klassen
sein. Dies ist z.B. für die Klasse A = WO aller Wohlordnungen unter der Anfangsstückrela-
tion E = f der Fall, denn hier ist A0 = ∅, A1 = { 〈∅, ∅〉 }, aber A2 = { 〈{ x }, ∅〉 | xPV }) ist eine
echte Klasse. (Ist dagegen E derart, dass für alle x P A gilt: { y P A | extA (x) = extE (y) } P V,
so sind alle Aα Mengen, und wir haben dann keine formalen Komplikationen.)
In diesem Fall ist obige Rekursion nicht formal gerechtfertigt (da unsere Rekursions-
funktionen V-wertig sind). Offiziell definieren wir deswegen die wohlfundierte Hierar-
chie wie oben zuerst nur für Mengen, und setzen dann für allgemeine V-relationale Klas-
sen E auf A uniform für alle α P On:
A α = { xPA | x P Bα , wobei 〈Bβ | β P On〉 die wohlfundierte Hierarchie
in der Menge t. c.E (x) ∪ { x } bzgl. E ist }.
Diese Klassendefinition setzt die Mengendefinition fort, und die Klassen A α erfüllen wie
gewünscht die Rekursionsgleichungen der Mengendefinition.
Beweis
Sei W′ = Íα P On A α . Dann ist W′ E-transitiv und E ist wohlfundiert auf der
Klasse W′. Also ist W′ ⊆ W nach Maximalität von W.
Umgekehrt gilt aber auch W ⊆ W′: Denn andernfalls hat die nichtleere
Klasse W − W′ ein E-minimales Element x. Dann ist extE (x) ⊆ W′ nach
Minimalität von x. Nach dem Ersetzungsschema gibt es dann ein α mit
extE (x) ⊆ A α , und dann ist x P A α + 1 ⊆ W′, Widerspruch.
Wir hatten bereits erwähnt, dass wir die Vα -Hierarchie in ZF ohne das Fun-
dierungsaxiom definieren können. Wir setzen dann V* = Íα P On Vα . Die
Klasse V* ist dann der wohlfundierte Teil des Universums:
Korollar
In ZF − (Fun) gilt: V* ist der wohlfundierte Teil von V unter P, d. h.
V* = { x P V | P ist wohlfundiert auf t. c. (x) }.
Wir können nun leicht induktive Beweise und rekursive Definitionen über
wohlfundierte Relationen rechtfertigen. Dabei ist an der Stelle x der Rückgriff
auf t. c.E (x) erlaubt, d. h. wir dürfen im Falle der Induktion annehmen, dass eine
Eigenschaft bereits für alle y P t. c.E (x) bewiesen ist, und im Falle der Rekursion,
dass die Funktion F bereits für alle y P t. c.E (x) definiert ist.
Beweis
Andernfalls ist B = { x P A | non ϕ(x) } eine nichtleere Klasse. Sei dann x ein
E′-minimales Element von B. Nach Minimalität von x gilt dann ϕ(y) für alle
y P t. c.E (x). Also gilt ϕ(x) nach (+), im Widerspruch zu x P B.
Im Allgemeinen können wir x nicht aus t. c.E (x) errechnen. Da wir zur Defini-
tion von F(x) sicher auch x selbst verwenden möchten, brauchen wir ein zweistel-
liges G.
Ist E′ der transitive Abschluss von E, so ist E′ wohlfundiert auf A, und die Rekur-
sionsgleichung ist wegen t.c.E (x) = ext E′ (x) identisch mit F(x) = G(x, F|extE′ (x)) für
alle x P A. Damit ist jede wohlfundierte Rekursion darstellbar als eine wohlfun-
dierte Rekursion über eine transitive Relation.
Beweis
Der Beweis des Rekursionssatzes für wohlfundierte Relationen verläuft
analog zum Beweis des Rekursionssatzes für On. Wir setzen für alle x P A:
F(x) = G(x, f ), wobei f : t. c.E (x) → V die eindeutige Funktion ist mit:
(#) Für alle y P t. c.E (x) ist f(y) = G(y, f|t. c.E (y)).
Die Existenz und Eindeutigkeit einer solchen x-Approximationsfunktion
wird durch wohlfundierte Induktion über x P A bewiesen. Zum Beweis der
Existenz definieren wir mit Hilfe des Ersetzungsschemas eine Funktion
f : t. c.E (x) → V durch
f(y) = G(y, fy ) für alle y P t. c.E (x),
wobei fy die nach I. V. eindeutig existierende y-Approximationsfunktion ist
für alle y P t. c.E (x). Dann ist die Funktion f die eindeutige x-Approximati-
onsfunktion.
Da sich extE (x) aus x und damit F|extE (x) aus x und F|t.c.E (x) errechnet, schließt
der Satz die einfacheren Rekursionen ein, bei denen wir nur x und F|extE (x) zur
Definition von F(x) heranziehen. Ist in einer solchen einfachen Rekursion speziell
E = P|A und A transitiv, so genügt eine einstellige Rekursionsfunktion G, da sich
dann auch x aus F|extE (x) errechnet, nämlich als x = dom(F|extE (x)). Wir halten
diesen wichtigen Spezialfall explizit fest:
Wir bemerken noch, dass uns die Methode des Zurückschneidens von Klassen
zu Mengen erlaubt, den Induktionssatz für beliebige fundierte Relationen zu zei-
gen, bei denen die Extension eines Elementes i. A. eine echte Klasse ist:
Beweis
Der Induktionssatz folgt wie oben aus der Existenz von E-minimalen
Elementen in nichtleeren Teilklassen von A. Es genügt also, (i) zu zeigen. Sei
hierzu B ⊆ A nichtleer. Ohne Einschränkung ist E ∩ B2 ≠ ∅. Wir setzen:
R = { (y, x) PE ∩ B2 | y hat minimalen P-Rang unter allen z P B mit z E x }.
Dann ist R eine wohlfundierte Relation auf C = dom(R) ∪ rng(R) ⊆ B.
Sei also x P C ≠ ∅ R-minimal. Dann ist x auch ein E-minimales Element
von B (denn gibt es ein y P B mit y E x, so gibt es ein y′ P C mit y′ E x).
Beweis
Eine E-Induktion zeigt, dass für alle x P A die Gleichung (+) erfüllt ist.
Übung
Sei E eine V-relationale Klasse auf A. Dann sind äquivalent:
(i) E ist wohlfundiert.
(ii) Es gibt ein F : A → On, sodass für alle x, y P A gilt:
x E y gdw f(x) < f(y).
(iii) Es gibt genau ein F : A → On, sodass für alle x, y P A gilt:
(α) x E y gdw F(x) < F(y).
(β) Für alle β < F(x) existiert ein y P extE (x) mit F(y) = β.
Es ist bemerkenswert, dass (i) eine einfache Aussage des Typs „für alle …“ ist,
während (ii) eine einfache Aussage des Typs „es gibt …“ darstellt. Derartige
Überlegungen werden bei der Betrachtung von Modellen eine wichtige Rolle
spielen.
Übung
Sei E wohlfundiert auf A, und sei E′ die Transitivierung von E. Dann gilt:
rangE (x) = rangE′ (x) für alle x P A.
Erbliche Eigenschaften
Mit Hilfe von wohlfundierter Rekursion können wir aus jeder durch E wohl-
fundierten Klasse A den E-transitiven Anteil herauslösen:
Satz (Erblichkeitssatz)
Sei E wohlfundiert auf A. Dann existiert genau eine Klasse B ⊆ A mit
B = { x P A | extE (x) ⊆ B }.
Beweis
Wir definieren F : A → { 0, 1 } durch wohlfundierte Rekursion für alle
x P A durch:
Die Klasse B des Satzes ist offenbar E-transitiv, und genauer ist B die größte E-
transitive Teilklasse von A. Weiter gilt, wie man leicht zeigt:
B = { x P A | t. c.E (x) ⊆ B }.
Nach dem Fundierungsaxiom istPwohlfundiert auf V. Damit erhalten wir den
folgenden wichtigen Spezialfall:
Für jede Eigenschaft ϕ(x) können wir also eindeutig eine Klasse B definieren
durch:
B = { x | ϕ(x) und x ⊆ B }.
Klassen sind Formeln, und der obige Beweis erlaubt, gegeben ϕ, die Konstruk-
tion einer Formel ψ mit B = { x | ψ(x) }. Hierzu ist die wohlfundierte Rekursion
des Beweises in eine Formel aufzulösen.
Definition (E-erblich in A)
Sei E wohlfundiert auf A. Dann heißt die eindeutige Klasse B mit
B = { x P A | extE (x) ⊆ B } die Klasse der E-erblichen Mengen von A.
Statt P-erblich sagen wir kurz auch erblich.
Alle Hκ und H′κ sind Mengen, und für viele κ gilt Hκ = H′κ :
Übung
(i) H′ω = H ω = Vω .
(ii) H′κ ⊆ Hκ ⊆ Vκ für alle κ.
(iii) H′κ = Hκ für alle regulären κ.
(iv) H′κ ⊆ H′µ , Hκ ⊆ Hµ für alle µ ≤ κ.
(v) H′µ = Íκ < µ H′µ für alle Limeskardinalzahlen µ > ω.
(vi) Hℵω ⊃ Ín < ω Hℵ . n
Die funktionalen Klassen 〈Hκ | κ P Kard〉 und 〈H′κ | κ P Kard〉 sind also ku-
mulative Hierarchien, die (mit (AC)) das ganze Universum ausschöpfen. Die
Folge der H′κ ist zudem stetig.
In der Literatur werden zuweilen alle Hκ über den transitiven Abschluss definiert und
als die Systeme der Mengen bezeichnet, die erblich die Kardinalität < κ haben. Die in der
Übung betrachtete Menge M = { ℵn | n P ω } hat aber im eigentlichen Wortsinn erblich
die Kardinalität kleiner als ℵω : M selbst ist sogar abzählbar, und steigen wir die P-Rela-
tion in M hinab, so finden wir nur Mengen der Kardinalität kleiner als ℵω . Dagegen ist ℵω
= t. c.(M), und damit M ¸ H′ℵω .
Wir zeigen, dass wir transitive Klassen nur in trivialer Form bijektiv und struk-
turerhaltend aufeinander abbilden können:
Beweis
Wir zeigen durch P-Induktion, dass π(x) = x für alle x P B gilt.
x ⊆ π(x):
Für alle z P x gilt z = π(z) P π(x) nach I. V. und (+).
π(x) ⊆ x:
Sei z′ P π(x) ⊆ C. Dann gibt es ein z P B mit π(z) = z′.
Wegen π(z) = z′ P π(x) ist dann aber z P x nach (+).
Übung
Zeigen Sie den obigen Satz allgemeiner für eine wohlfundierte Relation
E auf einer Klasse A, E-transitive Teilklassen B, C von A und einen
E-Isomorphismus π : B → C, falls E die folgende Bedingung erfüllt:
(+) Für alle x, y P A gilt: ext E (x) = ext E (y) impliziert x = y.
Zeigen Sie, dass der Satz ohne die Voraussetzung (+) i. A. nicht gilt.
[ Obiges Argument zeigt in einer E-Induktion, dass extE (x) = extE (π(x)) gilt, und aus
(+) folgt dann x = π(x). ]
Der Mostowski-Kollaps
Das wichtigste Beispiel für eine wohlfundierte Rekursion ist vielleicht der
transitive Kollaps einer „guten“ wohlfundierten Relation E auf einer Klasse A.
Dieser Kollaps transitiviert A und verwandelt dabei E strukturerhaltend in die
vertraute P-Relation. Insgesamt ergibt sich dann eine transitive Klasse B und
eine bijektive funktionale Klasse π : A → B, sodass für alle x, y P A gilt:
x E y gdw π(x) P π(y).
Die geeigneten „guten“ wohlfundierten Relationen E können wir ermitteln,
wenn wir den folgenden allgemeinen Ansatz analysieren:
Eine Relation E auf A ist also genau dann extensional, wenn sich je zwei ver-
schiedene Elemente von A durch ihre E-Extension unterscheiden. Diese Bedin-
gung kann man als Extensionalitätsaxiom für E ansehen. Das Extensionalitätsa-
xiom von ZFC besagt genau, dass die P-Relation extensional auf V ist.
Für extensionale wohlfundierte Relationen gilt nun der folgende wichtige Iso-
morphiesatz. Er ist sich interessant ist und spielt eine fundamentale Rolle in
mengentheoretischen Modellkonstruktionen.
Satz (Mostowski-Isomorphiesatz)
Sei E eine wohlfundierte und extensionale Relation auf A. Dann existiert
eine transitive Klasse W und eine funktionale Klasse π : A → W derart,
dass 〈A, E〉 isomorph zu 〈W, P〉 ist, d. h.:
(i) π : A → W ist bijektiv
(ii) für alle x, y P A gilt: x E y gdw π(x) P π(y)
Beweis
Sei π : A → W der Mostowski-Kollaps von A. Wir zeigen, dass W und π
wie gewünscht sind. Dabei wissen wir bereits, dass W transitiv ist, und dass
die Implikation von links nach rechts in (ii) gilt.
Wir zeigen zuerst, dass π injektiv ist. Hierzu zeigen wir für alle x P A:
(+) Für alle y P A mit y ≠ x ist π(x) ≠ π(y).
Beweis von (+) durch E-Induktion nach x P A
Sei also y P A mit x ≠ y. Dann ist extE (x) ≠ extE (y).
1. Fall: Es gibt ein a E x mit non(a E y).
Dann ist π(a) ≠ π(b) für alle b E y, da nach I. V. sonst a = b für ein
b E y und damit a E y gelten würde. Also ist
π(a) ¸ { π(b) | b E y } = π(y).
Aber π(a) P π(x) wegen a E x. Also π(x) ≠ π(y).
2. Fall: Es gibt ein b E y mit non(b E x).
Analog.
Also ist π injektiv. Damit folgt nun die Rückrichtung von (ii):
(++) Für alle x, y P A gilt: π(x) P π(y) impliziert x E y.
Beweis von (++)
Es gelte also π(x) P π(y) = { π(z) | z E y }. Dann existiert ein z E y mit
π(x) = π(z). Dann ist aber x = z nach Injektivität von π, also x E y.
Wir wollen noch zeigen, dass der Mostowski-Kollaps eindeutig bestimmt ist.
Sind π1 : A → W und π2 : A → W′ Isomorphismen wie im Satz über den Mo-
stowski-Kollaps, so ist π2 π1 −1 : W → W′ ein Isomorphismus zwischen zwei
transitiven Klassen. Nach dem Satz über die Starrheit transitiver Klassen gilt also
W = W′ und π2 π1 −1 = IdW ,
d. h. π1 = π2 . Damit haben wir:
Übung
Zeigen Sie durch E-Induktion, dass für jeden Isomorphismus σ : A → W′
auf einer transitiven Klasse W′ gilt:
σ(x) = { σ(y) | y E x } für alle x P A.
Folglich ist σ der Mostowski-Kollaps π.
Spezialfälle des Satzes sind Wohlordnungen 〈M, <〉 mit Mengen M. Diese
Wohlordnungen sind wohlfundiert und weiter extensional, denn für alle x P M
gilt ext < (x) = { y P M | y < x } = M x , d. h. ext < (x) ist das durch x gegebene An-
fangsstück von M. Also ist ext< (x) ≠ exty (x) für je zwei verschiedene x, y P M. Ist
nun π : M → W der Mostowski-Kollaps, so ist W transitiv und wohl geordnet
durch die P-Relation, also ist W eine Ordinalzahl. Genauer ist W der Ord-
nungstyp von M, und π der eindeutige ordnungserhaltende Isomorphismus
von M nach W. Damit liefert der Mostowski-Kollaps eine weitere Motivation
für die Ordinalzahldefinition „transitiv und durch P wohl geordnet“, und er
unterstützt das Prädikat „kanonisch“ für diese Definition.
Man kann sogar die Ordinalzahlen über den Mostowski-Kollaps einführen. Der Ele-
ganz und Ökonomie dieses Zugangs stehen didaktische und historische Argumente ent-
gegen. Die Definition der Ordinalzahlen nach von Neumann und Zermelo lässt sich auch
anders gut motivieren, und sie liegt zeitlich deutlich vor dem Mostowski-Kollaps von
1949 und seinen von Gödel benutzten Vorstufen aus den 1930er-Jahren.
Wir betrachten weiter noch den Fall, dass E die auf eine Klasse eingeschränkte
Elementrelation ist.
Beweis
Existenz und Eindeutigkeit folgen aus dem Satz oben für den Fall E = P|A.
Für alle x P A ist extP|A (x) = x ∩ A und damit gilt:
(+) π(x) = { π(y) | y P x ∩ A } für alle x P A.
Sei B der transitive Teil von A. Wir zeigen durch P-Induktion, dass π(x) = x
für alle x P B gilt: Für x P B ist x ⊆ B ⊆ A und nach (+) gilt dann
π(x) = { π(y) | y P x } = I. V. { y | y P x } = x.
Die Menge der geraden Zahlen fällt durch den Mostowski-Kollaps auf die
Menge der natürlichen Zahlen zusammen. Eine ähnliche Anschauung gilt all-
gemein für P-extensionale Mengen und Klassen A. Der Kollaps entfernt die
Transitivitätslücken A und komprimiert dadurch die P-Struktur auf A in einer
nicht weiter reduzierbaren Weise. Stellen wir uns A als gerichteten Graphen
vor, bei dem für alle x, y P A mit x P y ein Pfeil von x nach y führt, so können wir
den Mostowski-Kollaps als eine Umbenennung der Ecken x des Graphen anse-
hen: Wir benennen jede Ecke x mit der Menge der neuen Namen der auf x zei-
genden Ecken. Die Extensionalitätsbedingung ist notwendig, damit nicht zwei
Ecken den gleichen neuen Namen erhalten. Insgesamt bleibt die alte Pfeil-
struktur vollständig erhalten, und die Umbenennung der Knoten ist gerade die
Abbildung π.
Das Antifundierungsaxiom
Antifundierungsaxiom (AF)
Jeder Graph besitzt eine eindeutige Dekoration.
Dieses Prinzip widerspricht dem Fundierungsaxiom, wie wir gleich sehen wer-
den. Man kann zeigen, dass die Theorie T = ZF − (Fun) + (AF) konsistent ist rela-
tiv zu ZF (indem man in ZF ein Modell von T konstruiert).
Satz
In T = ZF − (Fun) + (AF) gilt: Es existiert genau eine Menge x mit x = { x }.
Insbesondere ist also das Fundierungsaxiom falsch.
Beweis
zur Existenz:
Sei p eine beliebige Menge. Wir setzen:
M = { p } und E = { (p, p) }.
Nach (AF) existiert eine Dekoration π : M → V des Graphen 〈M, E〉.
Dann gilt wegen { q | q E p } = { p }, dass
π(p) = { π(q) | q E p } = { π(p) }.
Sei also x = π(p). Dann gilt x = { x }.
zur Eindeutigkeit:
Sei x′ eine Menge mit x′ = { x′ }. Sei 〈M, E, π〉 wie im Beweis der
Existenz. Wir definieren σ : M → V durch σ(p) = x′. Dann gilt:
σ(p) = x′ = { x′ } = { σ(p) } = { σ(q) | q E p }.
Also ist σ eine Dekoration auf 〈M, E〉. Nach (AF) ist eine Dekoration
eindeutig bestimmt. Also gilt σ = π und damit x′ = σ(p) = π(p) = x.
Die eindeutige Menge x mit x = { x } wurde als „das ultimativ frustrierende Ge-
schenk“ bezeichnet: Stellt man sich x = { x } als Paket vor, so findet man nach Öff-
nung des Pakets wieder x, also ein Paket. Öffnet man dieses, findet man wieder x,
usw. Vielleicht noch frustrierender ist eine Menge y mit y = { y, ∅ }. In diesem Pa-
ket findet man wieder das Paket y, und zudem das leere Paket ∅. Ein solches y
existiert nach (i) der folgenden Übung.
Übung
In T = ZF − (Fun) + (AF) gilt:
(i) Es gibt genau ein y mit y = { y, ∅ }.
(ii) Es gibt genau ein z mit z = { { z } }. Für dieses z gilt dann z = { z }.
(iii) Sind x und y Mengen mit x = { y } und y = { x }, so ist x = y und
x = { x }.
Der Leser zeichne einen Punkt p auf ein Papier sowie einen kreisförmigen
Pfeil, der von diesem Punkt ausgeht und auf den Punkt selbst zeigt. Die Dekora-
tion dieses Graphen liefert die Menge x = { x }. Fügt man diesem Graphen einen
weiteren Punkt q und einen Pfeil von q nach p hinzu, so gelangt man zur eindeu-
tigen Menge y mit y = { y, ∅ } wie in (i) der Übung. Man kann in dieser Weise
leicht eine Unzahl weiterer Konstellationen erzeugen. Die so erhaltenden Re-
präsentationen sind allerdings nicht eindeutig. So führt etwa der Graph im Hin-
weis zu (ii) der Übung wieder zur eindeutigen Menge x mit x = { x }.
Die Themen der unendlichen Kombinatorik sind vielgestaltig, und das Gebiet
selbst ist nicht einfach zu umschreiben. Ein Hauptthema ist sicherlich das un-
endliche Zählen: Wieviele Objekte eines bestimmten Typs gibt es? Damit wäre
auch die Kontinuumshypothese und allgemeiner die Kardinalzahlarithmetik der
unendlichen Kombinatorik zuzuordnen. Traditionell wird aber dieses Gebiet für
sich betrachtet, während folgende Version der Frage der Kombinatorik zugeord-
net wird: Wieviele Objekte gibt es, wenn eine Identifikation von Objekten unter
einer bestimmten Äquivalenzrelation vorgenommen wird? Und weiter: Welche
Struktureigenschaften besitzt die − zumeist partiell geordnete − Menge der
Äquivalenzklassen?
Die beiden wichtigsten Äquivalenzen, die wir hier untersuchen, sind die Fak-
torisierungen von Mengen und Funktionen nach einem der beiden prominenten
Kleinheitsbegriffe der Mengenlehre. Zum einen betrachten wir hier für Kardi-
nalzahlen κ ≥ ω das Ideal der Mengen der Mächtigkeit kleiner κ, und zum ande-
ren für reguläre Kardinalzahlen κ ≥ ω1 das umfassendere und subtilere Ideal der
nichtstationären oder dünnen Mengen. Unser Hauptaugenmerk liegt auf der
stationären Kombinatorik der ersten überabzählbaren Kardinalzahl. Wir disku-
tieren hier eine Reihe von natürlichen und einfach zu formulierenden Prinzi-
pien, die allesamt in ZFC weder beweisbar und modulo der Konsistenz großer
Kardinalzahlen auch nicht widerlegbar sind.
Ein anderer intensiv erforschter Gegenstand der unendlichen Kombinatorik
sind die Bäume, die wir als eine Verallgemeinerung der Wohlordnungen ansehen
können: Wir verzichten auf die Eindeutigkeit von Nachfolgern und von Su-
prema, sodass sich die Strukturen also an jeder Stelle beliebig verzweigen kön-
nen, während die Wohlfundiertheit erhalten bleibt. Auch hier spielt die Kardi-
nalzahl ω1 eine Hauptrolle. Insbesondere übersetzen wir die Suslin-Hypothese
in eine gleichwertige Hypothese über die Existenz gewisser Bäume der Höhe ω1 ,
der so genannten Suslin-Bäume. In dieser Form werden wir später die Unabhän-
gigkeit der Suslin-Hypothese nachweisen. Bereits hier führen wir aber ein star-
kes kombinatorisches Prinzip ein, das uns die Konstruktion von Suslin-Bäumen
erlaubt. Im zweiten Abschnitt werden wir zeigen, dass dieses Prinzip in Gödels
Modell L richtig ist.
Schließlich betrachten wir Partitionen und homogene Teilmengen. Das über-
geordnete Thema ist hier die Existenz von großen einfach strukturierten Teilen
von großen komplizierten Systemen.
Im Verlauf der Untersuchung werden wir auch zwei neue große Kardinalzahl-
prinzipien kennen lernen, nämlich die schwach kompakten und die Ramsey-Kar-
dinalzahlen. Die schwach kompakten Kardinalzahlen erlauben dabei sowohl eine
Formulierung über Eigenschaften von Bäumen als auch eine Formulierung über
Partitionen.
Insgesamt versteht sich dieses Kapitel als eine kompakte Einführung in ein
großes Teilgebiet der Mengenlehre. Viele Dinge können wir nur kurz anspre-
chen oder referieren, ohne sie dann weiter zu verfolgen. Der Leser sei hierzu auf
die Literatur verwiesen. Im zweiten Abschnitt werden wir vor allem die Theorie
der Bäume wieder aufgreifen, und der Leser, der primär an einem Beweis der
Unabhängigkeit der Suslin-Hypothese interessiert ist, kann sich auf den Zwi-
schenabschnitt über Bäume beschränken. Daneben setzen wir im Folgenden nur
ein Grundverständnis der stationären Mengen voraus.
Übung
Ist A ⊆ P(κ) fast disjunkt, so existiert ein maximal fast disjunktes A′ ⊆ P(κ)
mit A ⊆ A′.
Ist A ⊆ P(κ) fast disjunkt, so gilt trivialerweise |A| ≤ 2κ . Nach der einleitenden
Bemerkung gibt es sogar ganz disjunkte A ⊆ P(κ) mit |A| = κ. Die natürlichen
Fragen sind nun:
Gibt es ein fast disjunktes A ⊆ P(κ) mit |A| = κ + ?
Gibt es sogar ein fast disjunktes A ⊆ P(κ) mit |A| = 2κ ?
Was kann man in ZFC über die Existenz fast disjunkter A ⊆ P(κ) sagen?
Bevor wir uns der weiteren Untersuchung dieser Fragen zuwenden, ist es
nützlich, auch fast disjunkte Funktionen zu betrachten. Der Leser kann vorab
versuchen, ein fast disjunktes A ⊆ P(ω) der Größe ω1 zu konstruieren. Mit Hilfe
von fast disjunkten Funktionen und einem kleinen Trick wird diese Aufgabe sehr
einfach (vgl. das Korollar unten).
Beweis
Es genügt nach obiger Übung zu zeigen:
(+) Ist A ⊆ κ κ fast disjunkt und |A| ≤ κ, so ist A nicht maximal.
Sei also A ⊆ κ κ fast disjunkt, und sei h : κ → A surjektiv. Wir definieren
d : κ → κ durch:
d(α) = min(κ − { h(β)(α) | β < α }) für alle α < κ.
Dann gilt für alle β < κ, dass { α < κ | d(α) = h(β)(α) } ⊆ β + 1. Also ist
A ∪ { d } fast disjunkt und d ¸ A. Dies zeigt (+).
Mit Hilfe dieses Satzes können wir unsere erste Frage positiv beantworten:
Korollar (Existenz von κ+ -vielen fast disjunkten Teilmengen von κ der Größe κ)
Sei κ eine unendliche Kardinalzahl. Dann existiert eine fast disjunkte
Menge A ⊆ κ mit |A| = κ+ .
Beweis
Sei B ⊆ κ κ eine Menge von fast disjunkten Funktionen mit |B| = κ+ .
Sei b : κ × κ → κ bijektiv. Wir setzen:
A = { b″f | f P B }.
Dann ist A wie gewünscht.
Einen direkteren Beweis des Korollars für reguläre κ liefert folgende Übung,
die die Methode der disjunkten Ausdünnung verwendet.
Übung
Zeigen Sie ohne Verwendung von fast disjunkten Funktionen:
Sei κ eine reguläre unendliche Kardinalzahl, und sei A ⊆ P(κ) fast disjunkt
mit |A| = κ. Dann ist A nicht maximal.
[ Sei 〈x α | α < κ〉 eine Aufzählung von A ohne Wiederholungen. Für α < κ setzen wir:
yα = xα − Íβ < α xβ.
Dann gilt yα ⊆ xα , |yα | = κ (da κ regulär) für alle α < κ, und { yα | α < κ } ist ganz
disjunkt. Sei z = { min(yα ) | α < κ }. Dann gilt |z| = κ, z ¸ A und A ∪ { z } ist fast
disjunkt. Also ist A nicht maximal. ]
Nach dem Korollar (und auch nach der Übung) existieren ω1 -viele fast dis-
junkte unendliche Teilmengen von ω. Unter einer bestimmten Voraussetzung exi-
stieren nun sogar größtmögliche fast disjunkte Familien, und wir können damit
die zweite Frage für den Fall κ = ω bejahen:
Beweis
<κ
Sei b : 2 → κ bijektiv. Wir setzen
A = { { b(f|α) | α < κ } | f : κ → 2 }.
Dann gilt A ⊆ P(κ), |x| = κ für alle x P A, und |A| = 2κ . Zudem ist A fast
disjunkt, denn für { b(f|α) | α < κ } ≠ { b(g|α) | α < κ } ist f ≠ g und mit
α0 = min({ α < κ | f(α) ≠ g(α) }) gilt
{ b(f|α) | α < κ } ∩ { b(g|α) | α < κ } = { b(f|α) | α < α0 }.
Korollar
(i) Es existieren 2ω -viele fast disjunkte Teilmengen von ω der Größe ω.
(ii) Gilt (CH), so existieren 2ω1 -viele fast disjunkte Teilmengen von ω1
der Größe ω1 .
(iii) Ist κ eine starke Limeskardinalzahl, so gibt es 2κ -viele fast disjunkte
Teilmengen von κ der Größe κ.
Für ω1 existiert ein fast disjunktes A ⊆ P(ω1 ) der Größe ω2 , aber wir können
ohne eine zusätzliche Voraussetzung nicht mehr zeigen, dass eine fast disjunkte
Menge A ⊆ P(ω1 ) der Größe 2ω 1 existiert. Die Existenz einer solchen Menge ist
in ZFC weder beweisbar noch widerlegbar.
Kardinalzahlinvarianten
Hierbei steht add für additivity, cov für covering, cof für cofinality und out für
outside.
Ein klassisches Zentrum des Interesses bilden die Ideale der Lebesgue-Null-
mengen und der mageren Teilmengen von R (oder gleichwertig des Cantorrau-
mes ω 2 oder des Baireraumes ω ω). Wir setzen:
In = { X ⊆ R | X hat Lebesgue-Maß Null }
Im = { X ⊆ R | X ist mager }
und schreiben addn statt add(In ), covm statt cov(Im ), usw.
Das folgende Ergebnis von Miller und Bartoszyński ist ein Beispiel dafür, wie
sich die Kardinalzahlinvarianten von In und Im durch kombinatorische Aussagen
über ω ω formulieren lassen. Es gilt:
covm = min({ |X| | X ⊆ ω ω, für alle g P ω ω gibt es ein f P X mit
g(n) = f(n) für höchstens endlich viele n })
outm = min({ |X| | X ⊆ ω ω, für alle g P ω ω gibt es ein f P X mit
g(n) = f(n) für unendlich viele n })
Die Kardinalzahlen b und d spielen eine wichtige Rolle bei der Untersuchung
der Größenverhältnisse der Kardinalzahlinvarianten der Ideale In und Im .
Das sog. Cichoń-Diagramm zeigt die in ZFC beweisbaren Größenverhältnisse
der betrachteten Kardinalzahlen:
b ≤ d
≤
≤
≤
vial, etwa
(i) addm = min(b, covm ),
(ii) cofm = max(d, outm ),
(iii) addn ≤ addm ,
(iv) cofm ≤ cofn .
Gilt (CH), so sind alle 10 Kardinalzahlen des Diagramms gleich ω1 . Mit Hilfe
der Erwingungsmethode lassen sich aber verschiedene Konstellationen in Mo-
dellen realisieren, und insbesondere lässt sich zeigen, dass in ZFC keine weiteren
Ungleichungen bestehen.
Stationäre Mengen
Wir stellen die wichtigsten Begriffe und Ergebnisse über stationäre Mengen
zusammen.
Ist z.B. α0 < κ beliebig, so sei rekursiv αn + 1 = sup(f ″αn ) für alle nP ω. Wir set-
zen dann α* = supn P ω αn . Dann gilt
f ″α* = Ín P ω f ″ αn ⊆ Ín P ω αn + 1 = α*.
Wir haben also f an der Stelle α* wieder eingeholt, so stark die Funktion auch an-
steigen mag.
„Stationär“ bedeutet einfach „nicht dünn“, sodass ein eigener Begriff viel-
leicht überflüssig erscheint. Der Begriff wird aber häufig verwendet, und statt
„dünn“ findet man häufig auch „nichtstationär“. Aus der Definition folgt
leicht, dass ein S ⊆ λ genau dann stationär ist, wenn S ∩ C ≠ ∅ für alle club-
Mengen C ⊆ λ gilt.
Über den club-Filter gilt:
Dass der club-Filter #κ kein Ultrafilter ist, ist bereits für κ = ω1 eine nichttri-
viale Aussage. Hierzu sind Ulam-Matrizen nützlich:
Definition (Ulam-Matrix)
Sei µ ≥ ω eine Kardinalzahl, und sei κ = µ+ . Eine Folge 〈X ν, α | ν < µ, α < κ〉
von Teilmengen von κ heißt eine Ulam-Matrix auf κ, falls gilt:
(i) Íν < µ X ν, α = κ − α für alle α < κ,
(ii) X ν, α ∩ X ν, β = ∅ für alle ν < µ und alle α < β < κ.
Eine Ulam-Matrix auf κ = µ+ können wir einfach konstruieren. Für β < κ sei
g β = „ein surjektives g : µ → β + 1“.
Für ν < µ und α < κ sei X ν, α = { β < κ | g β (ν) = α }. Dann ist 〈 X ν, α | ν < µ, α < κ〉
eine Ulam-Matrix.
Aus der Existenz einer Ulam-Matrix auf κ = µ+ folgt, dass sich jedes stationäre
S ⊆ κ in stationäre Mengen 〈Sα | α < κ〉 zerlegen lässt. Wir zeigen nun stärker,
dass sich jede stationäre Teilmenge einer regulären überabzählbaren Kardinal-
zahl κ in κ-viele paarweise disjunkte stationäre Teilmengen zerlegen lässt. Für
den Beweis brauchen wir ein für sich interessantes Ergebnis über nichtstationäre
Reflexion:
Satz (Reflexionslemma)
Sei κ eine reguläre Kardinalzahl, und sei S ⊆ { µ < κ | µ ist regulär }
stationär in κ. Dann ist die Menge S′ = { µ P S | S ∩ µ ist dünn in µ }
stationär in κ.
Beweis
Sei C club in κ, und sei µ = min((S − { ω }) ∩ Lim(C)). Wegen µ P Lim(C)
und cf(µ) = µ > ω ist C ∩ µ club in µ, und folglich ist auch Lim(C) ∩ µ club
in µ. Nun ist (S ∩ µ) ∩ (Lim(C) ∩ µ) ⊆ { ω } dünn in µ. Also ist S ∩ µ dünn
in µ und damit µ P S′. Zudem ist µ P Lim(C) ⊆ C. Also ist C ∩ S′ ≠ ∅.
Beweis
(1) Wir nehmen zunächst an, dass es ein µ < κ gibt mit S ⊆ { α < κ | cf(α) = µ }.
Sei gα : µ → α s. a. k. in α für alle α P S. Für alle ν P µ und β < κ sei
Sν, β = { α P S | gα (ν) ≥ β }.
Dann existiert ein ν P µ mit:
(+) Sν, β ist stationär in κ für alle β < κ.
Beweis von (+)
Annahme nicht. Dann existiert für alle ν P µ eine club-Menge Cν ⊆ κ und
ein βν mit Cν ∩ Sν, βν = ∅, d. h. es gilt gα (ν) < βν für alle α P S ∩ Cν .
Sei C = >ν P µ Cν , und sei β = supν P µ βν . Dann ist C club in κ und es gilt
gα (ν) < β für alle α P S ∩ C und alle ν P µ. Aber S ∩ C ist stationär in κ.
Sei also α P S ∩ C mit α ≥ β. Dann gilt gα (ν) < β ≤ α für alle ν P µ, im
Widerspruch zu gα : µ → α konfinal in α.
Sei also ν P µ wie in (+). Wir definieren f : S → κ durch
f(α) = gα (ν) für alle α P S.
Dann ist f regressiv auf S, also auch regressiv auf Sν, β ⊆ S für alle β < κ.
Nach dem Satz von Fodor gibt es für alle β < κ ein γβ mit
Sβ = { α P Sν, β | f(α) = γ β } ist stationär in κ.
Dann ist aber γ β ≥ β nach Definition von Sν, β . Also ist { γβ | β < κ }
unbeschränkt in κ. Wegen κ regulär existiert ein B ⊆ κ mit |B| = κ und
γβ ≠ γβ′ für alle β, β′ P B mit β ≠ β′. Dann ist aber 〈Sβ | β P B〉 eine
Zerlegung von Íβ P B Sβ ⊆ S in stationäre Mengen. Durch Hinzufügen von
S − Íβ P B Sβ zu S0 erhalten wir wegen |B| = κ eine Folge wie gewünscht.
(2) Wir nehmen nun an, dass S ∩ { α < κ | α ist singulär } stationär in κ ist.
Dann ist cf(α) < α auf einer stationären Teilmenge von S. Nach dem Satz
von Fodor existiert also ein µ < κ und ein stationäres S′ ⊆ S derart, dass
S′ ⊆ { α < κ | cf(α) = µ }. Dann folgt die Behauptung aber aus dem Fall (1).
(3) Es bleibt der Fall: S ∩ { α < κ | cf(α) = α } ist stationär in κ. Nach dem
Reflexionslemma ist dann S′ = { α P S | cf(α) = α, S ∩ α dünn in α }
stationär in κ. Es genügt also, eine Zerlegung von S′ in κ-viele stationäre
Teilmengen zu konstruieren. Für alle α P S′ sei gα : α → α s. a. k. und stetig
in α mit rng(gα ) ∩ S′ = ∅. (Solche gα existieren wegen S′ ∩ α dünn in α.)
Wir setzen wieder Sν, β = { α P S′ | ν < α, gα (ν) ≥ β } für alle ν, β < κ. Dann
existiert ein ν < κ mit Sν, β ist stationär in κ für alle β < κ. (Dies zeigt man
ähnlich wie im Beweis von (+) unter Verwendung eines diagonalen
Durchschnitts.) Der Rest des Arguments verläuft analog zum Fall (1).
Übung
Führen Sie die Details im Beweis von Fall (3) aus.
Definition (saturiert)
# heißt (ω2 -) saturiert, falls es keine Folge 〈Xα | α < ω2 〉 von stationären
Teilmengen von ω1 gibt mit der Eigenschaft:
Xα ∩ Xβ ist dünn für alle α < β < ω2 .
Ist # saturiert, so besitzt also jede Teilmenge von Ω* der Größe ω2 zwei Ele-
mente, die beide oberhalb von einem dritten Element von Ω* liegen.
Folgende Eigenschaft besagt stärker, dass Ω so „flach“ wie möglich ist:
Übung
Ist # ω1 -dicht, so ist # saturiert.
Beide Eigenschaften des club-Filters sind in ZFC nicht beweisbar und modulo
der Konsistenz großer Kardinalzahlen auch nicht widerlegbar.
Eine andere kombinatorische Analyse von # untersucht Funktionen von κ
nach κ modulo des club-Filters:
Wir definieren nun eine <*-aufsteigende Folge der Länge ω2 in κ κ. Wir fixie-
ren hierzu für jeden Limes λ < ω2 eine in λ konfinale Folge 〈λ i | i < cf ( λ ) 〉. Es
wird sich herausstellen, dass die mit Hilfe dieser Hilfsfolgen definierten Funktio-
nen modulo der Äquivalenz =* unabhängig von diesen Folgen sind.
Im Limesschritt bilden wir also mit Hilfe unserer Hilfsfolgen das punktweise
Supremum bzw. das punktweise diagonale Supremum der bereits konstruierten
Funktionen. Die Konstruktion können wir suggestiv wie folgt notieren:
h0 = 0, hν + 1 = hν + 1 für alle ν
hλ = sup i < cf ( λ ) hλ i , falls cf(λ) = ω
hλ = diagsup i < κ hλ i , falls cf(λ) = ω1
Beweis
zu (a): Wir zeigen die Behauptung durch Induktion nach ν < ω2 . Der
Induktionsanfang ν = 0 ist trivial. Für den Nachfolgerschritt von ν nach
ν + 1 sei f P κ κ mit ifi ≥ ν + 1. Sei dann g <* f mit igi = ν. Nach I. V. gilt
hν ≤* g. Also gilt:
hν + 1 = hν + 1 ≤* g + 1 ≤* f (mit punktweiser Addition der 1).
Im Limesschritt λ sei f P κ κ mit ifi ≥ λ. Für alle i < cf(λ) gilt dann
hλi ≤* f nach I. V., also Ci = { α < ω1 | hλi (α) ≤ f(α) } P # für alle i < cf(λ).
Dann ist aber hλ (α) ≤ f(α) für alle α P C, wobei C P # der Schnitt
(für cf(λ) = ω) bzw. der diagonale Schnitt (für cf(λ) = ω1 ) aller Ci ist.
zu (b): Aus (a) folgt, dass ihν i ≤ ν für alle ν < ω2 gilt. Da aber 〈hν | ν < ω2 〉
<*-aufsteigend ist, gilt auch ihν i ≥ ν für alle ν < ω2 .
zu (c): Gilt (a) und (b) für 〈gν | ν < ω2 〉, so gilt für alle ν, dass fν ≤* gν und
gν ≤* fν , also fν =* gν .
zu (d): Die Aussage folgt aus (c), da jede andere Wahl von Hilfsfolgen
〈λi | i < cf(λ)〉 eine Folge von Funktionen mit den Eigenschaften (a)
und (b) erzeugt.
Allgemeiner gilt:
Übung
Sei F ein normaler Filter auf ω1 mit ω1 − α P F für alle α < ω1 . Wir setzen
f <F g für f, g P κ κ, falls { α < ω1 | f(α) < g(α) } P F. Für ein f P κ κ sei wieder
i f iF der Rang von f bzgl. der wohlfundierten partiellen Ordnung <F .
Dann gilt i hν iF = ν für alle ν < ω2 .
Es ist überraschend, dass wir die kanonischen Funktionen auch ohne Verwen-
dung von Rekursion definieren können (modulo =*):
Beweis
Wir zeigen die Behauptung durch Induktion nach ν < ω2 .
Der Induktionsanfang ν = 0 ist trivial. Im Induktionsschritt ν setzen wir
für alle β < ν und α < κ:
X βα = X να ∩ β und gβ (α) = o. t.(X βα ).
Dann erfüllt 〈X βα | α < ω1 〉 für alle β < ν die Eigenschaften (a) und (b) aus
dem obigen Satz. Nach I. V. gilt also
Cβ = { α < ω1 | gβ (α) = hβ (α) } P # für alle β < ν.
Wir unterscheiden drei Fälle.
Fall ν = ν′ + 1:
Dann ist gν (α) = o. t.(X να ) = o. t.(X ν′
α ) + 1 = gν′ (α) + 1 für α ≥ α*,
wobei α* < ω1 genügend groß. Also gilt
gν (α) = gν′ (α) + 1 = hν′ (α) + 1 = hν (α) für alle α P Cν′ − α*.
Beweis
Die Mengen X να = fν ″α sind abzählbar für alle α < ω1 , und die Folge
〈Xνα | α < ω1 〉 ist stetig und ⊆-aufsteigend mit Vereinigung ν.
Eine natürliche Frage ist, ob wir das durch <* partiell geordnete System aller
Funktionen von κ nach κ mit der <*-aufsteigenden ω2 -Folge 〈hν | ν < ω2 〉 bis an
sein Ende durchwandert haben. Zwei Hypothesen in diesem Umfeld sind:
Übung
Die schwache Dominierungseigenschaft ist genau dann verletzt, wenn es
eine Funktion f : ω1 → ω1 gibt mit ifi = ω2 .
Beweis
Wir führen den Beweis indirekt und konstruieren ω2 -viele stationäre
Teilmengen von ω1 mit paarweise dünnem Durchschnitt aus der Verletzung
der starken Dominierungseigenschaft. Sei also f : κ → κ derart, dass
A ν = { α < ω1 | hν (α) < f(α) }
stationär in ω1 ist für alle ν < ω2 .
Für alle α < ω1 sei bα : f(α) → ω injektiv. Wegen der ω1 -Vollständigkeit
von # existiert dann für alle ν < ω2 ein nν P ω derart, dass
Bν = { α P A ν | bα (hν (α) ) = nν }
stationär in ω1 ist. Wegen ω2 regulär gibt es ein n* P ω und ein D ⊆ ω2 mit
Definition (Transversalen-Hypothese)
ω1 erfüllt die Transversalen-Hypothese, falls für jede Folge 〈gν | ν < ω2 〉 von
Funktionen von ω1 nach ω gilt:
Es gibt ν < µ < ω2 mit { α < ω1 | gν (α) = gµ (α) } stationär in ω1 .
Die fast disjunkte Abschwächung der Transversalen-Hypothese erhält man, indem man
„stationär in ω1 “ durch „unbeschränkt in ω1 “ ersetzt. Jensen hat gezeigt, dass diese Ab-
schwächung äquivalent zur stationären Version ist.
Obiges Argument zeigt also, dass aus der Transversalen-Hypothese die schwa-
che Dominierungseigenschaft folgt. Andererseits gilt wieder:
Beweis
Wir führen den Beweis wieder indirekt. Seien also gν : ω1 → ω Funktionen
mit { α < ω1 | gν (α) = gµ (α) } dünn für alle ν < µ < ω2 . Wie im Beweis oben
existiert dann ein D ⊆ ω2 und ein n* P ω derart, dass |D| = ω2 und
Bα = { α < ω1 | gν (α) = n* } stationär ist für alle α P D. Aber Bν ∩ Bµ ist
dünn für alle ν ≠ µ in D, also ist # nicht saturiert.
Ultrafilter auf ω1
Aus der Existenz einer Ulam-Matrix auf ω1 folgt, dass kein ω1 -vollständiger
uniformer Ultrafilter U auf ω1 existieren kann. Anders formuliert: Es gibt kein
nichttriviales 0-1-wertiges σ-additives Maß, das auf der ganzen Potenzmenge
von ω1 definiert ist. (Allgemeiner zeigt eine Ulam-Matrix, dass kein reellwertiges
Maß existieren kann.) Wir können die unmögliche Forderung nach einem vollen
Maß auf ω1 aber in mancherlei Hinsicht abschwächen, und es ergeben sich dann
wieder kombinatorische Fragen, die in ZFC weder beweisbar und modulo der
Konsistenz großer Kardinalzahlen auch nicht widerlegbar sind.
Eine nahe liegende Abschwächung ist die Frage, wie viele partielle Maße wir
brauchen, um die ganze Potenzmenge von ω1 ausmessen zu können. Der fol-
gende Satz besagt, dass abzählbar viele partielle Maße nicht ausreichen:
Beweis
Wir setzen Sn = P(ω1 ) − (Fn ∪ In ) für alle n. Für alle n P ω sei dann
〈An, α | α < ω1 〉 eine Zerlegung von ω1 mit An, α P Sn für alle α < ω1 . (Eine
solche Zerlegung existiert für alle n P ω, da andernfalls Fn ein Ultrafilter auf
ω1 wäre, was nicht sein kann.) Wir definieren nun f : ω → ω durch:
f(n) = min({ m P ω | es gibt ω1 -viele α < ω1 mit Am, α P Sn }).
Dann gilt f(n) ≤ n für alle n, und es gibt ein β < ω1 , sodass für alle n gilt:
(+) Am, α ¸ Sn für alle α > β und alle m < f(n).
Wir definieren rekursiv für alle n P ω:
γn = „das kleinste γ > γn − 1 mit A f(n), γn P Sn “, wobei γ − 1 = β, und setzen
Bn = Af(n), γn − { Af(m), γm | m P ω, f(m) < f(n) } für alle n P ω.
Dann gilt:
(i) Bn P Sn für alle n P ω
(ii) Bn ∩ Bm = ∅ für alle n < m < ω
zu (i): Es gilt Af(n), γn P Sn , und für alle m mit f(m) < f(n) folgt aus (+) und
γn > β, dass Af(m), γm P In .
zu (ii): Ist f(m) = f(n), so folgt die Behauptung aus γn ≠ γm , da die Mengen
Af(n), γ , γ < ω1 paarweise disjunkt sind. Ist f(n) ≠ f(m), so folgt die
Behauptung aus der Definition von Bn und Bm .
Wir zerlegen nun jedes Bn in zwei Teile Bn, 0 und Bn, 1 , die beide Elemente
von Sn sind, und setzen
X = Ín P ω Bn, 0.
Dann gilt X ¸ Fn und ω1 − X ¸ Fn für alle n P ω.
Definition (Ulam-Eigenschaft)
ω1 hat die Ulam-Eigenschaft, falls es eine Folge 〈Fα | α < ω1 〉 von
ω1 -vollständigen uniformen Filtern auf ω1 gibt mit P(ω1 ) = Íα < ω1 Fα ∪ Iα ,
wobei Iα das duale Ideal von Fα ist für alle α < ω1 .
Übung
Ist # ω1 -dicht, so hat ω1 die Ulam-Eigenschaft.
[ Sei 〈Xα | α < ω1 〉 eine Folge wie in der Definition von ω1 -dicht. Wir setzen dann
Fα = #[ Xα ] = { X ⊆ ω1 | es gibt ein C P # mit X ⊇ C ∩ Xα } für alle α < ω1 .
Dann ist jedes Fα ein uniformer ω1 -ständiger Ultrafilter und es gilt die erwünschte
Überdeckungseigenschaft, d. h. P(ω1 ) = Íα < ω1 Fα ∪ Iα . ]
Verstärken wir die Forderung der ω1 -Vollständigkeit zur Normalität der Filter Fα , so ist
die so verstärkte Ulam-Eigenschaft sogar äquivalent zur ω1 -Dichtheit von #ω1 . Die kon-
struierten Filter im Hinweis der obigen Übung sind normal. Für die umgekehrte Rich-
tung siehe [ Taylor 1980 ].
Beweis
Wir zeigen zunächst, dass U ⊇ #. Sei C ⊆ ω1 club, und sei A = ω1 − C. Für
alle α P A sei f(α) = sup(C ∩ α). Dann ist f regressiv auf A und
Xγ = { α P A | f(α) < γ } ist beschränkt in ω1 für alle γ < ω1 . Wegen U
uniform ist also Xγ ¸ U für alle γ < ω1 . Also ist A ¸ U.
Zum Beweis der Nichtregularität sei 〈Xα | α < ω1 〉 eine Folge in U.
Annahme, für alle unendlichen A ⊆ ω1 ist >α P A Xα = ∅. Wir definieren
f : ω1 → ω1 durch
f(α) = sup({ β < α | α P Xβ }) für alle α < ω1 .
Nach Annahme ist f regressiv auf ω1 . Sei also γ < ω1 derart, dass
Y = { α < ω1 | f(α) < γ } P U. Dann ist Y ∩ Xγ ⊆ γ + 1, denn für alle
α P Y mit γ < α ist sup({ β < α | α P Xβ }) < γ, also insbesondere α ¸ Xγ .
Also ist Y ∩ Xγ P U beschränkt, im Widerspruch zu U uniform.
Es gilt auch die Umkehrung des Satzes: Jeder nichtreguläre Ultrafilter, der
den club-Filter umfasst, ist schwach normal. Dies werden wir unten beweisen.
Die Existenz eines schwach normalen Ultrafilters folgt, mit nichttrivialen Ar-
gument, aus der ω1 -Dichtheit von #. Andererseits gilt:
Beweis
Wir zeigen die Behauptung indirekt. Sei also 〈gν | ν < ω2 〉 eine Folge von
Funktionen von ω1 nach ω, die paarweise nur auf einer dünnen Teilmenge
von ω1 übereinstimmen.
Für zwei beliebige Funktionen f1 , f2 : ω1 → On setzen wir
f1 < U f2 , falls { α < ω1 | f1 (α) < f2 (α) } P U,
f1 = U f2 , falls { α < ω1 | f1 (α) = f2 (α) } P U.
Dann ist <U eine lineare Ordnung modulo der Äquivalenzrelation = U .
Für alle ν < µ ist gν ≠U gµ , da { α < ω1 | gν (α) ≠ gµ (α) } P # ⊆ U. Weiter
existiert ein ν* < ω2 mit |{ ν < ω2 | gν <U gν* }| ≥ ω1 (!). Durch Umord-
nung der gν -Folge dürfen wir o. E. annehmen, dass ν* = ω1 und weiter
gν <U gω1 für alle ν < ω1 gilt. Für alle ν < ω1 sei dann
Xν = { α P ω1 | gν (α) < gω1 (α) } − ͵ < ν { α P ω1 | gµ (α) = gν (α) }.
Dann gilt Xν P U für alle ν < ω1 .
Beweis
Sei f : ω1 → ω1 regressiv auf ω1 . Aus U ⊇ # folgt zunächst:
(+) g + f < U idω1 für alle g : ω1 → ω1 .
Beweis von (+)
Andernfalls gibt es ein g : ω1 → ω1 mit
Y = { α < ω1 | α ≤ g(f(α)) } P U.
Wegen U ⊇ # ist Y stationär. Nach dem Satz von Fodor existieren ein
stationäres S ⊆ Y und ein δ* < ω1 mit f(α) = δ* für alle α P S. Dann gilt
aber α ≤ g(δ*) für alle α P S, im Widerspruch zu S unbeschränkt in ω1 .
Sei 〈gν | ν < ω2 〉 eine Folge von fast disjunkten Funktionen auf ω1 . Dann
existiert für alle ν < µ < ω2 ein δ < ω1 mit:
(++) { α < ω1 | gν (f(α)) = gµ (f(α)) } ⊆ { α < ω1 | f(α) ≤ δ }.
Denn andernfalls wäre gν (β) = gµ (β) für unbeschränkt viele β < ω1 .
Bislang haben wir nur benutzt, dass U ⊇ # gilt. Wir zeigen nun:
(+++) Ist U nicht schwach normal, so ist U regulär.
Sei also Xδ = { α < ω1 | f(α) ≥ δ } P U für alle δ < ω1 . Nach (++) gilt
gν + f ≠ U gµ + f für alle ν < µ < ω2 .
Nach (+) ist gν + f <U idω1 für alle ν < ω2 . Sei bα : α → ω injektiv für alle
α < ω1 . Für alle ν < ω2 und α < ω1 sei
g′ν (α) = bα (gν (f(α))), falls gν (f(α)) < α, und = 0, sonst.
Dann ist 〈g′ν | ν < ω2 〉 eine Folge von Funktionen von ω1 nach ω mit
g′ν ≠U g′µ für alle ν < µ < ω2 . Wie im Beweis oben folgt, dass der Ultrafilter
U regulär ist.
In ZFC lässt sich zudem zeigen: Existiert ein nichtregulärer uniformer Ultra-
filter U auf ω1 , so existiert ein nichtregulärer Ultrafilter U auf ω1 mit U ⊇ #. Da-
mit ist in ZFC die Existenz eines schwach normalen und eines nichtregulären
Ultrafilters auf ω1 gleichwertig.
Kombinatorische Implikationen
Nach obigen Ergebnissen gelten die folgenden Implikationen (von oben nach
unten) der betrachteten kombinatorischen Prinzipien auf ω1 :
# ist ω1 -dicht
starke Dominierung
Transversalen-Hypothese
schwache Dominierung
Subtile Implikationen sind ein typisches Kennzeichen für Theorien, denen ein
starkes ordnendes Axiom fehlt. Neben ZFC ist auch ZF ein Beispiel für eine sol-
che Theorie. Auch hier erhalten wir komplexe Implikationen zwischen vielen
Aussagen, die sich mit Hilfe von AC beweisen lassen. Welches Axiom könnte nun
für die kombinatorischen Prinzipien die ordnende Rolle übernehmen? Sollen
wir annehmen, dass der club-Filter ω1 -dicht ist, weil wir dadurch viele kombina-
torische Fragen lösen? Oder sollen wir Gödels konstruktibles Axiom annehmen,
das scheinbar alle kombinatorischen Fragen beantwortet, aber alle starken Hy-
pothesen im obigen Diagramm verwirft? Oder belassen wir es oberhalb von ZFC
mit der Untersuchung von Implikationen in ZFC und der Konstruktion von Mo-
dellen mit Hilfe möglichst schwacher großer Kardinalzahlaxiome? Der gefun-
dene Strukturreichtum ist bemerkenswert, aber viele Fragen bleiben offen.
Einige Eigenschaften lassen sich für stationäre Teilmengen von ω1 in ZFC be-
weisen, aber nicht für stationäre Teilmengen von ω2 und darüber hinaus. Ein Bei-
spiel ist die Existenz langer stetiger Folgen in stationären Mengen. Für ω1 gilt:
Beweis
Wir nennen 〈σβ | γ < α〉 wie im Satz eine α-Folge. Wir zeigen die Existenz von
α-Folgen simultan für alle stationären Mengen S durch Induktion nach α < ω1 .
Nachfolgerschritt von α nach α + 1, α kein Limes:
Sei f eine α-Folge. Sei α = α′ + 1 und sei σ P S mit σ > sup(rng(f )). Dann
ist f ∪ { (α, σ) } eine (α + 1)-Folge.
Limesschritt λ:
Sei 〈α n | n P ω〉 s. a. k. in λ mit αn Nachfolger für alle n P ω. Seien fn
αn -Folgen mit fn + 1 (0) > sup(rng(fn )) für alle n P ω. Sei f die monotone
Aufzählung von Ín P ω rng(fn ). Dann ist f eine dom(f )-Folge, dom(f ) ≥ λ.
Nachfolgerschritt von λ nach λ + 1, λ Limes:
Seien fη λ-Folgen mit fη + 1 (0) > δη = sup(rng(fη )) für alle η < ω1 . Dann
ist { δη | η < ω1 , η Limes } club in ω1 . Also existiert ein Limes η mit
δη P S. Sei 〈ηn | n P ω〉 s. a. k. in η. Weiter sei 〈αn | n P ω〉 s. a. k. in λ mit
αn Nachfolger für alle n P ω. Sei nun f die monotone Aufzählung von
Ín P ω rng(fη n |αn). Dann ist f eine dom(f )-Folge mit dom(f ) ≥ λ. Wegen
sup(rng(f )) = δη P S ist (f ∪ { (dom(f ), δη ) })|(λ + 1) eine (λ + 1)-Folge.
Eine analoge Aussage für ω2 lässt sich in ZFC nicht mehr beweisen und mo-
dulo der Konsistenz großer Kardinalzahlen auch nicht widerlegen.
Bäume
• • • • • • • • • 3. Stufe
• • • • • • • 2. Stufe
• • • • • 1. Stufe
• • 0. Stufe
Wir schreiben im Folgenden oft auch nur T statt ausführlich 〈T, <〉.
Um über Bäume angemessen reden zu können, brauchen wir noch einige Be-
griffe.
Ist T fest, so unterdrücken wir Indizes und schreiben etwa o.t.(s) statt o.t.T (s).
Es gilt offenbar:
height(T) = „das kleinste α P On mit T= α = ∅“.
Für alle Bäume T ist T= 0 die Menge aller s P T, die keine Vorgänger in T ha-
ben. T = 〈∅, ∅〉 ist der eindeutige Baum der Höhe 0. Für alle nichtleeren Men-
gen x ist T = 〈x, ∅〉 ein Baum der Höhe 1 mit T= 0 = { x }. Für alle Ordinalzahlen
α ist 〈α, P〉 ein Baum der Höhe α mit T= β = { β } für alle β < α.
〈T, <〉 ist also ein Wurzelbaum, falls die partielle Ordnung 〈T, <〉 ein kleinstes Ele-
ment besitzt. Die Blätter des Baumes T sind genau die maximalen Elemente der Ord-
nung 〈T, <〉.
Eine wichtige Klasse bilden die Bäume, die aus Folgen gebildet sind:
Definition (Folgenbaum)
Ein Baum 〈T, <〉 heißt ein Folgenbaum in M, falls es eine Ordinalzahl γ gibt
mit:
<γ
(i) T ⊆ M = { s : α → M | α < γ }.
(ii) T ist abgeschlossen unter Anfangsstücken, d. h. ist s P T und
α < dom(s), so ist s|α P T.
(iii) < = ⊂|T, d. h. für alle s, t P T gilt: s < t gdw s ⊂ t.
Definition (Zweig)
Sei 〈T, <〉 ein Baum. Ein B ⊆ T heißt Zweig von T, falls gilt:
(i) 〈B, <〉 ist linear geordnet.
(ii) Für alle s P B ist predT (s) ⊆ B.
Ein Zweig B heißt konfinal, falls kein Zweig B′ existiert mit B ⊂ B′. Die
Länge eines Zweiges ist der Ordnungstyp von 〈B, <〉.
Dabei steh „B“ für engl. branch. Wir nennen auch eine <-aufsteigende Folge
〈xα | α < β〉 einen Zweig, falls ihr Wertebereich ein Zweig nach der obigen Defi-
nition ist. Es gilt dann xα P T= α für alle α < β.
Für alle t P T ist predT (t) ∪ { t } ein Zweig in T. Dieser Zweig ist genau dann
konfinal in T, wenn t ein Blatt von T ist.
Ein Zweig eines Folgenbaumes T ⊆ < γ M hat die Form
B = { f|α | α < dom(f) }
für ein f mit dom(f) ≤ γ. Wir können dann B mit f identifizieren.
Bei der Untersuchung von Bäumen spielen die folgenden Begriffe eine wich-
tige Rolle:
Ist 〈T, <〉 ein Baum, so ist jede Stufe T= α eine Antikette in T. Existiert für alle
s P T mit o. t.(s) < α ein t P T= α mit s < t, so ist die Stufe T= α sogar eine maxi-
male Antikette in T.
Eine Ansammlung von nützlichen Strukturvoraussetzungen vereint der fol-
gende Begriff:
Ein normaler Baum T hat nach (iii) nur dann Blätter, wenn seine Höhe eine Nach-
folgerordinalzahl α + 1 ist. In diesem Fall ist dann T= α die Menge der Blätter von T.
Wir studieren Bäume der Höhe ω1 , die keine überabzählbaren Zweige besit-
zen. Zwei wichtige Klassen sind:
Definition (Suslin-Baum)
Ein Baum 〈T, <〉 heißt ein Suslin-Baum (auf ω1 ), falls gilt:
(i) height(T) = ω1 .
(ii) Jeder Zweig von T ist abzählbar.
(iii) Jede Antikette von T ist abzählbar.
Definition (Aronzajn-Baum)
Ein Baum 〈T, <〉 heißt ein Aronzajn-Baum (auf ω1 ), falls gilt:
(i) height(T) = ω1 .
(ii) Jeder Zweig von T ist abzählbar.
(iii) Jede Stufe von T ist abzählbar.
Jeder Suslin-Baum ist ein Aronzajn-Baum, da die Stufen eines Baumes Anti-
ketten sind. Die Umkehrung ist, wie wir sehen werden, nicht richtig.
Übung
(a) Statt (i) können wir äquivalent jeweils fordern, dass |T| = ω1 gilt.
(b) Existiert ein Suslin-Baum, so existiert auch ein blattfreier normaler
Suslin-Baum.
(c) Sei 〈T, <〉 ein Baum mit (i), (iii) wie in der Definition von „Suslin-
Baum“. Zudem sei |sucT (s)| ≥ 2 für alle t P T, die kein Blatt von T
sind. Dann ist 〈T, <〉 ein Suslin-Baum.
Insbesondere ist also jeder normale Baum der Höhe ω1 , der keine überabzähl-
baren Antiketten besitzt, ein Suslin-Baum.
Man kann in ZFC zeigen, dass ein Aronzajn-Baum existiert. Hier spielt der
Ordnungstyp der rationalen Zahlen eine entscheidende Rolle:
Beweis
Sei T* der Folgenbaum aller f P < ω 1 Q, die streng monoton wachsen und
beschränkt in Q sind. T* hat die Höhe ω1 und besitzt lediglich abzählbare
Zweige. Jedoch sind die Stufen von T* überabzählbar für alle α ≥ ω. Der
gesuchte Aronzajn-Baum T wird ein Teilbaum von T* sein.
Für f P T* und q P Q schreiben wir im Folgenden
f ≪ q anstelle von sup(rng(f )) < q.
Wir definieren einen Folgenbaum T ⊆ T*, indem wir für α < ω1 rekursiv
seine Stufen T= α ⊆ T*= α definieren. Dabei erhalten wir für alle α < ω1 die
folgende Eigenschaft aufrecht:
(+) Seien α < β, g P T= α und q P Q mit g ≪ q.
Dann existiert ein f P T= β mit g ⊂ f und f ≪ q.
Die Rekursion verläuft wie folgt.
Rekursionsanfang α = 0:
Wir setzen T= 0 = { ∅ } .
Rekursionsschritt von α nach α + 1:
Wir setzen
T= α + 1 = { g ∪ { (α, r) } P T* | g P T= α , r P Q }.
Dann gilt weiterhin (+).
Limesschritt λ:
Sei α < λ, und sei g P T= α . Weiter sei q P Q mit g ≪ q. Wir definieren
eine Funktion f(g, q) : λ → Q in T* wie folgt.
Seien 〈λn | n < ω〉, 〈qn | n < ω〉 streng monoton wachsend mit:
(α) α = λ0 , g ≪ q0 ,
(β) supn < ω λn = λ, supn < ω qn < q.
Nach I. V. (+) existiert dann eine Folge 〈gn | n < ω〉 mit:
(i) gn P T= λn für alle n < ω,
(ii) g = g0 ⊂ g1 ⊂ … ⊂ gn ⊂ …, n < ω,
(iii) gn ≪ qn für alle n < ω.
Wir setzen nun:
f(g, q) = Ín < ω gn.
Dann ist f(g, q) P T*= λ und f(g, q) ≪ q.
Wir setzen:
T= λ = { f(g, q) | g P T< λ , q P Q, g ≪ q }.
Nach Konstruktion gilt dann weiterhin (+).
Es gilt height(T) = ω1 und |T= α | ≤ ω für alle α < ω1 nach Konstruktion.
Weiter existiert kein überabzählbarer Zweig von T, denn wäre B ⊆ T ein
überabzählbarer Zweig, so wäre g = Í B eine streng monotone Funktion
von ω1 nach Q, was nicht sein kann. Also ist 〈T, ⊂〉 ein Aronzajn-Baum.
Übung
Der im Beweis konstruierte Aronzajn-Baum ist normal. Weiter besitzt er
eine überabzählbare Antikette und ist also kein Suslin-Baum.
[ Sei B = { g P T | dom(g) ist Nachfolgerordinalzahl }. Für g P B sei
qg = g(dom(g) − 1) = max(rng(g)) P Q.
Sei q* P Q und A ⊆ B überabzählbar mit qg = q* für alle g P A. Dann ist A eine
überabzählbare Antikette in T. Denn wäre g ⊂ g′ für g, g′ P A, so würde q* zweimal
von g′ als Wert angenommen werden, im Widerspruch zu g′ streng monoton
wachsend.]
Suslin-Hypothese (SH)
Jede dichte lineare Ordnung 〈M, <〉, die die Antiketten-Bedingung erfüllt,
ist separabel.
Dabei erfüllt eine lineare Ordnung 〈M, <〉 die Antiketten-Bedingung, wenn
jede Menge von offenen paarweise disjunkten Intervallen von M abzählbar ist.
Die Suslin-Hypothese ist motiviert durch die Frage:
Kann in der klassischen ordnungstheoretischen Charakterisierung von 〈R, <〉 die
Separabilität zur Antikettenbedingung abgeschwächt werden?
Definition (Suslin-Gerade)
Eine lineare Ordnung 〈M, <〉 heißt Suslin-Gerade, falls gilt:
(i) 〈M, <〉 ist unbeschränkt, vollständig und dicht.
(ii) 〈M, <〉 erfüllt die Antiketten-Bedingung.
(iii) 〈M, <〉 ist nicht separabel, d. h. es gibt keine abzählbare dichte
Teilmenge von M.
Beweis
(i) Â (ii): Sei 〈M, <〉 eine Suslin-Gerade. Wir definieren für α < ω1
rekursiv Intervalle
Iα = ] xα , yα [ = { z P M | xα < z < yα }
mit xα < yα derart, dass für alle β < α < ω1 gilt:
(+) I β ∩ Iα = ∅ oder I β ⊃ Iα ∪ { xα , yα }
Rekursionsschritt α < ω1
Sei R = { xβ , yβ | β < α } die Menge der Randpunkte der bislang
konstruierten Intervalle. Dann ist Rα abzählbar und damit nicht
dicht in M. Sei also I α = ] x α , yα [ , xα < yα , ein Intervall in M derart,
dass [ xα , yα ] ∩ R = ∅. Dann gilt weiterhin (+).
Wir setzen nun:
T = 〈 { I α | α < ω1 }, ⊃ 〉.
Nach (+) ist T ein Baum. Wir zeigen, dass T ein Suslin-Baum ist.
Offenbar gilt |T| = ω1 . Jede Antikette von T ist nach (+) eine Antikette
der Ordnung 〈M, <〉, also hat T keine überabzählbaren Antiketten. Es
existieren aber auch keine überabzählbaren Zweige in T. Denn
andernfalls existiert ein streng monoton wachsendes g : ω1 → ω1 mit
Ig(α) ⊃ Ig(β) für alle α < β < ω1 . Dann ist aber 〈xg(α) | α < ω1 〉 eine streng
monoton wachsende Folge in 〈M, <〉. Also ist
A = { ] xg(α) , xg(α + 1) [ | α < ω1 }
eine überabzählbare Antikette von Intervallen in 〈M, < 〉, Widerspruch.
(ii) Â (i): Sei 〈T, <〉 ein normaler Suslin-Baum. Wir setzen
M = { B ⊆ T | B ist ein konfinaler Zweig von T },
und definieren eine Ordnung auf M wie folgt. Für alle t P T sei < t
eine lineare Ordnung von suc(t) des Ordnungstyps η, d. h. es gilt
〈suc(t), < t 〉 ; 〈Q, <〉. Eine solche Ordnung < t existiert, denn es gilt
|suc(t)| ≤ ω wegen T Suslin und |suc(t)| ≥ ω wegen T normal.
Für B, C P M hat B ∩ C ein größtes Element nach der Limesbedingung
der Normalität. Wir können also definieren:
B < C falls „der Nachfolger von t = max(B ∩ C) in B ist <t -kleiner
als der Nachfolger von t in C.“
Kurz: C liegt lexikographisch rechts von B in dem durch die linearen
Ordnungen <t organisierten Baum.
Dann gilt:
(+) 〈M, <〉 ist unbeschränkt, dicht und nicht separabel.
Damit ist also die Vervollständigung von 〈M, <〉 eine Suslin-Gerade.
Beweis von (+)
〈M, <〉 ist offenbar eine dichte lineare Ordnung ohne Endpunkte.
Für t P T definieren wir ein Intervall I t von M durch
I t = { B P M | t P B }.
Ist J ein nichtleeres offenes Intervall von 〈M, <〉, so gibt es ein
t = t( J) mit I t ⊆ J. Ist weiter A eine Antikette in 〈M, <〉, so ist
A′ = { t( J) | J P A, J ≠ ∅ }
eine Antikette in T. Also ist jede Antikette in 〈M, <〉 abzählbar.
Es bleibt zu zeigen, dass 〈M, <〉 nicht separabel ist. Sei also Q ⊆ M
abzählbar. Jedes B P Q ist abzählbar, also ist auch Í Q ⊆ T
abzählbar. Also existiert ein α < ω1 derart, dass
ÍQ ∩ T= α = ∅.
Sei nun t P T= α . Dann ist I t ∩ Q = ∅, also ist Q nicht dicht in 〈M, <〉.
Das Karo-Prinzip
Wir können uns die linke obere Hälfte des Quadrats ω1 × ω1 abgedunkelt vor-
stellen, einschließlich der Diagonalen D = { (α, α) | α < ω1 }. Die Mengen Sα tra-
gen wir nun in der rechten unteren Hälfte ein. Nun ziehen wir eine beliebige
Teilmenge S von ω1 von links nach rechts durch das Quadrat. Dabei wird ein im-
mer größeres Anfangsstück von S sichtbar. Wir notieren alle α, für die Sα mit
dem sichtbaren Anfangsstück S ∩ α von S übereinstimmt. Eine ♦-Folge „rät“ in
diesem Sinne die Anfangsstücke jeder beliebigen Teilmenge von ω1 stationär oft
richtig. Dadurch wird die Potenzmenge von ω1 in vielerlei Hinsicht gebändigt
und gut analysierbar.
Man kann zeigen, dass das Karo-Prinzip äquivalent ist zu der scheinbar schwä-
cheren Version, die in (ii) für alle S ⊆ ω1 lediglich die Existenz eines einzigen un-
endlichen α < ω1 fordert mit S ∩ α = Sα . Dagegen ist die Forderung „für club-
viele α < ω1 “ statt „für stationär viele α < ω1 “ in (ii) unmöglich, wie man sich
leicht überlegt.
Eine der einfachsten Folgerungen des Karo-Prinzips ist:
Beweis
Sei 〈Sα | α < ω1 〉 eine ♦-Folge. Dann gilt:
(+) P(ω) ⊆ { Sα | α < ω1 }.
Denn für alle S ⊆ ω existiert ein ω ≤ α ≤ ω1 mit S = S ∩ α = Sα . Aus (+)
folgt aber, dass 2ω ≤ ω1 .
Das Karo-Prinzip können wir also als eine starke Version der Kontinuums-
hypothese ansehen.
Beweis
Sei 〈Sα | α < ω1 〉 eine ♦-Folge für ω1 . Wir konstruieren die Stufen T= α
und die Ordnung <T eines normalen Baumes T = 〈ω1 , < T 〉 durch Rekursion
über α < ω1 . Dabei sind alle Teilbäume T≤ α normal, und es gilt T≤ α ⊇ α.
Rekursionsanfang α = 0 :
Wir setzen T= 0 = { 0 }.
Rekursionsschritt von α nach α + 1 :
Sei 〈β γ | γ < α*〉 die monotone Aufzählung von T= α . Weiter seien
〈 δ ξ | ξ < ω ⋅ α*〉 die ersten (ω ⋅ α*)-vielen Ordinalzahlen von ω1 − T≤ α ,
also die ersten (ω ⋅ α*)-vielen bislang unverbrauchten Ordinalzahlen.
Die Stufe T= α + 1 samt Baumordnung definieren wir nun durch:
sucT ( βγ ) = { δ ω ⋅ γ + n | n < ω } für alle γ < α*.
Dann ist T≤ α + 1 normal.
Rekursionsschritt λ, mit λ Limes :
Für alle t P T< λ sei Bt ⊆ T< λ mit den Eigenschaften:
(a) tPBt .
(b) Bt ist ein konfinaler Zweig der Länge λ in T< λ .
(c) Ist Sλ eine maximale Antikette in T< λ , so ist Bt ∩ Sλ ≠ ∅.
Ein solches Bt existiert nach Normalität von T< λ . Denn sei 〈αn | n P ω〉
s. a. k. in λ mit t = t0 P T= α0 . Sei rekursiv tn + 1 ein Element von T= αn + 1
oberhalb von tn für alle n P ω. Dann gilt (a) und (b) für
B t = { s P T< λ | s < T tn für ein n < ω }.
Die Bedingung (c) können wir sicherstellen, indem wir α1 und t1 so
wählen, dass t1 P Sλ gilt, falls überhaupt ein Element von Sλ oberhalb
von t liegt. Ist dann Sλ eine maximale Antikette in T< λ , so ist ein t′ ≤ t in
Sλ oder es gilt t1 P Sλ . In jedem Falle gilt dann (c).
Sei f : { Bt | t P T< λ } → ω1 − T< λ injektiv. Wir setzen:
T= λ = rng(f ).
Wir erweitern nun noch die Baumordnung von T< λ nach T≤ λ , indem
wir für alle s, t P T< λ definieren:
s < T f(bt ) falls s P b t .
Es ist klar, dass T≤ λ normal ist.
Damit ist T = 〈ω1 , <T 〉 definiert. Wir zeigen, dass T ein Suslin-Baum ist. Da
T ein normaler Baum der Höhe ω1 ist, genügt es zu zeigen, dass T keine
überabzählbaren Antiketten besitzt. Sei also A ⊆ T eine o. E. maximale
Antikette in T. Wir zeigen, dass A abzählbar ist. Hierzu setzen wir:
C = { λ < ω1 | λ Limes, T< λ = λ,
A ∩ λ ist eine maximale Antikette in T < λ }
Dann ist C club in ω1 (!). Sei nun
S = { α < ω1 | A ∩ α = Sα }.
Dann ist S stationär in ω1 . Also existiert ein λ P C ∩ S, und dann ist A ∩ λ
= Sλ eine maximale Antikette in T< λ = λ. Wir zeigen:
(+) A = S λ .
Damit ist A insbesondere abzählbar.
Beweis von (+)
Annahme nicht. Sei dann s P A − λ, und sei s′ ≤T s mit s′ P T= λ . Weiter sei
B t wie im Limesschritt der Konstruktion von T= λ ein für die Existenz
von s′ P T= λ verantwortlicher konfinaler Zweig von T< λ . Dann gilt
s″ <T s′ ≤T s für alle s″ P B t .
Nach (c) gibt es ein s″ P Bt ∩ Sλ . Dann ist also s″ < s mit s″, s P A, im
Widerspruch zu A Antikette von T.
Der Beweis führte zur Isolation des Karo-Prinzips. Eine maximale Antikette A
in einem beliebigen Baum T auf ω1 reflektiert sehr häufig auf die Stufen des Bau-
mes: Die Menge A ∩ λ ist für club-viele λ eine maximale Antikette von T< λ . Die
Karo-Folge wird eingesetzt, um die Anfangsstücke der Antikette zu raten. Die
spezielle Eigenschaft der rekursiven Baumkonstruktion ist nun, dass die Zweige
{ s′ < s | s′ P T< λ }, die den Elementen s einer Limesstufe T= λ zugeordnet sind,
die Mengen Sλ treffen, falls diese eine maximale Antikette in T< λ sind. Diese Ei-
genschaft sichert, dass wir nicht nur die Anfangsstücke von Antiketten richtig ra-
ten, sondern die Antikette selbst.
Das Karo-Prinzip hat viele kombinatorische Konsequenzen. Zwei Beispiele
behandeln die folgenden Übungen.
Übung
Es gelte ♦. Dann existiert ein 6 ⊆ { S ⊆ ω1 | S ist stationär in ω1 } mit:
(i) |6| = 2ω1
(ii) |S ∩ T| ≤ ω für alle S, T P 6 mit S ≠ T
[ Sei 〈Sα | α < ω1 〉 eine ♦-Folge. Für ein stationäres S ⊆ ω1 sei
g(S) = { α < ω1 | S ∩ α = Sα }.
Wir setzen 6 = { g(S) | S ⊆ ω1 , S stationär in ω1 }. Dann ist 6 wie gewünscht. ]
Übung
Es gelte ♦. Dann existiert eine Folge 〈Xλ | λ < ω1 Limes〉 mit:
(i) X λ ⊆ λ,
(ii) sup(X λ ) = λ,
(iii) o. t.(X λ ) = ω für alle λ,
(iv) für alle A P [ ω1 ]ω1 ist { λ < ω1 | λ Limes, Xα ⊆ A } stationär in ω1 .
[ Sei 〈Sα | α < ω1 〉 eine ♦-Folge. Für Limiten λ < ω1 mit sup(Sλ ) = λ sei Xλ eine
Teilmenge von Sλ mit (i) − (iii). Für alle anderen Limiten λ sei Xλ eine beliebige
Teilmenge von λ mit (i) − (iii). Dann ist 〈Xλ | λ < ω1 , λ Limes〉 wie gewünscht, d. h.
es gilt (iv). Denn sei A ⊆ ω1 unbeschränkt in ω1 . Sei C die Menge der Limespunkte
von A. Dann ist C club in ω1 . Also ist S = { λ P C | Sλ = A ∩ λ } stationär in ω1 . Für
alle λ P S gilt sup(Sλ ) = λ, und damit ist Xλ ⊆ Sλ ⊆ A für alle λ P S. ]
Kurepa-Bäume
Wir betrachten nun Bäume auf ω1 , die im Gegensatz zu den bislang studierten
Bäumen besonders viele überabzählbare Zweige besitzen.
Definition (Kurepa-Baum)
Ein Baum 〈T, <〉 heißt ein Kurepa-Baum, falls gilt:
(i) height(T) = ω1 .
(ii) T hat ω2 -viele überabzählbare Zweige.
(iii) Für alle α ist T= α abzählbar.
Definition (Kurepa-Familie)
Sei F ⊆ P(ω1 ). F heißt Kurepa-Familie, falls gilt :
(i) |F| ≥ ω2
(ii) |{ X ∩ α | X P F } | ≤ ω für alle α < ω1
Beweis
(i) Â (ii):
Sei 〈T, <T 〉 ein Kurepa-Baum. Ohne Einschränkung ist T = ω1 und <T
verträglich mit der ordinalen Ordnung < auf ω1 , d. h. für alle α, β < ω1
gilt:
α <T β impliziert α < β.
Wir setzen nun
F = { b ⊆ T | b ist überabzählbarer Zweig von T }.
Dann ist F eine Kurepa-Familie auf ω1 .
(ii) Â (i):
Sei F ⊆ P(ω1 ) eine Kurepa-Familie auf ω1 . Für jedes x P F definieren wir
eine Funktion fx : ω1 → P(ω1 ) durch :
fx (α) = x ∩ α für α < ω1
Wir setzen nun
T = { fx |α | α < ω1 , x P F },
und ordnen T durch echte Inklusion. Dann ist 〈T, ⊂〉 ein Kurepa-Baum
mit T= α = { fx |α | x P F } für alle α < ω1 .
Beweis
Sei T ein Kurepa-Baum. Für alle α < ω1 sei f α : T= α → ω injektiv.
Weiter seien bν : ω1 → T, ν < ω2 , paarweise verschiedene überabzählbare
Zweige von T, aufgefasst als Funktionen mit bν (α) P T= α für alle α < ω1 .
Wir definieren gν : ω1 → ω für alle ν < ω2 durch
gν (α) = fα (gν (α)) für alle α < ω1 .
Dann ist 〈gν | ν < ω2 〉 eine Folge von fast disjunkten Funktionen von ω1
nach ω.
Die Baumeigenschaft
Die Suche nach unendlichen Zweigen in Bäumen führt zu einer neuen großen
Kardinalzahleigenschaft. Ausgangspunkt ist der folgende bekannte Satz:
Beweis
Wir definieren rekursiv Knoten
s0 < s1 < … < sn < …
von T derart, dass oberhalb von sn immer noch unendlich viele Knoten von
T liegen. Dies ist möglich, da jeder Knoten von T nur endlich viele
Nachfolger besitzt.
Der Beweis verwendet das Auswahlaxiom bei der Wahl des nächsten Knotens.
Es stellt sich die Frage, ob diese Eigenschaft von schmalen Bäumen der Höhe
ω auch für schmale Bäume überabzählbarer Höhe gilt bzw. überhaupt gelten
kann. Wir definieren:
Beweis
Wir wissen bereits, dass messbare Kardinalzahlen unerreichbar sind. Sei
also T = 〈κ, <T 〉 ein κ-Baum. Für alle x P T sei
M x = { y P T | x ≤T y }.
Sei U ein κ-vollständiger nichttrivialer Ultrafilter auf κ. Für alle α < κ ist
|T< α | < κ, also ist T≥ α P U für alle α < κ. Aber es gilt
T≥ α = Íx P T =α
M x P U,
und damit gibt es wegen der κ-Vollständigkeit von U für alle α < κ genau
ein xα mit M xα P U. Für alle α, β < κ gilt dann
M xα ⊆ M xβ oder M xβ ⊆ M xα ,
da andernfalls ∅ = M xα ∩ M xβ P U gelten würde. Also ist B = { xα | α < κ }
ein Zweig in T der Mächtigkeit κ.
Wir erinnern an den Begriff der Zerlegung: Ein Z ⊆ P(M) heißt eine Zerle-
gung von M, falls die Elemente von Z nichtleer und paarweise disjunkt sind und
weiter Í Z = M gilt.
Ist f eine Funktion mit dom(f) = M, so heißt f auch eine (funktionale) Zerlegung
von M. Ist nämlich I = rng(f ), so ist
Z = { f −1 ″{ i } | i P I }
eine Zerlegung von M. Z = Z(f) heißt die zu f gehörige oder von f induzierte Zerle-
gung von M. Ist umgekehrt Z eine Zerlegung von M, so ist f : M → Z mit
f(a) = „das x P Z mit a P x“ für alle a P M
eine funktionale Zerlegung von M mit rng(f) = Z.
Ist , eine Äquivalenzrelation auf M, so ist die Menge der Äquivalenzklassen
Z = M/, eine Zerlegung der Menge M. Ist umgekehrt Z eine Zerlegung von M,
so definiert „a , b, falls ein x P Z existiert mit a, b P x“ eine Äquivalenzrelation
auf M.
Besonders suggestiv ist schließlich auch die Sprechweise der Färbung. Jede
Zerlegung f : M → I heißt auch eine Färbung von M. Stellen wir uns die Ele-
mente von I als verschiedene Farben vor, so wird jedes x P M mit der Farbe f(x)
versehen.
Beispiel
Ist z.B. M = [ N ]2 , I = 2, und betrachten wir 0 als rot, 1 als blau, so ist jede
Funktion f : M → 2 eine rot-blau-Färbung der zweielementigen Teilmen-
gen von N, also der Kanten des vollständigen Graphen 〈N, [ N ]2 〉. Das
folgende Diagramm zeigt eine Färbung f : [ 4 ]2 → 2.
blau
2 3
blau
0 1
Die Frage ist die nach der Existenz großer homogener Teilmengen für belie-
bige Färbungen f von [M]n für nPω. Das thematische Umfeld ist also: „Existie-
ren einfach große Teilsysteme von komplizierten Systemen?“
Wir nehmen ohne Einschränkung an, dass M und rng(f ) Kardinalzahlen sind.
Zur bequemen Formulierung ist folgende Notation nützlich:
Die Anordnung der Variablen κ, µ, n, k sind durch folgende Auf- und Abwärts-
regeln motiviert:
Übung
Es gilt:
(i) κ → (µ) nk impliziert κ′ → (µ) nk für alle κ′ ≥ κ.
(ii) κ → (µ) nk impliziert κ → (µ′) n′
k′ für alle µ′ ≤ µ, k′ ≤ k, n′ ≤ n.
Satz
Sei κ eine unendliche Kardinalzahl. Dann gibt es eine Färbung
f : [ κ ]ω → 2, die kein homogenes N ⊆ κ der Größe ω besitzt.
Beweis
Sei M = [ κ ]ω , und sei < eine Wohlordnung von M. Wir definieren
f : M → 2 durch
Das überraschende positive Resultat für die Pfeilnotation im Fall κ = ω ist der
folgende Satz:
Beweis
Wir zeigen die Behauptung für ein festes 1 ≤ k < ω durch Induktion nach
1 ≤ n < ω. Die anderen Fälle sind trivial.
Induktionsanfang n = 1:
Jede endliche Zerlegung von ω hat ein unendliches Element.
Mit Hilfe des Lemmas von König gewinnen wir eine endliche Version:
Beweis
Annahme nicht. Sei
T = { f : [r]n → k | n ≤ r < ω,
es gibt kein f-homogenes N ⊆ r mit |N| = m }.
Für f, g P T setzen wir:
f ≤ T g, falls f = g|[ s ]n für ein s P ω.
Dann ist 〈T, <T 〉 ein Baum. Nach Annahme hat T die Höhe ω. Weiter sind
alle Stufen von T endlich. Nach dem Lemma von König existiert also ein
unendlicher Zweig B ⊆ T. Sei dann f = Í B. Dann ist f : [ ω ]n → k, aber die
Färbung f hat keine homogene Teilmenge der Größe m, im Widerspruch
zum Satz von Ramsey.
Übung
Zeigen Sie umgekehrt den Satz von Ramsey aus seiner endlichen Version.
Übung
Sind s, d, n P ω, so heißt { s, s + d, s + 2d, ..., s + nd } eine arithmetische
Progression der Länge n + 1 mit Startpunkt s und Schrittweite d.
Der Satz von van der Waerden besagt:
Ist f : ω → k eine Färbung von ω, 1 ≤ k < ω, so existiert für alle n P ω
eine einfarbige arithmetische Progression der Länge n + 1, d. h. für alle
n P ω existieren s, d P ω mit |f ″{ s, s + d, ..., s + nd }| = 1.
Zeigen Sie, dass der Satz von van der Waerden äquivalent zur folgenden
endlichen Version ist:
Seien n, k P ω. Dann existiert ein w = w(n, k) P ω derart, dass für jede
k-Färbung f : w → k eine einfarbige arithmetische Progression
s, s + d, ..., s + nd existiert.
Die van der Waerden-Funktion w(n, k) = „das kleinste wPω mit obiger Eigen-
schaft“ wächst sehr schnell. Erst kürzlich hat Shelah gute Schranken für das
Wachstum dieser Funktion gefunden, zusammen mit einem neuen Beweis eines
stärkeren Satzes.
Aus dem Satz von van der Waerden folgt für jede k-Färbung von ω die Existenz
einer Farbe mit beliebig langen arithmetischen Progression in dieser Farbe. Die
Farbe anzugeben ist schwieriger. Ein wichtiges Ergebnis, das oftmals die Identi-
fikation einer „guten“ Farbe erlaubt, ist der folgende Satz von Szemeredi:
A ⊆ ω habe positive obere Dichte, d.h. es gibt ein positives reelles ε mit
(|A ∩ n|)/n ≥ ε für unendlich viele n P ω. Dann gibt es beliebig lange
arithmetische Progressionen in A.
Nach dem Satz von Ramsey gilt ω → (ω) nk für alle n, k P ω. Dagegen ist die
Partitionseigenschaft ω1 → (ω1 ) nk nicht mehr richtig. Genauer gilt:
Beweis
zu (i):
Für f, g P κ 2 mit f ≠ g sei δ({ f, g }) = min({ α < κ | f(α) ≠ g(α) }). Dann hat
δ : [ κ 2 ]2 → κ keine homogene Menge mit drei Elementen.
zu (ii):
Sei < lex die lexikographische Ordnung auf κ 2. Sei b : 2κ → κ 2 bijektiv.
Wir definieren F : [ 2κ ]2 → 2 durch
Neben dem Satz von Ramsey gehört der folgende Satz von Erdös und Rado,
den wir ohne Beweis angeben, zu den wichtigsten positiven Pfeil-Resultaten. Für
unendliche Kardinalzahlen definieren wir hierzu 2κ, n für n P ω rekursiv durch
2κ, 0 = κ
κ, n
2κ, n + 1 = 2(2 )
für alle n P ω.
Wir hatten oben gezeigt, dass Zerlegungen f : [κ]ω → 2 von [κ]ω ohne unend-
liche homogene Teilmengen existieren. Es ist daher vielleicht nicht überra-
schend, dass die folgende Forderung für Zerlegungen von [ κ ]< ω = Ín P ω [ κ ]n
eine starke Eigenschaft ist.
Übung
Es gilt non(ω → (ω)<2 ω ).
[ Wir setzen f(x) = 0, falls n P x, wobei x P[ ω ]n , und f(x) = 1 sonst. ]
Definition (Ramsey-Kardinalzahl)
Eine Kardinalzahl κ heißt eine Ramsey-Kardinalzahl, falls κ → (κ) <2 ω .
Sei M eine Menge von nichtleeren paarweise disjunkten Mengen und sei weiter
g = 〈Xi | i P I〉 eine Folge von nichtleeren Mengen. Eine Menge N ⊆ Í M ist
eine Auswahlmenge für M, falls N ∩ x genau ein Element enthält für alle x P M,
und eine Funktion f auf I ist eine Auswahlfunktion für g, falls f(i) P X i für alle
i P I gilt. Das Auswahlaxiom garantiert die Existenz von Auswahlmengen und
Auswahlfunktionen.
Wir zeigen den Satz in gestraffter Form. Dabei betrachten wir mehr Implika-
tionen als nötig.
Beweis
(AC) Â (WS):
Sei M eine Menge, und sei f eine Auswahlfunktion auf P(M) − { ∅ }. Wir
definieren rekursiv für α P On solange möglich:
xα = f(M − { xβ | β < α }).
Es gibt γ < |M|+ , sodass xγ nicht definiert ist (da M = { xβ | β < γ }). Wir
erhalten eine Wohlordnung <M auf M via „xα < M xβ gdw α < β“.
(WS) Â (AC):
Sei M eine Menge wie in (AC). Sei < eine Wohlordnung von M. Dann
ist { min(x) | x P M } eine Auswahlmenge für M.
(WS) Â (ZL):
Sei 〈P, <P 〉 wie im Zornschen Lemma. Sei < eine Wohlordnung von P.
Wir definieren rekursiv für α P On solange möglich:
pα = „das <-kleinste p P P mit: p > pβ für alle β < α“.
Dann existiert ein letztes definiertes p γ (mit γ < |P|+ ), und pγ ist
maximal in P. (Die obere Schranken-Bedingung garantiert, dass pλ für
alle Limiten λ definiert ist, falls pα für alle α < λ definiert ist.)
(WS) Â (HM):
Sei P eine partielle Ordnung, und sei 〈xα | α < γ〉 eine Aufzählung von P
(mit (WS)). Wir definieren rekursiv für α < γ:
(AC) Â (MS):
In ZF gilt |W × W| = |W| für alle unendlichen Wohlordnungen, wie
wir mit Hilfe der Γ-Funktion gezeigt haben. Mit (AC) ist jede Menge M
wohlordenbar, und damit folgt die Behauptung.
(ZL) Â (MS):
Mehrere Anwendungen des Zornschen Lemmas liefern (MS) ohne
Verwendung von Wohlordnungen (siehe „Einführung“, 1. 12).
(VS) Â (AC):
Sei M eine Menge, und sei 〈H, <〉 die Hartogs-Wohlordnung von M.
Dann ist der Fall |H| ≤ |M| ausgeschlossen, also gilt |M| ≤ |H|. Eine
Injektion von M nach H induziert eine Wohlordnung auf M.
(MS) Â (WS):
Sei M eine o. E. unendliche Menge, und sei 〈H, <〉 die Hartogs-
Wohlordnung von M. Dann gilt
|M + H| = |(M + H) 2 |
= |M2 + 2 × M × H + H2 |
≤ |M × H|
Sei also f : M + H → M × H injektiv. Das Argument von Bernstein
liefert nun eine Injektion von M nach H oder eine Injektion von H nach
M. Der zweite Fall ist ausgeschlossen, und eine Injektion f : M → H
induziert eine Wohlordnung auf M.
Übung
Die folgenden Aussagen sind äquivalent zu (AC) in ZF:
(i) Für jede Menge M existiert ein N ⊆ M mit den Eigenschaften:
(a) Die Elemente von N sind paarweise disjunkt und nichtleer.
(b) Ist x P M − N, x ≠ ∅, so existiert ein y P N mit x ∩ y ≠ ∅.
(ii) Für alle Folgen 〈M i | i P I〉 existiert eine Folge 〈Ni | i P I〉 mit den
Eigenschaften:
(a) Íi P I Ni = Íi P I M i
(b) Ni ⊆ M i für alle i
(c) Ni ∩ Nj = ∅ für alle i ≠ j.
Wir nennen die Aussage (#) den hierarchischen Wohlordnungssatz, weil sie ge-
nügt, um die Wohlordenbarkeit jeder Stufe der von Neumann-Hierarchie zu
zeigen. Der Nachfolgerschritt von Vα zu Vα + 1 = P(Vα ) ist durch (#) abge-
deckt. Im Limesschritt können wir Vλ nicht so ohne weiteres wohlordnen,
denn Wohlordnungen auf allen Vα , α < λ, lassen sich i. A. nicht einfach zu-
sammenfügen. Der folgende Beweis zeigt aber, dass wir dennoch über den Li-
messchritt kommen, indem wir eine zusätzliche Wohlordnung auf P(κ) für
ein großes, von λ abhängiges κ heranziehen.
Beweis
Aus (AC) folgt in der Wohlordnungssatz und damit (#). Wir nehmen also
(#) an und zeigen (AC). Es genügt, durch Induktion nach α P On zu zeigen:
(+) Jedes Vα ist wohlordenbar.
Denn ist M wohlordenbar und M P Vα , so ist M ⊆ Vα und damit wohlor-
denbar nach (+).
Induktionsanfang α = 0:
∅ ist eine Wohlordnung auf V0 .
Induktionschritt von α nach α + 1:
Nach I. V. ist Vα wohlordenbar. Nach Voraussetzung (#) ist dann auch
Vα + 1 = P(Vα ) wohlordenbar.
Limesschritt λ:
Nach Induktionsvoraussetzung ist jedes α < λ wohlordenbar, also
existiert |Vα | für alle α < λ. Wir setzen nun:
κ = (sup α < λ |Vλ |) + .
Nach Voraussetzung (#) existiert eine Wohlordnung <* von P(κ). Mit
Hilfe dieser Wohlordnung konstruieren wir nun rekursiv Wohlordnun-
gen <α von Vα für alle α < λ.
Rekursionsanfang α = 0:
Wir setzen <0 = ∅.
Die Bezeichnung (MC) steht hier für „multiple choice“. Das Prinzip ist äqui-
valent zur folgenden funktionalen Form: Für alle Folgen 〈M i | i P I〉 von nicht-
leeren Mengen existiert eine Funktion f auf I derart, dass f(i) eine endliche nicht-
leere Teilmenge von M i ist für alle i P I.
Es ist überraschend, dass das Prinzip der mehrfachen Auswahl äquivalent zum
Auswahlaxiom ist. Der Weg führt über den hierarchischen Wohlordnungssatz,
und damit wird das Fundierungsaxiom (und das Ersetzungsschema) ganz we-
sentlich zum Beweis der Äquivalenz verwendet.
Beweis
Nach dem hierarchischen Wohlordnungssatz genügt es, in ZF die
Implikationen (i) Â (ii), (ii) Â (iii) und (iii) Â (iv) zu zeigen.
(i) Â (ii): Sei 〈P, <〉 eine partielle Ordnung. Sei κ der Ordnungstyp der
Hartogs- Wohlordnung von P(P). Wir definieren eine Funktion
f : κ → { X ⊆ P | X ist Antikette in P }
rekursiv solange möglich durch:
f(α) = „eine echte Erweiterung der Antikette Íβ < α f(β)“.
Dann bricht die Rekursion ab (denn andernfalls wäre f : κ → P(X)
injektiv), und folglich ist Írng(f) eine maximale Antikette in P.
Die Rekursion ist gerechtfertigt nach (MC): Sei nämlich g eine
Funktion, die jedem X ⊆ P, X ≠ ∅, ein endliches nichtleeres g(X) ⊆ X
zuordnet. Wir setzen nun g′(X) = { p P g(X) | p ist minimal in g(X) }.
Für alle nichtmaximalen Antiketten X in P ist dann
X ∪ g′({ p P P − X | X ∪ { p } ist eine Antikette in P })
eine echte Antikettenerweiterung (um endlich viele Elemente). ]
(ii) Â (iii): Sei 〈M, < M 〉 eine lineare Ordnung. Wir definieren eine
partielle Ordnung 〈P, <〉 durch:
P = { (X, x) | X ⊆ M und x P X } ,
(X, x) < (Y, y), falls X = Y und x < M y.
Sei nun f ⊆ P eine maximale Antikette in P. Dann gilt:
(a) f ist eine Funktion (nach Linearität von <M )
(b) dom(f ) = P(M) − { ∅ } (nach Maximalität von f )
(c) f(X) P X für alle nichtleeren X ⊆ M (nach Konstruktion von P)
Basen in Erzeugendensystemen
Wir diskutieren schließlich noch ein instruktives Beispiel aus der Theorie der
Vektorräume. Eine einfache transfinite Induktion oder Anwendung des Zorn-
schen Lemmas zeigt, dass jedes Erzeugendensystem eines Vektorraumes eine
Basis des Vektorraumes als Teilmenge enthält. Umgekehrt kann man aus dieser
Aussage das Auswahlaxiom gewinnen. Genauer gilt:
Beweis
Wir zeigen (MC). Sei hierzu M eine Menge von paarweise disjunkten
nichtleeren Mengen, wobei o. E. jedes Element von M unendlich ist.
Sei nun K ein Körper wie in (#). Wir nennen eine K-wertige Funktion g
fast konstant, falls ein endliches E ⊆ dom(g) und ein α P K existieren,
sodass g(x) = α für alle x P dom(g) − E.
Sei N = Í M. Wir setzen:
V = „der K-Vektorraum aller g : N → K, für die es ein X P M gibt mit:
g|X ist fast konstant und g|(N − X) ist konstant gleich 0“.
G = { vPV | es gibt ein X P M, ein xv P X und ein α P K mit:
v(xv ) ≠ α, v(x) = α für alle x P X − { xv }
v(x) = 0 für alle x P N − X } .
Nach Voraussetzung (#) existiert eine Basis B ⊆ G von V. Für alle X P M
seien 1X P V die 0-1-wertige Indikatorfunktion von X und F(X) sei die
eindeutig bestimmte endliche Teilmenge von B, sodass
1X = ∑ v P F(X) α(v) v für gewisse α(v) P K − { 0 }.
Dann ist A = { xv | v P F(X), X P M } eine (MC)-Auswahlmenge von M.
Wir nennen 〈xn | n P ω〉 auch eine unendliche R-absteigende Folge in M. Die Be-
zeichnung (DC) steht für „dependent choice“. Das Axiom erlaubt uns, abzählbar
oft ein Element aus M zu wählen, das mit dem letzten gewählten Element in der
Relation R steht. Die Wahl von xn + 1 hängt von der Wahl von xn ab. Für partielle
Ordnungen 〈P, <〉, die die Voraussetzung (+) erfüllen, erhalten wir
x0 > x1 > … > xn > … in P.
Das abzählbare Auswahlaxiom folgt direkt aus (AC). Auch (DC) ist leicht mit
(AC) beweisbar: Ist R auf M wie in (DC) und x0 P M beliebig, so definieren wir:
xn + 1 = „ein x P M mit x R xn “ für alle n P ω.
Dann ist 〈xn | n P ω〉 wie gewünscht.
Zwischen den beiden Axiomen besteht folgender Zusammenhang:
Beweis
Sei M eine abzählbare Menge von nichtleeren paarweise disjunkten
Mengen. Ohne Einschränkung ist M unendlich. Sei also 〈Xn | n P ω〉 eine
Aufzählung von M ohne Wiederholungen. Sei
F = { 〈x0 , …, xn 〉 | n P ω und xi P Xi für alle i ≤ n }.
Für s, t P F sei s < t, falls s ein Anfangsstück von t ist (d. h. s = t|dom(s)).
Dann erfüllt < auf F die Voraussetzung (+) von (DC). Also existiert eine
Folge 〈sn | n P ω〉 in F mit sn < sn + 1 für alle n P ω. Wir setzen dann:
A = Ín P ω rng(sn).
Dann ist A eine Auswahlmenge für M.
Mit Hilfe von Modellkonstruktionen kann man dagegen zeigen, dass (DC) in
ZF + (ACω ) nicht beweisbar ist (ein Ergebnis von Jensen (1966)).
Wir untersuchen die beiden Prinzipien und ihre typische Verwendung nun
noch etwas genauer. Zuerst bemerken wir, dass (DC) folgende Verstärkung zu-
lässt:
Übung
In ZF + (DC) gilt:
Sind M und R wie in (DC), und ist x* P M beliebig, so existiert eine Folge
〈xn | n P ω〉 in M mit: x0 = x* und xn + 1 R xn für alle n.
Den Kern des Prinzips der abhängigen Auswahl bringt folgende Äquivalenz
ans Licht:
Beweis
(i) Â (ii): Ist R nicht wohlfundiert, so existiert ein nichtleeres N ⊆ M ohne
R-minimales Element. Also erfüllt R ∩ N 2 die Bedingung (+) von (DC),
und somit gibt es eine unendliche R-absteigende Folge in N ⊆ M.
(ii) Â (i): Sei R eine Relation auf M wie in (DC). Dann ist M eine
nichtleere Teilmenge von M, die kein R-minimales Element besitzt.
Also ist R nicht wohlfundiert. Nach Voraussetzung (ii) existiert also eine
unendliche R-absteigende Folge.
Die Lesart „es gibt keine unendliche absteigende P-Folge“ des Fundierungs-
axioms benutzt also das Prinzip der abhängigen Auswahl.
In vielen Fällen ist eine Anwendung von (DC) natürlich und intuitiv, eine nä-
here Betrachtung zeigt dann aber, dass (ACω ) genügt. Ein instruktives Beispiel
für dieses Phänomen ist der folgende Satz, dessen Beweis wir in zwei Versionen
führen:
Satz
In ZF + (ACω ) gilt das Lemma von König.
Erster Beweis
Wir zeigen das Lemma von König zunächst in ZF + (DC). Sei also 〈T, <〉
ein Baum der Höhe ω mit endlichen Stufen (oder gleichwertig: jeder
Knoten von T hat höchstens endlich viele Nachfolger). Ohne Einschrän-
kung hat T eine Wurzel s 0 . Wir definieren nun rekursiv für alle n P ω:
Zweiter Beweis
Wir geben nun noch ein Argument in ZF + (ACω ). Es genügt zu zeigen:
(#) T ist abzählbar.
Denn dann können wir T aufzählen als 〈t i | i P ω〉 und in obiger Rekursion
„ein Nachfolger s von sn mit …“ durch „der erste in der Aufzählung
erscheinende Nachfolger s von sn mit …“ ersetzen.
Zum Beweis von (#) sei
M n = { g | g : n → T= n ist bijektiv } für alle n P ω.
Dann ist M n ≠ ∅ für alle n P ω. Nach (ACω ) existiert also eine Folge
〈gn | n P ω〉 mit gn P M n für alle n P ω. Aus dieser Folge erhalten wir leicht
eine (stufenweise) Aufzählung des Baumes.
In der Tat ist das Lemma von König äquivalent zu einer schwachen endlichen
Version von (ACω ). Wir betrachten hierzu:
Satz
In ZF sind äquivalent:
(i) (ACω, fin ).
(ii) Das Lemma von König.
Beweis
(i) Â (ii): Für den oben gegebenen Beweis von (#) „T ist abzählbar“ genügt
(ACω, fin ), denn alle Stufen T= n sind endlich, und weiter sind dann auch
alle Mengen M n = { g | g : n → T= n ist bijektiv } endlich.
(ii) Â (i): Sei 〈M n | n P ω〉 eine Folge von nichtleeren endlichen Mengen.
Weiter sei T = { g | dom(g) P ω und g(i) P M i für alle i P dom(g) }. Dann
ist T versehen mit der echten Inklusion ein Baum wie im Lemma von
König. Sei also { sn | n P T } ein unendlicher Zweig von T. Dann ist
f = Ín P ω sn eine Funktion auf ω mit f(i) P M i für alle i P ω.
Offenbar gilt (ACω ) Â (ACω, fin ) und (ACω, fin ) Â (ACω, n ) für alle n ≥ 2. Wir werden
später ein Modell von ZF konstruieren, in dem das Auswahlaxiom für abzählbare
viele Paarmengen verletzt ist. Damit ist jeder Satz, der (ACω, 2 ) impliziert, nicht in
ZF beweisbar (es sei denn ZF ist widerspruchsvoll).
Den Einsatz der abzählbaren Auswahl illustriert der folgende Satz:
Satz
In ZF + (ACω ) gilt:
(i) Jede unendliche Menge ist Dedekind-unendlich.
(ii) Die abzählbare Vereinigung von abzählbaren Mengen ist abzählbar.
(iii) ω1 ist eine reguläre Kardinalzahl.
Beweis
zu (i):
Sei M eine unendliche Menge. Wir zeigen, dass |N| ≤ |M| gilt (dies ist
äquivalent zur Dedekind-Unendlichkeit von M in ZF). Sei
M n = { g : n → M | g ist injektiv } für alle n P ω.
Wegen M unendlich ist M n nichtleer für alle n P ω. Nach (ACω ) gibt
es also eine Funktion f auf ω mit f(n) P M n für alle n P ω, und dann
ist Ín P ω rng(f(n)) eine abzählbar unendliche Teilmenge von M.
zu (ii):
Sei 〈M n | n P ω〉 eine Folge von abzählbaren Mengen.
Wir nehmen der Einfachheit halber an, dass jedes M n unendlich ist.
Für n P ω sei, mit (ACω ):
gn = „ein bijektives g : ω → M n “.
Die Cantorsche Diagonalaufzählung von { gn (m) | n, m P ω } ist dann
eine Bijektion zwischen ω und Ín P ω M n .
zu (iii):
Sei 〈αn | n P ω〉 eine Folge in ω1 , und sei α* = supn P ω αn .
Dann ist α* < ω1 , da sonst ω1 eine abzählbare Vereinigung von
abzählbaren Mengen wäre, also nach (ii) abzählbar wäre. Also ist
cf(ω1 ) > ω und damit cf(ω1 ) = ω1 .
Man kann in der Tat Modelle von ZF konstruieren, in denen cf(ω1 ) = ω gilt.
Beweis
Sei N = Í M, und sei < eine lineare Ordnung auf M. Dann ist die Menge
{ min< (x) | x P M } eine Auswahlmenge für M.
Wie üblich ist das Prinzip äquivalent zu einer Form mit Auswahlfunktionen.
Offenbar impliziert (ACWO ) das abzählbare Auswahlaxiom. Überraschender-
weise gilt aber stärker auch der folgende Satz von Jensen (1967):
Beweis
Nach obiger Äquivalenz zum Prinzip (DC) genügt es zu zeigen:
(#) Sei E eine Relation auf einer Menge M derart, dass keine unendliche
E-absteigende Kette in M existiert. Dann ist E wohlfundiert.
Sei also E auf M wie in (#). Wir beobachten:
(+) Ist W ⊆ M wohlordenbar, so ist E|W wohlfundiert.
[ Denn andernfalls existiert ein A ⊆ W ohne ein E-minimales Element.
Mit Hilfe einer Wohlordnung auf W können wir dann (ohne (AC))
eine unendliche E-absteigende Kette in A ⊆ M definieren, im
Widerspruch zur Voraussetzung aus E. ]
Wir definieren nun eine Funktion r : M → On durch:
r(x) = sup { rangE|W (x) | W ⊆ M ist wohlordenbar und x P W }.
Eine alternative Formulierung von (GCH) in ZF ist: „Für alle αPOn ist |2ℵα | = |ℵα + 1 |.“
In ZF gilt aber |2ℵα | = |P(α)| für alle αPOn. Weiter ist der hierarchische Wohlordnungs-
satz äquivalent zur Aussage: „Für alle αPOn existiert ein βPOn mit |P(ℵα )| = |ℵβ |.“ Da-
mit impliziert die alternative Formulierung von (GCH) den hierarchischen Wohlord-
nungssatz und damit (AC) nach dem obigen Ergebnis.
Lemma (Hilfssatz 1)
Gilt |P (2X)| = |X + Y| für X und Y, so gibt es ein surjektives s : Y → P (X).
Beweis
Wir identifizieren P (2X) = P(X1 ∪ X2 ) mit dem Produkt P (X1 ) × P (X2 ).
Sei b : X + Y → P (X1 ) × P (X2 ) bijektiv, und sei
pr1 (b, X) = { Q1 P P(X1 ) | es gibt x, Q2 mit b(x) = 〈Q1 , Q2 〉 }.
Wegen |X1 | < |P(X1 )| ist pr1 (b, X) ≠ P(X1 ). Sei R ⊆ X1 mit R ¸ pr1 (b, X).
Wegen { R } × P(X2 ) ⊆ b″(X + Y) gilt
b″ Y ⊇ { R } × P(X2 ).
Mit |X2 | = |X| folgt die Behauptung.
Lemma (Hilfssatz 2)
Sei A eine Menge, und sei B = P((A × { 0 }) ∪ ω).
Dann gilt |2P n (B)| = |P n (B)| für alle n P ω.
Beweis
Sei A′ = A × { 0 }. Dann gilt A′ ∩ ω = ∅ und:
|2B| = |P(A′ + ω + 1)| = |P(A′ + ω)| = |B|.
Weiter ist |B| ≤ |B + 1| ≤ |2B| = |B|, also |B| = |B + 1|, und damit:
|2 × B 2| = |B + 1 2| = |B 2|.
Also gilt |2P(B)| = |P(B)|. Induktiv zeigt dieses Argument:
|2P n (B)| = |P n (B)| für alle n P ω.
Beweis
Sei A beliebig, und sei B = P(A × { 0 } ∪ ω) (vgl. Hilfssatz 2). Es genügt,
eine Wohlordnung von B zu finden. Sei hierzu 〈W, <〉 die Hartogs-
Wohlordnung von B. Dann ist W ⊆ P n + 1 (B) für ein geeignet großes n P ω
(bei guter Organisation genügt n = 4). Nach Hilfssatz 2 ist
Im Fall (I) gibt es nach Hilfssatz 1 wegen |P n + 1 (B)| = |P(2P n (B))| ein
surjektives s : W → P n + 1 (B). Wir definieren f : P n + 1 (B) → W durch
f(x) = „das <W -kleinste w mit s(w) = x“ für alle x P P n + 1 (B).
Dann ist f injektiv, und mit (I) gilt also |W| ≤ |P n + 1 (B)| ≤ |W|.
Also ist P n + 1 (B) gleichmächtig zu W und also wohlordenbar. Wegen
|B| ≤ |P n + 1 (B)| ist dann aber auch B wohlordenbar.
Wir beweisen noch einen für sich interessanten allgemeinen Satz von Specker
(1954), aus dem wir obiges Resultat über (GCH) und (AC) als Korollar erhalten,
wenn wir heranziehen, dass der Multiplikationssatz das Auswahlaxiom impli-
ziert.
Beweis
Annahme nicht. Sei also f : P(M) → M2 injektiv. Wir erzeugen einen
Widerspruch durch die rekursive Konstruktion einer injektiven Folge
〈xα | α P On〉 mit xα P M für alle α P On.
Hierzu sei P : On → V derart, dass P(α) eine Bijektion von α × α nach α ist
für alle α P On. Wir schreiben auch Pα statt P(α). Weiter sei <e eine
falls a ¸ { x0 , ..., xα − 1 }
xα =
{ a,
b, falls b ¸ { x0 , ..., xα − 1 }
falls a ¸ { xβ | β < α }
xα =
{ a,
b, falls b ¸ { xβ | β < α }
Dieser Satz behauptet nicht, dass in ZF die Ungleichung |M2 | < |P(M)| gilt. In der
Tat lässt sich in ZF alleine |M2 | ≤ |P(M)| nicht zeigen, obwohl eine „fast-injektive“
Funktion f : M2 → P(M) existiert, nämlich f((x,y)) = { x, y } für x, y P M.
Der Satz von Specker enthält den Satz von Cantor: Denn es gilt |M| ≤ |P(M)| und aus
|P(M)| = |M| würde |P(M)| ≤ |M| ≤ |M2 | folgen.
Übung
Für alle unendlichen M und alle n P ω gilt:
|n ⋅ M| = |Íi < n M × { i }| ≤ |P(M)|.
[ Seien x 0 , x 1 , ...., x 2n P M paarweise verschieden. Wir setzen:
f(x, i) = { x, x 2 , x 4 , ..., x 2i }, falls x ¸ { x 2 , x 4 , ..., x 2i }
f(x, i) = { x 0 , x k − 1 , x 2 , x 4 , ..., x 2i }, falls x = x 2k für ein 1 ≤ k ≤ i ]
Korollar
In ZF gilt: Sei M eine unendliche Menge und n P ω. Dann gilt
|n ⋅ M| = |Íi < n M × { i }| < |P(M)|.
Insbesondere ist also |M + 1| = |M ∪ { M }| < |P(M)|.
Beweis
Es gilt |n ⋅ M| ≤ |P(M)| (vgl. die Übung oben). Wegen M unendlich ist
weiter |n ⋅ M| ≤ |M2 |. Aus der Annahme |n ⋅ M| = |P(M)| folgt also
|P(M)| ≤ |M2 |, im Widerspruch zum Satz.
Damit können wir nun wieder das Auswahlaxiom aus (GCH) herleiten:
Korollar
In ZF + (GCH) gilt der Multiplikationssatz und damit das Auswahlaxiom.
Beweis
Sei M eine unendliche Menge. Dann gilt nach dem Korollar:
|M| ≤ |2 ⋅ M| < |P(M)|.
Nach (GCH) gilt also |M| = |2 ⋅ M|. Hieraus folgt |P(M) 2 | = |P(M)|
durch Konstruktion einer Bijektion oder durch kurze Rechnung:
Das Auswahlaxiom führt zur Existenz von Teilmengen von R, die zuweilen als
„pathologisch“ und „unerwünscht“ bezeichnet worden sind. Wir betrachten
zwei Beispiele und zeigen die zugehörigen Irregularitäts-Resultate, wobei wir
eine gewisse Vertrautheit des Lesers mit der Lebesgue- und Baire-Messbarkeit
voraussetzen.
Zunächst betrachten wir:
Definition (Vitali-Menge)
Ein V ⊆ R heißt eine Vitali-Menge, falls V ein vollständiges
Repräsentantensystem für die folgende Äquivalenzrelation ist:
x , y, falls x − y P Q für alle x, y P R.
Die Existenz von Vitali-Mengen folgt direkt aus der Existenz von vollständi-
gen Repräsentantensystemen, also aus einer elementaren Äquivalenz des Aus-
wahlaxioms.
Beweis
Annahme doch. V kann keine Lebesgue-Nullmenge sein, da sonst aufgrund
der σ-Additivität und der Translationsinvarianz des Lebesgue-Maßes λ
λ(R) = λ(Íq P Q V + q) = ∑ q P Q λ(V + q) = ∑ q P Q λ(V) = 0
gelten würde, wobei V + q = { x + q | x P V } die Translation von V um q ist.
Also ist λ(V) > 0, und dann gibt es ein n P N, sodass W = V ∩ [ − n, n ] ein
positives Lebesgue-Maß besitzt. Dann ist aber mit Q = Q ∩ [ 0, 1 ]:
∞ = ∑ q P Q λ(W) = ∑ q P Q λ(W + q)
= λ(Íq P Q W + q)
≤ λ([ − n, n + 1 ]) < ∞,
Widerspruch.
Definition (Bernstein-Menge)
Ein B ⊆ R heißt eine Bernstein-Menge, falls gilt:
(i) |B| = |R| = |2ω |.
(ii) Weder B noch R − B enthält eine nichtleere perfekte Teilmenge.
Statt nichtleere perfekte Teilmenge kann man in der zweiten Bedingung nach dem
Satz von Cantor-Bendixson gleichwertig überabzählbare abgeschlossene Teilmenge
fordern.
Die Existenz einer Bernstein-Menge in ZFC ist etwas schwieriger zu zeigen
(vgl. „Einführung“, 2. 12): Mit (AC) existiert eine Aufzählung 〈Pα | α < 2ω 〉 aller
nichtleeren perfekten Mengen. Wir gehen nun diese Aufzählung rekursiv ab und
wählen an jeder Stelle zwei neue (bislang ungewählte) verschiedene reelle Zahlen
xα , yα PPα . Dann ist B = { xα | α < 2ω } eine Bernstein-Menge. Bernstein-Mengen
sind so konstruiert, dass sie die Scheeffer-Eigenschaft verletzen. Dabei hat eine
Menge P von reellen Zahlen die Scheeffer-Eigenschaft, falls P abzählbar ist oder
eine nichtleere perfekte Teilmenge enthält. Bernstein-Mengen sind aber auch
Gegenbeispiele zur maßtheoretischen und topologischen Messbarkeit:
Beweis
B ist nicht Lebesgue-messbar:
Annahme doch. Ohne Einschränkung ist dann λ(B) > 0 (sonst arbeiten
wir mit R − B). Lebesgue-messbare Mengen lassen sich bzgl. ihres
Maßes beliebig genau durch abgeschlossene Teilmengen approximieren.
Also gibt es ein abgeschlossenes A ⊆ B mit λ(A) > 0. Dann ist aber A
überabzählbar und abgeschlossen, also gibt es ein nichtleeres perfektes P
⊆ A nach dem Satz von Cantor-Bendixson, im Widerspruch zu B
Bernstein-Menge.
B ist nicht Baire-messbar:
Dann existiert eine offene Menge U mit B ∆ U = (B − U) ∪ (U − B)
mager. Ohne Einschränkung ist U ≠ ∅ (sonst arbeiten wir wieder mit
R − B). Seien nun Nn , n P ω, nirgendsdicht mit U − B = Ín P ω Nn .
Wir können nun leicht eine Folge 〈Is | s ist eine endliche 0-1-Folge〉
konstruieren (durch Rekursion über |s|), sodass für alle f : ω → 2 gilt:
(i) I f|n ist ein kompaktes Intervall positiver Länge,
(ii) 〈If|n | n P ω〉 ist ⊂-absteigend gegen eine Einermenge { x f },
(iii) If|n ⊆ U − Nn für alle n P ω.
Dann ist aber P = { x f | f : ω → 2 } ⊆ U − Ín P ω Nn ⊆ B perfekt,
im Widerspruch zu B Bernstein-Menge.
Bemerkungen
Das Auswahlaxiom hat bei seiner Einführung und Popularisierung durch Ernst
Zermelo große Kontroversen ausgelöst, wurde danach aber zu einem festen Be-
standteil der axiomatischen Mengenlehre. Es ist sicherlich ein besonderes Axiom.
Alle Axiome von ZF mit Ausnahme der regulierenden Axiome (Ext) und (Fun) for-
dern die Existenz einer eindeutig bestimmten Menge oder sie lassen sich als In-
stanzen des Komprehensionsschemas schreiben, z.B. ist das Potenzmengenaxiom
die Aussage: Für alle x ist { y | y ⊆ x } P V. Das Auswahlaxiom ist ein Reichhaltig-
keitsaxiom, lässt sich aber nicht in dieser Weise formulieren.
Eine genauere Untersuchung der verschiedenen Formen und Abschwächun-
gen des Auswahlaxioms, ihrer Einsatz-Möglichkeiten und Einsatz-Notwendig-
Für den Autor ist die Bezeichnung „pathologisch“ für gewisse Konsequenzen des Aus-
wahlaxioms eine reine Sprechweise, und keinerlei Hinweis auf einen zu kurierenden De-
fekt. Es ist hochinteressant, dass das Lebesgue-Maß nicht auf der vollen Potenzmenge
von R konstruiert werden kann. Aber warum ist es intuitiv oder auch nur wünschenswert,
dass jede Menge Lebesgue-messbar ist? Man kann in ZFC auf einem reichhaltigen Teil-
bereich von P(R) σ-additiv und symmetrieinvariant messen, und damit kann die axioma-
tische Mengenlehre die Erfahrungen der physikalischen und mathematischen Analysis
bestätigen, erläutern und absichern. Die Extension des regulären Bereiches genauer zu
bestimmen ist eine spannende Angelegenheit. Der Bereich der unmessbaren Mengen
wird mit ganz anderen Methoden entdeckt und untersucht als der der messbaren Men-
gen, und er bleibt seiner Natur entsprechend viel dunkler als z. B. das gut ausleuchtbare
Feld der Borel-Mengen. Aber dies spricht nicht gegen das Auswahlaxiom.
Wer (AC) ablehnt und nicht angibt, genau welche Mengen wohlordenbar
sind, raubt der Axiomatik an Klarheit. Wer nur in ZF arbeitet und Implikationen
schwacher Formen des Auswahlaxioms untersucht, findet interessante Zusam-
menhänge und mathematische Struktur, aber auch hier bleibt dann die Frage of-
fen, für welche Mengen eine Auswahlmenge existiert und für welche nicht.
Für die metamathematische Untersuchung von ZFC ist eine Auszeichnung
der Theorie ZF unabdingbar. Wir werden im nächsten Abschnitt zeigen, dass das
Auswahlaxiom nicht für Widersprüche von ZFC verantwortlich sein kann: Ist
ZF widerspruchsfrei, so ist auch ZFC widerspruchsfrei. Um dies zu beweisen,
werden wir in ZF arbeiten und ein Klassenmodell von ZFC konstruieren, näm-
lich Gödels konstruktibles Universum L. Da wir nur ZF zur Verfügung haben, ist
es notwendig zu wissen, dass wir wichtige Teile der axiomatischen Mengenlehre
− etwa die Ordinalzahltheorie samt Rekursion − ohne Auswahlaxiom etablieren
können. Denn nur dann können wir sie zur Konstruktion des Modells L inner-
halb der Theorie ZF heranziehen.
Insgesamt wird sich durch die Untersuchung von L ergeben, dass das
Auswahlaxiom für einen riesengroßen Teilbereich des mengentheoretischen
Universums − der Klasse L − automatisch gilt. Die Axiomatik ZF garantiert so-
gar, dass sich die Klasse L durch eine Formel der Sprache der Mengenlehre woh-
lordnen lässt, und damit können in L Auswahlakte „f(x) = ‚ein x mit ϕ(x)‘ “ immer
und uniform durch „f(x) = ‚das L-kleinste x mit ϕ(x)‘ “ ersetzt werden. Dieses Er-
gebnis ist vielleicht der wichtigste Beitrag zur ganzen Diskussion um (AC): Das
Auswahlaxiom ist ein beweisbarer Satz in L, und es gilt in L in einer stärksten
Form. Zudem kann man in ZFC nicht zeigen, dass der Teilbereich L echt ist, dass
es also eine Menge x gibt mit x P V − L. Die Theorie ZFC fordert nicht, dass V
die Klasse L transzendiert. (Diese Aussagen gelten wie immer unter der Voraus-
setzung der Widerspruchsfreiheit von ZFC oder gleichwertig der von ZF. An-
dernfalls ist ja alles beweisbar.) Die Aussage „V = L“ ist inkompatibel mit großen
Kardinalzahlaxiomen. Die Meinung, dass durch die großen Kardinalzahlaxiome
V = L widerlegt ist, wird nicht von allen Mengentheoretikern geteilt. Das Licht,
das L auf das Auswahlaxiom wirft, wird von dieser Diskussion nicht getrübt.
Den schwachen abzählbaren Formen des Auswahlaxioms kommt eine weitere
wichtige Bedeutung zu: Ein in der modernen Mengenlehre intensiv untersuch-
tes Prinzip ist das Axiom der Determiniert (AD), das allen Teilmengen von R
gute Regularitätseigenschaften aufnötigt. Unter (AD) sind alle Teilmengen von
R Lebesgue-messbar, Baire-messbar, und haben die Scheeffer-Eigenschaft.
(Siehe z. B. „Reelle Zahlen“.)
In der Theorie ZF + (AD) ist nun zwar (AC) beweisbar falsch, aber andererseits
ist das Prinzip (ACω ) beweisbar richtig. Gewöhnlich wird aber etwas stärker in ZF
+ (AD) + (DC) argumentiert, und die wichtigsten Modelle von ZF + (AD), die in
ZFC mit Hilfe starker großer Kardinalzahlaxiome konstruiert worden sind, er-
füllen in der Tat das Axiom der abhängigen Auswahl. Durch das Axiom der Deter-
miniertheit erhält also (DC) zusätzliches Gewicht. Das Axiom der Determiniert-
heit wird insgesamt nicht als Alternative zu (AC) gesehen und propagiert, die vor-
herrschende Sicht der Dinge ist: In ZFC erweitert um große Kardinalzahlaxiome
existiert ein kanonisches Modell von ZF + (AD). (Konkret ist dies das Modell
L(R), das über den reellen Zahlen konstruierte konstruktible Universum.)
Zusätzliches
Das Auswahlaxiom und seine Varianten lassen sich in vielerlei Hinsicht weiter
untersuchen: Wie hängen die schwachen Formen des Auswahlaxioms unterein-
ander zusammen? Welche Formen genügen für welche Anwendungen? Welche
Sätze der allgemeinen Mathematik implizieren (AC) oder Abschwächungen?
Die Untersuchung solcher Fragen ist ein klassisches Teilgebiet der Mengen-
lehre seit Arbeiten von Tarski, Sierpiński und anderen. Sie ist aber nicht jeder-
manns Sache, und speziell für die, denen das Auswahlaxiom als unproblematisch
gilt und die von der abstrakten infinitären Mengenlehre keine konstruktiven
Charakterzüge erwarten, wird dieses Gebiet vielleicht als unattraktiv und ver-
zichtbar erscheinen. Andere wiederum werden seine Vielfalt und Eigenartigkeit
schätzen. Wir präsentieren einige Fragestellungen und Ergebnisse in den fol-
genden Übungen. Der Leser möge sich die ihn ansprechenden Themen heraus-
suchen. Sie sind in jedem Falle geeignet, das Auge für das Auswahlaxiom und sei-
nen Einsatz weiter zu schulen.
Übung
In ZF gilt:
(i) Es gibt ein surjektives f : R → ω1 .
(ii) Existieren abzählbare M n ⊆ R mit R = Ín P ω M n , so gilt cf(ω1 ) = ω.
(iii) Ist |ω1 | ≤ |R|, so ist R keine abzählbare Vereinigung von abzählbaren
Mengen.
(iv) Es gibt keine abzählbaren A n ⊆ ω2 mit ω2 = Ín P ω A n .
[ zu (i): Es gilt |R| = |P(ω)| = |P(ω × ω)|. Ist α < ω1 , so existiert eine Wohlordnung
< ⊆ ω × ω (auf ω oder einem Element von ω) des Ordnungstyps α.
zu (ii): mit Hilfe von (i).
zu (iii): Es gilt |R| = |ω 2|. Sei 〈An | n P ω〉 eine Zerlegung von ω mit |An | = ω für
alle n P ω. Aus |ω1 | ≤ |ω 2| folgt die Existenz eines injektiven g : ω1 → ω 2 derart,
dass { g(α)|An | α < ω1 } überabzählbar ist für alle n P ω. Sind nun M n ⊆ ω 2
abzählbar für alle n P ω, so sei f : ω → 2 definiert durch
f|M n = g(αn )|M n für alle n P ω,
wobei
αn = „das kleinste α < ω1 mit g(α)|M n ¸ M n “.
Dann ist f ¸ Ín P ω M n .
zu (iv): Annahme doch. Sei dann αn = o. t.(〈An , <〉) für n P ω, und sei
α = ∑ n P ω αn .
Dann existiert eine Surjektion f : α → ω2 , im Widerspruch zu α ≤ ω1 . ]
Übung
Die folgenden Aussagen sind äquivalent zu (ACω ) in ZF:
(i) Für alle surjektiven g : M → N gibt es ein h : N → M mit g + h = id N .
(ii) Für alle f : N → C und alle surjektiven g : B → C existiert ein
h : N → B mit f = g + h.
Übung
Die folgende Aussage ist äquivalent zu (ACω, fin ) über ZF:
Die abzählbare Vereinigung von endlichen Mengen ist abzählbar.
[ Ist E endlich, so ist die Menge aller bijektiven f : |E| → E endlich. ]
Übung
Die folgenden Aussagen sind äquivalent in ZF für alle n ≥ 2:
(i) Ist M eine abzählbare Menge von Mengen mit jeweils höchstens n
Elementen, so ist Í M abzählbar.
(ii) Ist M eine abzählbare Menge von Mengen mit jeweils genau n
Elementen, so ist Í M abzählbar.
(iii) Für alle 2 ≤ m ≤ n gilt (ACω, m ).
(iv) Es gilt (ACω, ≤ n ), wobei (ACω, ≤ n ) wie (ACω, n ) definiert ist, aber nun
„höchstens n Elemente (und mindestens eines)“ die Phrase
„genau n Elemente“ ersetzt.
Übung
In ZF gilt: (ACω, n ) impliziert (ACω, m ), falls m ein Teiler von n ist.
Übung
Für eine natürliche Zahl n ≥ 2 sei (AC ∞, n ) wie (ACω, n ), wobei nun auf die
Abzählbarkeit der Menge M verzichtet wird. Dann gilt in ZF:
(i) (AC ∞, 2 ) impliziert (AC ∞, 4 ).
(ii) (AC ∞, 2 ) + (AC ∞, 3 ) impliziert (AC ∞, 6 ).
[ zu (i): Sei M eine Menge von paarweise disjunkten Mengen mit jeweils genau 4
Elementen. Betrachte Auswahlmengen für P = { { A, B } | { A, B } ist eine Zerlegung
eines X P M in 2 Teile mit jeweils genau 2 Elementen } und R = { A | A ist eine
Teilmenge eines X P M mit genau zwei Elementen }.
zu (ii): Sei M eine Menge von paarweise disjunkten Mengen mit jeweils genau 6
Elementen. Betrachte Auswahlmengen für R(2) und R(3), wobei
R(n) = { A | A ist eine Teilmenge eines X P M mit genau n Elementen }.
Mit Hilfe dieser Auswahlmengen genügt es (!), ein N zu finden mit:
Für alle Y P N ist Y ≠ ∅ und es existiert genau ein X P M derart, dass Y eine
echte Teilmenge von X ist.
Hierzu sei Z = { { A, B, C } | { A, B, C } ist eine Zerlegung eines X P M in 3 Teile mit
jeweils genau zwei Elementen }. Mit Hilfe von (AC ∞, 3 ) und (AC ∞, 2 ) erhalten wir ein
f : Z → ÍM mit
f({ A, B, C }) P A ∪ B ∪ C für alle { A, B, C } P Z.
Jedes X P M hat genau 15 Zerlegungen der Form { A, B, C } mit |A| = |B| = |C| = 2.
Wir setzen nun für alle X P M:
g(X) = { x P X | x erscheint mindestens dreimal im Wertebereich von f }
Dann ist 1 ≤ g(X) ≤ 5 und also N = { g(X) | X P M } wie gewünscht. ]
Die folgende Übung zeigt, dass wir bereits in ZF + „ Jede Menge von paarweise
disjunkten 2-elementigen Mengen besitzt eine Auswahlmenge“ (also (AC∞, 2 ))
eine Menge reeller Zahlen angeben können, die den Symmetrie-Eigenschaften
des Lebesgue-Maßes widerspricht.
Übung
Für s P R − Q ist g s : R → R wohldefiniert durch:
falls x − s P Q
{
1,
gs (x) = −1, falls x + s P Q
0, sonst
Einer axiomatischen Mengenlehre, die sich nur auf endliche Mengen be-
schränkt, kommt ein natürliches Interesse zu: Sie ist überschaubar und intuitiv zu-
gänglich wie die reine Zahlentheorie, erlaubt aber eine viel freiere Objektbildung.
In der reinen Zahlentheorie müssen wir jedes Objekt, das keine Zahl ist, erst ko-
dieren, z.B. das Zahlenpaar (a, b) durch 2a ⋅ 3b . In der endlichen Mengenlehre ste-
hen uns alle endlichen kombinatorischen Objekte unmittelbar zur Verfügung.
Das intendierte Universum V der endlichen Mengenlehre ist das der erblich end-
lichen Mengen, d.h. wir haben V = Vω = ÍnPω Vn im Blick. Diese Anschauung lässt
sich auf zwei verschiedene Weisen durch Axiome einfangen. Zum einen können wir
ZFC modifizieren. Zum anderen können wir den zahlentheoretischen Charakter
von einer endlichen Mengenwelt betonen und entsprechend ein „arithmetisches
Induktionsschema“ in das Zentrum der Axiomatik rücken. Wir beschreiben diese
beiden Wege und zeigen, dass sie äquivalente Theorien hervorbringen. Die Unter-
suchung wirft auch ein interessantes Licht auf das Fundierungsaxiom.
Wir wiederholen im Folgenden bewusst einige bereits bekannte Argumente, um eine un-
abhängige Lektüre zu unterstützen. Die Darstellung wird dadurch nur unwesentlich länger.
Wir beginnen mit einer Modifikation von ZFC. Wir betrachten hierzu:
Endlichkeits-Axiom (Fin)
Jede Menge ist Tarski-endlich.
∀x ∀z ≠ ∅. ∀u P z u ⊆ x → ∃u P z ∀v P z ¬ (u ⊂ v).
Fundierungsschema (FuS)
Für jede Formel ϕ(v) (mit Parametern) gilt:
∃x ϕ(x) → ∃x. ϕ(x) ∧ ∀y P x ¬ ϕ(y).
Epsilon-Induktion (P-Ind)
Für jede Formel ψ(v) (mit Parametern) gilt:
(∀x. ∀y P x ψ(y) → ψ(x)) → ∀x ψ(x).
Genauer gilt (ErS) für ϕ(v) genau dann, wenn (P-Ind) für ψ(v) = ¬ ϕ(v) gilt.
Wir definieren nun:
Erweiterungsaxiom (Erw)
Für alle x, y existiert x ∪ { y }. ∀x, y ∃z ∀u. u P z ↔ u P x ∨ u = y.
Aus { x } = ∅ ∪ { x } und { x, y } = { x } ∪ { y } folgt leicht, dass für alle x,y das geord-
nete Paar (x, y) = { { x }, { x, y } } existiert.
Die beiden Induktionsschemata lauten nun:
(Ind) impliziert (Ind− ) : Im starken Induktionsschema haben wir die beiden In-
duktionsvoraussetzungen ϕ(x) und ϕ(y) zur Verfügung, um ϕ(x ∪ { y }) zu zeigen,
im endlichen Induktionsschema dagegen nur ϕ(x). Der Nachweis von ϕ(x ∪ { y })
ist einfacher mit den beiden Induktionsvoraussetzungen, aber der postulierte
Schluss auf die universelle Gültigkeit von ϕ ist dafür stärker.
Wir definieren nun:
Beweis
FST − ⊢ (Ext), (LM), (Erw):
(Ext) und (LM) sind Axiome von FST − . Nach (Pa) und (Ver) existiert
für alle x, y die Menge x ∪ { y } = Í { x, { y } }.
FST − ⊢ (Ind − ):
Sei ϕ(v) eine Formel (mit Parametern). Es gelte ϕ(∅) und für alle x, a mit
ϕ(x) gelte ϕ(x ∪ { a }). Wir zeigen, dass ϕ(y) für alle y gilt. Sei y beliebig,
und sei z = { x ⊆ y | ϕ(x) } nach (Pot) und (Aus). Dann ist z ≠ ∅, da
∅ P z. Nach (Fin) gibt es ein ⊆-maximales x P z. Für alle a P y gilt
ϕ(x ∪ { a }) nach Voraussetzung, also ist x ∪ { a } = x nach Maximalität
von x, d. h. a P x. Also ist x = y, und folglich gilt ϕ(y).
AST − ⊢ (Pa):
Es gilt { x, y } = (∅ ∪ { x }) ∪ { y }. Also gilt (Pa). Insbesondere existiert
also (x, y) = { { x }, { x, y } } für alle x, y.
AST − ⊢ (Ver):
Sei z beliebig. Wir zeigen durch Induktion nach x, dass z ∪ x existiert:
Es gilt z ∪ ∅ = z und z ∪ (x ∪ { y }) = (z ∪ x) ∪ { y } für alle x, y.
Damit zeigen wir nun induktiv, dass Í x für alle x existiert:
Es gilt Í ∅ = ∅ und Í(x ∪ { y }) = Í x ∪ y für alle x, y.
AST − ⊢ (Pot):
Sei z beliebig. Wir zeigen durch Induktion nach x, dass { u ∪ { z } | u P x }
existiert:
Dies ist klar für ∅, und es gilt
{ u ∪ { z } | u P x ∪ { y } } = { u ∪ { z } | u P x } ∪ { y ∪ { z }.
Damit zeigen wir nun induktiv, dass P(x) für alle x existiert:
Es gilt P(∅) = { ∅ } und
P(x ∪ { y }) = P(x) ∪ { u ∪ { y } | u P P(x) }.
AST − ⊢ (Aus):
Wir zeigen induktiv, dass A ϕ (x) = { z P x | ϕ(z) } existiert:
Es gilt Aϕ (∅) = ∅ und für alle x, y gilt
A ϕ (x ∪ { y }) = A ϕ (x) oder A ϕ (x ∪ { y }) = A ϕ (x) ∪ { y }.
AST − ⊢ (Fin):
Wir zeigen durch Induktion, dass jedes x Tarski-endlich ist:
Dies ist klar für x = ∅. Sei also x Tarski-endlich, und sei y beliebig.
Sei z ⊆ P(x ∪ { y }) nichtleer. Wir setzen
z′ = { u ∩ x | u P z }.
Dann ist z′ ≠ ∅. Sei u ⊆-maximal in z′. Ist u ∪ { y } P z, so ist u ∪ { y }
⊆-maximal in z. Ist u ∪ { y } ¸ z, so ist u ⊆-maximal in z.
Alternativ können wir (Aus) und (Pot) aus dem Ersetzungsschema gewinnen, das in
AST − sehr leicht zu zeigen ist (siehe unten).
Auf der Grundlage des obigen Satzes können wir nun zeigen:
Beweis
FST − + „(P-Ind) für ϕ(v)“ ⊢ „(Ind) für ϕ(v)“:
Sei ϕ(v) eine Formel derart, dass ϕ(∅) gilt, und dass mit ϕ(x) und ϕ(a)
stets auch ϕ(x ∪ { a }) gilt. Wir zeigen ϕ(y) für alle y durch P-Induktion.
Sei also y eine Menge mit ϕ(a) für alle a P y. Sei wieder
z = { x ⊆ y | ϕ(x) }.
Nach Voraussetzung ist z ≠ ∅, da ∅ P z. Wegen y Tarski-endlich besitzt
z ein ⊆-maximales Element x. Sei a P y beliebig. Dann gilt ϕ(x) und ϕ(a),
also gilt ϕ(x ∪ { a }) nach Voraussetzung. Wegen x maximal in z ist
x ∪ { a } = x, und damit a P x. Folglich gilt x = y und damit ϕ(y).
Etwas grob gesprochen gilt also: Das Fundierungsschema schenkt uns die In-
duktionsvoraussetzung in der zweiten Komponente − und umgekehrt.
Beweis
AST − ⊢ (Ers):
Wir zeigen induktiv, dass F ″x für alle x existiert:
Es gilt F″∅ = ∅ und F ″(x ∪ { y }) = F″x ∪ { F(y) } für alle x, y.
AST − ⊢ (AC):
Wir zeigen, dass jede nichtleere Menge von paarweise disjunkten
Mengen eine Auswahlmenge besitzt. Dies ist klar für x = ∅. Sei also
x ∪ { y } eine Menge von paarweise disjunkten nichtleeren Mengen, und
sei z eine Auswahlmenge für x. Wegen y ≠ ∅ gibt es ein a P y. Dann ist
z ∪ { a } eine Auswahlmenge für x ∪ { y }.
Alternativ kann man (Ers) und (AC) auch leicht direkt in FST − beweisen. Wir
werden gleich zeigen, dass in FST das Auswahlaxiom dann sogar in einer sehr
starken Form gilt: Es gibt eine definierbare Wohlordnung des Universums.
Wie üblich definieren wir in FST − die Ordinalzahlen als die Klasse On aller
transitiven und durch P wohl geordneten Mengen. On ist eine echte Klasse und
die P-Relation ist eine Wohlordnung auf On. In FST − hat jede Ordinalzahl un-
gleich 0 einen eindeutigen Vorgänger. Wir schreiben auch Ω statt On und nen-
nen Ω die Klasse der natürlichen Zahlen.
Der Induktionssatz für Ω gilt in FST − als Schema: Ist ϕ(v) eine Formel derart,
dass ϕ(0) gilt und mit ϕ(n) stets auch ϕ(n + 1) gilt, so gilt ϕ(n) für alle n P Ω. Auch
der Rekursionssatz steht zur Verfügung: Ist G : V → V eine funktionale Klasse,
so existiert genau eine funktionale Klasse F : Ω → V mit F(n) = G(F|n) für alle
nPΩ. Insbesondere ist V* = ÍnPΩ Vn definiert, wobei V0 = ∅ und Vn + 1 = P(Vn )
für alle n P Ω. Das Fundierungsschema wird nun wie üblich eingesetzt, um zu
zeigen, dass V* = V ist (und aus V = V* folgt umgekehrt (FuS)). Hieraus folgt:
Beweis
Wir konstruieren F rekursiv: Haben wir ein bijektives F|kn : kn → Vn
konstruiert, so ordnen wir Vn + 1 − Vn lexikographisch gemäß F an, d. h. x
erscheint vor y, falls das F-kleinste z P x ∆ y ein Element von x ist. Die so
erhaltene Aufzählung x0 , …, xm von Vn + 1 − Vn fügen wir an F|kn an, d. h.
wir setzen
F(kn + i) = xi für alle i ≤ m.
Dann ist F|kn + 1 : kn + 1 → Vn + 1 bijektiv, mit kn + 1 = kn + m.
Wir diskutieren schließlich noch die Wahl der Tarski-Endlichkeit als Endlich-
keits-Axiom. Es zeigt sich, dass wir hier viele Alternativen haben:
Übung
Über FST − sind äquivalent:
(i) (Fin)
(ii) Jede Menge ist Ω-endlich: Für alle x gibt es ein n P Ω mit |x| = |n|.
(iii) Jede Menge ist Dedekind-endlich.
Beweis
FST − ⊢ ¬ (Un) :
Annahme, es gibt ein induktives x0 . Sei ω = > { x ⊆ x0 | x ist induktiv }.
Dann ist ω nicht Tarski-endlich, denn ω ⊆ P(ω) ist nichtleer und hat
kein ⊆-maximales Element, im Widerspruch zu (Fin).
Schließlich können wir das Fundierungsschema auch durch zwei einzelne Axi-
ome ersetzen. Wir definieren hierzu:
Beweis
FST − + (FuS) ⊢ (Fun):
Die Aussage ∀p. ∃x x P p → ∃x. x P p ∧ ∀y P x y ¸ p ist die Instanz des
Fundierungsschemas für die Formel ϕ(v) = „v P p“ mit Parameter p.
Nullinduktion (0-Ind)
∀p. (∅ ¸ p ∧ ∀x, y. x ¸ p ∧ y ¸ p → x ∪ { y } ¸ p) → p = ∅.
Die Nullinduktion ist die Instanz des Induktionsschemas für die Formel v ¸ p
(mit p als Parameter).
Beweis
FST − + (Fun) ⊢ (0-Ind):
Das Fundierungsaxiom ist die Instanz des Fundierungsschemas für die
Formel v P p. Damit ist (Fun) äquivalent zur P-Induktion für die
Formel v ¸ p, also nach dem obigen Satz zu (Ind) für die Formel v ¸ p.
Schließlich halten wir fest, dass die folgenden schwachen Versionen von (Ind), (P-Ind)
und (FuS) gleichwertig sind (ohne Involvierung eines Endlichkeitsaxioms):
Der Unterschied von (FuS-2) zu (FuS) wird besonders deutlich, wenn wir (FuS) in der
folgenden äquivalenten Version schreiben:
(FuS) ∃x ϕ(x) → ∃x. ϕ(x) ∧ (x = ∅ ∨ ∀y P x ¬ ϕ(y))
Gibt es ein x mit x = { x }, so ist die Formel v = { v } ein Gegenbeispiel zu (FuS-2) und da-
mit auch zu (FuS). Gibt es ein x mit x = { x, ∅ }, so ist v = { v, ∅ } ein Gegenbeispiel zu (FuS),
aber keines zu (FuS-2).
Übung
Zeigen Sie, dass die folgenden Theorien äquivalent sind:
(i) FST − , also (Ext), (LM), (Pa), (Ver), (Aus), (Pot), (Fin)
(ii) (Ext), (LM), (Pa), (Ver), (Ers), „ Jede Menge ist Ω-endlich.“
[ zur Gewinnung des Potenzmengenaxioms in (ii) Â (i): Wir zeigen durch Induktion
nach n P Ω, dass P(n) existiert. ]
Das Tarski-Fragment
Im Tarski-Fragment existieren geordnete Paare, und damit stehen uns alle Be-
griffe im Umfeld von Funktionen zur Verfügung. Es zeigt sich, dass wir den Satz
von Cantor-Bernstein in der Klassenversion beweisen können. Wir müssen den
im ersten Kapitel gegebenen Beweis nur geringfügig modifizieren:
Beweis
Es genügt wieder, (a) zu zeigen. Wir setzen:
B* = { x PA ∪ B | es gibt ein f ⊆ F, sodass für alle (y, F(y))Pf ∪ { (x, F(x)) }:
y ¸ B impliziert y P A und (F −1 (y), y) P f }.
Dann ist B ⊆ B*, wie f = ∅ ⊆ F bezeugt. Weiter gilt:
(#) F″B* = B* − B.
Beweis von (#)
Sei x P B*, und sei f ⊆ F ein Zeuge hierfür. Dann ist f ∪ { (x, F(x)) } ein
Zeuge für F(x) P B*. Zudem ist F(x) ¸ B. Also ist F(x) P B* − B.
Sei umgekhert x P B* − B, und sei f ⊆ F ein Zeuge für x P B*. Dann ist f
auch ein Zeuge für F −1 (x) P B*. Also ist x P F″B*.
Sei C* = (A ∪ C) − B*. Nach (#) ist H = F|C* ∪ IdB* wie gewünscht.
Den alten Beweis hätten wir gar nicht modifizieren müssen, denn im Tarski-
Fragment können wir die natürlichen Zahlen definieren, und weiter sogar die
Addition und die Multiplikation auf den natürlichen Zahlen. Wir skizzieren die
Definition der natürlichen Zahlen im Tarski-Fragment, und verweisen den Le-
ser auf [ Monk (1976), Kapitel 16 ] für die Konstruktion der Arithmetik.
Im Tarski-Fragment ist an vielen Stellen erhöhte Vorsicht geboten, da ver-
traute Dinge wie x ∩ y, x ∪ y oder x − y nicht zu existieren brauchen. Letztend-
lich ergibt sich aber, dass eine leicht verstärkte Version der Formel nat(x), die
wir im ersten Kapitel betrachtet hatten, geeignet ist, die natürlichen Zahlen im
Tarski-Fragment zu definieren.
An Konstanten, Operationen haben wir in TF zunächst zur Verfügung:
∅, { x }, { x, y }, (x, y), S(x) = x ∪ { x }.
Mengen, die gute Boolesche Operationen zulassen, sind nicht mehr selbstver-
ständlich:
Übung
(i) Ist x gut und y ⊆ x, so ist auch y gut.
(ii) Ist x gut und y beliebig, so ist auch x ∪ { y } gut.
Übung
(i) 0 P Ω* und für alle n gilt: n P Ω* gdw S(n) P Ω*.
(ii) Für alle n P Ω* und alle x P n ist x P Ω*.
Ein Induktionsschema steht nicht zur Verfügung, denn wir können nicht zei-
gen, dass jede nichtleere Teilklasse A von Ω* ein kleinstes Element hat. Im übli-
chen Beweis definieren wir für ein beliebiges nPA die Teilmenge { mPn | mPA
} = n ∩ A von n, und zeigen, dass das kleinste Element von n ∩ A auch das kleinste
Element von a ist. Diese Argumentation scheitert in TF bei der Definition von n
∩ A, die das Aussonderungsschema benötigt.
Definition (Robinson-Arithmetik Q)
Die Robinson-Arithmetik Q besteht aus den folgenden sieben Axiomen:
(Q1 ) ∀x S(x) ≠ 0,
(Q2 ) ∀x, y. S(x) = S(y) → x = y,
(Q3 ) ∀x. x ≠ 0 → ∃y x = S(y),
(Q4 ) ∀x x + 0 = x, (Q5 ) ∀x, y x + S(y) = S(x + y),
(Q6 ) ∀x x ⋅ 0 = 0, (Q7 ) ∀x, y x ⋅ S(y) = (x ⋅ y) + x.
Es zeigt sich nun, dass die endliche Mengenlehre und die Peano-Arithmetik
äquikonsistent sind: Ist FST widerspruchsfrei, so ist PA widerspruchsfrei und
umgekehrt. Stärker sind die beiden Theorien sogar ineinander interpretierbar:
In FST können wir auf Ω die üblichen funktionalen Klassen +Ω , ⋅Ω , SΩ und die
Konstante 0Ω = 0 P Ω definieren. Dann gilt, wie man leicht zeigt:
Für (Q4) lautet die Behauptung des Satzes z. B. einfach, dass in FST die Aus-
sage ∀x P Ω. x +Ω 0Ω = x beweisbar ist.
Mit einer logischen Argumentation, die wir im nächsten Abschnitt diskutieren
werden, können wir aus dem Satz folgern: Ein Beweis von 0 = 1 in PA lässt sich ef-
fektiv in einen Beweis von 0 = 1 in FST übersetzen.
Umgekehrt kann man in der Peano-Arithmetik via Kodierung über Mengen
reden, und dies in einer erstaunlich einfachen Art und Weise, die von Ackermann
bereits 1937 entdeckt wurde. Wir schreiben hierzu natürliche Zahlen n (die Ob-
jekte der Peano-Arithmetik) in ihrer eindeutigen Dualdarstellung:
n = ∑ i ≥ 0 ai (n) 2i mit 0 ≤ ai (n) ≤ 1 für alle i.
Dies ist innerhalb unserer Sprache und Axiomatik möglich: In der Peano-Arith-
metik lässt sich die Exponentiation definieren und es lässt sich zeigen, dass jede
natürliche Zahl eine eindeutige Dualdarstellung besitzt. Weiter existiert eine
„funktionale Klasse“ F mit F(n, i) = ai (n) für alle n, i.
All diese Dinge sind nicht trivial, aber es ist hier nicht der Ort, die Peano-Arithmetik zu
entwickeln. Wir nehmen im Folgenden als nachgewiesen an, dass in der Peano-Arithme-
tik alle elementaren zahlentheoretischen Sätze bewiesen werden können. (De facto sind
arithmetische Sätze, die in ZFC, nicht aber in PA beweisbar sind, schwer zu finden.)
Diese Relation simuliert die P-Relation in der durch die Peano-Arithmetik be-
schriebenen Welt der Zahlen. Alle Axiome der endlichen Mengenlehre sind erfüllt:
Eine Beschränkung der Quantoren wie oben ist hier nicht notwendig. Unter dieser In-
terpretation ist jede Zahl eine Menge.
Beweis
zu (Ext):
Seien n, m derart, dass für alle i gilt: i e n gdw i e m. Dann stimmen die
Dualdarstellungen von n und m überein, also gilt n = m. Die andere
Implikation in (Ext) gilt aus rein logischen Gründen.
zu (LM):
Es gilt non(i e 0) für alle i. Also ist die Null die leere Menge bzgl. P.
zu (Erw):
Seien n, i gegeben. Wir setzen:
n + 2i falls non(i e n)
m =
{ n, falls i e n
Der Beweis zeigt, dass die mengentheoretischen natürlichen Zahlen unter der
Ackermann-Interpretation die Zahlen
0, 1 = 0 + 21 , 3 = 1 + 21 , 11 = 3 + 23 , 11 + 211 , …
sind. Für alle m ist m ∪ { m } = m + 2m der mengentheoretische Nachfolger der
Zahl m.
Aus dem Satz folgt wieder: Ein Beweis von 0 = 1 in FST lässt sich effektiv in ei-
nen Beweis von 0 = 1 in PA übersetzen. Damit sind FST und PA äquikonsistent.
Die endliche Mengenlehre und die Peano-Arithmetik sind also eng miteinan-
der verwandte Theorien, so sehr sich ihre „Charakterzüge“ und ihre Universen
∅ ∪ P(∅) ∪ P(P(∅)) ∪ …, und
0, S(0), S(S(0)), …
auch auf den ersten Blick unterscheiden. Wir können die endliche Mengenlehre
als eine Version der Arithmetik ansehen, die uns die Kodierung von endlichen
kombinatorischen Strukturen erspart und die uns den Komfort und die Eleganz
der mengentheoretischen Sprache zur Verfügung stellt. Die Analyse wirft auch
ein Licht darauf, „was man in PA alles machen kann“: Alles, was man in ZFC
ohne Unendlichkeitsaxiom, aber verstärkt um das Fundierungsschema und das
Endlichkeitsaxiom, definieren und beweisen kann.
Das Unendlichkeitsaxiom führt uns von der Welt der Zahlen in die Welt der
Mengen. ZFC hat keine arithmetische Struktur mehr. Es gibt aber ein interes-
santes Axiom, unter dem die riesengroße Welt der unendlichen Mengen als eine
arithmetische Welt erscheint: Das Axiom der Konstruierbarkeit. Dieses Axiom
werden wir im nun folgenden zweiten Abschnitt ausführlich untersuchen.
Wir setzen ab jetzt voraus, dass der Leser mit den Grundlagen der mathemati-
schen Logik vertraut ist.
Relative Konsistenz
Nach dieser Definition sind alle Aussagen relativ konsistent und unabhängig
von T, falls T widerspruchsvoll ist.
Eine ebenso einfache wie wichtige Äquivalenz, die für alle Theorien T und alle
Aussagen ϕ gilt, ist:
(+) T ⊢ ϕ gdw T + ¬ ϕ ist widerspruchsvoll.
Hier muss T nicht als widerspruchsfrei vorausgesetzt werden. Nach der Defini-
tion der relativen Konsistenz gilt also für alle T und ϕ:
(++) non(T ⊢ ϕ) gdw T ist widerspruchsfrei und ¬ϕ ist relativ konsistent zu T.
Ist T widerspruchsfrei, so ist also eine Aussage ϕ genau dann unabhängig von
T, wenn weder ϕ noch ¬ ϕ in T beweisbar sind.
Die Kontraposition der relativen Konsistenz liefert, dass die folgenden Aussa-
gen äquivalent sind:
(i) ϕ ist relativ konsistent zu T.
(ii) T ⊢ ¬ϕ impliziert T ist widerspruchsvoll.
Allgemeiner als die relative Konsistenz einer Aussage ist die relative Konsi-
stenz einer Theorie:
Eine Aussage ϕ ist demnach genau dann relativ konsistent zu T, falls die Theo-
rie S = T + ϕ relativ konsistent zu T ist. Weiter ist eine Theorie S ⊇ T genau dann
relativ konsistent zu T, wenn für alle ϕ1 , …, ϕn in S die Aussage ϕ1 ∧ … ∧ ϕn rela-
tiv konsistent zu T ist.
Wir betrachten im Folgenden nur axiomatisch präsentierte Theorien T: Von einer
gegebenen Aussage ϕ lässt sich immer effektiv entscheiden, ob ϕ zur Axiomatik T ge-
hört oder nicht. Hieraus folgt nicht, dass wir von einer Aussage ψ effektiv entscheiden
können, ob ϕ in T beweisbar ist oder nicht. In der Tat ist bereits das Tarski-Fragment
unentscheidbar.
(CH) Kontinuumshypothese
Es gilt 2ω = ω1 .
Wir werden zeigen, dass diese Hypothesen in ZFC weder beweisbar noch wi-
derlegbar sind, falls ZFC selbst widerspruchsfrei ist. Unser Ziel ist also:
Zum Beweis dieses Satzes konstruieren wir Modelle von ZFC. In manchen
Modellen wird die Kontinuumshypothese gelten, in anderen wird sie falsch sein.
Die Situation ist bis zu einem gewissen Grad analog zu Modellen der Geometrie,
die je nach ihrer Natur das Parallelenpostulat erfüllen oder verletzen. Vielleicht
noch einfacher sind Modelle der Gruppentheorie, die je nach ihrer Natur kom-
mutativ sind oder nicht. Die Angabe je einer einzigen kommutativen und einer
nichtkommutativen Gruppe genügt, um zu zeigen, dass das Kommutativgesetz
unabhängig von den Gruppenaxiomen ist. Eine intrinsische Schwierigkeit, die
diese Analogie sprengt, ergibt sich aus dem Gödelschen Unvollständigkeitssatz:
Modelle der Geometrie und der Gruppentheorie konstruiert man innerhalb der
Mengenlehre. Nun möchten wir aber Modelle der Mengenlehre innerhalb der
Mengenlehre konstruieren. Aufgrund des zweiten Gödelschen Unvollständig-
keitssatzes können wir aber in ZFC nicht zeigen, dass ein Modell von ZFC exi-
stiert, denn dann würde ZFC aufgrund des Gödelschen Vollständigkeitssatzes
beweisen, dass ZFC widerspruchsfrei ist − was nur dann möglich ist, wenn ZFC
widerspruchsvoll ist.
Es ist nun aber unangemessen, sich durch dieses „großartige Hindernis“ allzu
sehr irritieren zu lassen. Die formalen Schwierigkeiten im Umfeld der Gödel-
schen Sätze lassen sich in mehrfacher Weise auflösen:
Zum einen können wir in einer sehr natürlichen Weise echte Klassen als Mo-
delle ansehen, und hier ist ja bereits das Universum V ein Modell von ZFC. Der
Unvollständigkeitssatz schließt nur die Beweisbarkeit der Existenz von Model-
len aus, deren Träger eine Menge ist. Den Begriff eines Klassenmodells werden
wir gleich diskutieren, und wir werden sehen, wie wir Klassenmodelle zum Be-
weis der relativen Konsistenz einer Aussage verwenden können.
Zum anderen sind wir letztendlich auf relative Konsistenz aus, sodass wir im-
mer annehmen dürfen, dass ZFC oder die zur Diskussion stehende Theorie wi-
derspruchsfrei ist, und also nach dem Gödelschen Vollständigkeitssatz ein (Men-
gen-) Modell besitzt. Leider können wir aus der Widerspruchsfreiheit von ZFC
aber nicht folgern, dass ein transitives Modell von ZFC existiert, und gerade die
transitiven Modelle sind es, die wir gut analysieren können. Starten wir also mit
der Voraussetzung „Sei M ein transitives Modell von ZFC.“, so gehen wir über
die Voraussetzung der Widerspruchsfreiheit hinaus. Haben wir mit Hilfe des
transitiven Modells M ein Modell M′ von ZFC + ϕ konstruiert, so sind noch zu-
sätzliche Argumente nötig, um zu begründen, dass wir die relative Konsistenz
von ϕ zu ZFC wirklich einwandfrei bewiesen haben, d. h. dass die Transitivitäts-
Voraussetzung letztendlich doch wieder eliminiert werden kann.
Weiter möchten wir die relative Konsistenz einer Aussage nicht nur über ZFC
zeigen, sondern wir streben stärker effektive relative Konsistenzbeweise an: Ein
Beweis der Konsistenz einer Aussage ϕ relativ zu ZFC überzeugt uns nur dann
restlos, wenn er uns erlaubt, einen hypothetischen in ZFC geführten Beweis von
¬ ϕ effektiv in einen in ZFC geführten Beweis von ∃x x ≠ x zu übersetzen. Unsere
relativen Konsistenzbeweise werden in der Tat diesen effektiven Ansprüchen ge-
nügen. Für die Klassenmodelle ist dies sogar besonders leicht einzusehen.
Dem Leser, der nicht gerade ein intensives Studium der mathematischen Logik hinter
sich hat, sei geraten, sich die folgenden Konstruktionen zunächst einfach einmal anzuse-
hen, ohne sich von technischen Problemen irritieren zu lassen. Dass sie tatsächlich leisten,
was wir von ihnen wollen und behaupten, kann besser eingesehen werden, wenn man die
Methoden konkret vor Augen hat.
Der Weg zum Beweis des Hauptsatzes verläuft traditionell zweistufig: Wir
konstruieren zunächst ein Klassenmodell von ZFC, das konstruktible Univer-
sum L von Kurt Gödel aus dem Jahr 1938, und zeigen, dass die echte Klasse L ein
Klassenmodell von (GCH) ist.
In einem zweiten Ansatz führen wir dann die 1963 entwickelte Erzwingungs-
methode − auch im Deutschen oft Forcing genannt − von Paul Cohen ein, mit
deren Hilfe ein gegebenes Modell M von ZFC flexibel und kontrolliert zu einem
umfassenderen Modell M[ G] von ZFC erweitert werden kann. Man spricht hier
von einer generischen Erweiterung, da das Modell M[G] jeweils durch ein einziges
neues Objekt G, einen sog. generischen Filter, erzeugt wird − ganz ähnlich zu
den Körpererweiterungen der Form K[ x ] in der Algebra. Mit dieser Methode
kann durch Hinzufügen einer hinreichend langen Folge von reellen Zahlen zu
einem gegebenen transitiven Mengenmodell von ZFC ein Mengenmodell von
ZFC konstruiert werden, in dem (CH) falsch ist.
Die Erzwingungsmethode von Cohen ist bemerkenswert − um nicht zu sagen:
schockierend − allgemein. Sie lässt sich insbesondere auch dazu verwenden, um
Modelle von (CH) zu konstruieren. Sie liefert also auch das mit Hilfe des Klas-
senmodells L gewonnene Konsistenzresultat von Gödel. Trotz dieser Tatsache
ist aber das Interesse an Gödels Modell L ungebrochen. Im Gegensatz zur Me-
thode von Cohen, die ein beliebiges Modell anhand einer beliebigen partiellen
Ordnung, die dieses Modell besitzt, erweitert, ist L ein einzigartiges Mengenu-
niversum, das ein detailliertes Studium zulässt, ja seinen bewundernden Betrach-
ter geradezu zu einem solchen Studium verführt. Die Klarheit von L ist nur noch
mit der der Arithmetik zu vergleichen. L ist die transfinite Vision der Pythago-
reer. Alles ist Zahl. Die Forcing-Methode dagegen glänzt mit Allgemeinheit,
und leidet daher auch an der Beliebigkeit einer Methode, die hundert- und tau-
sendfach die Grenzen von ZFC aufzeigt.
Insgesamt ergänzen sich die beiden Ansätze von Gödel und Cohen, und ihre
Verallgemeinerungen sind auch für das Verständnis der großen Kardinalzahlaxi-
ome und den mit ihnen verbundenen relativen Konsistenzresultaten komple-
mentär.
Neben der Kontinuumshypothese spielt das Auswahlaxiom eine Schlüsselrolle
in der Geschichte der Mengenlehre. Zermelos Beweis des Wohlordnungssatzes
von 1904 und seine erste mengentheoretische Axiomatik von 1908 lösten eine
große Diskussion um dieses unschuldige Prinzip aus. Es war zu vermuten, dass
dieses Axiom nicht aus den übrigen abzuleiten war, aber dringender erhob sich die
Frage nach seiner relativen Konsistenz. Die Frage wurde durch Gödel beantwor-
tet, und die Vermutung durch Cohen aufgrund von Vorarbeiten von Fraenkel
und Mostowski bestätigt:
Gödel zeigte, dass das Auswahlaxiom (AC) relativ konsistent zu ZF ist. Sein
Modell L lässt sich in der Theorie ZF konstruieren, und es lässt sich beweisen,
dass in L das Auswahlaxiom gilt. Mag also das Auswahlaxiom auch gewissen ma-
thematischen Intuitionen oder philosophischen Auffassungen zuwiderlaufen, für
einen möglichen Widerspruch der Mengenlehre ZFC ist es sicher nicht verant-
wortlich. Lässt sich in ZFC beweisen, dass 0 = 1 gilt, so lässt sich ein solcher Be-
weis in einen Beweis von 0 = 1 in ZF umwandeln. Außerdem zeigt Gödels L das
Auswahlaxiom in einem ganz neuen Licht, nämlich als eine Eigenschaft eines
Mengenuniversums, das sich durch eine Formel wohlordnen lässt. In L gilt das
Auswahlaxiom in einer beeindruckend starken Form, ganz so, wie es in der endli-
chen Mengenlehre gilt.
Die Erzwingungsmethode von Cohen liefert andererseits auch die Möglich-
keit, Modelle von ZF zu konstruieren, in denen (AC) falsch ist. Dieses Resultat
bewies die von niemandem angezweifelte Vermutung, dass (AC) nicht in ZF be-
weisbar ist, es sei denn, ZF ist widerspruchsvoll. Die konstruierten Modelle, die
(AC) verletzen, liegen dabei zwischen dem Ausgangsmodell und einer geeigne-
ten generischen Erweiterung, die beide jeweils Modelle von ZFC sind.
Wir führen zunächst den Begriff eines Klassenmodells ein. Ist W = { x | ψ(x) }
eine Klasse, und ist ϕ eine Aussage, so wollen wir zum Ausdruck bringen, dass ϕ
bezogen auf das Teiluniversum W von V = { x | x = x } eine wahre oder gültige
Aussage ist. So ist etwa die Aussage „für alle x existiert ein y mit xPy“ wahr für die
Klasse On aller Ordinalzahlen. Weiter sind alle ZFC-Axiome trivialerweise wahr
im vollen Universum V = { x | x = x }. Formal definieren wir nun:
Mit den üblichen Konventionen können wir den Quantorschritt der Defini-
tion auch in der Form (∀x ϕ) W = ∀x P W ϕW schreiben.
Für die definierten Junktoren und den Existenzquantor gelten, wie man leicht
überprüft:
(ϕ1 ∨ ϕ2 ) W = ϕ1 W ∨ ϕ2 W
(ϕ1 → ϕ2 ) W = ϕ1 W → ϕ2 W
(ϕ1 ↔ ϕ2 ) W = ϕ1 W ↔ ϕ2 W
(∃x ϕ) W = ∃x P W ϕW = ∃x. x P W ∧ ϕW
Damit entsteht die ϕ-Relativierung ϕW also einfach, indem wir alle in ϕ erschei-
nenden Quantoren ∀x und ∃x durch die beschränkten Quantifizierungen
∀x P W und ∃x P W ersetzen.
Es ist suggestiv, die Notation der Modelltheorie für diese einfache meta-
sprachliche effektive Umformung einer Formel zu übernehmen:
Im Folgenden ist ein Klassenmodell also eine beliebige nichtleere Klasse. Die
Begriffsbildung hat einen suggestiven Charakter: Wir sprechen von Klassenmo-
dellen in Kontexten, in denen wir uns primär dafür interessieren, für welche Aus-
sagen ϕ die Relativierung ϕW gilt und für welche nicht.
Die Bedingung „W ist nichtleer“ ist sinnvoll, da jede Theorie T aus rein logischen
Gründen den Satz ∃x x = x beweist. Wir wollen, dass ein Klassenmodell W logische Argu-
mente „mitträgt“, und dann ist die Bedingung W ≠ ∅ also unumgänglich. Das „Mittra-
gen“ von Beweisen wird unten im Korrektheitssatz präzisiert.
Wir können die Sprache der Mengenlehre in ZFC oder einer schwachen
Teiltheorie von ZFC wie zum Beispiel der endlichen Mengenlehre ZFCfin for-
malisieren, und so ein Spiegelbild der Metasprache auf der Objektebene erzeu-
gen. Für eine Formel ϕ(x1 , …, xn ) der Metabebene sei dann ϕ* das ϕ entspre-
chende Objekt der Objektebene, also etwa ein bestimmtes Element von Vω . Ist
nun 〈M, P〉 ein Modell im Sinne der Modelltheorie − insbesondere also M eine
Menge −, so gilt:
(+) ∀x1 , …, xn P M . ϕM (x1 , …, xn ) ↔ 〈M, P〉 |= ϕ*[ x1 , …, xn ]
Dabei fassen wir auf der linken Seite die Menge M als Klasse M = { x | xPM } auf.
Auf der rechten Seite verwenden wir die übliche modelltheoretische Gültigkeits-
relation. Es gilt also auf der rechten Seite, dass
|= ⊆ { (ϕ*, 〈x1 , …, xn 〉) | ϕ* ist eine Formel in den Variablen v1 , …, vn
und 〈x1 , …, xn 〉 P < ω M }.
Der Beweis von (+) ist eine einfache, aber notationell etwas aufwendige Angele-
genheit. Er hat die Form einer Metainduktion über ϕ. Wichtig ist die Unter-
scheidung, dass die Gültigkeit W |= ϕ für Klassenmodelle mit keiner Relation
der Objektebene verbunden ist, sondern W |= ϕ einfach die Formel ϕW ist, also
das Resultat einer effektiven Umwandlung der Formel ϕ anhand der Formel ψ,
durch welche die Klasse W = { x | ψ(x) } definiert ist. Dagegen ist die Gültigkeits-
relation der Modelltheorie für Mengenmodelle und Formeln der Objektebene
eine übliche Relation. Dieser Modellbegriff steht nicht für echte Klassen zur
Verfügung.
Die Modelltheorie der mathematischen Logik kann wie eine übliche mathematische
Disziplin „grundlagentheoretisch naiv“ dargestellt und entwickelt werden, so wie etwa die
Algebra. Vom Standpunkt der Mengenlehre als Grundlagentheorie findet diese Entwick-
lung aber im Rahmen (einer Teiltheorie) von ZFC statt, sodass z. B. Formeln mathemati-
sche Objekte, also Mengen sind.
Bemerkung
Hier und im Folgenden beziehen sich „Theorie“, „Aussage“, „Formel“,
usw. auf die Sprache der Mengenlehre.
Der Beweis des Korrektheitssatzes ist etwa für den Hilbert-Kalkül durch In-
duktion über die Länge eines Beweises von ψ in S leicht zu führen. Das Argument
zeigt dann, dass und wie sich ein Beweis b von ψ in S effektiv in einen Beweis b′
von ψW in T umwandeln lässt, wenn Beweise von ϕW in T aller in b verwendeten
ϕ aus S vorliegen.
Aus dem einfachen Korrektheitssatz erhalten wir nun den folgenden tragen-
den Satz der metamathematischen Untersuchung der Mengenlehre:
Beweis
Ist ψ eine Aussage mit S ⊢ ψ, so gilt T ⊢ ψW nach dem Korrektheitssatz.
Ist S widerspruchsvoll, so gilt S ⊢ ∃x x ≠ x, und damit T ⊢ ∃x P W x ≠ x.
Wegen W ≠ ∅ ist dann also auch T widerspruchsvoll.
Wir notieren explizit den Fall der Konsistenz einer Aussage ψ relativ zu einer
Theorie T. Er entspricht dem Fall S = T + ψ im letzten Korollar:
Wir können also folgende Strategie verfolgen, um die Konsistenz von (CH)
und (AC) relativ zu ZF zu zeigen: Wir arbeiten in der Theorie ZF und definieren
ein Klassenmodell L = { x | ψ(x) }, für welches wir, immer noch in ZF argumentie-
rend, zeigen können:
L |= ϕ für alle Axiome ϕ von ZF + (GCH) + (AC).
Der Teilbereich L von V erfüllt alle Axiome unserer Ausgangstheorie ZF, und
seine besondere Struktur gibt uns die Möglichkeit, Aussagen wie (GCH) und
(AC) zu zeigen, die wir über V in ZF nicht zeigen können. Die „Struktur von L“
ist die Aussage L = { x | ψ(x) }, d.h. die globale Information, dass jedes Objekt un-
seres Bereiches L die Eigenschaft ψ erfüllt. Für das ganze Universum V haben wir
die triviale globale Information x = x und auch die schon etwas bessere globale In-
formation ∃α xPVα . Diese Information genügt aber nicht, um die Kontinuums-
hypothese oder das Auswahlaxiom abzuleiten. Wir werden die Vα -Hierarchie
durch eine andere Hierarchie, die so genannte Lα -Hierarchie, ersetzen, die sehr
viel langsamer wächst und deren Eigendynamik wir im Detail verfolgen können.
Aus der globalen Information ψ(x) = ∃α x P Lα können wir dann sowohl (GCH)
als auch (AC) ableiten. Das entstehende Klassenmodell L ist Gödels konstruktib-
les Universum. Es ist möglicherweise kleiner als V, aber es ist in jedem Falle ein
Teilbereich von V, der ZF + (AC) + (GCH) erfüllt. Und dass dies so ist, lässt sich
in ZF beweisen.
Bevor wir uns konkreten Klassenmodellen und insbesondere Gödels L zuwen-
den, studieren wir noch ganz allgemein „gute Klassenmodelle“ und reflektieren
über die „Bedeutung von außen“ im Gegensatz zur „Bedeutung von innen“: Ist
zum Beispiel ein Objekt, das ein Klassenmodell W für eine Bijektion hält, wirklich
eine Bijektion? Wie sieht es mit Objekten aus, die W für Kardinalzahlen ansieht?
Weiter studieren wir eine Teiltheorie von ZF und isolieren mit ihrer Hilfe ein
notwendiges und hinreichendes Kriterium dafür, wann gewisse Klassenmodelle
alle Axiome von ZF erfüllen. Diese Überlegungen sind für sich von Interesse, und
sie werden sich auch bei der Untersuchung von L als besonders nützlich erweisen.
Ein transitives Klassenmodell W „kennt“ oder „sieht“ also mit jedem seiner
Elemente x auch alle Elemente y von x, die das Universum V kennt und sieht.
Diese Eigenschaft erleichtert das Überprüfen der Gültigkeit einer Aussage ϕ in
W erheblich. Es zeigt sich: Ist ϕ besonders einfach, so ist ϕW mit ϕ gleichwertig.
Und für kompliziertere ϕ bestehen oft noch Implikationen der Form ϕW → ϕW
oder ϕ → ϕW . Zur genauen Formulierung dieser Ergebnisse betrachten wir ei-
nige syntaktische Komplexitätsbegriffe.
Anders ausgedrückt: Eine Formel ϕ ist eine ∑ 0 -Formel, wenn alle Quantoren
von ϕ beschränkt sind, d. h. in der Form ∀x P y und ∃x P y auftauchen.
Für beschränkte Formeln und transitive Modelle gilt nun folgende ebenso ein-
fache wie fundamentale Übereinstimmung:
Beweis
Wir zeigen die Aussage durch Induktion über den Aufbau von ϕ.
Ist ϕ eine Primformel, so ist die Aussage klar. Gilt ϕ = ϕ1 ∧ ϕ2 oder ϕ = ¬ ψ,
so folgt die Behauptung unmittelbar aus der Induktionsvoraussetzung. Sei
also ϕ = ∀x. x P xn → ψ(x1 , …, xn , x). Dann gilt für alle x1 , …, xn − 1 P W die
Äquivalenzenkette:
W |= ϕ gdw ∀x P W. x P xn → W |= ψ(x1 , …, xn , x)
gdw I. V., xn ⊆ W ∀x. x P xn → ψ(x1 , …, xn , x) gdw ϕ
Die Äquivalenz des Satzes taucht an vielen Stellen auf. Wir definieren:
Der vorangehende Satz besagt also, dass beschränkte Formeln absolut sind für
transitive Klassen. Allgemeiner gilt:
Bei der nächsten Komplexitätsstufe von Formeln geht eine Reihe von unbe-
schränkten Quantoren einer beschränkten Formel voran:
Der Beweis des Satzes kann dem Leser zur Übung überlassen bleiben.
Wir definieren wieder allgemein:
Nach dem Satz sind also Σ1 -Formeln aufwärts absolut und Π1 -Formeln ab-
wärts absolut für transitive Klassenmodelle.
Wir zeigen nun, dass sich viele vertraute Begriffe als beschränkte Formeln
schreiben lassen und daher absolut für transitive Klassen sind.
Für den Leser, der keine Freude an dieser Art der Begriffsanalyse hat, genügt es, nur die
Liste der Eigenschaften zur Kenntnis zu nehmen. Dieser Stoff ist naturgemäß etwas trok-
ken und mühsam, aber die Ausdrucksstärke der Σ0 -Formeln ist überraschend. Wir werden
damit belohnt, nicht mehr ständig überprüfen zu müssen, ob z. B. eine Funktion im Sinne
eines transitiven W tatsächlich eine Funktion ist und umgekehrt.
Beweis
x = ∅: ∀y P x y ≠ y
x ⊆ y: ∀z P x z P y
x = { x1 , …, xn }: x1 P x ∧ … ∧ xn P x ∧ ∀z P x. z = x1 ∨ … ∨ z = xn
x = (y, z) : ∃a P x a = { y } ∧ ∃a P x a = { y, z } ∧ ∀a P x. a = { y } ∨ a = { y, z }
x P (y, z) : x = { y } ∨ x = { y, z }
(x, y) P z : ∃u P z u = (x, y)
„x ist ein geordnetes Paar“: ∃u P x ∃a, b P u x = (a, b)
x = y × z : ∀u P x ∃a P y ∃b P z u = (a, b) ∧ ∀a P y ∀b P z ∃u P x x = (a, b)
x = z − y : (∀u P x. u P z ∧ u ¸ y) ∧ ∀u P z. u ¸ y → u P x
x = y ∩ z : (∀u P x. u P y ∧ u P z) ∧ ∀u P y. u P z → u P x
x = Í y : ∀u P x ∃a P y ∃b P a u = a ∧ ∀a P y ∀b P a ∃u P x u = a
x = > y : ähnlich zu x = Í y
x ist Relation: ∀u P x. u ist ein geordnetes Paar
x ist Funktion: x ist Relation ∧ ∀y,zPx. ∃a P y (∃b. a = { b } ∧ a Pz) → y = z
x P dom( y) : ∃u P y ∃v P u ∃b P v u = (x, b)
x P rng( y) : ∃u P y ∃v P u ∃a P v u = (a, x)
x = dom( y) : ∀u P x u Pdom(y) ∧ ∀u Py ∀v P u ∀a, b P v. u = (a, b) → u P x
x = rng( y) : ähnlich zu x = dom(y)
x = y(z) : (z, x) P y, d. h. ∃u P y u = (z, x)
x = y″z : ∀u P x ∃v P z (v, u) P y ∧ ∀v P z ∃u P x (v, u) P y
x = y|z : x ⊆ y ∧ dom(x) ⊆ z ∧ ∀u P z. u P dom(y) → u P dom(x)
x : y → z : x ist Funktion ∧ dom(x) = y ∧ rng(x) ⊆ z
x ist injektiv : x ist Funktion ∧
∀u, u′Px ∀vPu ∀v′Pu′ ∀a,bPv ∀a′Pv′. u = (a, b) ∧ u′ = (a′, b) → a = a′
x : y → z surjektiv: x ist Funktion ∧ dom(x) = y ∧ rng(x) = z
x : y → z bijektiv: x : y → z surjektiv ∧ x ist injektiv
x ist transitiv : ∀y P x y ⊆ x
x ist erblich transitiv : x ist transitiv ∧ ∀y P x y ist transitiv
x ist durch Plinear geordnet : ∀aPx a¸a ∧
∀a, b, c P x (a P b ∧ b P c → a P c) ∧ ∀a, b P x. a P b ∨ a = b ∨ b P c
< ist eine partielle Ordnung auf x : < ⊆ x × x ∧ ∀a P x (a, a) ¸ < ∧
∀a, b, c P x. (a, b) P < ∧ (b, c) P < → (a, c) P <
< ist eine lineare Ordnung auf x : < ist eine partielle Ordnung auf x ∧
∀a, b P x. (a, b) P < ∨ a = b ∨ (b, a) P <
x ist induktiv: ∅ P x ∧ ∀y P x ∃z P x z = y ∪ { y }
Alle Definitionen sind entweder bereits die offiziellen Definitionen oder aber
über sehr schwachen Fragmenten von ZF äquivalent zu diesen. Wir betrachten
nur transitive Klassen W, die diese Äquivalenzen erfüllen, sodass in diesen Klas-
sen die angegebenen Definitionen auch das zum Ausdruck bringen, was wir sa-
gen möchten. Alternativ kann man vereinbaren, dass die offiziellen Definitionen
wo immer möglich durch Σ0 -Formeln gegeben werden.
Obige Liste ließe sich noch lange weiter fortsetzen. Weiter zeigt eine Betrach-
tung der obigen Formel für „x = dom(y)“, dass für alle Σ0 -Formeln ϕ die Formel
∀xPdom(y) ϕ als Σ0 -Formel geschrieben werden kann. Ähnliches gilt für rng(y),
und damit lässt sich dann etwa „x ist injektiv“ schreiben als
„x ist Funktion ∧ ∀a, b P dom(x) ∀c P rng(x) (a, c) P x ∧ (b, c) P x → a = b“.
Wir verwenden im Folgenden derartige Varianten recht frei, und überlassen dem
Leser den Nachweis, dass wir den Bereich der Σ0 -Formeln nicht verlassen.
Beweis
|x| ≤ |y|: ∃f. f ist injektive Funktion ∧ dom(f) = x ∧ rng(f) ⊆ y
|x| = |y|: ∃f. f ist injektive Funktion ∧ dom(f) = x ∧ rng(f) = y
Beweis
zu x = P(y): ∀z. z ⊆ y ↔ z P x.
< ist wohlfundiert auf x: < ist eine partielle Ordnung auf x ∧
∀y. y ⊆ x ∧ y ≠ ∅ → ∃a P y ∀b P y (b, a) ¸ <
α ist eine Ordinalzahl: α ist transitiv ∧ α ist durch P linear geordnet ∧
∀y. y ⊆ α ∧ y ≠ ∅ → ∃a P y. ∀b P y. a = b ∨ a P b
α ist Kardinalzahl:
α ist Ordinalzahl ∧ ∀f. f Funktion ∧ dom(f) P α → rng(f) ≠ α
α ist regulär:
α ist Ordinalzahl ∧ ∀f. f Funktion ∧ dom(f) P α → ∃β P α rng(f) ⊆ β
Beweis
„x P On“ ist eine Π1 -Formel und damit abwärts absolut. Da W das
Fundierungsaxiom erfüllt, gilt für alle x P W:
W |= „xPOn“ gdw W |= „x ist transitiv und durch P linear geordnet“
gdw W |= x ist erblich transitiv.
Die Formeln auf der rechten Seite sind Σ0 -Formeln und damit aufwärts
absolut. Weiter gilt:
x ist Limesordinalzahl:
x ist Ordinalzahl ∧ x ≠ ∅ ∧ ∀y P x ∃z P x y P z.
x ist eine natürliche Zahl :
x ist Ordinalzahl ∧ x ist kein Limes ∧ ∀y P x y ist kein Limes.
x = ω : x ist Limes ∧ ∀y P x y ist kein Limes.
Dagegen wird sich zeigen, dass viele andere Σ1 - und Π1 -Aussagen nicht abso-
lut für transitive Klassenmodelle sind, auch dann nicht, wenn diese starke Frag-
mente von ZFC oder sogar ZFC selbst erfüllen.
Beispiele
Nicht absolut sind:
(a) |x| ≤ |y|, |x| = |y|
(b) cf(λ) ≤ β
(c) x = P(y)
(d) α ist eine Kardinalzahl, α ist regulär
Übung
Sei W ein transitives Klassenmodell mit W |= (Fun). Dann gilt für alle
x,yPW:
(i) W |= cf(λ) = α impliziert α Limes und cf(λ) ≤ α.
(ii) W |= x = P(y) impliziert x = P(y) ∩ W.
(iii) W |= α = ω1 impliziert α ≤ ω1 .
(iv) { α P W | W |= α ist Ordinalzahl } = On ∩ W.
Satz
Sei W ein transitives Klassenmodell, und seien ϕ(x1 , …, xn ) eine Σ1 -Formel,
ψ(x1 , …, xn ) eine Π1 -Formel und χ(x1 , …, xn ) eine beliebige Formel. Für
alle x1 , …, xn P W gelte
(a) ϕ(x1 , …, xn ) ↔ ψ(x1 , …, xn ) ↔ χ(x1 , …, xn )
(b) W |= ϕ(x1 , …, xn ) ↔ ψ(x1 , …, xn ) ↔ χ(x1 , …, xn ).
Dann sind ϕ, ψ und χ absolut für W.
Hier und im Folgenden verwenden wir die übliche Konvention, dass ϕ ↔ ψ ↔ χ als
(ϕ ↔ ψ) ∧ (ψ ↔ χ) zu lesen ist. Die Formeln ϕ ↔ (ψ ↔ χ) und (ϕ ↔ ψ) ∧ (ψ ↔ χ) haben
eine unterschiedliche Bedeutung, wie z. B. eine Wahrheitstafel zeigt.
Der Satz findet wie folgt Anwendung: Sei T eine Teiltheorie von ZFC, und
sei χ eine Formel, die in T sowohl zu einer ∑ 1 -Formel ϕ als auch zu einer ∏ 1 -
Formel ψ äquivalent ist. Dann ist χ absolut für jedes transitive Klassenmodell W
von T. Damit haben wir folgende Definition motiviert und den anschließenden
Satz bewiesen:
Sind ϕ, ψ ∆T
1 -Formeln, so auch ¬ ϕ und ϕ ∧ ψ.
Beweis
Π1 -Formulierung der Wohlfundiertheit von R :
„ R ist Relation ∧ ∀x. x ⊆ R ∧ x ≠ ∅ → ∃y P x ∀z P x (z, y) ¸ R“.
Σ1 -Formulierung der Wohlfundiertheit von R :
„R ist Relation ∧ ∃f . f : dom(R) ∪ rng(R) → On ∧
∀x, y P dom(f ). (x, y) P R → f(x) < f(y)“.
Σ1 -Formulierung der Endlichkeit von x:
„∃n ∃f . n P ω ∧ f : n → x bijektiv.“
Beweis
Die obige ∑ 1 -Formulierung ist die Definition der Endlichkeit. Also ist
„x ist endlich“ aufwärts absolut für transitive Modelle, für die „n ist eine
natürliche Zahl“ absolut ist.
Sei andererseits x P W endlich, und sei f P V mit f : n → x bijektiv für ein
n P ω. Durch Induktion nach k ≤ n zeigt man, dass f|k P W gilt. Hier wird
die Abgeschlossenheit von W unter der Operation a ∪ { b } gebraucht.
Also ist f = f|n P W, und damit ist x auch endlich in W.
Ein inneres Modell enthält nach Definition alle Ordinalzahlen und ist damit
eine echte Klasse.
Ist die Arbeitstheorie T fest gewählt, so sagen wir auch kurz „inneres Modell“
statt „inneres Modell von T“, und wir lassen auch den Vorsatz „T ⊢“ in (iii) weg.
Sei W ein inneres Modell von ZF − (Fun). Wir können dann in W die von
Neumann-Zermelo-Hierarchie bilden. Der Begriff der Ordinalzahl und die
Operation der Vereinigung sind absolut, während für die Potenzmengenbildung
gilt, dass P W (x) = P(x) ∩ W. Durch Induktion über α P On folgt:
Vα W = Vα ∩ W.
Erfüllt W das Fundierungsaxiom, so gilt zudem W = Íα P On Vα W .
Ziel des Folgenden ist es, ein einfaches Kriterium zu entwickeln, wann ein
Klassenmodell ein inneres Modell von ZF ist.
Besonders der Nachweis, dass das Aussonderungsschema in einem transitiven
Klassenmodell W gilt, kann Schwierigkeiten bereiten. W erfüllt Aussonderung
für ϕ(u), falls gilt:
W |= ∀x ∃y ∀z. z P y ↔ ϕ(u).
Hierzu ist zu zeigen, dass für alle x P W die Menge { u P x | ϕW (u) } ein Element
von W ist (!). Dies ist oft nur für ∑ 0 -Formeln einfach zu beweisen, denn dann ge-
nügt es zu zeigen, dass die wirkliche Aussonderung { u Px | ϕ(u) } in W ist. Diese
Überlegung begründet das Interesse an einer Theorie, in der die Aussonderung
zunächst nur für ∑ 0 -Formeln gefordert wird, sich aber letztendlich aus anderen
Axiomen ergibt, die in Klassenmodellen leichter nachzuweisen sind als das volle
Aussonderungsschema. Die folgende dergestaltige Teiltheorie ZF* von ZF geht
auf Jensen zurück. Mit ihrer Hilfe wird ein Kriterium für innere Modelle sehr
einfach zu beweisen sein.
Kollektionsschema (Kol)
Für jede Formel ϕ(u, v, p1 , …, pn ) gilt:
∀x, p1 , …, pn ∃y ∀u P x. ∃v ϕ(u, v, p1 , …, pn ) → ∃v P y ϕ(u, v, p1 , …, pn ).
Hier fehlt das Potenzmengenaxiom (Pot). Damit ist zunächst nicht klar, dass
vertraute Dinge wie das karteische Produkt x × y existieren. Dies ist aber richtig.
Zunächst zeigen wir:
Satz (∑ 0 -Ersetzungsschema)
In ZF ′ gilt das Ersetzungsschema für ∑ 0 -Formeln: Ist F = { (u, v) | ϕ(u, v) }
eine durch eine ∑ 0 -Formel ϕ (mit Parametern) definierte funktionale
Klasse, so ist F″x eine Menge für alle x.
Beweis
Nach dem Kollektionsschema für x und ϕ(u, v) gibt es ein y mit:
∀u P x. ∃v F(u) = v → ∃v P y F(u) = v.
Dann existiert F″ x = { v P y | ∃u P x F(u) = v } = { v P y | ∃u P x ϕ(u, v) }
nach dem ∑ 0 -Aussonderungsschema.
Beweis
Wir zeigen zunächst, dass { a } × y für alle Mengen a existiert:
Sei hierzu F(b) = (a, b) für alle b P V. Dann ist F durch eine Σ0 -Formel
definiert und es gilt { a } × y = F″y P V.
Damit sei nun G(a) = { a } × y für alle a P V. Dann ist G durch eine
Σ0 -Formel definiert und es gilt
x × y = Ía P x { a } × y = Í G″x P V.
Die Σ0 -Aussonderung genügt für viele Konstruktionen. So existieren etwa die
Mengen x ∩ y und x − y. Es ist nun überraschend, dass in ZF* de facto das volle
Aussonderungsschema beweisbar ist:
Hierbei ist (u) = u für alle u. Für den Fall n = 1 haben wir also das Aussonderungsschema
vorliegen. Aus diesem folgt umgekehrt die Produktaussonderung als die übliche Aussonde-
rung { wPx1 × … × xn | ∃u1 Px1 , …, un Pxn . w = (u1 , …, un ) ∧ ϕ(u1 , …, un ) }. Für den Beweis
brauchen wir aber die Produktform, um den Quantorschritt durchführen zu können.
Beweis
Für alle x1 , …, xn existiert x1 × … × xn nach dem obigen Satz. Wir unter-
drücken der Einfachheit halber die Parameter p1 , …, p k . Wir zeigen durch
Induktion über den Aufbau von ϕ(u1 , …, un ), dass für alle x1 , …, xn die
folgende Klasse eine Menge ist:
Aϕx1, …, xn = { (u1 , …, un ) P x1 × … × xn | ϕ(u1 , …, un ) }.
Fall ϕ = u i = u j :
Dann ist
Aϕx1, …, xn = { (u1 , …, un ) P x1 × … × xn | u i = u j }
= { wPx1 × … × xn | ∃u1 Px1 … ∃un Pxn . w = (u1 , …, un ) ∧ u i = u j }
Fälle ϕ = u i P u j , u i P pj , u i = pj , usw. :
Diese atomaren Fälle sind analog zum Fall u i = u j .
Fall ϕ = ϕ1 ∧ ϕ2 :
Nach I. V. und Σ0 -Aussonderung gilt:
Fall ϕ = ¬ ψ :
Nach I. V. und Σ0 -Aussonderung gilt:
Aϕx1, …, xn = x1 × … × xn − Aψx1, …, xn P V
Fall ϕ = ∃v ψ(v, u1 , …, un ) :
Nach (Kol) existiert ein y derart, dass für alle u1 P x1 , …, un P xn gilt:
Damit hat sich also die Theorie ZF* als eine starke Form von ZF − = ZF − (Pot)
erwiesen.
∆ZF*
1 -Absolutheit
Übung
Sei ϕ eine ∆1* -Formel. Dann ist auch ∀x P y ϕ eine ∆1* -Formel.
[ Seien ψ und χ äquivalent zu ϕ in ZF*, ψ eine ∑ 1 -Formel, χ eine ∏ 1 -Formel.
Sei ψ = ∃z1 , …, zn ψ′ mit einer ∑ 0 -Formel ψ′. Das Kollektionsschema liefert in ZF*
die Äquivalenz:
∀x P y ϕ ↔ ∀x P y ∃z1 , …, zn ψ′ ↔ ∃v ∀x P y ∃z1 P v, …, zn P v ψ′.
Die rechte Seite ist aber eine ∑ 1 -Formel. Weiter ist ∀x P y χ logisch äquivalent zu
einer ∏ 1 -Formel. ]
Der Rekursionssatz ist in ZF * beweisbar. Wir zeigen nun noch, dass die Re-
kursion über ∆1*-Funktionen wieder ∆1*-Funktionen erzeugt.
Satz (∆1*-Rekursion)
Sei G eine ∆1*-Funktion. Dann existiert eine ∆1*-Funktion F : On → V mit
der Eigenschaft:
F(α) = G(F|α) für alle α P On.
Beweis
Die Formel
„f ist α-Approximation (für G)“ = „f : α → V ∧ ∀β < α f(β) = G(f|β) “
ist ∆1* nach obiger Übung, da G eine ∆1*-Funktion ist. ZF* beweist, dass für
alle α genau eine α-Approximation existiert, und damit sind die folgenden
Σ1 - bzw. Π1 -Definitionen gleichwertig:
F(α) = y, falls ∃f. f ist (α + 1)-Approximation ∧ f(α) = y
F(α) = y, falls ∀f. f ist (α + 1)-Approximation → f(α) = x
Wir geben nun ein Kriterium dafür an, wann eine transitive Klasse ein inneres
Modell von ZF ist. Die Ergebnisse über ZF′ setzen wir dabei so ein: Statt dem
Ersetzungsschema genügt es, das ∑ 0 -Aussonderungsschema und das Kollekti-
onsschema zu zeigen. Dies vereinfacht den Beweis erheblich.
Die Eigenschaften (a) und (b) sind notwendig für innere Modelle von ZF:
Übung
Sei W ein inneres Modell von ZF. Dann gilt (a) und (b).
[ (a) gilt wegen (Aus) W und der Absolutheit von ∑ 0 -Formeln für transitive Klassen.
Zum Beweis von (b) bilden wir in W die Va -Hierarchie, mit Wα := (Vα ) W = Vα ∩ W
für alle α P On (= OnW ). Ist dann y ⊆ W, so ist y ⊆ Wα P W für ein α nach (Fun). ]
Beweis
Wir arbeiten in ZF. W ist transitiv nach Voraussetzung. Weiter gilt:
(+) On ⊆ W.
Beweis von (#)
Annahme nicht. Dann ist β := On ∩ W P On nach (Fun), und es gilt
β ⊆ W, β ¸ W. Nach (b) existiert ein y mit β ⊆ y. Dann ist aber
β = { α P y | α ist erblich transitiv } P W nach ∑ 0 -Aussonderung,
Widerspruch.
Wir zeigen nun, dass W |= ϕ für alle ZF-Axiome ϕ gilt. Statt (Aus) und
(Ers) zeigen wir (∑ 0 -Aus) und (Kol).
W |= (Ext) :
(Ext) gilt in jedem transitiven P-Modell.
W |= (Pa) :
Seien a, b P W. Dann ist z = { a, b } ⊆ W. Sei also y P W mit z ⊆ y. Dann
ist z = { u P y | u = a ∨ u = b } P W. Weiter gilt z = { a, b }W .
W |= (Ver) :
Für alle x P W ist z = Í x ⊆ W. Sei y P W mit z ⊆ y. Dann ist
z = { b P y | ∃a P x b P a } P W. Weiter gilt z = (Í x) W .
W |= (LM), (Un) :
Klar wegen 0, ω P W.
W |= (Σ0 -Aus) :
Ist klar nach (a) und der Absolutheit von ∑ 0 -Formeln für transitive W.
W |= (Kol) :
Sei ϕ(u, v) eine Formel, und sei x P W (wir unterdrücken Parameter).
Wir zeigen:
W |= ∃y ∀u P x. ∃v ϕ(u, v) → ∃v P y ϕ(u, v),
d. h. zu zeigen ist:
∃y P W ∀u P x. ∃v P W ϕW (u, v) → ∃v P y ϕW (u, v).
Nach dem Kollektionsschema in V für „ϕW ∧ v P W“ gibt es ein y* mit:
∀u P x. ∃v P W ϕW (u, v) → ∃v P y* ϕW (u, v).
Sei nun y P W mit y* ∩ W ⊆ y. Dann ist y wie gewünscht.
W |= (Pot) :
Sei x P W, und sei z = P(x) ∩ W. Es genügt z P W zu zeigen, denn dann
gilt Z = P W (x). Wegen z ⊆ W gibt es ein y P W mit z ⊆ y. Dann ist aber
z = { u P y | u ⊆ x } P W.
W |= (Fun) :
(Fun) ist eine Π1 -Aussage, also abwärts absolut für transitive W.
Notation
Wir schreiben auch 〈W, E〉 |= ϕ statt ϕW, E .
Die „Paarbildung“ zweier u.U. echter Klassen 〈W, E〉 ist hier eine rein notationelle Be-
quemlichkeit. Der Ausdruck 〈W, E〉 |= ϕ ist ja nichts anderes als ϕW, E , eine übliche Formel
der Sprache der Mengenlehre.
Im Vergleich zu ϕW wird in ϕW, E also zusätzlich jedesPdurch ein E ersetzt. In der Relati-
vierung der Quantoren bleibt die P-Relation: „〈W, E〉 |= ∀x ϕ“ ist die Formel „∀xPW ϕ“
und nicht etwa „∀x E W ϕ“, was keinen Sinn ergibt.
Es gilt ϕW = ϕW, P und W |= ϕ ist identisch mit 〈W, P〉 |= ϕ, wobei wir hier kurz
P statt strenger und länger P ∩ W 2 schreiben.
An dieser Stelle spielt nun der transitivierende Mostowski-Kollaps, den wir im
ersten Abschnitt kennen gelernt haben, eine wichtige Rolle. Er erlaubt uns, in
vielen Fällen eine E-Relation strukturerhaltend in die vertraute P-Relation auf
einer transitiven Klasse überzuführen. Wir definieren:
Wir konstruieren ein inneres Modell von ZF − (Fun), in welchem das Fundie-
rungsaxiom gültig ist. Die gleiche Konstruktion können wir auch in der Theorie
ZFC − (Fun) durchführen, und wir erhalten dann ein Klassenmodell von ZFC.
Damit haben wir gezeigt, dass das Fundierungsaxiom relativ konsistent zu den
Theorien ZF − (Fun) und ZFC − (Fun) ist.
Das gesuchte Klassenmodell ist uns im ersten Abschnitt bereits begegnet. Wir
arbeiten in ZF − (Fun) und definieren:
Beweis
V* ist transitiv und es gilt On ⊆ V*. Weiter ist V* fast universell, denn V*
enthält sogar alle seine Teilmengen als Elemente: Ist x ⊆ V*, so existiert ein
α mit x ⊆ Vα , und dann ist x P Vα + 1 ⊆ V*. Ebenso erfüllt V* das Aussonde-
rungsschema, denn für jede Formel ϕ(v) (mit Parametern) und alle x P V*
gibt es ein α mit x ⊆ Vα , und dann ist
z = { u P x | ϕW (u) } ⊆ Vα ⊆ V*,
also z P V*. Nach dem modifizierten Kriterium für innere Modelle ist also
V* ein Modell von ZF − (Fun). Aber V* |= (Fun): Ist x P V* ≠ ∅, so sei α
minimal mit Vα ∩ x ≠ ∅. Dann ist jedes y P Vα ∩ x P-minimal in x.
Gilt (AC), so gilt (AC) in V*, denn eine Auswahlmenge für ein x P V* ist
eine Teilmenge von x, also ein Element von V*.
Statt das Kriterium für innere Modelle zu verwenden, kann man auch leicht alle Axiome
von ZF direkt in V* nachrechnen.
Damit haben wir einen sehr transparenten Beweis für unsere Intuition gefun-
den, dass das regulative Fundierungsaxiom keine Widersprüche erzeugen kann.
Unabhängig davon, ob das Fundierungsaxiom gilt oder nicht, können wir die von
Neumann-Zermelo-Hierarchie bilden. Die so definierte Klasse V* ist sehr reich-
haltig, und unabhängig davon, ob sie mit ganz V zusammenfällt, erfüllt sie alle
Axiome der Ausgangstheorie, also ZF − (Fun) oder ZFC − (Fun). Und in V* gilt
zusätzlich auch das Fundierungsaxiom: Bilden wir die Vα -Hierarchie innerhalb
von V*, so schöpfen wir ganz V* aus. Im Klassenmodell V* gilt „V = V*“.
Bislang bleibt noch die Frage offen, ob wir das Fundierungsaxiom nicht bereits
in ZFC − (Fun) beweisen können. Falls ja, so können wir in ZFC − (Fun) zeigen,
dass V = V* gilt, und dann wäre obiger Beweis, dass V* alle ZF-Axiome erfüllt,
vollkommen überflüssig.
Wir können nun aber in ZFC überraschend einfach ein Klassenmodell von
ZFC − (Fun) konstruieren, in welchem es eine Menge x gibt, für die x = { x } gilt.
Das Fundierungsaxiom ist in diesem Modell also in einer sehr starken Weise ver-
letzt. Das Modell und die relative Konsistenz des Fundierungsaxioms zeigen,
dass wir in ZFC − (Fun) das Fundierungsaxiom nicht beweisen können, es sei
denn, ZFC − (Fun) ist widerspruchsvoll.
Die Idee der Konstruktion ist die folgende: Die Menge 1 = { ∅ } übernimmt die
Rolle der leeren Menge, während die alte leere Menge die Aufgabe übernimmt,
mit ihrer Einermenge identisch zu sein. Zur Durchführung dieser Idee definie-
ren wir ganz allgemein die Umstrukturierung des Universums gemäß einer bi-
jektiven funktionalen Klasse:
Der Beweis besteht aus dem Nachrechnen der einzelnen Axiome und kann
dem Leser zur Übung überlassen bleiben.
Die einfachste Bijektion auf V ist der Tausch von 0 und 1. Diese Umstruktu-
rierung liefert ein Modell, in dem ∅ = { ∅ } für die alte leere Menge unter der
neuen Elementrelation E gilt:
Beweis
Nach dem obigen Satz gilt ZFC − (Fun) in VF . Sei c = ∅. Dann gilt für
alle y:
x E c gdw x P F(c) gdw x P { 0 } gdw x = c.
Also gilt VF |= c = { c }.
Übung
Konstruieren Sie ein Modell der folgenden Theorie:
ZFC − (Fun) + „∃x x = { x, ∅ }“.
Übung
Konstruieren Sie ein Modell der folgenden Theorie
ZFC − (Fun) + „∃〈xn | n P ω〉 ∀n P ω xn = { xn + 1 }“
Analog zur Konstruktion von V* in ZFC − (Fun) können wir in FST − die
Klasse VΩ bilden und zeigen, dass VΩ alle Axiome von FST erfüllt. Damit ist FST
relativ konsistent zu FST − .
Weiter gilt für die endliche Mengenlehre auch der Satz über die Umstruktu-
rierung: Jedes bijektive F : VΩ → VΩ induziert ein Modell VΩ, F = 〈VΩ , E〉 von
FST − , wobei wieder x E y gesetzt wird, falls x P F(y) gilt. Der 0-1-Tausch liefert
ein Modell von FST − + ¬(Fun), und der n-n*-Tausch der obigen Übung liefert
ein Modell von FST − + (Fun) + ¬(FuS) ; in diesem Modell besitzt die alte leere
Menge c = ∅ keine transitive Obermenge.
Übung
Beweisen Sie diese Aussagen über FST − .
Schließlich halten wir fest, dass wir in ZFC − (Un) das Unendlichkeitsaxiom
nicht beweisen können, es sei denn, ZFC − (Un) (und damit FST und PA) ist in-
konsistent. Denn in ZFC − (Un) können wir die Klasse VΩ bilden, unabhängig
davon, ob Ω eine Menge oder eine echte Klasse ist. Und VΩ ist ein Klassenmodell
von FST. Damit gilt also:
Satz
FST ist relativ konsistent zu ZFC − (Un).
In manchen Fällen gelingt es, die Unabhängigkeit eines ZFC-Axioms von den
restlichen Axiomen oder auch die Unabhängigkeit einer Aussage − wie z. B. der
Kontinuumshypothese − von ZFC nachzuweisen. In anderen Fällen ist es dage-
gen nur möglich, die Konsistenz von ¬ ϕ relativ zu einer Theorie T zu beweisen,
nicht aber die Konsistenz von ϕ relativ zu T. Dies ist immer dann der Fall, wenn
es die Aussage ϕ erlaubt, Modelle der Arbeitstheorie T zu konstruieren. Wir füh-
ren diese Dinge für Leser genauer aus, die mit den Gödelschen Sätzen gut ver-
traut sind. Wir betrachten das Unendlichkeitsaxiom und untersuchen, was folgen
würde, wenn es uns gelänge, die Widerspruchsfreiheit von (Un) relativ zu T =
ZFC − (Un) zu zeigen. Wir nehmen also an, wir hätten durch eine metamathema-
tische Untersuchung ähnlich wie für das Fundierungsaxiom gezeigt:
(+) T widerspruchsfrei impliziert ZFC widerspruchsfrei.
Die Formalisierung des Argumentes zeigt dann:
(++) T ⊢ Con(T) → Con(ZFC).
Hier und im Folgenden ist Con(T) die in T formalisierte Aussage der Widerspruchsfrei-
heit von T.
Aber ZFC beweist, dass T ein Mengenmodell besitzt (nämlich Vω ), und nach
dem Gödelschen Vollständigkeitssatz ist dies gleichwertig zur Aussage Con(T).
Also gilt ZFC ⊢ Con(T). Da ZFC alles beweist, was T beweist, folgt aus (++):
ZFC ⊢ Con(ZFC).
Nach dem zweiten Gödelschen Unvollständigkeitssatz ist dann aber ZFC wider-
sprüchlich. Ein relativer Konsistenzbeweis für das Unendlichkeitsaxiom würde
also die Widersprüchlichkeit von ZFC zeigen.
Wir können noch etwas mehr zeigen. Hierzu argumentieren wir wie oben bis (++) und
verwenden nun, dass ZFC ⊢ T + Con(T), und dass folglich gilt:
(#) ZFC widerspruchsfrei impliziert T + Con(T) widerspruchsfrei.
Eine Formalisierung von (#) liefert nun:
(##) T ⊢ Con(ZFC) → Con(T + Con(T)).
Zusammen mit (++) erhalten wir also
T ⊢ Con(T) → Con(T + Con(T)), d. h. T + Con(T) ⊢ Con(T + Con(T)).
Dies ist nach dem zweiten Gödelschen Unvollständigkeitssatz nur möglich, wenn die
Theorie T + Con(T) widerspruchsvoll ist, d. h. wenn gilt, dass
(p) T ⊢ ¬ Con(T).
Wir können diese Möglichkeit nicht ausschließen, und aus (p) folgt noch nicht, dass T
wirklich widerspruchsvoll ist.
Insgesamt würde also ein Beweis der Konsistenz von (Un) relativ zu ZFC − (Un) nicht
nur zeigen, dass ZFC widersprüchlich ist, sondern er würde stärker zeigen, dass die Theo-
rie ZFC − (Un) ihre eigene Widersprüchlichkeit beweist.
Beweis
Annahme, wir können in S zeigen:
T ist widerspruchsfrei impliziert S ist widerspruchsfrei.
Eine Formalisierung dieses Argumentes liefert
S ⊢ Con(T) → Con(S).
Wegen S ⊢ Con(T) gilt also S ⊢ Con(S), Widerspruch.
Die Voraussetzung non(S ⊢ Con(S)) ist nach dem zweiten Gödelschen Un-
vollständigkeitssatz für alle S ⊇ ZFC − (Un) richtig, vorausgesetzt, S ist wider-
spruchsfrei.
Einige Mengenmodelle
Die Vα - und Hκ -Hierarchien stellen uns viele Modelle zur Verfügung, die
große Fragmente von ZFC erfüllen.
Wir arbeiten in ZFC. Für die von Neumann-Zermelo-Hierarchie gilt:
Korollar
Ein Konsistenzbeweis von (Ers) relativ zu ZFC − (Ers) ist in der Theorie
ZFC nicht möglich.
Korollar
Ein Konsistenzbeweis von „Es gibt eine unerreichbare Kardinalzahl“ relativ
zu ZFC ist in der Theorie ZFC + „Es gibt eine unerreichbare Kardinalzahl“
nicht möglich.
Übung
Sei κ unerreichbar. Dann gilt:
(i) Vκ |= „Es gibt ein abzählbares Modell von ZFC“
(ii) C = { α < κ | Vα d Vκ } ist club in κ
Beweis
Wir zeigen als Beispiel das Kollektionsschema. Die anderen Axiome sind
ebenfalls leicht nachzuprüfen. Sei also ϕ(u, v) eine Formel (mit Parame-
tern), und sei x P Hκ . Wir finden ein y P Hκ , sodass gilt:
Hκ |= ∀u P x. ∃v ϕ(u, v) → ∃v P y ϕ(u, v).
Sei
x′ = { u P x | es gibt ein v P Hκ mit ϕHκ (u, v) }
und sei
f(u) = „ein v P Hκ mit ϕHκ (u, v)“ für alle u P x′.
Dann ist y = rng(f ) P Hκ wie gewünscht.
Korollar
Ein Konsistenzbeweis des Potenzmengenaxioms relativ zu ZFC − (Pot) +
(Kol) ist in der Theorie ZFC nicht möglich.
Damit können wir die Konsistenz des Potenzmengenaxioms relativ zur Theo-
rie ZFC − (Pot) nicht zeigen, es sei denn, ZFC − (Pot) ist widerspruchsvoll.
Es gilt:
Hω1 |= „ Jede Menge ist abzählbar“ .
Damit können wir in der Theorie ZFC − (Pot) nicht zeigen, dass eine überab-
zählbare Menge existiert, es sei denn, diese Theorie ist widerspruchsvoll.
Wegen Hω = Vω ist Hω ein Modell der endlichen Mengenlehre. Für unerreich-
bare Kardinalzahlen κ gilt Hκ = Vκ , und dann ist also Hκ ein Modell von ZFC.
Definierbare Teilmengen
Wir definieren, mit dem Modell- und Formelbegriff der Objektebene, was es
heißt, definierbar über einem Modell zu sein:
Die L-Hierarchie
Die Formel „x P L“ ist also identisch mit „∃α P On x P Lα “. Wie immer lassen
sich die Formeln „x P Lα “ und „x = Lα “ durch Auflösen der Rekursion als reine
P-Formeln schreiben.
Wir halten einige elementare Eigenschaften der Hierarchie fest.
Beweis
Die Aussagen (i) − (iii) zeigen wir simultan durch Induktion nach α. Die
Aussage (iv) folgt aus (iii). Schließlich zeigen wir (v) durch Induktion nach
α ≤ ω.
Nach (iv) haben also L und V dieselben erblich endlichen Mengen, und die
Hierarchien stimmen bis einschließlich ω überein. Dagegen ist Lω + 1 abzählbar,
während Vω + 1 die Mächtigkeit 2ω besitzt.
Mit unserem Kriterium für innere Modelle können wir sehr einfach zeigen:
Satz
L ist ein inneres Modell von ZF.
Beweis
L ist transitiv, da alle Lα transitiv sind. Weiter gilt On ⊆ L. Sei ϕ(u, v1 , …,
vn ) eine ∑ 0 -Formel, und seien x, p1 , …, pn P L. Sei y = { a P x | ϕ(a, p1 , …,
pn ) }. Wir zeigen, dass y P L gilt. Sei hierzu α derart, dass x, p1 , …, pn P Lα .
Wegen der Absolutheit von Σ0 -Formeln für transitive Modelle gilt dann:
y = { a | a P x ∧ ϕ(a, p1 , …, pn ) }
= { a P Lα | Lα |= a P x ∧ ϕ[ a, p1 , …, pn ] } P Def(Lα )
= Lα + 1 ⊆ L.
Wir zeigen schließlich, dass L fast universell ist. Sei hierzu also x ⊆ L.
Dann existiert ein α mit x ⊆ Lα . Aber Lα P L.
Die Konstruktion von L erlaubt es, das Klassenmodell L wohlzuordnen. Ist eine
Wohlordnung von Lα gegeben, so können wir diese Wohlordnung zu einer Wohl-
ordnung auf Lα + 1 ausdehnen, da die Elemente von Lα + 1 durch Formeln und Para-
meter in der Wohlordnung Lα beschrieben werden. Für die Vα -Hierarchie ist dies
nicht ohne zusätzliche Voraussetzungen möglich. Selbst mit Hilfe des Auswahla-
xioms können wir nur Wohlordnungen einzelner Stufen Vα erzeugen, nicht aber
eine Wohlordnung von ganz V. Es steht keine Möglichkeit zur Verfügung, aus ei-
ner Wohlordnung von Vα uniform eine Wohlordnung von Vα + 1 = P(Vα ) zu ge-
winnen.
Der Aufbau von L wird durch Formeln und endliche Parameterfolgen kontrol-
liert. Es gibt abzählbar viele Formeln, und damit ist ein Element von Lα + 1 durch
ein Tupel (n, s) mit nPω und sPLα < ω gegeben. Haben wir Lα schon wohl geord-
net, so können wir die Elemente von Lα mit Ordinalzahlen identifizieren. Dann ist
s ein Element von On< ω . Diese Überlegung motiviert unser Interesse an einer
Wohlordnung der Klasse ω × On< ω . Eine solche ist aus der im ersten Abschnitt
konstruierten Wohlordnung aseq auf On< ω durch Produktbildung leicht zu ge-
winnen. Wir setzen für alle (n, s), (m, t) P ω × On< ω :
(n, s) a (m, t), falls s aseq t oder s = t und n < m.
Die Ordnung a ist die übliche Produktordnung 〈ω, P〉 ⋅ 〈On<ω , < seq 〉. Wir erset-
zen jedes s in der Wohlordnung <seq durch die unendlich vielen Elemente
〈(0, s), (1, s), (2, s), …, (n, s), …〉.
Mit Hilfe der Wohlordnung a können wir nun leicht eine Wohlordnung von
L konstruieren. Wir konstruieren hierzu eine Bijektion von ω × On< ω auf L.
Beweis
Sei 〈ϕn | n P ω〉 eine Aufzählung aller P-Formeln (auf der Objektebene).
Weiter sei π : ω → ω × ω< ω bijektiv.
Eine unmittelbare Folgerung des Satzes, die sich auch leicht direkt beweisen
lässt, ist:
Beweis
Wegen α ⊆ Lα ist |α| ≤ |Lα |. Weiter ist Fα : ω × α < ω → L α surjektiv, und
ω × α< ω ist wohlordenbar in ZF. Also ist |Lα | ≤ |ω × α< ω |. Zudem gilt
|ω × α < ω | = |α< ω | = |α| für alle α ≥ ω.
Korollar
Es existiert ein surjektives G : On → L. Insbesondere ist L eine wohlorden-
bare Klasse.
Beweis
Sei G = F + T, wobei F wie im obigen Satz ist. G induziert wie üblich eine
Wohlordnung auf L durch x < y, falls das kleinste G-Urbild von x kleiner als
das kleinste G-Urbild von y ist.
Wir zeigen, dass die L-Hierarchie in transitiven Modellen von ZF* absolut ist.
Wird die Konstruktion von L in derartigen Modellen ausgeführt, so entstehen,
solange Ordinalzahlen im Modell zur Verfügung stehen, genau die Lα -Stufen.
Wir verwenden hierzu den folgenden Satz, dessen Beweis wir später nachrei-
chen, wenn wir die Äquivalenz der beiden zu Beginn des Kapitels beschriebenen
Wege der Konstruktion von L nachgewiesen haben.
falls w transitiv
F(w) =
{ Def(w),
∅, sonst
ist ∆1* .
Für einen Beweis an dieser Stelle wäre eine syntaktische Analyse der Erfüllbar-
keitsrelation notwendig, was eine mühselige und nicht besonders spannende Ange-
legenheit ist. Man kann den Beweis des Satzes als eine Aufgabe der mathematischen
Logik ansehen, die sich die syntaktische Komplexität ihrer tragenden Begriffe zu
überlegen hat. Damit ist der Satz also durchaus „zitierfähig“. Andererseits sind die
Grundfunktionen, die Def(w) erzeugen, für sich von Interesse, und es trifft sich gut,
dass wir mit ihrer Hilfe eine Komplexitätsanalyse umschiffen können.
Durch die Hypothek der Absolutheit des Definierbarkeitsoperators erhalten
wir sofort:
Beweis
Die Rekursionsfunktion der Lα -Hierarchie ist ∆1* . Aus dem Satz über
∆1*-Rekursionen folgt also die Behauptung.
Die Existenz eines kleinsten inneren Modells von ZF ist keineswegs klar. Sind
W und W′ innere Modelle von ZF, so ist im Allgemeinen W ∩ W′ kein inneres
Modell von ZF.
Das Auswahlaxiom in L
Um zu zeigen, dass in L das Auswahlaxiom gilt, müssen wir nur noch die bishe-
rigen Ergebnisse zusammentragen:
Satz (Auswahlakte in L)
L |= „Es gibt eine Wohlordnung von V“. Insbesondere also L |= (AC).
Beweis
Sei G = F + T die oben definierte Surjektion von On nach L. Dann gilt
L |= „G : On → L ist surjektiv“,
da L ein Modell von ZF ist. (De facto gilt GL = G, was wir hier nicht
brauchen.) Wegen LL = L gilt nun stärker
L |= „G : On → V ist surjektiv“.
Wie früher induziert nun G in L eine Wohlordnung von V.
Das Axiom (V = L)
Im obigen Beweis des Satzes über Auswahlakte in L haben wir verwendet, dass
L in L betrachtet mit dem gesamten Universum zusammenfällt. In L sind die
beiden Klassen L und V identisch. Diese Aussage erheben wir zum:
Satz (L erfüllt V = L)
L |= V = L. Ist α P On derart, dass Lα |= ZF*, so gilt Lα |= (V = L).
Beweis
Die Aussage L |= V = L ist gleichwertig mit V L = L L . Aber V L ist trivialer-
weise gleich L, und LL ist gleich L nach dem obigen Satz. Ebenso zeigt
man die Aussage über die Stufenmodelle Lα von ZF *.
Korollar
Das Axiom (V = L) ist relativ konsistent zu ZF.
Man kann also in ZFC nicht beweisen, dass eine nicht konstruierbare Menge
existiert. Anders: Man kann in ZFC nicht beweisen, dass ein von L verschiedenes
inneres Modell existiert. Umgekehrt ist an dieser Stelle ZF ⊢ V = L noch nicht
auszuschließen. Dies wird später mit der Erzwingungsmethode möglich sein.
Eine einfache, aber nützliche Beobachtung ist:
Beweis
zu (i) Â (ii):
Folgt aus dem Korrektheitssatz und der Tatsache, dass L |= (V = L).
zu (ii) Â (i):
Für alle Aussagen ϕ gilt:
(+) ZF + (V = L) ⊢ ϕ ↔ ϕL .
Gilt ZF ⊢ ϕL , so gilt sicher auch ZF + (V = L) ⊢ ϕL , und nach (+) also
ZF + (V = L) ⊢ ϕ.
Ergebnisse der ZF-Analyse des Klassenmodells L lassen sich also immer in der
Form „In ZF + (V = L) gilt: …“ schreiben, und erscheinen so als Konsequenzen
einer Erweiterung von ZF um ein neues Axiom, nicht mehr als Eigenschaften ei-
nes speziellen Modells. Obiges Ergebnis über Auswahlakte können wir zum Bei-
spiel schreiben als:
Satz
In ZF + (V = L) gilt: „Es gibt eine definierbare Wohlordnung von V“.
In dieser Form wird die oben diskutierte Beleuchtung des Auswahlaxioms durch
eine Theorieerweiterung besonders deutlich.
Mengenmodelle von V = L
Transitive Modelle von ZF* berechnen die konstruktiblen Stufen korrekt, so-
lange Ordinalzahlen zur Indizierung zur Verfügung stehen. Gilt nun „V = L“ in
einem solchen Modell, so ist das Modell bereits eine Stufe der konstruktiblen
Hierarchie:
Satz
Sei M ein transitives Mengenmodell mit M |= ZF* + (V = L). Dann ist M =
Lα für α = On ∩ M.
Beweis
Nach obigem Absolutheitssatz gilt LM = Lα (unabhängig von M |= V = L).
Wegen M |= (V = L) ist zudem LM = VM = M, also M = Lα .
Umgekehrt sind viele Lα -Stufen Modelle von ZF* + (V = L). Zunächst gilt:
Der Beweis sei dem Leser zur Übung überlassen. Wir zeigen:
Beweis
Nach dem letzten Satz genügt es, das Kollektionsschema in Lκ zu zeigen.
Sei also ϕ(u, v, p1 , …, pn ) eine Formel, und seien p1 , …, pn P Lκ . Sei x P Lκ .
Für u P x sei
f(u) = „das kleinste α < κ mit : ∃v P Lα Lκ |= ϕ(u, v, p1 , …, pn )“,
falls ein solches α existiert, und es sei f(u) = 0 sonst. Wegen κ Limes gibt es
ein γ < κ derart, dass x ⊆ Lγ . Aber |Lγ | = |γ| < κ, also |x| < κ. Wegen κ
regulär ist dann aber
δ = sup(f ) < κ.
Dann ist aber Lδ P Lκ eine Menge, wie sie vom Kollektionsschema für ϕ
und x gefordert wird.
Der Zusatz folgt, da Lκ L = L gilt, und also Lκ |= ϕ gleichwertig zu
L |= „Lκ |= ϕ“ für alle Aussagen ϕ ist. Damit können wir obiges Argument
unter der Voraussetzung V = L durchführen.
Übung
Es gelte V = L. Sei C = { α P On | Lα = Vα }. Dann ist C club in On.
An dieser Stelle können wir unter (V = L) noch nicht zeigen, dass Lκ = Vκ für
alle unerreichbaren Kardinalzahlen gilt. Denn Vκ enthält sicher alle Teilmengen
von ω, während prinzipiell neue Teilmengen von ω über Lκ definierbar sein
könnten, die dann erst in Lκ + 1 auftauchen. Dass dies nicht so ist, werden wir nun
zeigen.
Satz (Kondensationslemma)
Sei γ eine Ordinalzahl mit L γ |= ZF *. Sei X ein elementares Submodell
von Lγ , und sei π : X → M der Mostowski-Kollaps von X. Dann existiert
ein α ≤ γ mit M = Lα . Genauer gilt:
α = o. t.(X ∩ On), α ≤ sup(X ∩ γ), α < |X|+
Beweis
Es gilt Lγ |= ZF* + (V = L), also X |= ZF* + (V = L), und damit auch
M |= ZF* + (V = L). Wegen M transitiv ist also M = Lα für α = On ∩ M.
Es gilt α = o.t.(X ∩ On), da π|α : X ∩ γ → α ordnungsisomorph ist.
Hieraus folgt auch α ≤ sup(X) und α < |X|+ .
Beweis
Sei κ ≥ ω eine Kardinalzahl, und sei x ⊆ κ. Wir zeigen, dass x P Lκ+ .
Dann ist also P(κ) ⊆ Lκ+ und aus |Lκ+ | = κ+ folgt die Behauptung.
Sei β eine Ordinalzahl mit x P Lβ , und sei µ = |β|+ , sodass also L µ |= ZF*.
Weiter sei X ein elementares Submodell von Lµ mit:
(i) κ ⊆ X
(ii) x P X
(iii) |X| = κ
Sei π : X → L γ der Mostowski-Kollaps nach dem Kondensationslemma.
Dann ist π|κ = idκ wegen κ ⊆ X und κ transitiv. Folglich ist
π(x) = π″x = x.
Also x P Lγ . Aber |γ| = |On ∩ X| < |X|+ = κ + , und damit x P Lκ+ .
Wir hoffen, dass der Leser die Einschätzung teilt, dass wir weit mehr erreicht
haben als dieses tiefsinnige, aber doch recht nackte relative Konsistenzresultat.
War die Frage nach der relativen Konsistenz der Kontinuumshypothese auch der
Antrieb zur Entwicklung des Modells L, so haben wir dadurch doch ein für sich
interessantes und reich geschmücktes Mengenuniversum gefunden, das wir auch
dann noch weiter untersuchen würden, wenn sich z.B. ω2 als die Mächtigkeit der
reellen Zahlen in diesem Modell herausgestellt hätte.
In der Erweiterung von ZF um (V = L) sind also sowohl das Auswahlaxiom als
auch die allgemeine Kontinuumshypothese beweisbare Sätze. Wir werden unten
zeigen, dass das Axiom (V = L) auch das Suslinsche Problem der Charakterisie-
rung der reellen Ordnung löst. Es scheint in der Tat, als hätten wir das ersehnte
fehlende Axiom gefunden. Wird die Untersuchung von L auch desto schwieriger
und verwickelter, je subtilere kombinatorische Fragen wir stellen, so erreichen
wir doch in den meisten Fällen eine Lösung und oft auch eine tiefere Einsicht in
das Problem. Die Theorie ZF + (V = L) ist ebenso „quasi-vollständig“ wie die
endliche Mengenlehre oder gleichwertig die Peano-Arithmetik. Die Gödel-
schen Sätze zeigen die prinzipielle und unvermeidbare Unvollständigkeit dieser
Theorien, aber die meisten Fragen mit einem „üblichen“ mathematischen Ge-
halt lassen sich in diesen Theorien beantworten. Es gibt wichtige Ausnahmen:
Auch mit Hilfe von (V = L) können wir z.B. die Frage nicht beantworten, ob eine
unerreichbare Kardinalzahl existiert oder nicht (es sei denn, diese Kardinalzah-
len führen zu Widersprüchen), denn ist κ eine unerreichbare Kardinalzahl, so ist
κ eine unerreichbare Kardinalzahl in L, und Lκ ist ein Modell von ZF + (V = L).
Ist aber ϕ eine „übliche“ mathematische Aussage derart, dass sowohl ϕ als auch
non ϕ die Konsistenzstärke von ZF nicht erhöhen, so lässt sich in der Regel ϕ in
ZF + (V = L) beweisen oder widerlegen.
Die Gültigkeit von (GCH) in L wirft zumindest etwas Licht auf die unerreich-
baren Kardinalzahlen:
Beweis
κ ist offenbar schwach unerreichbar in L. Wegen der Gültigkeit von GCH
ist κ weiter ein starker Limes, als eine unerreichbare Kardinalzahl.
Wir werden später zeigen, dass sich die Messbarkeit einer Kardinalzahl im
Gegensatz zur Unerreichbarkeit nicht von V nach L überträgt. Stärker gilt in der
Theorie ZF + (V = L): „Es gibt keine messbare Kardinalzahl“. Diese Limitation
ist eines der oft vorgebrachten Argumente gegen die Erhebung des Axioms der
Konstruierbarkeit in Rang eines Basisaxioms der Mengenlehre.
Aus dem Beweis von (GCH) in L erhalten wir:
Beweis
Es gilt Lω = Vω = Hω . Sei also κ überabzählbar.
zu Lκ ⊆ Hκ : Sei x P Lκ . Dann existiert ein α < κ mit x P Lα . Wegen Lα
transitiv ist t.c.(x) ⊆ Lα . Also
|t. c.(x)| ≤ |Lα | = |α| < κ.
zu Hκ ⊆ Lκ : Sei x P Hκ . Sei γ derart, dass t.c.(x) ⊆ Lγ und L γ |= ZF*.
Sei y = t. c.(x ∪ { x }). Sei X d Lγ mit y ⊆ X und |X| = |y|. Dann ist der
Mostowski-Kollaps konstant auf y, also ist wie im Beweis oben y ⊆ Lα
für ein α mit |α| = |y| = |t. c.(x)| < κ.
Nach diesen Untersuchungen reichen wir nun die versprochene zweite Kon-
struktion von L mit Hilfe von Grundfunktionen nach. Mit ihrer Hilfe zeigen wir,
dass die Konstruktion von L absolut ist: Die Funktion F : On → V mit F(α) = Lα
ist eine ∆1*-Funktion.
Gödel-Funktionen
Die folgende Liste von einfachen Funktionen präsentieren wir ad hoc. Man
findet eine derartige Liste, indem man analysiert, was man benötigt, um alle defi-
nierbaren Teilmengen einer transitiven Menge durch Operationen einzufangen.
Wir schreiben Fi (x) für Fi (x, x), 1 ≤ i ≤ 10. Dies ist insbesondere für die Basis-
funktionen nützlich, die de facto nur von der ersten Komponente abhängen.
Durch Induktion zeigt man: Für alle n ≥ 2 ist Gn : Vn → V mit
Gn (x1 , …, xn ) = x1 × … × xn für alle x1 , …, xn
eine Gödel-Funktion (denn Gn + 1 (x1 , …, xn + 1 ) = F2 (Gn (x1 , …, xn ), xn + 1 )).
Übung
Die Funktion G : V2 → V mit G(x, y) = rng(x) ist eine Gödel-Funktion.
Wir zeigen, dass Gödel-Funktionen absolut für transitive Modelle sind. Mit
obiger Aufstellung von ∑ 0 -Formeln ist leicht zu sehen:
Satz
Die Basisfunktionen sind ∑ 0 .
Stärker gilt, dass sich auch alle Kompositionen von Basisfunktionen, also alle
Gödel-Funktionen als ∑ 0 -Formeln schreiben lassen:
Beweis
Wir schreiben F(x̄) statt F(x1 , …, xn ) zur Vereinfachung der Notation.
zu (i) und (ii):
Wir zeigen die Behauptungen simultan durch Induktion über den
Aufbau von F. Der Beweis ist mühsam, aber unproblematisch. Zum
Beispiel gilt:
yP Í F(x̄) gdw ∃z P F(x̄) yP z.
yPF1 (x̄) × F2 (x̄) gdw ∃a P F1 (x̄) ∃b P F1 (x̄) y = (a, b).
Die rechten Seiten sind Σ0 -Formeln nach I.V.
zu (iii):
Folgt aus (ii), denn es gilt
y = F(x̄) gdw ∀a P y a P F(x̄) ∧ ∀a P F(x̄) a P y.
zu (iv):
Folgt aus (iii), denn es gilt: F(x̄) P y gdw ∃a P y a = F(x̄).
zu (v):
Wir beweisen die Aussage durch Induktion über den Aufbau von ψ. Der
Primformelfall folgt aus (i), (iii) und (iv). Der ∧- und ¬-Fall ist klar, und
der beschränkte Quantorschritt folgt aus (ii).
Definition (abgeschlossen)
Eine Klasse W heißt abgeschlossen unter Gödel-Funktionen, falls für 1 ≤ i ≤ 10
gilt, dass Fi ″ W ⊆ W.
Satz
Die Funktion cl ist ∆1* .
Beweis
Die Definition ist Σ1 . Eine in ZF* äquivalente Π1 -Definition ist:
cl(x) = > { w ⊇ x | w ist abgeschlossen unter Gödel-Funktionen }.
Streng genommen müssen wir Fϕ, u1, …, un schreiben, damit insbesondere die
Stelligkeit von Fϕ klar ist. Wir unterdrücken dies der besseren Lesbarkeit halber.
Beweis
Wir zeigen die Behauptung durch Induktion über den Aufbau von ϕ. Dabei
dürfen wir annehmen, dass ϕ kein Gleichheitssymbol enthält, denn wir
können x = y durch ∀z P x z P y ∧ ∀z P y z P x ersetzen. Weiter können wir
annehmen, dass ϕ keine Primformeln der Form „x P x“ enthält; diese
können wir durch ∃u P x u = x gefolgt von einer Elimination der Gleichheit
ersetzen.
Den Primformelfall zeigen wir durch Induktion nach n ≥ 2.
Induktionsanfang n = 2:
Fall ϕ = u1 P u2 : Dann ist Fϕ = F3 (x1 , x2 ).
Fall ϕ = u2 P u1 : Dann ist Fϕ = F8 (Fu1 P u2 ).
Induktionsschritt von n nach n + 1, n ≥ 2:
Fall ϕ = ui P uj , i, j ≠ n + 1:
Dann ist Fϕ = Fϕ(u1, …, un ) × xn eine Gödel-Funktion nach I. V. und der
Funktion F3 (Paare).
Fall ϕ = ui P uj , i, j ≠ n:
Dann ist Fϕ = F9 (Fϕ(u1, …, un ) ) eine Gödel-Funktion nach I. V. und dem
vorherigen Fall.
Fall ϕ = ui P uj , i = n, j = n + 1:
Dann ist Fϕ = F10 (Fun P un + 1 × (x1 × … × xn − 1 )) eine Gödel-Funktion
nach I. V.
Fall ϕ = ui P uj , i = n + 1, j = n: wie eben.
Damit haben wir die Aussage für alle Primformeln bewiesen.
Fall ϕ = ϕ1 ∧ ϕ2 :
Dies folgt aus der I.V. unter Verwendung der Gödel-Funktion F5
(Schnitt).
Fall ϕ = ¬ ψ:
Dies folgtt aus der I.V. unter Verwendung der Gödel-Funktionen F4
(Differenz) und wiederholter Produktbildung
F(x1 , …, xn ) = x1 × … × xn .
Fall ϕ = ∃un + 1 P ui ψ(u1 , …, un + 1 ):
Sei χ = un + 1 P ui ∧ ψ(u1 , …, un + 1 ). Dann gilt:
(+) Fϕ (x1 , …, xn ) = dom(Fχ (x1 , …, xn , Í xi )).
Beweis
Für alle (u1 , …, un ) P x1 × … × xn gilt:
ϕ(u1 , …, un ) gdw ∃u. u P ui ∧ ψ(u1 , …, un , u)
gdwui P xi ∃u P Í xi . u P ui ∧ ψ(u1 , …, un , u)
Damit gilt dann für alle (u1 , …, un ):
(u1 , …, un )PFϕ gdw ∃u (u1 , …, un , u) P Fχ (x1 , …, xn , Í xi )
gdw (u1 , …, un ) P dom(Fχ (x1 , …, xn , Í xi ))
Die rechte Seite von (+) ist nach I.V. und Verwendung von F5 , F6 , F7
eine Gödel-Funktion.
Beweis
Es gilt F(w, p1 , …, pn ) = dom(dom(… dom(Fϕ ( w, { p1 }, …, { pn }))…)).
Als Korollar erhalten wir folgende Version des Kriteriums für innere Modelle:
Beweis
Wir definieren durch Rekursion über den Aufbau von ϕ eine Formel ϕ′
wie folgt. Hierbei sind x, y beliebige Variablen ungleich der Variablen u
(die dem Universum w entspricht). Ohne Einschränkung enthält ϕ kein
Gleichheitszeichen, keine Primformel der Form „v P v“, und keine
Quantifizierungen über die Variablen u1 , …, un + 1 , u. Wir setzen dann:
(xPy)′ = xPy
(xPu)′ = ∃u u = u
(uPx)′ = ∃u u ≠ u
(ϕ1 ∧ ϕ2 )′ = ϕ1 ′ ∧ ϕ2 ′
(¬ ϕ)′ = ¬ ϕ′
(∃xPy ϕ)′ = ∃x P y ϕ′
(∃xPu ϕ)′ = ∃x ϕ′
Sei nun ψ die Entsprechung von ϕ′ auf der Objektebene. Dann gilt:
x = { a P w | w |= ψ[ a, p1 , …, pn ] } .
Beweis
zu ⊆ : Durch Induktion über den Aufbau von ψ(u1 , …, un + 1 ) zeigt man wie
im Normalform-Theorem von Gödel, dass
F(w, p1 , …, pn ) = { a P w | w |= ψ[ a, p1 , …, pn ] }.
eine Gödel-Funktion ist (mit F(w, p1 , …, pn ) = 0, falls pi ¸ w für ein i).
Damit ist dann Def(w) ⊆ cl(w ∪ { w }). Zudem gilt Def(w) ⊆ P(w).
zu ⊇: Sei x P cl(w ∪ { w }) ∩ P(w). Dann existieren eine Gödel-Funktion
H : V n + 1 → V und p1 , …, pn P w mit x = H(w, p1 , …, pn ). Da Gödel-
Funktionen Σ0 sind, gibt es eine Σ0 -Formel ϕ(a, p1 , …, pn , w) eine
Σ0 -Formel, sodass für alle a gilt:
a P H(w, p1 , …, pn ) gdw ϕ(a, p1 , …, pn , w).
Nach Voraussetzung ist aber x ⊆ w, und damit gilt
x = { a P w | ϕ(a, p1 , …, pn , w) }.
Nach dem Satz oben ist dann aber x P Def(w).
Damit haben wir die erwünschte Absolutheit der Lα -Hierarchie gezeigt und
unsere Hypothek aufgelöst:
falls w transitiv
F(w) =
{ Def(w),
∅, sonst
ist ∆1* .
Beweis
Nach oben cl eine ∆1* -Funktion. Weiter ist dann auch die Funktion G mit
G(w) = cl(w ∪ { w }) eine ∆1*-Funktion . Für transitive w gilt
Def(w) = cl(w ∪ { w }) ∩ P(w),
und hieraus erhalten wir die Äquivalenz:
z = F(w) gdw
„w ist nicht transitiv“ ∧ z = 0 ∨
„w ist transitiv“ ∧ ∀x P z x P cl(w ∪ { w }) ∧ ∀x P cl(w ∪ { w }). x ⊆ w → x P z.
Mit Hilfe der Gödel-Funktionen können wir leicht eine natürliche Wohlord-
nung von L definieren.
Durch Iteration erhalten wir Wohlordnungen <n (x, <0 ) auf allen cln (w). Wir
setzen hierzu
<n + 1 (x, <0 ) = <(x, <n ) für alle n < ω.
Dann ist
W(x, <0 ) := Ín < ω <n ∩ P(w)
eine Wohlordnung von Def(w). Die Wohlordnung <(w, <0 ) ist ∆1* , und damit ist
W(x, <0 ) eine ∆1* -Funktion.
Satz
(i) Für alle α ist <α eine Wohlordnung von Lα und < L ist eine
Wohlordnung von L.
(ii) Ist α < β, so ist < β eine Enderweiterung von < α .
(iii) Die Funktion F : On → V mit
F(α) = <α für alle α P On
ist ∆1* .
Wir besprechen noch zwei Varianten der L-Hierarchie, die so genannten rela-
tivierten Hierarchien. Es bieten sich zwei Möglichkeiten an, L anders zu organi-
sieren bzw. zu vergrößern: Zum einen können wir mit einer Menge A anstelle der
leeren Menge starten, und dann die L-Hierarchie über A konstruieren. Zum an-
deren können wir eine Menge A als Prädikat in die Definierbarkeitsrelation mit
aufnehmen. Gilt V = L, so sind die resultierenden Modelle wieder gleich L, aber
die konstruierten Hierarchien sind i. A. verschieden. Gilt V ≠ L, so können die
konstruierten Modelle größer als L sein.
Wir beginnen mit den L-artigen Modellen, die über einer gegebenen Menge
konstruiert werden. Um transitive Modelle zu erhalten, starten wir mit t.c.({ A })
anstelle von A:
Aus unserem Kriterium für innere Modelle folgt leicht, dass für alle A die
Klasse L(A) ein Modell von ZF ist. Dagegen können wir nicht mehr allgemein
zeigen, dass in L(A) das Auswahlaxiom gilt. Ein Kandidat für einen solchen Fall
ist das Modell L(R), das alle reellen Zahlen des Universums enthält, dann aber
nur noch die daraus konstruierbaren Mengen. Unter Annahme großer Kardinal-
zahlaxiome kann man zeigen, dass in L(R) das Auswahlaxiom verletzt ist. Gilt
umgekehrt V = L, so gilt natürlich L = L(R).
Leicht zu sehen ist:
In den Formeln der erweiterten Sprache taucht das neue Prädikat R auf. Es
wird im Modell 〈w, A ∩ w〉 durch die Menge A ∩ w interpretiert. Damit ist zum
Beispiel
{ a P w | 〈w, A ∩ w〉 |= v P R } = { a P w | a P A ∩ w } = A ∩ w P DefA (w).
Die Definierbarkeit relativ zu A kann man wieder durch Gödel-Funktionen
ausdrücken. Man erweitert die Liste F1 , …, F10 hier einfach um eine neue Basis-
funktion, nämlich um die Funktion F11 : V 2 → V mit
F11 (x, y) = x ∩ A.
Wie früher ist der Abschluss clA (x) einer Menge unter den Gödel-Funktionen
definiert, wobei nun auch die Funktion F11 verwendet wird. Man zeigt wieder,
dass für alle transitiven Mengen w gilt:
DefA (w) = clA (w ∪ { w }) ∩ P(w).
Alternativ kann man mit dem alten Gödel-Abschluss arbeiten, denn für alle w gilt
clA (w ∪ { w }) = cl(w ∪ { w } ∪ { w ∩ A }).
Wir definieren nun:
Unser Kriterium für innere Modelle zeigt wieder, dass L[ A ] ein inneres Mo-
dell von ZF ist für alle Klassen A. Weiter gilt wieder das globale Auswahlaxiom in
allen L[ A ]. Die Beweise des Kondensationslemmas und damit der allgemeinen
Kontinuumshypothese können wir allerdings nicht mehr übernehmen. In L[ A ]
können neue Teilmengen von ω erst sehr spät auftauchen (wobei dann natürlich
V ≠ L gilt). Sei hierzu x ⊆ ω mit x ¸ L und sei δ ≥ ω eine Ordinalzahl. Wir setzen
A = { { δ, n } | nPx }. Dann ist x ein Element von Lδ + 3 [A], denn es gilt δPLδ + 1 [A]
und damit { n, δ } P Lδ + 2 [ A ] für alle n P ω. Damit ist also A eine Teilmenge von
Lδ + 2 [ A ] und folglich ist
x = { n P Lδ + 2 [ A ] | { n, δ } P A ∩ Lδ + 2 [ A ] }
= { n P Lδ + 2 [ A ] | 〈Lδ + 2 [ A ], P, A〉 |= { n, δ } P R } P Lδ + 3 [ A ].
Andererseits ist A ∩ Lα [ A ] = ∅ für alle α < δ + 2. Damit erscheint also in der
L[ A ]-Hierarchie eine neue Teilmenge von ω erst nach der Stufe δ, und δ kann
beliebig groß sein. Das Kondensationslemma ist also verletzt.
In der allgemeinen inneren Modelltheorie konstruiert man Modelle L[ A ] für eine
echte Klasse A mit dem Ziel, dass in L[A] möglichst viele große Kardinalzahlen existieren.
Die von L bekannte Organisation der Teilmengen von κ ist eine sehr wünschenswerte Ei-
genschaft, unter anderem, weil sie (GCH) liefert. Man möchte also, dass in L[ A ] wie für
L alle Teilmengen von κ bis zur Stufe κ+ konstruiert werden. Man erreicht dies, indem
man die „Kardinalzahl-Information“ A so schnell und behutsam wie möglich hinzufügt:
Man fügt nicht urplötzlich eine große Informationsmenge an der Stelle κ hinzu, sondern
baut diese Information durch Hinzufügen partieller Information bis hinauf zu κ schritt-
weise auf. So wird unter anderem verhindert, dass an einer Stelle κ ≥ ω1 noch einmal eine
neue Teilmenge x von ω konstruiert werden kann. Die Information, die man braucht, um
x zu konstruieren, hat man dem Modell bereits vor der Stufe ω1 hinzugefügt.
Satz (Kondensationslemma in L[ A ])
Sei A eine Klasse. Sei γ eine Ordinalzahl mit L γ [ A ] |= ZF *. Weiter sei
X ein elementares Submodell von Lγ [ A ], und es sei π : X → M der
Mostowski-Kollaps von X. Dann gilt:
M = Lα [ B ] für α = o. t.(X ∩ On) und B = π″(A ∩ X).
Satz ((GCH) in L[ A ])
Sei A eine Menge. Dann existiert ein κ derart, dass (GCH) oberhalb von κ
in L[ A ] gilt, d. h. es gilt
L[ A ] |= „2µ = µ+ für alle µ ≥ κ“.
Ist κ ≥ ω eine Kardinalzahl in L[ A ] und A ⊆ (κ+ ) L[ A ] , so gilt (GCH) in L[ A ]
oberhalb von κ. Insbesondere gilt also (GCH) in L[ A ] für alle A ⊆ (ω1 ) L[ A ] .
Die Beweise dieser Sätze liegen im Bereich anspruchsvollerer Übungen. Das Kondensa-
tionslemma liefert (GCH) oberhalb von κ+ . Um zu beweisen, dass 2κ = κ+ in L[A] gilt, zeigt
man: Ist x PP(κ) ∩ L[A], so existiert ein β < κ+ mit xPL[A ∩ β].
Gilt V = L, so ist L[A] = L für alle Klassen A. Andererseits sind die Hierarchien
von L[A] und L i.A. verschieden. Ist z.B. x eine beliebige Teilmenge von ω, so er-
scheint x in der L[ x ]-Hierarchie an der Stelle ω + 1, während x in der L-Hierar-
chie i. A. erst sehr viel später auftaucht.
Gilt V ≠ L, so ist L[A] im Allgemeinen größer als L. Allerdings kann die Infor-
mation, die A enthält, der Natur von L so fremd sein, dass die L[ A ]-Hierarchie
das neue Prädikat A überhaupt nicht gewinnbringend verwerten kann. Es kann
Mengen A geben mit A ¸ L und L[ A ] = L.
Die Charakterisierung der Modelle L[ A ] lautet:
Beweis
Offenbar gilt A ∩ x P L[ A ] für alle x P L[ A ]. Ist andererseits W ein inneres
Modell mit A ∩ x P W für alle x P W, so gilt Lα [ A ]W = Lα [ A ] für alle
α P On, und damit L[ A ] = L[ A ]W ⊆ W.
Ist A eine Menge, so ist A′ = A ∩ L[ A ] ein Element von L[ A ]. Speziell ist x ein
Element von L[ x ], falls x eine Menge von Ordinalzahlen ist.
Völlig analog sind die Klassenmodelle L[ A1 , …, An ] definiert. Wir erweitern
die Sprache hier um endlich viele neue Prädikate R1 , …, Rn , die in der Definier-
barkeit über w als A1 ∩ w, …, An ∩ w interpretiert werden. Die entsprechenden
Basisfunktionen sind F10 + i mit F10 + i (x, y) = x ∩ Ai für alle x, y und alle 1 ≤ i ≤ n.
Übung
Sei B eine Klasse. Dann existiert ein A ⊆ On mit L[ A ] = L[ B ].
Übung
Sei κ eine Kardinalzahl, und sei κ ≤ α < κ+ . Dann existiert ein A ⊆ κ mit
L[ A ] |= |α| = κ.
Übung
Sei 2ω = ω2 . Dann existiert ein A ⊆ ω2 mit L[ A ] |= 2ω = ω2 .
Übung
Sei F : On → V surjektiv. Dann existiert eine Klasse A ⊆ On mit
V = L[ A ].
Wir arbeiten im Folgenden wieder in ZFC. Im ersten Abschnitt hatten wir das
Karo-Prinzip ♦ betrachtet. Dieses kombinatorische Prinzip behauptet, dass eine
Folge 〈Sα | α < ω1 〉, Sα ⊆ α für alle α < ω1 , existiert, sodass für alle S ⊆ ω1 die Menge
{ α < ω1 | S ∩ α = Sα } stationär in ω1 ist. Eine solche Folge 〈Sα | α < ω1 〉 heißt dann
eine Karo-Folge. Jensen hat gezeigt, dass in L eine Karo-Folge existiert:
Satz (Karo-Prinzip in L)
(V = L) impliziert ♦.
Beweis
Wir arbeiten in ZFC + (V = L). Wir konstruieren rekursiv eine Folge
〈(Sα , Cα ) | α < ω1 〉 durch :
(Sα , Cα ) = „das < L -kleinste Paar (S, C) mit den Eigenschaften:
(a)α S, C ⊆ α
(b)α C ist club in α
(c)α S ∩ γ ≠ Sγ für alle γ P C ,“
falls α Limes und ein solches Paar (S, C) existiert.
Andernfalls setzen wir (Sα , Cα ) = (∅, ∅).
Es gilt
L ω2 |= „(S, C) ist das < L -kleinste Paar mit (a) − (c)“,
und wegen σ : Lδ d Lω2 gilt dann nach (i) − (v) für (S′, C′) = (S ∩ κ, C ∩ κ):
L δ |= „(S′, C′) ist das < L -kleinste Paar mit (a)κ − (c)κ “.
Wegen Lδ d Lω2 ist Lδ ein Modell von ZF*, und folglich ist (< L )Lδ = < δ .
Auch die Eigenschaften (a)κ − (c)κ sind absolut, und damit gilt:
(S ∩ κ, C ∩ κ) ist das < δ -kleinste Paar mit (a)κ − (c)κ .
Da aber < L eine Enderweiterung von < δ ist, ist (S ∩ κ, C ∩ κ) auch das
< L -kleinste Paar mit (a)κ − (c)κ , und damit ist
(Sκ , Cκ ) = (S ∩ κ, C ∩ κ)
nach der rekursiven Definition von (Sκ , Cκ ), Widerspruch.
Allgemeiner gilt unter (V= L) ein analoges Prinzip ♦κ für alle regulären Kardi-
nalzahlen κ ≥ ω1 ; das ♦-Prinzip ist dann identisch mit ♦ω 1 .
Dem Leser wird aufgefallen sein, dass die Definition der Folge der (Sα , Cα ) ge-
nau die Situation (a) − (c) widerspiegelt, die immer vorliegt, wenn irgendeine
Folge von Sα keine Karo-Folge ist. Die Rekursion reflektiert diese allgemeine Si-
tuation, und die Kondensationseigenschaften im Zusammenspiel mit der Abso-
lutheit der kanonischen Wohlordnung von L garantieren dann, dass wir eine
Folge von Sα erhalten, für die die Situation (a) − (c) nicht mehr eintreten kann,
weil wir jedes potenzielle Gegenbeispiel (S, C) während der Rekursion beachtet
haben.
Im ersten Abschnitt hatten wir bereits gesehen, dass das Karo-Prinzip die Exi-
stenz eines Suslin-Baumes nach sich zieht. Damit erhalten wir:
Korollar (Suslin-Hypothese in L)
Es gelte (V = L). Dann existiert ein Suslin-Baum.
Insbesondere ist die Suslin-Hypothese in L falsch.
Kurepa-Bäume in L
Satz (Kurepa-Bäume in L)
Es gelte (V = L). Dann existiert ein Kurepa-Baum.
Beweis
Wir arbeiten in ZFC + (V = L), und konstruieren eine Kurepa-Familie F.
Für alle α < ω1 sei:
f(α) = „das kleinste γ > α mit Lγ d L ω1 “.
Wir setzen:
F = { x ⊆ ω1 | x ∩ α P Lf(α) für alle α < ω1 }.
Wir zeigen, dass F eine Kurepa-Familie ist. Nach Definition gilt
{ x ∩ α | x P F } ⊆ Lf(α) für alle α < ω1 .
Also ist { x ∩ α | x P F } abzählbar für alle α < ω1 . Es bleibt zu zeigen, dass
|F| = ω2 .
Annahme nicht. Dann ist |F| = ω1 , denn { α } P F für alle α < ω1 . Sei also
y = 〈xν | ν < ω1 〉
die <L -kleinste Aufzählung von F der Länge ω1 . Dann ist y P Lω2 und y
definierbar in Lω2 .
Wir definieren nun eine elementare Kette 〈Nα | α < ω1 〉 von elementaren
Submodellen von Lω2 durch:
N0 = „das kleinste N d Lω2 “
Nν + 1 = „das kleinste N d Lω2 mit Nν ∪ { Nν } ⊆ N “
Nλ = Íα < λ Nα
Für ν < ω1 sei
πν : Lg(ν) → Nν d Lω2
der inverse Mostowski-Kollaps, und es sei
αν = πν −1 (ω1 ) für α < ω1 .
Dann ist αν der kritische Punkt von πν , d. h. αν = min({ γ | πν (γ) ≠ γ } ). Wir
zeigen:
(1) g(ν) < f(αν ) für alle ν < ω1
Beweis von (1)
Lg(ν) |= αν = ω1 , während
Lf(αν) |= |αν | = ω , denn dies gilt in Lω1 und es ist Lf(αν) d Lω1 .
Hieraus folgt g(ν) < f(αν ).
Korollar
Es gelte (V = L). Dann gilt die Negation der Transversalen-Hypothese, d. h.
es gibt eine Folge 〈gν | ν < ω2 〉 von Funktionen gν : ω1 → ω mit
{ α < ω1 | gν (α) = gµ (α) } ist dünn für alle ν < µ < ω2 .
Folglich ist der club-Filter #ω1 nicht saturiert (und nicht dicht). Weiter ist
die Ulam-Eigenschaft verletzt und jeder Ultrafilter auf ω1 ist regulär.
Kurepa-Bäume in L[ A ]
Satz (Kurepa-Bäume in L[ A ])
Sei A ⊆ ω1 derart, dass ω1 L[ A ] = ω1 , ω2 L[ A ] = ω2 . Dann gilt:
L[ A ] |= „es existiert ein Kurepa-Baum“.
Damit erhalten wir aber:
Beweis
Wir zeigen die Aussage indirekt. Sei also κ nicht unerreichbar in L. Wir
zeigen, dass ein Kurepa-Baum in V existiert.
κ ist eine reguläre Kardinalzahl in L, und nach Voraussetzung keine
Limeskardinalzahl. Sei also γ < ω2 mit κ = (γ+ ) L . Dann existiert aber ein
A ⊆ ω1 mit ω1 L[ A ] = ω1 und ω2 L[ A ] = ω2 (!). Nach dem Satz existiert also ein
〈T, <〉 P L[ A ] mit
L [ A ] |= „〈T, <〉 ist ein Kurepa-Baum“.
Aber wegen ω2 = ω2 L [ A ] ist 〈T, <〉 ein Kurepa-Baum (auf ω1 = ω1 L [ A ] ) in V.
Die Existenz von Suslin-Bäumen hatten wir aus dem Karo-Prinzip abgeleitet.
Auch Jensen zeigte zunächst die Existenz von Suslin-Bäumen aus dem Axiom „V
= L“, und isolierte dann das Karo-Prinzip aus diesem Beweis. Es stellt sich die
Frage, ob es ein verwandtes kombinatorisches Prinzip gibt, mit dessen Hilfe sich
Kurepa-Bäume konstruieren lassen. Dies ist in der Tat der Fall. Wir betrachten
hierzu einige Varianten des Karo-Prinzips.
Variante 1 (♦′)
Es gibt eine Folge 〈6α | α < ω1 〉 mit den Eigenschaften:
(i) 6α ist eine abzählbare Teilmenge von P(α) für alle α < ω1 .
(ii) Für alle S ⊆ ω1 ist { α P ω1 | S ∩ α P 6α } stationär in ω1 .
Das Prinzip ♦′ ist eine Abschwächung von ♦. Kunen hat aber gezeigt, dass ♦
bereits aus ♦′ folgt. Das Interesse an obiger Formulierung ist darin begründet,
dass die Verstärkung von „stationär“ zu „club“ für abzählbare Rate-Mengen 6α
nicht mehr ausgeschlossen ist. Wir definieren:
Variante 2 (♦*)
Es gibt eine Folge 〈6α | α < ω1 〉 mit den Eigenschaften:
(i) 6α ist eine abzählbare Teilmenge von P(α) für alle α < ω1 .
(ii) Für alle S ⊆ ω1 ist { α P ω1 | S ∩ α P 6α } P #ω1 .
Variante 3 (♦+ )
Es gibt eine Folge 〈6α | α < ω1 〉 mit den Eigenschaften:
(i) 6α ist eine abzählbare Teilmenge von P(α) für alle α < ω1 .
(ii) Für alle S ⊆ ω1 existiert eine club-Menge C ⊆ ω1 mit:
S ∩ α, C ∩ α P 6α für alle α P C.
Hier raten wir also nicht nur die Anfangsstücke einer Menge club-oft richtig,
sondern wir raten auch noch club-oft, wo wir richtig geraten haben. Für dieses
Prinzip gelten nun die folgenden Sätze von Jensen, die wir ohne Beweis angeben
(siehe e z. B. [ Devlin 1984 ] für Beweise.)
Satz
Es gelte (V = L). Dann gilt ♦+ .
Satz
Es gelte ♦+ . Dann existiert ein Kurepa-Baum.
Kanonische Funktionen in L
Wir zeigen schließlich noch, dass in L die kanonischen Funktionen die schwa-
che Dominierungseigenschaft nicht besitzen. Damit haben wir dann alle kombi-
natorischen Fragen über ω1 , die wir im ersten Abschnitt untersucht hatten, in L
beantwortet. Das Argument geht auf Ketonen zurück.
Beweis
Sei D ⊆ ω2 − ω1 eine club-Menge in ω2 mit Lν d Lω2 für alle ν P D.
Für ν P D sei gν : ω1 → ν surjektiv, und es sei 〈Xνα | α < ω1 〉 eine stetige und
⊆-aufsteigende Folge von abzählbaren elementaren Submodellen von Lν
mit der Eigenschaft gν ″α ⊆ Xνα für alle α < ω1 . Für alle ν P D sei schließlich
Cν = { α < ω1 | Xνα ∩ ω 1 = α }.
Dann ist Cν club in ω1 (da ν ≥ ω1 für alle ν P D). Für alle ν P D sei
Lf(α) ⊆ Lhν(α) und damit α auch in Lhν (α) abzählbar wäre. Also dominiert die
Funktion f jede der Funktionen hν , ν P D, auf einer club-Menge. Aber D ist
unbeschränkt in ω2 , und damit dominiert f jede kanonische Funktion auf
einer club-Menge.
In diesem Kapitel arbeiten wir wieder in ZF. Wir möchten ein inneres Modell
von ZF mit Hilfe des Begriffs der Ordinalzahldefinierbarkeit konstruieren: Eine
Menge soll dem Modell angehören, wenn sie sich durch eine Formel definieren
lässt, deren Parameter beliebige Ordinalzahlen sind. Die formale Definition die-
ser offenbar sehr reichhaltigen Klasse von Mengen ist nicht so ohne Weiteres
möglich, da wir die Gültigkeitsrelation des Universums nicht durch eine P-For-
mel ausdrücken können. Für einzelne Formeln auf der Metaebene können wir
problemlos definieren:
Das Reflexionsprinzip
Satz (Reflexionsprinzip)
Sei ϕ(x1 , …, xn ) eine Formel. Dann existiert eine Klasse C ⊆ On mit:
(i) C ist club in On.
(ii) Für alle α P C ist ϕ absolut für Vα , d. h. für alle x1 , …, xn P Vα gilt:
ϕ(x1 , …, xn ) gdw Vα |= ϕ(x1 , …, xn ).
Wir sagen auch, dass die Stufe Vα die Formel ϕ in V reflektiert, falls (ii) gilt. Das
Reflexionsprinzip besagt dann, dass jede Formel club-oft in der Vα -Hierarchie
reflektiert wird.
Beweis
Wir zeigen die Behauptung durch Induktion über den Aufbau von ϕ. Dabei
konstruieren wir explizit eine Formel ψ(α) derart, dass die Ordinalzahl-
klasse
C = { α P On | ψ(α) }
abgeschlossen und unbeschränkt in den Ordinalzahlen ist und Vα die
Formel ϕ für alle α P C reflektiert.
ϕ ist atomar :
Wir setzen Cϕ = On = { α | α ist Ordinalzahl }.
ϕ = ϕ0 ∧ ϕ1 :
Seien Cϕ0 = { α | ψ0 (α) } und Cϕ1 = { α | ψ1 (α) } die konstruierten club-
Klassen für ϕ0 bzw. ϕ1 . Wir setzen Cϕ = { α | ψ0 (α) ∧ ψ1 (α) }.
ϕ = ¬ ϕ0 :
Sei Cϕ0 = { α | ψ0 (α) } die konstruierte club-Klasse für ϕ0 . Wir setzen
Cϕ = Cϕ0 .
ϕ = ∃x ϕ0 :
Sei ϕ0 = ϕ0 (x1 , …, xn , x), und sei Cϕ0 = { α | ψ0 (α) } die konstruierte
club-Klasse für ϕ0 . Weiter sei χ(α) die Formel
∀x1 , …, xn P Vα . ∃x ϕ0 (x1 , …, xn , x) → ∃x P Vα ϕ0 (x1 , …, xn , x).
Dann ist D = { α | χ(α) } club in On (!). Wir setzen
Cϕ = { α | ψ0 (α) ∧ χ(α) }.
Beweis
Annahme, es gibt eine endliche Axiomatisierung ϕ1 , …, ϕn von ZF, d. h.
ϕ1 , …, ϕn sind in ZF beweisbare Aussagen der P-Sprache derart, dass für
jedes Axiom ϕ von ZF gilt, dass ϕ0 , …, ϕn ⊢ ϕ. Sei dann
ψ = ϕ1 ∧ … ∧ ϕn .
Dann existiert ein α P On mit Vα |= ψ, und damit ist Vα ein Modell von ZF.
Also beweist die Theorie ZF, dass es ein Modell von ZF gibt. Also ist ZF
widerspruchsvoll.
Das gleiche Argument zeigt, dass jede Theorie T ⊇ ZF, die endlich axiomati-
sierbar ist, widerspruchsvoll ist.
Den Rückgriff auf den Gödelschen Unvollständigkeitssatz können wir hier so-
gar vermeiden:
Übung
Zeigen Sie obigen Satz ohne Verwendung des Gödelschen Unvollständig-
keitssatzes.
[ Sei ψ wie im Beweis oben. Sei α P On minimal mit Vα |= ψ. Dann gilt
Vα |= „es gibt ein β P On mit Vβ |= ψ“.
Wegen Vβ Vα = Vβ für alle β < α gibt es also ein β < α mit Vβ |= ψ, Widerspruch. ]
Zuweilen taucht beim Nachdenken über das Reflexionsprinzip die Frage auf, ob es uns
nicht gestattet, ein Mengenmodell von ZF zu konstruieren. Die vermeintliche Konstruk-
tion eines Modells verläuft in etwa wie folgt: „Wir listen alle ZF-Axiome auf als ϕ0 , ϕ1 , …,
ϕn , …, und betrachten zugehörige club-Klassen Cn = Cϕn ⊆ On von Reflexionspunkten.
Dann ist C = >nPω Cn eine club-Klasse in On, und für alle α POn ist Vα ein Modell aller
ϕn , also ein Modell von ZF.“ Dieses Argument ist in ZF aber nicht formalisierbar. Wir
können zu jedem ϕn effektiv eine Cn definierende Formel angeben, sodass Cn club in On
ist und jedes α P Cn die Formel ϕ reflektiert. Wir können aber die Klassen Cn nicht uni-
form definieren, d.h. es gibt keine Formel ψ(n, α) mit Cn = { αPOn | ψ(n, α) }. Das Refle-
xionsprinzip schließt wie oben gezeigt die endliche Axiomatisierung von ZF aus. Es zeigt
die Existenz von club-vielen Vα -Modellen für jedes endliche Teilsystem von ZF, aber es
erlaubt uns keine Konstruktion einer Ordinalzahl α mit Vα |= ZF. Hierzu werden substan-
tiell stärkere Prinzipien gebraucht. Ist zum Beispiel κ eine unerreichbare Kardinalzahl, so
ist { α P κ | Vα |= ZF } eine club-Menge in κ.
Das Reflexionsprinzip gilt in vielen Varianten. Obiger Beweis macht von der
speziellen Natur der Vα -Hierarchie keinen Gebrauch. Statt der Vα -Hierarchie
kann man etwa die Hκ -Hierarchie oder unter V = L auch die Lα -Hierarchie zu-
grunde legen. Allgemein zeigt der Beweis:
Das Reflexionsschema liefert einen neuen Beweis für die Gültigkeit des Aus-
sonderungsschemas im konstruktiblen Universum:
Übung
Zeigen Sie mit Hilfe des Reflexionsschemas für die Lα -Hierarchie, dass
in L das Aussonderungsschema gilt.
[ Sei z = { x P y | L |= ϕ(x1 , …, xn , x) } für eine Formel ϕ und y, x1 , …, xn P L. Es ist zu
zeigen, dass y P L. Sei hierzu α P On derart, dass y, x1 , …, xn P Lα und Lα die
Formel ϕ reflektiert. Dann ist z definierbar über Lα , also z P L α + 1 ⊆ L. ]
Ordinalzahldefinierbare Mengen
Das Reflexionsprinzip können wir nun dazu benutzen, um eine Klasse zu defi-
nieren, die unseren Erwartungen an den Begriff „ordinalzahldefinierbar“ ge-
recht wird. Wir definieren (mit Hilfe des Formelbegriffs der Objektebene):
Dabei steht OD für engl. ordinal definable und HOD für hereditarily ordinal de-
finable.
Mit dem Reflexionsprinzip können wir nun zeigen, dass jede Menge, die mit
Hilfe einer Formel und Ordinalzahlparametern definierbar ist, ein Element der
Klasse OD ist:
Beweis
Seien α1 , …, αn P On derart, dass x = { y | ϕ(y, α1 , …, αn ) } P V. Weiter sei
α > α1 , …, αn derart, dass ϕ absolut für Vα ist. Schließlich sei ϕ* die
Entsprechung von ϕ auf der Objektebene. Dann ist
x = { y | Vα |= ϕ* [ y, α1 , …, αn ] } P OD.
Beweis
Wir nehmen zur Vereinfachung der Notation an, dass ϕ nur einen
Parameter p P OD enthält. Seien dann α P On, s P α< ω , ψ P Form mit
p = { a P Vα | Vα |= ψ[ a, s ] }.
Sei x = { y | ϕ(y, p) } P V. Dann gilt
x = { y | ∃z. ϕ(y, z) ∧ z = { α P Vα | Vα |= ψ[ a, s ] } }.
Also ist x ordinalzahldefinierbar mit Parametern α, s(0), …, s(|s| − 1), und
damit ist x P OD nach obigem Satz.
Beweis
HOD ist transitiv:
Gilt nach Konstruktion.
HOD ist fast universell:
Wir beobachten zunächst, dass für alle α P On die Menge
Wα = Vα ∩ HOD
ein Element von HOD ist. Wegen Wα ⊆ HOD genügt es hierzu zu
zeigen, dass Wα P OD. Aber
Wα = { y | y P Vα ∧ y P HOD }.
Also ist Wα ordinalzahldefinierbar mit Parameter α, sodass Wα P OD.
Sei nun x ⊆ HOD, und sei α derart, dass x ⊆ Vα . Dann gilt
x ⊆ Vα ∩ HOD = Wα P HOD.
HOD erfüllt Σ0 -Aussonderung:
Sei ϕ(u, p) eine Σ0 -Formel, und seien x, p P HOD. (Wir arbeiten zur
Vereinfachung der Notation mit nur einem Parameter.) Da ϕ eine
Σ0 -Formel ist, genügt es zu zeigen:
y = { u | u P x ∧ ϕ(u, p) } P HOD.
Wegen y ⊆ x ⊆ HOD genügt es zudem zu zeigen, dass y P OD. Aber
y ist definierbar durch die Parameter x, p P OD. Also ist y P OD nach
dem obigen Korollar.
Beweis
Die Elemente von OD sind gegeben durch eine Formelnummer und eine
endliche Folge von Ordinalzahlen, bestehend aus einem Hierarchieindex
und Ordinalzahlparametern. Die im letzten Kapitel konstruierte Wohlord-
nung der Klasse ω × On< ω liefert also ein surjektives F : On → OD. Durch
durch Ausdünnung und Neuaufzählung erhalten wir ein surjektives
G : On → HOD. Wir setzen nun
gα = G|α für alle α P On.
Dann gilt gα P OD für alle α P On, denn gα ist definierbar mit dem
Parameter α. Offenbar ist gα ⊆ HOD. Also ist gα P HOD für alle α P On.
Ist nun x P HOD beliebig, so existiert ein α mit x ⊆ rng(gα ). Wie üblich
induziert gα P HOD nun eine Wohlordnung < auf x durch Vergleich der
kleinsten gα -Urbilder:
a < b, falls min( gα −1 ″ { a }) < min( gα −1 ″ { b }).
Jedes x ist also wohlordenbar in HOD, und damit gilt (AC) in HOD.
Damit haben wir einen von L unabhängigen Beweis der relativen Konsistenz
des Auswahlaxioms gefunden. Die Klasse HOD ist wohlordenbar in V, und die
Anfangsstücke jeder Wohlordnung von HOD sind Elemente von HOD. Folg-
lich gilt der Wohlordnungssatz in HOD.
Die folgende Übung behandelt eine weitere Möglichkeit, die Klasse OD zu
definieren:
Übung
Es gilt:
OD = „der Abschluss von { Vα | α P On } unter Gödel-Funktionen“
= Íα P On cl({ Vβ | β < α }).
Analog zu „V = L“ kann man die Axiome „V = OD“ und „V = HOD“ betrach-
ten. Hier gelten die folgenden Äquivalenzen:
Wie üblich ist die Quantifikation über echte Klassen in (iii) und (iv) effektiv zu lesen.
Für (iii) gilt etwa: Gilt V = OD (= HOD), so können wir eine Formel ϕ(α, x) angeben, so-
dass F = { (α, x) | ϕ(α, x) } eine funktionale Klasse von On nach V ist. Weiß man umgekehrt
von einer Formel ϕ(α, x), dass sie eine Surjektion F : On → V definiert, so kann man be-
weisen, dass V = OD = HOD gilt.
Beweis
(i) Â (ii) :
Sei x P V. Wegen V = OD ist x P OD und x ⊆ OD. Also ist x P HOD.
(ii) Â (iii) :
Wie im Beweis oben gewinnen wir aus einer surjektiven Funktion
G : On → On × On< ω ein surjektives F : On → HOD.
Gilt V = HOD, so ist F wie gewünscht.
(iii) Â (iv) :
Wir setzen wieder x < y, falls das kleinste F-Urbild von x kleiner ist als
das kleinste F-Urbild von y ist.
(iv) Â (i) :
Sei 〈xα | α P On〉 = { (α, x) | ϕ(α, x) } eine Wohlordnung von V. Dann
gilt für alle α P On:
xα = { y | y P xα } = { y | ∃z. y P z ∧ ϕ(α, z) }
Also ist xα ordinalzahldefinierbar durch ϕ mit Parameter α. Damit ist
xPOD.
Damit können wir die Aussage „V = HOD“ als starke Form des Wohlord-
nungssatzes und damit des Auswahlaxioms lesen.
Der Leser wird nun wahrscheinlich eine Diskussion der Absolutheit erwarten
und vermuten, dass HOD in HOD konstruiert wieder HOD ergibt. Man kann
aber nicht zeigen, dass HODHOD = HOD gilt. Im Allgemeinen ist HODHOD eine
echte Teilklasse von HOD, und dann gilt HOD |= V ≠ HOD. Insbesondere kann
man also ohne weitere Voraussetzung in HOD keine Wohlordnung des Univer-
sums konstruieren, da sonst V = HOD nach dem obigen Charakterisierungssatz
in HOD gelten würde. Die Anfangsstücke einer Wohlordnung von HOD sind in
HOD, aber die die Wohlordnung definierende Formel liefert i. A. keine Wohl-
ordnung des Universums in HOD. Andererseits gilt natürlich HOD L = L und
weiter
L |= HODHOD = HOD = L = V.
Die mangelnde Absolutheit macht das innere Modell HOD für gewisse
Zwecke unattraktiv. Der folgende Satz, den wir ohne Beweis angeben, zeigt, dass
wir das Modell HOD abgesehen von (AC) für keine weiteren relativen Konsi-
stenzresultate nutzen können (siehe [ Roguski 1977 ]):
Wir betrachten noch eine Variante der Ordinalzahldefinierbarkeit, bei der wir
zusätzliche Parameter zur Definition zulassen.
Für alle A ist HOD(A) ein inneres Modell von ZF. Weiter gilt A P HOD(A).
Dagegen ist HOD(A) im Allgemeinen kein Modell des Auswahlaxioms mehr.
Wir werden im fünften Kapitel ein solches Modell HOD(A) angeben.
In diesem Kapitel stellen wir die Konstruktion von Klassenmodellen mit Hilfe von
Ultrafiltern vor. Jeder Ultrafilter U auf einer Menge M erzeugt ein Klassenmo-
dell, dessen Träger die nach U faktorisierte Klasse aller Funktionen von M nach V
ist. Ist U hinreichend vollständig, so ist dieses Klassenmodell wohlfundiert, und
der Mostowski-Kollaps liefert dann ein transitives Klassenmodell W. Wir erhal-
ten zudem eine kanonische Einbettung j : V → W, indem wir jedem x das Mostow-
ski-Bild der Äquivalenzklasse derjenigen Funktion auf M zuordnen, die konstant
den Wert x annimmt. Das Modell W ist in diesem Sinne „größer“ als V.
Mit Hilfe der Ultrapotenzen zeigen wir, dass in L keine messbaren Kardinal-
zahlen existieren können. Weiter liefern die Einbettungen j : V → W die Mög-
lichkeit, große Kardinalzahlprinzipien oberhalb der Messbarkeit durch die Va-
riation eines einzigen Themas zu beschreiben: Wie nahe kann W an V liegen?
Ein grundlegendes Resultat von Kunen schließt die Möglichkeit W = V aus.
Ultrapotenzen
Wir unterdrücken den U-Index, falls der Ultrafilter aus dem Kontext hervor-
geht. Weiter schreiben wir kurz Ult(U) für das allgemeine Klassenmodell
〈Ult(U), EU 〉.
Bei der Formung der Ultrapotenz ist die Methode des uniformen Stutzens von
echten Klassen von großer Bedeutung. Hat M mehr als zwei Elemente, so ist für
jede Funktion f : M → V die Äquivalenzklasse von f unter =U eine echte Klasse.
Ohne Zurückschneiden wäre Ult(U) also eine Klasse von echten Klassen, und die
Konstruktion wäre in ZFC nicht durchführbar.
Die Methode der Ultrapotenzen entstammt der Modelltheorie der mathema-
tischen Logik, die sie für Mengenmodelle entwickelt und untersucht hat. Wie in
der Modelltheorie gilt nun auch in unserem Klassenkontext der folgende grund-
legende Satz von Łos:
Beweis
Wir zeigen die Aussage durch Induktion über den Aufbau der Formel
ϕ = ϕ(v1 , …, vn ). Dabei nehmen wir zur Vereinfachung der Notation
n = 1 an.
ϕ = „vi = vj “:
〈Ult(U), EU 〉 |= [fi ] = [fj ] gdw [ fi ] = [ fj ]
gdw { x P M | f i (x) = f j (x) } P U
ϕ = „vi P vj “:
〈Ult(U), EU 〉 |= [fi ] P[fj ] gdw [ fi ] EU [ fj ]
gdw { x P M | f i (x) P f j (x) } P U
ϕ = ψ ∧ χ:
〈Ult(U), EU 〉 |= ψ([f]) ∧ χ([f]) gdw
〈Ult(U), EU 〉 |= ψ([f]) und 〈Ult(U), EU 〉 |= χ([f]) gdw I.V.
{ xPM | ψ(f(x)) }PU und { xPM | χ(f(x)) }PU gdw
{ xPM | ψ(f(x)) und χ(f(x)) }PU gdw
{ x P M | ϕ(f(x)) } P U
ϕ = ¬ ψ:
〈Ult(U), EU 〉 |= ¬ ψ([f]) gdw
non(〈Ult(U), EU 〉 |= ψ([f]) gdw I.V.
{ xPM | ψ(f(x)) }¸U gdw
{ x P M | ϕ(f(x)) } P U
ϕ = ∀w ψ( w, v):
〈Ult(U), EU 〉 |= ∀w ψ(w, [f]) gdw
für alle [g]PUlt(U) gilt 〈Ult(U), EU 〉 |= ψ([g], [f]) gdw I.V.
für alle g : M → V ist { xPM | ψ(g(x), f(x)) } PU gdw (!)
{ xPM | für alle w gilt ψ(w, f(x)) } PU gdw
{ x P M | ϕ(f(x)) } P U
Zum Beweis der mit (!) markierten Äquivalenz seien
Xg = { x P M | ψ(g(x), f(x)) } für alle g : M → V ,
X = { x P M | für alle w gilt ψ(w, f(x)) } .
Ist X P U, so ist jedes Xg P U, da Xg ⊇ X für alle g : M → V. Die Umkeh-
rung zeigen wir indirekt. Sei also X ¸ U. Wir finden ein g : M → V mit
Xg ¸ U. Wir setzen hierzu für alle x P M:
Beweis
Für eine Aussage ϕ ist { x P M | ϕ } entweder gleich M oder gleich ∅. Aus
M P U und ∅ ¸ U folgt dann die Behauptung.
Nach dem Satz von Tarski lässt sich jeder Filter auf einer Menge zu einem Ul-
trafilter fortsetzen. Damit liefert die Methode der Ultrapotenzen unzählige Bei-
spiele für Klassenmodelle von ZFC. Nach dem Korollar können wir diese Me-
thode allerdings nicht verwenden, um relative Konsistenzresultate zu etablieren.
Jede Ultrapotenz spiegelt das Universum treu ab.
Die Konstruktion ist erstaunlich, aber es ist an dieser Stelle noch nicht zu se-
hen, welch helles Licht sie auf die mengentheoretische Theorie der Ultrafilter
wirft. Dies wird sich erst zeigen, wenn wir die Ultrapotenz transitivieren und das
Universum in das so erhaltene Klassenmodell von ZFC einbetten.
Wir untersuchen also, unter welchen Bedingungen wir die Ultrapotenz
〈Ult(U), EU 〉 transitivieren können. Zunächst gilt für jedes f : M → V, dass die
EU -Extension von [ f] in Ult(U) eine Menge ist. Denn für alle [ g ] EU [f ] existiert
ein g′ mit g =U g′ derart, dass g′(x) P f(x) oder g′(x) = 0 für alle x P M gilt, und die
Klasse aller dieser g′ ist eine Menge. Weiter ist EU immer eine extensionale Rela-
tion auf Ult(U), denn nach dem Satz von Łos gilt das Extensionalitätsaxiom in
Ult(U). Für die Wohlfundiertheit von EU sind nun allerdings starke Vorausset-
zungen an den Ultrafilter U nötig. Es gilt folgende Äquivalenz:
Die Wohlfundiertheit der Ultrapotenz ist ein Paradebeispiel für den Unter-
schied der Gültigkeit „von außen“ und „von innen“. Nach dem Satz von Łos gilt
in jeder Ultrapotenz das Fundierungsaxiom, d. h. das Modell 〈Ult(U), EU 〉 sieht
keine unendlich absteigende EU -Kette. Im Universum dagegen existieren solche
Ketten genau dann, wenn U nicht ω1 -vollständig ist. Dies ist z. B. für alle Ultra-
filter U auf ω der Fall.
Wir definieren:
Notation
Wir fassen die Situation zusammen durch
jU : V → W . Ult(U).
Elementare Einbettungen
Beweis
Sei ϕ(v1 , …, vn ) eine Formel, und seien x1 , …, xn P V. Dann gilt:
ϕ(x1 , …, xn ) gdw { x P M | ϕ(constx1 (x), …, constxn (x)) } P U
gdwŁos Ult(U) |= ϕ([ constx1 ], …, [ constxn ])
gdwπU : Ult(U) → W isomorph W |= ϕ(πU ([constx1 ]), …, πU ([constxn ]))
gdw W |= ϕ( jU (x1 ), …, jU (xn ))
Beweis
Wir zeigen die Aussage durch Induktion über rang(x).
Induktionsschritt α:
Für alle y P x gilt y =I. V. j(y) P j(x). Also ist x ⊆ j(x). Sei umgekehrt z P j(x).
Aus rang(x) = α folgt, dass rang(j(x)) = j(α). Wegen j(α) = α ist also
α = rang(j(x)), und damit ist rang(z) < α. Wegen B ⊆ A ist z P A, und
nach I. V. gilt also j(z) = z. Also ist j(z) P j(x) und damit z P x.
Zum Zusatz:
Der gerade geführte Beweis zeigt, dass j(x) = x für alle x ⊆ On2 gilt
(denn On2 ∩ B = On2 ⊆ A). Für jedes a P A kann aber b = t. c.({ a }) durch
eine Menge x ⊆ On2 kodiert werden: Mit (AC) gibt es ein bijektives
g : κ → b in A. Wir setzen dann α E β, falls g(α) P g(β) für alle α, β < κ.
Wegen E ⊆ On2 ist j(E) = E, also E P B. Weiter ist in beiden Modellen b
der Mostowski-Kollaps von 〈κ, E〉, und a das eindeutige Element von b
mit größtem Rang. Also ist j(a) = a nach Elementarität.
Den kritischen Punkt der Einbettung eines Ultrafilters, der die Messbarkeit
einer Kardinalzahl bezeugt, können wir leicht ausrechnen:
Beweis
Wir zeigen durch Induktion über α < κ, dass j(α) = α.
Induktionsschritt α:
Es gilt α ≤ j(α). Es genügt also zu zeigen: Ist β < j(α), so ist β < α. Sei
also β < j(α). Sei f : κ → V mit πU ([ f ]) = β. Dann gilt wegen β P j(α),
dass [ f ] EU [ constα ], d. h. es gilt
{ γ P κ | f(γ) < α } P U.
κ-vollständig gibt es ein β < α mit { γ < κ | f(γ) = β } P U, d. h. es gilt
[ f ] = [ constβ ]. Damit ist also [ constβ ] EU [ constα ]. Dann gilt
β = I. V. j(β) = πU ([ constβ ]) P πU ([ constα ]) = j(α).
Wir zeigen nun, dass j(κ) > κ. Sei hierzu d : κ → κ die Diagonale auf κ, also
d(α) = α für alle α < κ. Dann gilt [ d ] EU [ constκ ] und [ constα ] EU [ d ] für
alle α < κ. Also ist α = j(α) < πU ([ d ]) < j(κ) für alle α < κ, und so κ < j(κ).
Beweis
Ist x ⊆ y ⊆ κ und x P U, so ist κ P j(x) ⊆ j(y), also y P U.
Sind x, y P U, so gilt κ P j(x) ∩ j(y) = j(x ∩ y), also ist x ∩ y P U.
Ist x ⊆ κ, so ist j(x) ∪ j(κ − x) = j(x ∪ (κ − x)) = j(κ) > κ. Also ist κ P j(x) oder
κ P j(κ − x), d. h. x P U oder κ − x P U.
Ist x ⊆ κ beschränkt in κ, so ist j(x) = x und damit x ¸ U.
Damit haben wir gezeigt, dass U ein Ultrafilter auf κ ist mit κ − α P U für
alle α < κ. Zum Beweis der Normalität sei 〈xα | α < κ〉 eine Folge in U.
Sei 〈yα | α < j(κ)〉 = j(〈xα | α < κ〉). Dann ist κ P yα = j(xα ) für alle α < κ.
Damit gilt
κ P D α < j(κ) yα = j(D α < κ xα ),
sodass D α < κ xα P U.
Insgesamt haben wir also gezeigt, dass die kritischen Punkte von nichttrivialen
elementaren Einbettungen auf V genau die messbaren Kardinalzahlen sind.
Beweis
Sei U ein κ-vollständiger nichttrivialer Ultrafilter auf κ, und sei
j : V → W . Ult(U) die zugehörige Abbildung. Dann ist der von j
induzierte Ultrafilter normal nach dem obigen Satz.
Beweis
(i) Â (ii):
Oben hatten wir bereits gezeigt, dass πU ([ d ]) ≥ κ gilt (hier wird die
Normalität nicht benötigt). Sei also α < πU ([ d ]), und sei πU ([ f ]) = α.
Dann gilt { γ < κ | f(γ) < d(γ) } P U. Wegen U normal gibt es ein δ mit
{ γ < κ | f(γ) = δ } P U. Also ist α = πU ([ f ]) = πU ([ constδ ]) = δ < κ.
(ii) Â (iii):
Für alle x ⊆ κ gilt:
xPUj U gdw κ P j(x) gdw πU ([ d ]) P πU ([ constx ])
gdw { γ < κ | γ P x } P U gdw x P U
(iii) Â (i):
Ein induzierter Ultrafilter ist normal nach dem obigen Satz.
Beweis
Sei j : V → W . Ult(U) die Ultrapotenzeinbettung. Wegen κ unerreichbar
ist κ unerreichbar in jedem transitiven Modell von ZFC, also gilt
W |= κ ist unerreichbar.
Wegen U normal gilt πU ([ d ]) = κ für die Diagonale d : κ → κ auf κ, also
Ult(U) |= [ d ] ist unerreichbar.
Nach dem Satz von Łos ist dann { α < κ | α ist unerreichbar } P U.
Hatten wir eben noch Schwierigkeiten zu zeigen, dass überhaupt eine uner-
reichbare Kardinalzahl unterhalb einer messbaren Kardinalzahl existiert, so er-
trinken wir nun geradezu in unerreichbaren Zahlen. Ein messbares κ besteht aus
der Sicht eines normalen Ultrafilters im Wesentlichen nur aus unerreichbaren
Kardinalzahlen. Analog kann man zeigen, dass die Menge { α < κ | α ist Mahlo }
und weiter auch die Menge { α < κ | α ist schwach kompakt } Elemente eines nor-
malen Ultrafilters auf einer messbaren Kardinalzahl κ sind.
Übung
Sei U ein normaler Ultrafilter auf κ mit κ − α P U für alle α < κ. Zeigen Sie,
dass { α < κ | α ist eine Mahlo-Kardinalzahl } P U gilt.
[ Ein normaler Ultrafilter umfasst den club-Filter, also ist jedes X P U stationär in κ.
Wegen { α < κ | α unerreichbar } P U ist also κ eine Mahlo-Kardinalzahl, und dann
gilt auch W |= „κ ist Mahlo“. Hieraus folgt wie im Beweis oben die Behauptung. ]
Wir zeigen nun folgenden ebenso einfachen wie grundlegenden Satz von
Scott, der historisch die via Ultrapotenzen konstruierten Klassenmodelle in der
Mengenlehre eingeführt hat:
Beweis
Annahme doch. Sei dann κ die kleinste messbare Kardinalzahl. Weiter sei
U ein κ-vollständiger nichttrivialer Ultrafilter auf κ, und es sei
jU : V → W . Ult(U)
die zugehörige elementare Einbettung. Dann gilt:
W |= „j(κ) ist die kleinste messbare Kardinalzahl“.
Wegen (V = L) gilt W |= (V = L). Da W ein transitives Modell von ZF ist,
gilt W = L. Also gilt
L |= „j(κ) ist die kleinste messbare Kardinalzahl“,
im Widerspruch zu (V = L), κ < j(κ) und der Definition von κ.
Speziell gilt:
Korollar
Es gelte (V = L). Dann existiert keine nichttriviale elementare Einbettung
j : V → V.
Beweis
Andernfalls ist crit(κ) eine messbare Kardinalzahl in L.
Nach einem Satz von Kunen kann hier auf die Voraussetzung (V = L) verzich-
tet werden. Diesen Satz werden wir unten beweisen. Vorab formulieren wir noch
ein Axiom, das nach obigem Korollar dem Axiom (V = L) widerspricht:
Zero-Sharp (0 # )
Es gibt eine nichttriviale elementare Einbettung j : L → L.
Diese Formulierung verlässt die Ausdrucksstärke von ZFC, da wir über ele-
mentare Einbettungen nicht quantifizieren dürfen. Dennoch lässt sich eine
ZFC-Aussage ϕ finden, die genau leistet, was wir wollen: Gilt ϕ, so können wir
eine nichttriviale elementare Einbettung j : L → L konstruieren. Ist umgekehrt
j : L → L eine durch eine Formel gegebene nichttriviale Einbettung, so können
wir zeigen, dass ϕ richtig ist. Die Aussage ϕ lässt sich mit Hilfe von Ultrafiltern
über L formulieren, und man kann erstaunlicherweise sogar eine gleichwertige
Aussage ϕ′ finden, die die Existenz einer elementaren Einbettung von L nach L
durch eine reelle Zahl kodiert. Damit behauptet das durch ϕ′ in ZFC formali-
sierte Axiom (0# ) die Existenz einer reellen Zahl mit bestimmten Eigenschaften.
(Die Namensgebung „Zero-Sharp“ ist durch diese Formulierung motiviert.)
Eine solche Kodierung ist eine nichttriviale Angelegenheit, und wir verweisen
den Leser hierzu auf die Literatur.
Zero-Sharp ist das erste große Kardinalzahlprinzip, das nicht mit V = L ver-
träglich ist. Die Aussage liegt in ihrer Stärke oberhalb von schwach kompakten
Kardinalzahlen und unterhalb von Ramsey-Kardinalzahlen. Einfach zu sehen ist,
dass die Messbarkeit die Existenz einer nichttrivialen elementaren Einbettung
von L nach L nach sich zieht. Hierzu betrachten wir allgemein Einschränkungen
von elementaren Abbildungen:
Beweis
Für jedes x P A gilt χ(x), also gilt W |= χ(j(x)). Damit ist rng( j) ⊆ AW . Für
jede Formel ϕ gilt zudem:
W
(+) (ϕA )W ist logisch äquivalent zu ϕ(A ) .
Beweis von (+) durch Induktion über den Aufbau von ϕ
Wir zeigen den Quantorschritt. Alle anderen Fälle sind einfach zu
sehen. Sei also ϕ = ∀x ψ. Dann gilt:
(ϕA )W gdw (∀x. χ(x) → ψA )W
gdw ∀x. x P W → (χ(x) → ψA )W
gdw ∀x. x P W → (χW (x) → (ψA )W )
W
gdw ∀x. x P W ∧ χW (x) → ψ(A )
W
gdw ∀x. x P AW → ψ(A )
W
gdw ϕ(A )
Beweis
Sei U ein nichttrivialer κ-vollständiger Ultrafilter auf κ, und sei
j : V → W . Ult(U) die zugehörige Ultrapotenzeinbettung. Es gilt
LW = L. Nach dem obigen Satz ist also j|L : L → L eine elementare
Einbettung. Wegen j(κ) > κ ist zudem j nichttrivial.
Beweis
zu (i):
Wie oben durch Induktion nach α = rang(x) < κ mit Hilfe von j(α) = α.
zu (ii):
Für alle x ⊆ Vκ ist x = j(x) ∩ κ P W.
zu (iii):
Sei κ ≤ α < κ+ . Dann existiert eine Wohlordnung < auf κ mit
o. t.(〈κ, <〉) = α. Wegen < ⊆ κ 2 ist < P W, und damit ist |α|W = κ.
zu (iv):
Es gilt P(κ)W = P(κ), und folglich
2κ = |P(κ)| ≤ |P(κ)|W = (2κ )W .
Weiter ist κ unerreichbar. Also ost j(κ) unerreichbar in W und damit
(2κ )W < j(κ). Wegen
j(κ) = πU ([ constκ ]) = { πU ([ f ]) | f : κ → κ }
ist zudem j(κ) < (2κ )+ .
zu (v):
Seien fα , α < κ, Funktionen von κ nach V. Wir finden eine Funktion
g : κ → V mit πU ([ g ]) = 〈πU ([ fα ]) | α < κ〉. Sei hierzu h : κ → κ mit
πU ([ h ]) = κ. Für alle γ < κ setzen wir nun
g(γ) = „die Funktion f ( · ) (γ) auf h(γ)“,
d. h. wir setzen g(γ)(α) = fα (γ) für α < h(γ). Dann ist πU ([ g ]) eine
Funktion auf πU ([ h ]) = κ, und für alle α < κ gilt
πU ([ g ])(α) = πU ([ g ])(πU ([ constα ])) = πU ([ fα ]).
Also ist g wie gewünscht.
zu (vi):
Sei f : κ → κ beliebig mit πU ([ f ]) < j(κ+ ). Dann ist δ = sup(rng(f)) < κ+
und weiter πU ([ f ]) ≤ πU ([ constδ ]) = δ.
zu (vii):
Es gilt o. t. j″κ+ = κ+ ≤ 2κ < (iv) j(κ+ ), und j(κ+ ) ist regulär in W. Damit
folgt die Behauptung aus (vi).
zu (viii):
Wir definieren k : κ κ → j(κ) durch k(f) = πU ([ f ]) für alle f : κ → κ.
Nach (v) ist κ κ = (κ κ)W P W. Ist also U P W, so ist auch k P W (denn
für alle f : κ → κ ist f P Vκ + 1 = (Vκ + 1 )W , und damit gilt [ f ]U = ([ f ]U )W ).
Also gilt W |= j(κ) ≤ (2κ )+ , im Widerspruch zu W |= „j(κ) ist unerreich-
bar“.
Satz
Sei λ ≥ ω eine Kardinalzahl mit 2λ = λω . Dann gibt es ein f : [ λ ]ω → λ mit:
Für alle x ⊆ λ mit |x| = λ ist f ″[ x ]ω = λ.
Beweis
Sei g : 2λ → [ λ ]λ × λ bijektiv, und sei g = 〈(xα , γα ) | α < 2λ 〉. Wir definieren
rekursiv für α < 2λ :
aα = „ein a P [ xα ]ω mit a ≠ aβ für alle β < α“.
Ein solches a existiert, da |[ xα ]ω | = λω = 2λ nach Voraussetzung. Wir
definieren nun f : [ λ ]ω → λ durch:
Dann ist f wie gewünscht. Denn sei x P [ λ ]λ , und sei γ < λ. Dann gibt es
ein α mit (x, γ) = (xα , γα ), und dann ist aα P [ x ]ω und f(aα ) = γ.
Damit können wir nun zeigen:
Satz (Satz von Kunen, Schranke für die Abgeschlossenheit des Zielmodells)
Sei j : V → W, W transitiv, eine nichttriviale elementare Einbettung.
Dann gilt W ≠ V. Genauer gilt non( λ W ⊆ W), wobei
λ = supn P ω κn , mit κ0 = crit(j) und κn + 1 = j(κn ) für alle n P ω.
Beweis
Annahme, λ W ⊆ W. Dann gilt für alle n P ω:
(+) κn ist eine messbare Kardinalzahl.
Beweis von (+) durch Induktion nach n P ω
Zunächst ist κ0 = crit(j) messbar. Ist κn messbar in V für ein n P ω, so ist
j(κn ) = κn + 1 messbar in W nach Elementarität. Ist U ein nichttrivialer
κn + 1 -vollständiger Ultrafilter auf κn + 1 in W, so ist U wegen λ W ⊆ W
auch ein derartiger Ultrafilter in V.
Damit ist λ = supn P ω κn eine starke Limeskardinalzahl. Folglich gilt
2λ = λcf(λ) = 2ω . Sei also f : [ λ ]ω → λ mit f ″[ x ]ω = λ für alle x P [ λ ]λ . Es gilt
j(λ) = sup(j({ κn | n P ω })) = sup({ κn + 1 | n P ω }) = λ.
Also gilt für g = j(f ):
W |= „ g : [ λ ]ω → λ und für alle x P [ λ ]λ gilt g″[ x ]ω = λ “.
Wir betrachten nun
x* = j″ λ.
Dann ist x* P [ λ ]λ ⊆ W. Also gibt es ein a P [ x* ]ω mit g(a) = κ. Wegen a ⊆ ″λ
und |a| = ω gilt j(b) = a für b = j −1 ″a. Also ist
j(f(b)) = j(f )(j(b)) = g(a) = κ,
sodass κ P rng(j), Widerspruch.
Das Argument verwendet das Auswahlaxiom. Es ist bislang kein Beweis be-
kannt, der die Existenz einer nichttrivialen elementaren Einbettung j : V → V in
ZF widerlegen würde.
Es stellt sich heraus, dass sich auch für die großen Kardinalzahlaxiome unter-
halb der Messbarkeit äquivalente Formulierungen finden lassen, die dem Cha-
rakter der obigen Liste näher kommen als die originalen Definitionen. Wir ge-
ben ohne Beweis solche Versionen für die unerreichbaren Kardinalzahlen, die
Mahlo-Kardinalzahlen sowie die schwach kompakten Kardinalzahlen an.
Weitere Reflexionsprinzipien
Wir betrachten die folgenden Aussagen:
(1) Es gibt eine unerreichbare Kardinalzahl κ.
(2) Es gibt α < β mit Vα d Vβ .
(3) Es gibt ein α mit Vα |= ZFC.
(4) Es gibt eine transitive Menge M mit M |= ZFC.
(5) Es gibt eine Menge M mit M |= ZFC und ωM = ω.
(6) Es gibt eine Menge M mit M |= ZFC.
Es gelten alle Implikationen von oben nach unten.
Ist κ eine unerreichbare Kardinalzahl, so zeigt die Konstruktion einer
elementaren Kette von Submodellen, dass
C = { α < κ | Vα d Vκ }
eine club-Menge ist. Insbesondere gilt dann
Vα |= ZFC für alle α P C.
Bereits eine unerreichbare Kardinalzahl führt also zu einer Flut von Stufen
der von Neumann-Hierachie, die allesamt transitive Modelle von ZFC
sind.
Eine Aufgabe der axiomatischen Mengenlehre ist die Messung der Stärke von
kombinatorischen Prinzipien auf der Skala der großen Kardinalzahlaxiome. Wer
würde es einem Prinzip wie der schwachen Dominierungseigenschaft ansehen,
dass es die Existenz einer nichttrivialen elementaren Einbettung von L nach L
impliziert? Wir hatten gezeigt, dass dieses Prinzip impliziert, dass V ≠ L ist, und
eine genauere Analyse der verwendeten Methoden würde uns eine elementare
Einbettung j : L → L ungleich der Identität liefern. Weiter hatten wir gesehen,
dass die Nichtexistenz eines Kurepa-Baumes dazu führt, dass ω2 eine unerreich-
bare Kardinalzahl in L ist. Andere kombinatorische Prinzipien dagegen sind we-
sentlich stärker, so ist die Saturiertheit des club-Filters auf ω1 äquikonsistent zu
einer Woodin-Kardinalzahl, und die ω1 -Dichtheit des club-Filters auf ω1 äqui-
konsistent zu ω-vielen Woodin-Kardinalzahlen. Die starke Dominierungsei-
genschaft ist äquikonsistent zu einer unerreichbaren Kardinalzahl κ, die ein Li-
mes von messbaren Kardinalzahlen ist. Diese Resultate werden i. A. mit einer
Kombination zweier Techniken gewonnen: In der einen Richtung nimmt man
ein kombinatorisches Prinzip als gegeben an, und sucht dann nach großen Kardi-
nalzahlen in L-ähnlichen inneren Modellen. Zum anderen startet man mit ge-
eignet großen Kardinalzahlen, und versucht, mit Hilfe der Erzwingungsme-
thode Modelle eines kombinatorischen Prinzips zu konstruieren. Damit nähert
man sich, oft schrittweise, einer optimalen Kardinalzahlhypothese von unten
und von oben an. Es ist bemerkenswert, dass die großen Kardinalzahlaxiome sol-
che optimalen Hypothesen zur Verfügung stellen, die dann mit einem bestimm-
ten kombinatorischen Prinzip äquikonsistent relativ zu ZFC sind. Oft lassen sich
zwei Prinzipien erst dadurch miteinander vergleichen, dass man beide auf der
Skala der großen Kardinalzahlen misst. Das Wort „Skala“, das einen linearen
Charakter suggeriert, ist hier angemessen. In vielen Fällen impliziert ein stärke-
res großes Kardinalzahlaxiom (K1) direkt die Existenz von Kardinalzahlen des
schwächeren Typs (K2). Und in jedem Falle gilt: Ist κ die kleinste Kardinalzahl
des Typs (K1), so existiert in Vκ eine Kardinalzahl des Typs (K2). Eine allgemeine
Definition, was ein großes Kardinalzahlaxiom ist, existiert allerdings nicht.
Wir wollen nun die von Paul Cohen Anfang der 1960er-Jahre entwickelte Er-
zwingungsmethode ( forcing) vorstellen. Sie ist insbesondere dazu geeignet, die
Konsistenz der folgenden Aussagen relativ zu ZFC zu zeigen:
(a) „V ≠ L“ , d. h. „es gibt eine nicht konstruierbare Menge“,
(b) ¬ (CH) , d. h. „es gibt mindestens ω2 -viele Teilmengen von ω“,
(c) (SH) , d. h. „es gibt keine Suslin-Gerade“.
Die Methode der inneren Modelle kommt für diese Ziele nicht in Frage, wie fol-
gende Überlegung zeigt. Sei M ein transitives Klassenmodell von ZFC. Das Mo-
dell M könnte nun das kleinste transitive Modell von ZFC sein, also die kleinste
Stufe L γ der L-Hierarchie mit Lγ |= ZFC (Lγ = L ist hier möglich). Jedes transi-
tive Modell N ⊆ M von ZFC ist dann wegen LN ∩ On = LN ⊆ N und minimaler
Wahl von γ identisch mit M, und erfüllt daher die Aussagen V = L, (CH) und
¬ (SH). Es gibt also keine allgemein durchführbare Methode, durch eine die
Transitivität erhaltende Verkleinerung eines Modells auch nur eines der obigen
relativen Konsistenzresultate zu gewinnen. Cohens Erzwingungsmethode er-
weitert gegebene transitive Modelle von ZFC anstatt sie zu reduzieren, und in
diesem Sinne sind die Ansätze von Gödel und Cohen komplementär.
Die Erzwingungsmethode verläuft im Überblick wie folgt: Wir starten mit ei-
nem abzählbaren transitiven Modell M von ZFC. (Um Rechtfertigungen dieser
über die bloße Widerspruchsfreiheit von ZFC hinausgehenden Annahme küm-
mern wir uns später.) In unserem Modell M betrachten wir eine prinzipiell belie-
bige partielle Ordnung 〈P, ≤〉. Diese Ordnung beschreibt Approximationen an
ein Objekt, das wir zu M hinzufügen möchten, z. B. eine neue Teilmenge von ω.
Ein solches Objekt heißt ein M-generischer Filter über P. Solche Filter sind gewisse
Teilmengen G ⊆ P, die M selbst, von trivialen Ausnahmen abgesehen, nicht
kennt, d.h. es gilt G ¸ M. Die Erweiterung von M um G kann nun immer derart
durchgeführt werden, dass für das entstehende Modell M [ G ] neben M ⊆ M[ G ]
und G P M[ G ] gilt:
(i) M[ G ] ist transitiv (Erhalt der Transitivität)
(ii) M [ G ] |= ZFC (Erhalt der Axiome)
(iii) M ∩ On = M[ G ] ∩ On (Erhalt der Höhe)
(iv) Ist N ein transitives Modell von ZF
mit M ⊆ N und G P N, so ist M[ G ] ⊆ N. (Minimalität)
Das Modell M[ G ] ist also immer noch ein gutes, transitives Modell von ZFC,
und die Erweiterung fügt keine Ordinalzahlen zu dem Modell hinzu. Zudem ist
die Erweiterung minimal, was die aus der Algebra bekannte Schreibweise M[ G ]
mit eckigen Klammern motiviert (vgl. z. B. die Körpererweiterung Q[ £2 ]).
Das Modell M kennt den generischen Filter G nicht, kann aber genau beschrei-
ben, was in einer minimalen Erweiterung von M um G alles gelten wird: Gilt in
M[G] eine Aussage, so gibt es ein pPG, das − in einem zu präzisierenden Sinne −
erzwingt, dass diese Aussage in M[ G ] gilt. Diese Kontrolle der Eigenschaften der
Erweiterung durch das Grundmodell gibt der Theorie ihren Namen.
Neben der genauen inhaltlichen Durchführung dieser Beschreibung werden
wir uns weiter darum kümmern müssen, dass die Methode tatsächlich relative
Konsistenzresultate über ZFC liefert. Wir werden zeigen, dass für jedes abzähl-
bare transitive M und jede partielle Ordnung in M immer ein generischer Filter
G existiert. Schließlich argumentieren wir, dass unser Startpunkt „sei M ein ab-
zählbares transitives Modell von ZFC“ kein wirkliches Hindernis für die ange-
strebten Konsistenzbeweise darstellt, die ja nur die Widerspruchsfreiheit von
ZFC voraussetzen.
Generische Filter
Wir stellen zuerst den begrifflichen Rahmen für die Erzwingungsmethode zu-
sammen. Den Ausgangspunkt bilden partielle Ordnungen.
Englisch heißt eine Bedingungsmenge (notion of) forcing oder oft auch p.o.-set,
wobei p. o. für partial order steht. Die Elemente von P heißen (forcing) conditions.
Alternativ kann man die Erzwingungsmethode auch auf der Grundlage von
Booleschen Algebren aufbauen. Beide Ansätze hängen eng miteinander zusam-
men. Den Zugang über Boolesche Algebren diskutieren wir später.
Konventionen
Oft schreiben wir kurz P anstelle von 〈P, <〉. Ohne Einschränkung nehmen
wir weiter oft stillschweigend an, dass P ein größtes Element besitzt, das
wir mit 1P bezeichnen.
Wir folgen der Konvention: „ kleiner heißt stärker“. Eine Bedingung p ist
also stärker oder informativer als eine Bedingung q in P, falls p < q. Damit
ist 1P die schwächste Bedingung in P. In vielen Fällen wird die Ordnung auf
P die umgekehrte echte Inklusion sein, d. h. es gilt q < p, falls q ⊃ p. Das
größte Element 1P der Ordnung ist dann in den meisten Fällen die leere
Menge.
Betrachten wir die Elemente von P als abstrakte Informationen, so sind also
zwei Informationen genau dann verträglich, wenn es eine dritte Information
gibt, die beide Informationen umfasst.
Von größter Bedeutung in der Erzwingungsmethode ist nun der Begriff einer
dichten Teilmenge einer partiellen Ordnung. Wir geben die Definition gleich
zusammen mit einigen Varianten an.
„Dicht“ meint hier also „dicht nach unten“. Sei etwa P die Menge aller endli-
chen 0-1-Folgen, geordnet durch umgekehrte Inklusion, und sei s ein beliebiges
Element von P. Dann ist die Menge D aller pPP, die mit der Folge s enden, dicht
in P. Denn für alle p P P ist die Verlängerung von p um s, also q = p c s, ein Ele-
ment von D, und es gilt q ≤ p.
Jede dichte Menge ist offenbar auch prädicht. Ist D prädicht, so ist die Menge
D′ = { r P P | es gibt ein q P D mit r ≤ q }
offen dicht in P.
Die Objekte, die uns interessieren, sind spezielle Filter auf Bedingungsmen-
gen:
Definition (Filter)
Sei P eine Bedingungsmenge. Ein F ⊆ P heißt ein Filter auf P, falls gilt:
(i) 1P PF.
(ii) Für alle p P F und q P P mit p < q ist q P F.
(iii) Für alle p, q P F existiert ein r P F mit r ≤ p, q.
Filter sind also „nach oben“ abgeschlossen in der Ordnung. Je zwei Elemente
eines Filters sind miteinander verträglich, und weiter findet sich im Filter immer
auch ein Zeuge für die Verträglichkeit.
Die erzeugende Kraft eines Filters beschreibt der folgende Begriff:
Definition (!-generisch)
Sei P eine Bedingungsmenge, und sei F ein Filter auf P. Weiter sei ! eine
beliebige Menge. F heißt !-generisch, falls für alle D P ! gilt:
Ist D dicht in P, so ist D ∩ F ≠ ∅.
Ein Leitmotiv für das Folgende ist: Wir suchen und studieren Filter, die mög-
lichst viele dichte Teilmengen von P treffen. Wir interessieren uns also für !-ge-
nerische Filter für möglichst umfassende Systeme !.
Ein ebenso einfacher wie grundlegender Existenzsatz für generische Filter ist:
Beweis
Sei 〈Dn | n P ω〉 eine Aufzählung aller in P dichten Elemente von !.
Wir konstruieren rekursiv 〈pn | 1 ≤ n < ω〉 durch:
pn + 1 = „ein p P Dn mit p ≤ pn “ für alle n P ω.
Wir setzen nun
G = { p P P | es existiert ein n P ω mit pn ≤ p }.
Dann ist G ein !-generischer Filter auf P mit p0 P G.
Übung
Zeigen Sie, dass G tatsächlich ein Filter wie gewünscht ist.
Dagegen ist volle Generizität bis auf triviale Ausnahmen nicht zu haben:
Beweis
Sei G ein Filter auf P. Wir setzen
D = P − G.
Dann ist D dicht in P. Denn sei p P P. Nach (+) gibt es p0 , p1 mit p0 ⊥ p1
Bevor wir nun die Modellerweiterung definieren, wollen wir noch den Einsatz
von generischen Filtern illustrieren.
dem anderen ist. Hieraus folgt, dass g eine Funktion ist. Weiter ist der
Definitionsbereich von g gleich ω. Zum Beweis dieser Behauptung
verwenden wir zum ersten Mal ein Dichtheitsargument. Sei n P ω beliebig,
und sei
Dn = { p P P | n P dom(p) }.
Dann ist Dn P P und Dn ist dicht in P. Denn für ein beliebiges p P P ist jede
Fortsetzung von p, die mindestens die Länge n + 1 hat, ein Element von Dn .
Also gilt P ∩ Dn ≠ ∅, und damit ist dom(g) ≥ n.
Schließlich ist g ¸ M. Denn andernfalls wäre auch G = { g|n | n P ω } ein
Element von M. In M betrachtet wäre dann G ein P(P)-generischer Filter
auf P, was nach obigem Satz nicht sein kann, da P die Verzweigungs-
Eigenschaft (+) erfüllt, sodass also P − G dicht in P ist.
Der Leser kann zur Übung mit Hilfe eines Dichtheitsarguments beweisen,
dass z. B. x = { g(2n) | n P ω } kein Element von M ist. Der Filter G fügt
viele neue reelle Zahlen hinzu, aber diese neuen Zahlen werden nach der
bereits erwähnten Minimalitäts-Eigenschaft der Erweiterung alle durch G
oder gleichwertig durch die reelle Zahl g = Í G kontrolliert.
Konvention (Standardvoraussetzungen M, P, G)
Im Folgenden bezeichnet:
(a) M ein transitives Modell von ZFC,
(b) 〈P, <〉 P M eine Bedingungsmenge mit größtem Element 1P ,
(c) G einen Filter auf P.
Existiert ein transitives Modell von ZFC, so existiert nach dem Satz von Lö-
wenheim-Skolem auch ein abzählbares transitives Modell von ZFC. Solche
Modelle spielen im Folgenden eine wichtige Rolle, da für jedes solche Modell
M und jede Bedingungsmenge 〈P, <〉 in M nach obigem Existenzsatz ein M-ge-
nerischer Filter G auf P existiert.
Wir können zu jedem Modell M und jedem Filter G auf einer Bedingungs-
menge P P M ein Modell M [ G ] konstruieren, das M umfasst und G als Element
enthält. Zuerst definieren wir eine P-Relation „aus der Sicht“ eines Filters G:
Der Filter G gibt also die „guten“ Elemente von P vor, und ein a P M gilt im
Sinne von G nur dann als ein Element eines b P M, wenn a in b mindestens ein-
mal mit dem Prädikat oder dem Zettel „gut“ versehen ist. Gilt (a, p), (a, q) P b mit
p P G, q ¸ G, so ist a PG b.
Da der Filter G im Allgemeinen kein Element des Modells M ist, ist die Rela-
tion PG im Allgemeinen auch keine definierbare Klasse in M. Die Relation PG
ist in V definiert.
Die Relation PG ist wohlfundiert, denn gilt a PG b, so existiert ein p P P mit
(a, p)Pb, und folglich gilt rang(a) < rang((a, p)) < rang(b). Wir können also rekur-
sive Definitionen über PG durchführen.
Die Funktion ˆ ist eine definierbare Klasse in M und G° ist ein Element von
M. Die Bezeichnung G° ist eine reine Konvention. Zur Definition von G° P M
wird kein Filter G auf P, sondern nur P selbst benutzt.
Beweis
zu (i) :
Wir zeigen die Aussage durch Induktion über PG . Im Induktionsschritt
a P M rechnen wir:
iG (â) = { iG (c) | c PG â } = { iG (b̂) | b P a } = I. V. { b | b P a } = a.
zu (ii) :
iG (G°) = { iG (c) | c PG G° } = { iG (p̂) | p P G } = (i) { p | p P G } = G.
Beweis
zu (i):
Ist klar nach obigem Satz.
zu (ii):
Sei x P M[ G ], und sei a P M ein Name für x. Dann ist
x = iG (a) = { iG (b) | b PG a } ⊆ M[ G ].
zu (iii):
Wegen M ⊆ M[ G ] ist On ∩ M ⊆ On ∩ M[ G ]. Eine einfache Induk-
tion über PG zeigt:
(+) Für alle a P M ist rang(iG (a)) ≤ rang(a).
Sei nun α P M[ G ] ∩ On, und sei τ P M ein Name von α. Dann gilt
α = rang(α) ≤ (+) rang(τ) P M ∩ On,
also α P M, da M transitiv ist.
zu (iv):
Wegen G P N sind PN N
G und i G definierbare Klassen in N. Insbesondere
ist dann also rng(i G ) ⊆ N. Aber es gilt i N
N M
G |M = i G (!). Damit haben wir:
M[ G ] = rng(i M N
G ) ⊆ rng(i G ) ⊆ N.
Übung
Beweisen Sie in obiger Situation, dass i N M
G |M = i G .
Generische Erweiterungen
Wir hatten allgemein den Begriff eines !-generischen Filters G auf P P M de-
finiert. Der wichtigste Spezialfall hier ! = M. Ein M-generischer Filter G auf P
ist also ein Filter auf P mit der Eigenschaft:
(#) G ∩ D ≠ ∅ für alle dichten D ⊆ P mit D P M.
Die Generizitäts-Bedingung (#) besitzt verschiedene Umformulierungen:
Übung
Sei G ein Filter auf P. Dann sind äquivalent:
(i) G ist M-generisch, d. h. es gilt (#).
(ii) G ∩ D ≠ ∅ für jedes offen dichte D ⊆ P mit D P M.
(iii) G ∩ D ≠ ∅ für jedes prädichte D ⊆ P mit D P M.
(iv) G ∩ A ≠ ∅ für jede maximale Antikette A ⊆ P mit A P M.
Weiter können wir folgende semantische Definition dafür geben, dass ein Ele-
ment von P die Gültigkeit einer Aussage in der generischen Erweiterung garan-
tiert oder, mit einem anderen Wort, erzwingt:
Die Voraussetzung der Abzählbarkeit von M garantiert, dass für alle p P P ein
M-generischer Filter G auf P existiert. Diese Folgerung aus der Abzählbarkeit
von M würde als Voraussetzung für das Folgende genügen, aber wir beschränken
uns der Einfachheit halber auf abzählbare Modelle.
Die Definition der Forcing-Relation ist eine Definition in V. Wir werden im
Verlauf unserer Untersuchungen aber das erstaunliche und nichttriviale Ergeb-
nis beweisen, dass diese Relation auch im Modell M selbst definiert werden kann.
M kann also genau vorhersagen, was in allen seinen generischen Erweiterungen
gilt, deren Filter G eine bestimmte Bedingung p als Element enthält. Im Modell
M kann man über generische Erweiterungen wie folgt diskutieren: „Wir haben
keinen generischen Filter für diese Bedingungsmenge, aber wenn wir einen hät-
ten, dann würde in der zugehörigen Erweiterung diese und jene Aussage gelten,
eine dritte aber nur, wenn diese bestimmte Bedingung p im Filter liegt, usw.“
Der Leser kann zunächst nur die Aussagen der folgenden drei Forcing-Lemmata stu-
dieren (und die Beweise überfliegen), und mit ihrer Hilfe dann die Eigenschaften der Ta-
belle im nächsten Zwischenabschnitt beweisen.
Satz (Erweiterungslemma)
Sei M abzählbar. Dann gilt für alle a1 , …, an P M, Formeln ϕ(x1 , …, xn )
und p,qP P:
p ||− ϕ(a1 , …, an ) und q ≤ p impliziert q ||− ϕ(a1 , …, an ).
Beweis
Ist q P G und q ≤ p, so ist auch p P G. Damit folgt die Aussage unmittelbar
aus der Definition der Forcing-Relation.
Satz (Wahrheitslemma)
Sei M abzählbar, und sei G ⊆ P M-generisch. Dann sind für alle Formeln
ϕ(x1 , …, xn ) und alle a1 , …, an P M äquivalent:
(a) M[ G ] |= ϕ(iG (a1 ), …, iG (an )).
(b) Es existiert ein p P G mit p ||− ϕ(a1 , …, an ).
Klar ist hier nur die Implikation von (b) nach (a). Gilt ϕ in irgendeiner generi-
schen Erweiterung M[ G ], so besagt das Wahrheitslemma, dass es ein p P G gibt
derart, dass ϕ in allen generischen Erweiterungen M[ H ] gilt mit p P H. Für die
Gültigkeit von ϕ in einer generischen Erweiterung ist also immer eine einzelne
Bedingung im Filter verantwortlich und nie der ganze Filter selbst.
Das zweite starke Ergebnis ist die oben bereits angesprochene Definierbarkeit
der Forcing-Relation im Grundmodell:
Satz (Definierbarkeitslemma)
Sei M abzählbar. Dann gilt für alle Formeln ϕ(x1 , …, xn ):
Sϕ = { 〈p, a1 , …, an 〉 | p P P , a1 , …, an P M, p ||− ϕ(a1 , …, an ) }
ist eine definierbare Klasse in M.
Zum Beweis der letzten beiden Sätze führen wir eine zweite Forcing-Relation
ein. Im Unterschied zur semantischen Forcing-Relation wird sie als Klasse im
Modell M definiert. Die Darstellung folgt dem Artikel von Shoenfield in [ Scott
1971]. Die zweite Forcing-Relation geht auf Cohens sog. „weak forcing“ zurück.
Übung
Die Definition von ||− * ist eine wohlfundierte Rekursion in M.
Übung
Für alle Formeln ϕ(x1 , …, xn ) und alle a1 , …, an P M gilt:
(i) D = { p P P | p ||− * ϕ oder p ||− * ¬ ϕ } ist dicht in P.
(ii) Es existiert kein p P P mit: p ||− * ϕ und p ||− * ¬ ϕ.
[ zu (i): Sei p P P beliebig. Existiert ein q ≤ p mit q ||− * ϕ, so ist q P D. Andernfalls
gilt ∀q ≤ p ¬ q ||− * ϕ, und damit p ||− * ¬ ϕ. Also ist p P D.
zu (ii): Gilt p ||− * ¬ ϕ, so gilt non(q ||− * ϕ) für alle q ≤ p. Also non(p ||− * ϕ). ]
Wir zeigen nun die Analoga der ersten beiden Forcing-Lemmata für die
schwache Forcing-Relation, klären den Zusammenhang zwischen den beiden
Relationen und können dann leicht das zweite und dritte Forcing-Lemma für die
semantische Forcing-Relation beweisen. Zunächst gilt:
Beweis
Wir zeigen die Aussage durch Induktion über eine geeignete Wohlordnung
der Formeln ϕ und der Parameter a1 , …, an P M.
Primformelfall P:
M[G] |= iG (a) P iG (b) gdw
∃c. c PG b ∧ M[G] |= iG (a) = iG (c) gdw I.V.
∃c. c PG b ∧ ∃pPG p ||− * a = c gdw mit Erweiterungslemma
∃pPG ∃c ∃q ≥ p. (c, q)Pb ∧ p ||− * a = c gdw Def. von p |− * a P b
∃p P G p ||− * a P b.
Primformelfall ≠ :
M[G] |= iG (a) ≠ iG (b) gdw
(∃c. c PG a ∧ ∃p P G p ||− * c ¸ b) ∨
(∃c. c PG b ∧ ∃pPG p ||− * c ¸ a) gdw wie oben
∃p P G p ||− * a ≠ b.
Fall ¬ ϕ :
M[ G ] |= ¬ ϕ impliziert ∃p P G p ||− * ¬ ϕ :
Es gelte also M[ G ] |= ¬ ϕ. Sei
D = { p P P | p ||− * ϕ oder p ||− * ¬ ϕ }.
Dann ist D P M dicht in P. Sei also p P D ∩ G. Dann gilt
p ||− * ϕ oder p ||− * ¬ ϕ.
Der erste Fall ist unmöglich, da sonst M[ G ] |= ϕ nach I. V. gelten
würde. Also gilt p ||− * ¬ ϕ, mit einem p P G.
∃p P G p ||− * ¬ ϕ impliziert M[ G ] |= ¬ ϕ
Sei p P G mit p ||− * ¬ ϕ. Annahme, M [ G ] |= ϕ. Nach I. V. existiert
dann ein q P G mit q ||− * ϕ. Wegen G Filter gibt es ein r P G mit
r ≤ p, q. Dann gilt
r ||− * ϕ und r ||− * ¬ ϕ,
Widerspruch.
Fall ϕ = ψ ∨ χ :
Es gelten die Äquivalenzen:
M[G] |= ψ ∨ χ gdw M[ G ] |= ϕ oder M[ G ] |= χ
gdw I.V. ∃p P G p ||− ψ oder ∃p P G p ||− χ
gdwG Filter, Erweiterungslemma ∃q P G. q ||− ψ oder q ||− χ
gdwDefinition ∃q P G q ||− * ϕ.
Fall ϕ = ∃x ψ :
Klar nach Definition und I. V.
Übung
Rechtfertigen Sie die obige Induktion durch Angabe einer geeigneten
Wohlordnung.
Wir zeigen:
Beweis
(i) Â (ii) :
Wir zeigen die Behauptung indirekt. Es gelte also non(p ||− * ¬ ¬ ϕ).
Nach Definition von ||− * existiert dann ein q ≤ p mit q ||− * ¬ ϕ.
Sei G ein M-generischer Filter auf P mit q P G. Dann gilt M[ G ] |= ¬ ϕ
nach dem Wahrheitslemma für die schwache Forcing-Relation. Wegen
q ≤ p ist p P G. Also gilt non(p ||− ϕ) nach Definition von ||− .
(ii) Â (i) :
Es gelte p ||− * ¬ ¬ ϕ. Dann gilt für alle M-generischen Filter G auf P
mit p P G nach dem Wahrheitslemma für ||− * , dass M[ G ] |= ¬ ¬ ϕ,
also M[ G ] |= ϕ. Also gilt p ||− ϕ nach Definition von ||− .
Korollar
Das Wahrheits- und Definierbarkeitslemma gilt für ||− .
Beweis
Für alle M-generischen Filter G auf P, alle p P P und alle Formeln ϕ gilt:
M[G] |= ϕ gdw M[ G ] |= ¬ ¬ ϕ
gdw ∃p P G p ||− * ¬ ¬ ϕ
gdw ∃p P G p ||− p
Dies zeigt das Wahrheitslemma. Das Definierbarkeitslemma folgt
zusammen mit dem letzten Satz aus der Definierbarkeit von ||− * in M.
Wir stellen häufig verwendete Regeln für den Umgang mit der Forcing-Rela-
tion zusammen.
Die Beweise dieser Eigenschaften sind mit Hilfe des Erweiterungs- und des
Wahrheitslemmas für die semantische Forcing-Relation leicht zu führen.
Die erste Eigenschaft hält die offensichtliche Aussage fest, dass kein p sowohl
ϕ als auch ¬ ϕ erzwingen kann. Die zweite Eigenschaft besagt, dass für jede Be-
dingung eine stärkere Bedingung existiert, die ϕ entscheidet. Hier geht das
Wahrheitslemma ein. Die bemerkenswerte Negationsregel (iii) ist ebenfalls eine
Folge des Wahrheitslemmas. Schließlich sind die ∧- und ∀-Regeln glatt und ein-
fach, während sich für ∨ und ∃ komplizierte Bedingungen ergeben, um die er-
warteten Auflösungen zu erhalten. Genauer besagen die Regeln, dass die erwar-
teten Auflösungen dicht unterhalb von p gelten: ∀q ≤ p ∃r ≤ q …
Das folgende Maximumsprinzip zeigt nun aber, dass wir für den Existenz-
quantor doch eine glatte Regel erhalten, indem wir die durch die obigen Regeln
gegebenen Zeugen unterhalb von p zu einem bereits für p geeigneten Zeugen
zusammenbauen.
Beweis
Wir unterdrücken die Parameter. Es gelte also p ||− ∃x ϕ(x). Sei
B = { q ≤ p | ∃b q ||− ϕ(b) }.
Dann ist B P M offen dicht unterhalb von p. Sei A ⊆ B eine maximale
Antikette in B mit A P M. Weiter sei 〈bq | q P A〉 P M derart, dass
q ||− ϕ(bq ) für alle q P A. Wir definieren nun b P M durch:
b = { (c, r) | ∃q P A. c P dom(bq ) ∧ r ≤ q ∧ r ||− c P bq }.
Ist G ein M-generischer Filter auf P mit p P G, so gibt es ein q P A ∩ G.
Für dieses q gilt dann q ||− b = bq (!), also q ||− ϕ(b) wegen q ||− ϕ(bq ).
Also gilt p ||− ϕ(b).
Die Regel für ϕ ||− ϕ ∨ ψ lässt sich dagegen nicht weiter verbessern. Für alle
Aussagen ϕ und alle Bedingungsmengen P gilt trivialerweise 1P ||− ϕ ∨ ¬ ϕ. Aber
i.A. gilt nicht, dass p ||− ϕ oder p ||− ¬ ϕ. Aufgrund der logischen Äquivalenz von
ϕ ∨ ψ und ∃x. (x = ∅ → ϕ) ∧ (x ≠ ∅ → ψ) gibt es nach dem Maximumsprinzip aber
ein b, sodass gilt:
p ||− ϕ ∨ ψ gdw p ||− (b = ∅ → ϕ) ∧ (b ≠ ∅ → ψ).
Satz (M[ G ] ist ein Modell von ZFC für M-generische Filter G)
Sei M abzählbar, und sei G ein M-generischer Filter auf P. Dann ist M[ G ]
ein Modell von ZFC.
Der Satz ist auch für beliebige transitive Modelle M von ZFC richtig. Die allgemeine
Version lässt sich mit Hilfe des Satzes von Löwenheim-Skolem auf den abzählbaren Fall
zurückführen. Für Leser, die mit dieser Art von Konstruktionen gut vertraut sind, liegt
der Beweis der allgemeineren Version im Bereich einer Übungsaufgabe.
Beweis
M[ G ] |= (Ext), (Fun), (LM), (Un):
Dies ist klar, da M[ G ] transitiv ist und M ⊆ M[ G ] gilt.
M[ G ] |= (Pa):
Seien x, y P M[ G ], und seien a, b P M mit x = iG (a), y = iG (b). Sei
c = { (a, 1P ), (b, 1P ) },
und sei z = iG (c). Dann ist iG (c) = { iG (a), iG (b) }. Also
M[ G ] |= z = { x, y }.
M[ G ] |= (Aus):
Sei ϕ(u, v) eine Formel, und seien iG (a), iG (b) P M[ G ]. Wir nehmen
zur Vereinfachung der Notation an, dass ϕ nur einen Parameter enthält.
Wir setzen:
y = { u P iG (a) | M[ G ] |= ϕ[ u, iG (b) ] }.
Wir zeigen, dass y P M[ G ]. Sei hierzu
c = { (d, p) | d P dom(a), p P P und p ||− d P a ∧ ϕ(d, b) }.
Dann gilt c P M nach dem Definierbarkeitslemma. Wir zeigen:
(+) iG (c) = y.
M[ G ] |= (Ver):
Sei iG (a) P M[ G ]. Wir zeigen, dass ein d P M existiert mit
Í iG(a) ⊆ iG (d).
Dies genügt, da M[ G ] |= (Aus), und da M[ G ] transitiv ist. Es gilt
iG (a) = { { iG (c) | c PG b } | b PG a }
und damit:
Í iG(a) = { iG (c) | ∃b PG a c PG b }
= { iG (c) | ∃p, q P G ∃b. (c, p) P b ∧ (b, q) P a }.
Also ist folgendes d P M wie gewünscht:
d = { (c, 1P ) | ∃p, q P P ∃b. (c, p) P b ∧ (b, q) P a }.
M[ G ] |= (Pot):
Sei iG (a) P M[ G ]. Es genügt zu zeigen, dass ein d P M existiert mit
P(iG (a)) ∩ M[ G ] ⊆ iG (d).
Sei y P M[ G ] mit y ⊆ iG (a). Sei b P M ein Name von y. Dann ist
y = { u P iG (a) | u P iG (b) }. Der Beweis des Aussonderungsschemas
in M[ G ] zeigt, dass ein c P M, c ⊆ dom(a) × P existiert mit iG (c) = y.
Wir setzen:
d = { (c, 1P ) | c P M, c ⊆ dom(a) × P }.
Dann ist d P M wie gewünscht.
M[ G ] |= (Kol):
Sei also ϕ(x, y, p) eine Formel, und seien a, b P M. Wir zeigen, dass
ein d P M existiert mit:
M[ G ] |= ∀u P iG (a). ∃v ϕ[ u, v, iG (b) ] → ∃v P iG (d) ϕ[ u, v, iG (b) ].
Es genügt, ein d zu finden, sodass für alle c PG a gilt:
M[ G ] |= (AC):
Wir zeigen den Wohlordnungssatz in M[ G ]. Sei hierzu iG (a) P M[ G ].
Sei jG = i M[
G
G]
die Interpretationsfunktion für den Filter G auf P in
M[ G ]. Wegen G P M[ G ] ist die Funktion jG : M[ G ] → M[ G ]
definierbar in M[ G ] und es gilt jG |M = iG .
Es gilt jG |dom(a) P M[ G ], da in M[ G ] das Ersetzungsschema gilt.
Dann ist aber jG ″dom(a) wohlordenbar in M[ G ], da dom(a) bereits
wohlordenbar in M, also insbesondere wohlordenbar in M[ G ] ist. Also
ist auch iG (a) ⊆ iG ″dom(a) = jG ″dom(a) wohlordenbar in M[ G ].
Wir haben gesehen, wie wir ein gegebenes abzählbares transitives Modell von
ZFC sehr flexibel und kontrolliert zu einem Modell M[ G ] erweitern können.
Zeigen wir nun, dass eine Aussage ϕ in M[ G ] gilt, so haben wir die Konsistenz
von ϕ relativ zu ZFC bewiesen. Um dies streng zu begründen, sind noch einige
Überlegungen notwendig, da unsere Modellannahme über die Widerspruchs-
freiheit von ZFC hinausgeht. Wir zeigen hierzu vorab eine Variante des Reflexi-
onsprinzips.
Beweis
Nach dem früheren Reflexionsprinzip existiert ein α P On mit Vα |= Ψ.
Eine Submodellkonstruktion nach Löwenheim-Skolem gefolgt von einem
Mostowski-Kollaps liefert ein abzählbares transitives Modell M mit
M d Vα . Dann gilt speziell auch M |= Ψ.
Beweis
Wir nehmen ZFC als widerspruchsfrei an und zeigen, dass ZFC + ϕ
widerspruchsfrei ist. Seien also Φ endlich viele Axiome aus ZFC + ϕ. Wir
zeigen in ZFC, dass Φ ein Modell N besitzt. Hieraus folgt dann, dass die
Theorie ZFC + ϕ widerspruchsfrei ist.
Beweis hierzu
Denn andernfalls existieren endlich viele Axiome Φ von ZFC + ϕ mit
Φ ⊢ ∃x x ≠ x. Dann würde ZFC nach Korrektheit des Modellbegriffs
beweisen, dass N |= ∃x x ≠ x. Wegen ZFC ⊢ „N |= ∀x x = x“ wäre dann
ZFC widersprüchlich. Insgesamt zeigt das folgende Argument wieder,
wie wir einen Beweis eines Widerspruchs in ZFC + ϕ effektiv in einen
Beweis eines Widerspruchs in ZFC übersetzen können.
Gegeben Φ können wir endlich viele ZFC-Axiome Ψ finden derart, dass
ZFC beweist:
(+) Ist M ein abzählbares transitives Modell von Ψ, so ist 〈P, <〉 eine partielle
Ordnung in M und für alle M-generischen G ⊆ P gilt M[ G ] |= Φ.
Solche Axiome Ψ existieren nach Voraussetzung (b) sowie dem Beweis des
Satzes, dass M[ G ] jedes Axiom von ZFC erfüllt. Denn für jedes χ in Φ wird
nur die Gültigkeit von höchstens endlich vielen ZFC-Axiomen in M
bemüht, um zu zeigen, dass χ in jeder generischen Erweiterung M[ G ] von
M gilt. Aufgrund der Existenz M-generischer Filter für abzählbare Mengen
M genügt es nach (+) also zu zeigen, dass Ψ ein abzählbares transitives
Modell M besitzt. Dies gilt aber nach obigem Reflexionslemma.
Damit können wir nun erste relative Konsistenzbeweise mit der Forcing-Me-
thode durchführen. (Eine weitere Rechtfertigung der relativen Konsistenz-Be-
weise durch Forcing geben wir mit Hilfe von Booleschen Modellen im nächsten
Kapitel.)
Modelle von „V ≠ L“
Bis auf weiteres ist M immer ein abzählbares transitives Modell von ZFC.
Beweis
Sei P = 〈< ω 2, ⊃〉, und sei G ein M-generischer Filter auf P (vgl. obige
Diskussion der Hinzufügung einer reellen Zahl). Sei g = Í G. Dann ist g
eine Funktion und genauer gilt g : ω → 2. Also ist
x = { n P ω | g(n) = 1 }
eine Teilmenge von ω. Da sich P unterhalb jeder Bedingung unverträglich
verzweigt, gilt G ¸ M. Also ist auch die reelle Zahl x kein Element von M,
da sich G aus x rekonstruieren lässt. Wegen On ∩ M = On ∩ M[ G ] =: α
und der Transitivität der ZFC-Modelle M und M[ G ] gilt zudem
LM = Lα = LM[ G ] .
Also ist x ¸ Lα und damit ist M[ G ] ein Modell von V ≠ L.
Beweis
In M sei P = < ω ω1 , geordnet durch ⊃. (In V ist P = { f : n → ω1M | n P ω }.)
Sei G ein M-generischer Filter auf P, und sei g = Í G. Dann gilt:
(+) g : ω → ωM
1 ist surjektiv.
Die Bedingungsmenge des Beweises kollabiert, wie man sagt, ω1 M auf ω. Wir
fügen durch Forcing eine Surjektion von ω auf ωM 1 hinzu. Die erste überabzähl-
bare Kardinalzahl ω1 N in einer generischen Erweiterung N von M ist dadurch
notwendig größer als ωM N M
1 . Wir werden später sehen, dass ω1 = ω2 gilt, d. h. die
M
M-Kardinalzahl ω2 bleibt als Kardinalzahl erhalten, übernimmt nun aber die
Rolle von ω1 . (P = 〈< ω ω1 , ⊃〉 erfüllt die ω2 -Antikettenbedingung, s. u.)
Das Argument zeigt insbesondere:
Korollar
Die Eigenschaften „α = ω1 “ und „α ist eine Kardinalzahl“ sind nicht absolut
für transitive Modelle von ZFC.
Korollar
Die Aussagen „V ≠ L“ und stärker „L ∩ R ist abzählbar“ sind konsistent
relativ zu ZFC.
Antiketten in Bedingungsmengen
Ein zentrales Ergebnis über ∆-Systeme ist das folgende sog. ∆-Lemma.
Auch hier kann der Leser, der zunächst nur einen Überblick der Konstruktion eines
Modells von ¬(CH) sucht, wieder nur die Aussage des Lemmas und die berechnete Satu-
riertheit der Bedingungsmengen part(A, B) zur Kenntnis nehmen.
Satz (Delta-Lemma)
Sei κ > ω eine reguläre Kardinalzahl. Sei E eine Menge von endlichen
Mengen mit |E| = κ. Dann existiert ein ∆-System W ⊆ E mit |W| = κ.
Beweis
Wegen κ regulär existiert ein 1 ≤ n < ω und ein E′ ⊆ E mit |E′| = κ und
|x| = n für alle x P E′. Es genügt also zu zeigen:
(+) Sei n P ω und E ⊆ [ V ] n mit |E| = κ.
Dann existiert ein ∆-System W ⊆ E mit |W| = κ.
Wir geben noch einen weiteren Beweis des ∆-Lemmas, der regressive Funk-
tionen und den Satz von Fodor heranzieht.
Übung
Es existiert eine Menge E von endlichen Mengen mit |E| = ℵω mit:
Ist D ⊆ E ein ∆-System, so ist |D| < ℵω .
[ Wir betrachten E = { { ℵ0 , ..., ℵn , γ } | n P ω, ℵn < γ < ℵn + 1 } . ]
Der Beweis sei dem Leser zur Übung überlassen. Gilt die allgemeine Kontinu-
umshypothese, so ist die „ λ< µ < κ “-Voraussetzung für alle Kardinalzahlen µ < κ
erfüllt.
Ein wichtiger Spezialfall der allgemeinen Form ist:
Beweis
Ohne Einschränkung ist B unendlich, sodass |B| ⋅ ω = |B| gilt. Sei
κ = |B|+ und sei C ⊆ part(A, B) mit |C| = κ. Wir finden zwei verschiedene
kompatible Elemente von C. Sei hierzu
E = { dom(p) | p P C }.
Dann gilt |E| = κ. Denn wäre |E| < κ, so hätten κ-viele p P C denselben
Definitionsbereich d. Es gibt aber nur |B||d| = |B| < κ viele p P part(A, B)
mit Definitionsbereich d, Widerspruch.
Sei also W ⊆ E ein ∆-System der Kardinalität κ mit Wurzel w. Mit dem
Argument für „|E| = κ“ gibt es dann p ≠ q in C mit
dom(p) ∩ dom(q) = w und p|w = q|w.
Dann sind aber p und q kompatibel in part(A, B).
Das Argument zeigt: Es existiert ein C′ ⊆ C mit |C′| = κ derart, dass die Ele-
mente von C′ paarweise kompatibel sind. Auf diese Verstärkung der κ-Antiket-
tenbedingung werden wir später noch zurückkommen.
Der Vollständigkeit halber definieren wir nun noch allgemeiner:
Es gilt also part(A, B) = part < ω (A, B). Das allgemeine ∆-Lemma zeigt:
Konvention
Wir lassen auf der rechten Seite der Erzwingungsrelation häufig das
„Dach“ für kanonische Namen weg, speziell bei Ordinalzahlen. Damit
schreiben wir also z. B. p ||− „µ ist eine Kardinalzahl“ statt korrekter
p ||− „µ̂ ist eine Kardinalzahl“. Diese Konvention ist suggestiv, aber nicht
ganz ungefährlich, da nun ein Name a P M von dem speziellen Namen
â P M nicht mehr unterschieden werden kann. In der Regel ist aber die
Bedeutung aus dem Kontext heraus klar.
Beweis
Sei µ < κ, und sei g P M[ G ] eine Funktion mit g : µ → κ. Wir zeigen, dass
sup(rng(g) ) < κ. Dies zeigt, dass M[ G ] |= „κ ist regulär“. Sei g̊ P M ein
Name von g. Dann existiert ein p P G mit:
p ||− g̊ ist eine Funktion von µ nach κ.
Wir arbeiten nun in M. Für α < µ sei
Aα = { β < κ | ∃q ≤ p q ||− g̊(α) = β } .
Dann gilt:
(+) |Aα | < κ für alle α < µ.
Beweis von (+)
Für β P Aα sei qβ ≤ p mit q β ||− g̊(α) = β. Dann ist { qβ | β P Aα } eine
Antikette in P, also |Aα | ≤ |{ qβ | β P Aα }| < κ nach Voraussetzung.
Sei γ = strsup Íα < µ Aα . Wegen κ regulär ist γ < κ und es gilt p ||− g̊(α) < γ
für alle α < µ. Also p ||− rng(g̊) ⊆ γ. Dies zeigt, dass sup(rng(iG (g̊))) < κ.
Ist cf M (λ) ≥ κ, so erfüllt P die cf M (λ)-Antikettenbedingung in M, also ist
cf M (λ) regulär in M[ G ]. Also ist
cf M[ G ] (λ) = cf M[ G ] (cf M (λ)) = cf M (λ).
Nach diesen Vorbereitungen können wir nun leicht eine generische Erweite-
rung konstruieren, in der (CH) falsch ist.
Beweis
Sei κ = ω M
2 , und sei P = part(κ × ω, 2) in M. Sei G ein M-generischer Filter
auf P. Wir setzen wieder
g = Í G.
Dann gilt g : κ × ω → 2. Für alle α < κ sei
x α = { n P ω | g(α, n) = 1 },
d. h. xα ⊆ ω ist gegeben durch die α-te Spalte der 0-1-Funktion g auf κ × ω.
Dann gilt:
(+) xα ≠ xβ für alle α < β < κ.
Beweis von (+)
Für α < β < κ sei
Dα, β = { p P P | es existiert ein n P ω mit p(n, α) ≠ p(n, β) }.
Dann ist Dα, β P M dicht in P, also G ∩ Dα, β ≠ ∅. Hieraus folgt (+).
Damit gilt M[ G ] |= 2ω ≥ κ. Aber P erfüllt nach obigen Berechnungen die
abzählbare Antikettenbedingung, und folglich gilt M[ G ] |= κ = ω2 . Also
gilt M[ G ] |= 2ω ≥ ω2 und somit M[ G ] |= ¬ (CH).
Wir werden gleich zeigen, dass in der Forcing-Erweiterung des obigen Bewei-
ses M[ G ] |= 2ω = ω2 gilt, falls 2ω ≤ ω2 in M gilt. Wir haben also auch nicht mehr
neue Teilmengen von ω zu unserem Grundmodell M hinzugefügt als unser An-
satz vorgibt.
Das Forcing-Argument zeigt:
Erst jetzt wissen wir also sicher, dass wir keinen Beweis von (CH) in ZFC über-
sehen haben (es sei denn, ZFC ist inkonsistent).
Zusammen mit den Ergebnissen über das innere Modell L der konstruktiblen
Mengen haben wir also den folgenden Hauptsatz der metamathematischen Unter-
suchung von ZFC bewiesen:
Beweis
zu M[ G ] |= 2 ω ≥ µ:
Wie im Beweis oben gilt M[ G ] |= 2ω ≥ κ. Also
M[ G ] |= 2ω = (2ω ) ω ≥ κ ω .
Wegen ω κ ∩ M ⊆ ω κ ∩ M[ G ] gilt zudem (κ ω ) M[ G ] ≥ (κ ω ) M = µ.
zu M[ G ] |= 2 ω ≤ µ:
Für a P M und n P ω sei
Ba (n) = { p P P | p ||− a ⊆ ω und n P a }.
Für jedes a P M ist 〈Ba (n) | n P ω〉 P M und somit gibt es für alle a P M
eine Folge g(a) = 〈Aa (n) | n < ω〉 P M derart, dass für alle n P ω gilt:
„ Aa (n) ⊆ Ba (n) und Aa (n) ist eine maximale Antikette in Ba (n). “
Es gibt aber nur ((|P|ω ) ω ) M = µ-viele derartige Folgen in M, da P die
abzählbare Antiketten-Bedingung erfüllt. Es genügt also zu zeigen:
(+) Sind iG (a), iG (b) ⊆ ω mit g(a) = g(b), so ist iG (a) = iG (b).
Beweis von (+)
Sei n P iG (a) beliebig. Sei p P G mit p ||− a ⊆ ω ∧ n P a. Dann ist
G ∩ Aa (n) ≠ ∅, also ist wegen g(a) = g(b) auch G ∩ Ab (n) ≠ ∅. Dann
folgt aber n P iG (b) nach Definition von Ba (n) ⊇ Aa (n). Dies zeigt
iG (a) ⊆ iG (b). Analog gilt iG (b) ⊆ iG (a).
Erfüllt das Grundmodell (GCH), so ist κ ω = κ für alle κ mit cf(κ) > ω. Für diese
κ gilt dann M[G] |= 2ω = κ, falls G ein M-generischer Filter auf part(κ × ω, 2) ist.
Für alle M ist LM ein Grundmodell, das (GCH) erfüllt. Also gilt:
Die Definierbarkeit von κ brauchen wir, damit „2ω = κ“ eine Aussage ist.
Damit haben wir schließlich gezeigt, dass der Satz von König-Zermelo best-
möglich ist: Die Konfinalität der Mächtigkeit des Kontinuums ist überabzählbar.
Mehr hat ZFC über die Größe der reellen Zahlen nicht zu sagen. Die Theorie
kann Mächtigkeiten wie 2ω = ω 5ω2 + ω + 75 nicht ausschließen.
Wir notieren noch, wie das Hinzufügen von κ-vielen Cohenschen reellen
Zahlen die allgemeine Kontinuumshypothese verändert.
{
κ,
µ +
M[ G ] |= 2 = κ , falls cf(κ) ≤ µ < κ
µ+ , falls κ ≤ µ
Definition (κ-abgeschlossen)
Sei κ ≥ ω eine Kardinalzahl. P heißt κ-abgeschlossen, falls für jede abstei-
gende Folge 〈pα | α < λ〉 in P der Länge λ < κ ein p P P existiert mit:
p ≤ pα für alle α < λ.
Der Schnitt über offene dichte Mengen ist immer offen. Offenbar besteht fol-
gender Zusammenhang:
Die Wirkung der Dichtheit ist nun, dass ein Forcing mit einer κ-dichten Be-
dingungsmenge keine neuen Folgen der Länge kleiner als κ zum Grundmodell
M hinzufügt:
Beweis
Sei λ < κ, und sei g P λ M ∩ M[ G ]. Sei g̊ P M ein Name von g, und sei
p P G mit p ||− „g̊ ist eine Funktion auf λ“. Für α < λ sei schließlich
Uα = { q ≤ p | ∃b q ||− g(α) = b̂ }.
Dann ist Uα offen dicht in M unterhalb von q, und die Folge 〈Uα | α < λ〉
ist ein Element von M. Sei
U = >α < λ Uα.
Dann ist U P M offen dicht unterhalb von p. Sei q P U beliebig. Dann
existiert für alle α < λ ein eindeutiges b = b(α, q) P M mit q ||− g̊(α) = b̂.
Zudem gilt 〈b(α, q) | α < λ〉 P M. Wegen U offen dicht unterhalb von
p P G gibt es ein q P U ∩ G. Dann gilt aber
g = iG (g̊) = 〈b(α, q) | α < λ〉 P M.
Korollar
Sei P κ-distributiv und G ein M-generischer Filter auf P. Dann gilt
P(λ) ∩ M[ G ] = P(λ) ∩ M für alle λ < κ.
Ist speziell P ω1 -distributiv, so gilt ωM M[ G ]
1 = ω1 .
Satz
Sei P separativ. Sei κ eine Kardinalzahl in M derart, dass für alle
M-generischen Filter G auf P gilt λ M ∩ M[ G ] ⊆ M für alle λ < κ.
Dann ist P κ-dicht in M.
Die Erzwingungsmethode ist auch dazu geeignet, die relative Konsistenz der
Aussagen (CH), (♦) und ¬(SH) zu beweisen, die wir mit Hilfe von L gewonnen
hatten. Der Wert des inneren Modells L wird dadurch nicht geschmälert.
Am einfachsten erhalten wir (CH):
Beweis
Sei g = Í G. Dann ist wie üblich g : ωM M
1 → P(ω) surjektiv. Die Ordnung
M M[ G ]
P ist ω1 -abgeschlossen, also gilt ω1 = ω1 und P(ω) M = P(ω) M[ G ] .
Damit gilt
M[ G ] |= g : ω1 → P(ω1 ) surjektiv.
Also M |= (CH).
Beweis
Die Bedingungsmenge 〈P, ⊃〉 ist ω1 -abgeschlossen, also bleibt ωM
1 erhalten.
Wir schreiben kurz ω1 für ωM
1 = ωM[ G ]
1 . Wir zeigen, dass
ÍG = 〈Sα | α < ω1 〉
eine ♦-Folge ist. Seien hierzu C˚, X˚ P M und β < ω1 mit
〈Sα | α < β 〉 ||− C˚ ist club in ω1 und X˚ ⊆ ω1 .
Ein Dichtheitsargument zeigt, dass ein λ < ω1 existiert mit β < λ und
〈Sα | α ≤ λ 〉 ||− λ P C˚ ∧ X˚ ∩ λ = „das λ-te Element von Í G° “.
Dann gilt
M[ G ] |= λ P C ∧ X ∩ λ = Sλ .
Schließlich lassen sich auch Suslin-Bäume durch Forcing erzeugen. Wir skiz-
zieren das Argument.
Beweis
Das ∆-Lemma zeigt, dass 〈P, <〉 die abzählbare Antiketten-Bedingung
erfüllt. Wir setzen
〈S, <〉 = Í G.
Dann ist S ein Baum auf ω1 der Höhe ω1 in M[ G ]. Wir zeigen, dass S ein
Suslin-Baum in M[ G ] ist. Hierzu genügt es zu zeigen:
(+) S besitzt keine Antiketten der Mächtigkeit ω1 in M[ G ].
Da sich S immer wieder spaltet, hat S keine überabzählbaren Zweige.
Beweisskizze von (+)
Seien A˚ P M, p0 P G mit
p0 ||− „ A˚ ist eine überabzählbare Teilmenge von Í G° “.
Sei W ⊆ P × ω1 überabzählbar derart, dass für alle (p, α) P W gilt:
p ||− α P A˚.
Produkt-Forcing
Satz (Produktsatz)
Seien P, Q P M Bedingungsmengen, und sei G ⊆ P × Q. Dann sind
äquivalent:
(i) G ist ein M-generischer Filter auf P × Q.
(ii) Es existiert ein M-generischer Filter GP auf P und ein
M[ GP ]-generischer Filter GQ auf Q P M[ G ] mit G = GP × GQ .
In dieser Situation ist dann GP = pr1 (G) und GQ = pr2 (G).
Beweis
(i) Â (ii):
Seien GP = pr1 (G) und GQ = pr2 (G). Dann gilt G = GP × GQ (!).
Es ist leicht zu sehen, dass GP M-generisch auf P ist. Weiter ist GQ ein
Filter auf Q. Wir zeigen, dass GQ M[ G ]-generisch auf Q ist. Sei also
D P M[ GP ] dicht in Q. Sei D° P M ein Name von D, und sei
p0 P GP mit p0 ||− „D˚ ist dicht in Q“. Wir setzen:
E = { (p, q) P P × Q | p ⊥ p0 oder p < p0 und p ||− q P D˚ }.
Dann gilt (!):
(+) E ist dicht in P × Q.
Dann ist E ∩ G ≠ ∅, und damit D ∩ GQ ≠ ∅.
(ii) Â (i):
Sei also G = GP × GQ wie in (ii). Dann ist G ein Filter auf P × Q.
Wir zeigen, dass G M-generisch auf P × Q ist. Sei hierzu D P M dicht in
P × Q. Wir setzen:
D′ = { q P Q | ∃p P G (p, q) P D }.
Dann ist D′ P M[ G ]. Es genügt zu zeigen:
(+) D′ ist dicht in Q.
Denn dann ist GQ ∩ D′ ≠ ∅ und weiter G ∩ D ≠ ∅.
Beweis von (+)
Sei q0 P Q, und sei E = { p P P | ∃q < q0 (p, q) P G }. Dann ist
E P M dicht in Q. Also existiert ein p P GP ∩ E. Sei dann q < q0 mit
(p, q) P G. Dann ist q P D′.
Aus der Minimalität generischer Erweiterungen erhalten wir dann sofort den
folgenden Identifikationssatz für Produkte:
Übung
Sind GP ⊆ P und GQ ⊆ Q M-generisch, so ist GP × GQ im Allgemeinen
nicht M-generisch auf P × Q.
[ Sei P eine Bedingungsmenge derart, dass für jedes p P P unverträgliche p1 , p2 ≤ p
existieren. Sei G M-generisch auf P. Dann ist G P M[ G ], also ist G nicht M[ G ]-
generisch auf P. Nach dem Satz oben ist also G × G nicht M-generisch auf P × P.
Bemerkung: Sind GP ⊆ P und GQ ⊆ Q M-generisch, so ist G = GP × GQ ein Filter
auf P × Q. Für alle D P M, die dicht in P × Q sind, existiert ein p P GP und ein
q P GQ mit { p } × Q ∩ D ≠ ∅ und P × { q } ∩ D ≠ ∅. I. A. ist dann aber (p, q) ¸ D. ]
Die generischen Filter G auf P × Q sind also Produkte generischer Filter auf
P und Q, aber nicht beliebige solche Produkte.
Seien A, B disjunkte Mengen, und sei C beliebig. Die Bedingungsmenge
part(A ∪ B, C) können wir mit dem Produkt part(A, C) × part(B, C) identifizie-
ren. Nach dem Produktsatz ist jedes Forcing auf part(A ∪ B, C) gleichwertig zu
einem Forcing auf part(A, C) in M gefolgt von einem Forcing auf part(B, C) in
M[ G ]. Speziell können wir das Cohen-Forcing part(2 × ω, ω), das dem Grund-
modell zwei neue Cohensche Zahlen aus dem reichen Vorrat des Universums
spendiert, als einen Prozess auf part(ω, ω) × part(ω, ω) auffassen, der zwei Co-
hensche Zahlen nacheinander hinzufügt. Eine ähnliche Aufspaltung werden wir
im nächsten Zwischenabschnitt verwenden.
Das Produkt-Forcing liefert uns eine Möglichkeit zu zeigen, dass bestimmte
Objekte der generischen Erweiterung nicht neu sein können:
Satz
Seien P, Q Bedingungsmengen in M, und sei G M-generisch auf P × Q.
Weiter sei X ⊆ M mit X P M[ pr1 (G) ] ∩ M[ pr2 (G) ]. Dann gilt X P M.
Korollar
Sei X ⊆ M derart, dass gilt: X P M[ G ] für alle M-generischen G auf P.
Dann gilt X P M.
Beweis
Sei G M-generisch auf P × P. Nach Voraussetzung gilt
X P M[ pr1 (G) ] ∩ M[ pr2 (G) ].
Nach dem Satz gilt also X P M.
Übung
Sei 〈T, <T 〉 ein normaler Suslin-Baum, und sei 〈T, <〉 die gestürzte
Ordnung, d. h. es gilt s < t, falls t <T s. Dann gilt für die Bedingungsmenge
〈T, <〉:
(i) 〈T, <〉 erfüllt die abzählbare Antikettenbedingung.
(ii) 〈T, <〉 × 〈T, <〉 besitzt eine überabzählbare Antikette.
Wir konstruieren später durch iteriertes Forcing ein Modell, in dem das Pro-
dukt zweier Bedingungsmengen, die die abzählbare Antikettenbedingung erfül-
len, stets wieder die abzählbare Antikettenbedingung erfüllt.
Wir betrachten folgende Verstärkung der κ-Antikettenbedingung:
Das club-Schießen
Definition (club-Schießen)
Sei S ⊆ ω1 stationär in ω1 . Wir definieren:
P = { p | dom(p) < ω1 ist eine Nachfolgerordinalzahl,
rng(p) ist abgeschlossen,
p : α + 1 → S ordnungstreu }.
Wir ordnen P durch ⊃. 〈P, <〉 heißt das club-Schießen für S.
Beweis
Seien Dn , n P ω dicht in P für n < ω, und sei p P P. Wir finden ein q ≤ p mit
q P >n P ω Dn . Sei hierzu X d Vω2 mit:
(i) |X| = ω
(ii) S, P, 〈Dn | n P ω〉 P X
(iii) X ∩ ω1 P S
zur Existenz:
Sei 〈Xα | α < ω1 〉 eine strikt aufsteigende elementare Kette von
abzählbaren Submodellen von Vω2 mit:
P P X0 , 〈Dn | n P ω〉 P X0 , Xα d Vω1 für alle α < ω1 .
Dann ist C = { α < ω1 | α = Xα ∩ ω1 } club in ω1 . Sei α P C ∩ S. Dann ist
Xα wie gewünscht.
Sei α = X ∩ ω1 , und sei 〈αn | n < ω〉 s. a. k. in α. Wir konstruieren rekursiv
eine Folge 〈pn | n < ω〉, sodass für alle n P ω gilt:
(i) p0 ≤ p
(ii) pn P X ∩ Dn
(iii) pn + 1 < pn
(iv) dom(pn ) > αn
Sei nun q = Ín P ω pn ∪ { (α, α) }. Dann ist q wie gewünscht.
(iii) g : ωM
1 →S
(v) M[ G ] |= SP #ω1
Die ω1 -Dichtheit haben wir bereits bewiesen. Alle anderen Aussagen sind ein-
fach zu zeigen.
Die Konstruktion zeigt insbesondere: Ist M ein abzählbares Modell von ZFC
und 6M die Menge der stationären Teilmengen von ω1 im Sinne von M, so ist
6M ⊆ { X ⊆ ωM M
1 | X enthält eine club-Menge C ⊆ ω1 }.
Korollar
Sei S stationär-kostationär in ωM1 , und seien P und Q das club-Schießen
für S bzw. ωM1 − S in M. Weiter sei G ⊆ P × Q M-generisch. Dann gilt
ωM[
1
G]
> ω M
1 . Insbesondere ist P × Q also nicht ω1 -dicht.
Beweis
Bliebe ω1 erhalten, so hätten wir M[ G ] |= S P #ω1 und ω1 − S P #ω1 ,
was nicht sein kann.
Satz
Sei G M-generisch auf P, und sei π P M ein Automorphismus auf P. Weiter
sei G* = π″ G. Dann gilt:
(i) G* ist M-generisch auf P
(ii) iG (a) = iG* (π*(a)) für alle a P M
(iii) M [ G ] = M[ G* ]
(iv) für alle p P P, a1 , …, an P M und alle Formeln ϕ:
p ||− ϕ(a1 , …, an ) gdw π(p) ||− ϕ(π*(a1 ), …, π*(an ))
Beweis
zu (i):
Ist klar.
zu (ii):
Für alle a, b P M gilt:
(+) b PG a gdw π*(b) PG* π*(a).
Wir zeigen nun die Aussage durch Induktion nach P. Im Induktions-
schritt a gilt:
iG (a) = { iG (b) | b PG a }
= I.V. { iG* (π*(b)) | b PG a }
=(+) { iG* (b) | b PG* π*(a) }
= iG* (π*(a))
zu (iii):
Nach (ii) gilt M[ G ] = rng(iG ) ⊆ rng(iG* ) = M[ G* ]. Ein analoges
Argument für π −1 liefert M[ G* ] ⊆ M[ G ].
[ Alternativ: Es gilt G* P M[ G ], da G* aus π und G definierbar ist. Nach
Minimalität der Erweiterung ist also M[ G* ] ⊆ M[ G ]. Analog gilt die
andere Inklusion. ]
zu (iv):
Wir nehmen zur Vereinfachung der Notation nur einen Parameter an.
Dann gilt:
p ||− ϕ(a) gdw
∀G. G M-generisch ∧ pPG → M[G] |= ϕ[iG (a)] gdw(ii), (iii)
∀G*. G* M-generisch ∧ π(p)PG* → M[G*] |= ϕ[iG* (π*(a))] gdw
π(p) ||− ϕ(π*(a))
Der folgende Satz zeigt die Bedeutung des Begriffs der schwachen Homogeni-
tät: Die Forcing-Verhältnisse betreffend die Negation werden einfacher.
Satz
Seien a1 , …, an P M derart, dass M |= „P ist schwach homogen für a1 , …, an “.
Dann gilt für jede Formel ϕ:
1P ||− ϕ(a1 , …, an ) oder 1P ||− ¬ ϕ(a1 , …, an ).
Beweis
Es gelte non(1P ||− ϕ(a1 , …, an )). Wir zeigen, dass für alle q P P
non(q ||− ϕ(a1 , …, an )) gilt. Dies zeigt, dass 1P ||− ¬ϕ(a1 , …, an ).
Sei also q P P beliebig. Wegen non(1P ||− ϕ(a1 , …, an )) existiert ein p mit
p ||− ¬ ϕ(a1 , …, an ).
Sei π : P → P ein Automorphismus mit π(p) || q, π*(ai ) = ai für 1 ≤ i ≤ n.
Nach dem obigen Satz gilt
π(p) ||− ¬ ϕ(π*(a1 ), …, π*(an )).
Wegen q || π(p) gilt dann sicherlich
non(q ||− ϕ(a1 , …, an )).
Korollar
Seien a1 , …, an P M derart, dass
M |= „P ist schwach homogen für a1 , …, an “.
Sei G ein M-generischer Filter auf P, und sei x P M[ G ] mit x ⊆ M. Es gebe
eine Formel ϕ derart, dass:
x = { y P M[ G ] | M[ G ] |= ϕ[ y, iG (a1 ), …, iG (an )) ]
Dann ist x P M.
Beweis
Wegen x P M[ G ], x ⊆ M und On ∩ M = On ∩ M[ G ] existiert ein α P M
mit x ⊆ VM
α . Nach dem Satz gilt dann aber:
x = { y P VM
α | 1P ||− ϕ[ y, a1 , …, an ] } P M.
Übung
Sei M |= V = L, und sei G ein M-generischer Filter für part(ω, 2). Dann
gilt M[ G ] |= L = HOD, V ≠ L.
Nach diesen Vorbereitungen können wir nun Modelle konstruieren, die das
Auswahlaxiom verletzen.
Beweis
A ist unendlich in V, also auch unendlich in M[ G ]. Annahme,
N |= A ist Dedekind-unendlich.
Sei f P N = HOD(A) M[ G ] ein Zeuge hierfür, d. h. f : ω → A injektiv. Weiter
sei f definierbar mit den Parametern α0 , …, αm , x0 , …, xj , A in M[ G ].
Wegen f : ω → A injektiv existiert ein k > j mit xk P rng(f ). Dann ist aber xk
von der Form
xk = { y P M[ G ] | M[ G ] |= ϕ[ y, α0 , …, αm , x0 , …, xj , A ] }.
Die Ordnung P ist isomorph zu Q0 × Q1 , wobei:
Q0 = part(( j + 1) × ω, 2),
Q1 = part((ω − ( j + 1)) × ω, 2).
Sei entsprechend G = G0 × G1 mit G0 auf Q0 und G1 auf Q1 . Für i > j sei
ai = { (n̂, p) | n P ω, p P Q1 , p(i, n) = 1 }.
Weiter sei B = { (ai , 1Q1 ) | j ≤ i < ω }. Dann gilt:
(i) x0 , …, xj P M[ G0 ]
(ii) iG1 (ai ) = xi für alle i > j, und folglich iG1 (B) = A − { x0 , …, xj }
(iii) M[ G0 ] |= Q1 ist schwach homogen für B
[ Permutiere Spalten der partiellen Ordnung. ]
Damit haben wir bewiesen, was wir bisher nur vermutet hatten:
Korollar
Die Äquivalenz von „endlich“ und „Dedekind-endlich“ ist nicht in ZF
beweisbar.
Übung
Es existiert eine generische Erweiterung M[ G ] von M und ein Modell N
von ZF mit:
(i) M ⊂ N ⊂ M[ G ]
(ii) N |= ∃g. g Funktion auf ω ∧ ∀n < ω |g(n)| = 2 ∧ ¬ ∃h ∀n < ω h(n)Pg(n)
Wir diskutieren nun noch eine von Solovay und Scott entwickelte Version der
Erzwingungsmethode, die mit Booleschen Algebren anstelle von partiellen Ord-
nungen operiert. Nach einem knappen Überblick über die Grundlagen der
Theorie der Booleschen Algebren besprechen wir, im Rahmen der Vervollstän-
digung einer Booleschen Algebra, wie wir von einer partiellen Ordnung 〈P, <〉 zu
einer vollständigen Booleschen Algebra B gelangen können, in die die Ordnung
P dicht eingebettet ist. Dieser Zusammenhang verbindet die beiden Zugänge zur
Forcing-Theorie. Anschließend führen wir Boolesche Modelle ein und zeigen,
wie wir mit ihrer Hilfe relative Konsistenzresultate gewinnen können. Metho-
disch sind hier die Booleschen Algebren sogar klarer als die partiellen Ordnun-
gen. Insgesamt ergänzen sich die beiden Ansätze und ermöglichen ein vertieftes
Verständnis der Erzwingungsmethode.
Boolesche Algebren
Übung
Sei B eine Boolesche Algebra. Dann gilt für alle a, b P B:
(i) a + a = a, a ⋅ a = a,
(ii) a + 0 = a, a + 1 = 1,
(iii) a ⋅ 0 = 0, a + 1 = 1,
(iv) − (− a) = a, − 0 = 1, − 1 = 0,
(v) − (a + b) = − a ⋅ − b , − (a ⋅ b) = − a + − b.
Definition (a ⇒ b)
Sei B eine Boolesche Algebra. Dann definieren wir für alle a, b P B:
a ⇒ b = (− a) + b.
Jede Boolesche Algebra bringt eine natürliche partielle Ordnung mit sich:
Man zeigt leicht, dass ≤ eine partielle Ordnung auf B mit kleinsten Element 0
und größtem Element 1 ist. Für alle Elemente a,b einer Booleschen Algebra gilt:
a ≤ b gdw a + b = b gdw a ⇒ b = 1.
Die partielle Ordnung P = 〈B − { 0 }, ≤〉 der positiven Elemente von B ist separa-
tiv, denn für alle a, b P P mit non(a ≤ b) ist a − b ≤ a und inkompatibel mit b in P.
Übung
Sei B eine Boolesche Algebra. Dann gilt für alle a, b, c, d P B:
(i) a + b ist das Supremum von a und b in 〈B, ≤〉
(ii) a ⋅ b ist das Infimum von a und b in 〈B, ≤〉
(iii) a ≤ b und c ≤ d impliziert a + c ≤ b + d und a ⋅ c ≤ b ⋅ d
(iv) a ≤ b impliziert − b ≤ − a
Diese Begriffe sind wie üblich definiert. Wir geben die Definitionen der Voll-
ständigkeit halber an.
Definition (Unteralgebra, A ⊆ B)
Seien A, B Boolesche Algebren. A heißt eine Unteralgebra von B, in Zeichen
A ⊆ B, falls gilt:
(i) Der Träger von A ist eine Teilmenge des Trägers von B.
(ii) Die Operationen von A sind die Einschränkungen der Operationen
von B, d. h. es gilt
+A = +B |A2 , ⋅A = ⋅B |A2 , − A = −B |A,
(iii) 0A = 0B , 1A = 1B .
Für Boolesche Algebren liest sich der mengentheoretische Filter und Idealbe-
griff wie folgt:
Ist B = 〈P(M), ∪, ∩, −, ∅, M〉, so fallen die neuen Begriffe mit den alten zusam-
men (wobei man hier auch oft von Filtern und Idealen auf M spricht anstatt auf
P(M)). Diese Mengenalgebren betrachten wir gleich noch genauer.
Für alle a P B − { 1 } ist Ia = { b P B | b ≤ a } ein Ideal auf B und entsprechend ist
Fa = { b P B | a ≤ b } für alle a P B − { 1 } ein Filter auf B.
Ist I ein Ideal auf B, so definieren wir für alle a, b P B:
a ,I b, falls a ∆ b = (a − b) + (b − a) P I.
Auf C = B/,I können wir nun Boolesche Operationen einführen. Wir schreiben
, für ,I und setzen für alle a/, und b/, P C:
a/, + b/, = (a + b)/,
a/, ⋅ b/, = (a ⋅ b)/,
− a/, = (− a)/,
0 = 0/,, 1 = 1/,
Es ist leicht zu zeigen, dass diese Operationen wohldefiniert sind, und dass C un-
ter ihnen zu einer Booleschen Algebra wird.
Definition (Quotientenalgebra)
Für ein Ideal I auf B heißt C = B/,I die Quotientenalgebra von B modulo I.
Die Abbildung f : B → B/I mit f(a) = a/, ist ein Homomorphismus. Ist um-
gekehrt f : B → C ein Homomorphismus zwischen zwei Booleschen Algebren,
so ist der Kern von f, also
I = { a P B | f(a) = 0 },
ein Ideal auf B. Ist der Homomorphismus f : B → C surjektiv, so ist C isomorph
zur Quotientenalgebra B/I.
Der Satz von Tarski über die Existenz von Ultrafiltern gilt auch im Kontext
von Booleschen Algebren:
Der Satz kann wie für Ultrafilter auf Mengen entweder mit einem
Maximalitätsprinzip oder mit transfiniter Induktion bewiesen werden. Den Zu-
satz erhält man durch Fortsetzung des Filters Fa − b = { cP B | a − b ≤ c } zu einem
Ultrafilter U auf B.
Mengenalgebren
Definition (Mengenalgebra)
Eine Boolesche Algebra B heißt die volle Mengenalgebra auf einer Menge M,
falls B = 〈P(M), ∪, ∩, −, ∅, M〉.
Eine Boolesche Algebra A heißt eine Mengenalgebra auf M, falls A eine
Subalgebra der vollen Mengenalgebra auf M ist.
a b a +2 b a ⋅2 b a −2 a
0 0 0 0 0 1
0 1 1 0 1 0
1 0 1 0
1 1 1 1
Offenbar ist 2 die kleinste Boolesche Algebra, d.h. es gilt 2 d B für jede Boole-
sche Algebra B.
Die Mengenalgebren schöpfen nun im folgenden Sinne bereits alle Boole-
schen Algebren aus:
Beweis
Wir definieren f : B → P(P(B)) durch:
f(b) = { U | U ⊆ B ist ein Ultrafilter auf B mit b P U } für alle b P B.
Sei A = rng(f ) = { f(b) | b P B }. Dann ist f : B → A surjektiv. Weiter ist
f injektiv. Denn seien a, b P B mit a ≠ b. Ohne Einschränkung gilt non(a ≤
b) (sonst vertauschen wir a und b). Nach dem Satz von Tarski existiert ein
Ultrafilter U auf B mit a P U und b ¸ U. Also ist f(a) ≠ f(b). Man rechnet
nun leicht nach, dass A eine Mengenalgebra auf P(B) ist, und dass die
bijektive Funktion f : B → A ein Isomorphismus ist.
Übung
Führen Sie die Details des Beweises aus.
Wie oben schon erwähnt übertragen sich aufgrund dieses Satzes alle Rechen-
gesetze für Mengen auf Boolesche Algebren (und umgekehrt). Definieren wir
z. B. die symmetrische Differenz in Booleschen Algebren wie oben bei der Bil-
dung der Quotientenalgebra durch a ∆ b = (a − b) + (b − a), so wissen wir automa-
tisch, dass a ∆ (b ∆ c) = (a ∆ b) ∆ c gilt, denn diese Assoziativität gilt für die meng-
entheoretische symmetrische Differenz a ∆ b = (a − b) ∪ (b − a).
Wir diskutieren nun noch zwei Typen von Booleschen Algebren, nämlich die
sog. Intervallalgebren über linearen Ordnungen und die durch die mathemati-
sche Logik motivierten Lindenbaum-Tarski-Algebren.
Jede lineare Ordnung führt zu einer Booleschen Algebra durch die Betrach-
tung von halb offenen Intervallen. Ist 〈M, <〉 eine lineare Ordnung, so setzen wir
für alle x, y P M:
[x, y[ = { zPM | x ≤ z < y }
[x, ∞[ = { zPM | x < z }
]− ∞, y[ = { z P M | z < y }
]− ∞, ∞[ = M
Alle und nur diese Intervalle von M gelten für das Folgende als die (nach rechts)
halb offenen Intervalle in 〈M, <〉.
Definition (Intervallalgebra)
Sei 〈M, <〉 eine lineare Ordnung. Wir setzen:
B = { Í E | E ist eine endliche Menge von halboffenen Intervallen in 〈M, <〉 }
Die Mengenalgebra 〈B, ∪, ∩, −, 0, M〉 heißt die Intervallalgebra der
Ordnung 〈M, <〉.
Die Ordnung der rationalen Zahlen 〈Q, <〉 ist bis auf Ordnungsisomorphie
die einzige abzählbare, dichte und unbeschränkte lineare Ordnung. Für die zu-
gehörige Intervallordnung gilt die folgende Charakterisierung:
Übung
Sei B eine abzählbare atomfreie Boolesche Algebra. Dann ist B isomorph
zur Intervallordnung von 〈Q, <〉.
Wir diskutieren schließlich noch ein Beispiel aus der mathematischen Logik.
Hier werden die Booleschen Operationen durch ∨, ∧, ¬ interpretiert.
Sei T eine widerspruchsfreie Theorie in der Sprache L. Zwei L-Formeln
ϕ, ψ heißen T-äquivalent, in Zeichen ϕ , ψ, falls gilt:
T ⊢ ϕ ↔ ψ.
Man überprüft ohne Schwierigkeiten, dass , eine Äquivalenzrelation auf der
Menge FormL aller L-Formeln ist.
Auf der Faktorisierung der Formeln nach , können wir eine Boolesche Alge-
bra definieren. Wir setzen hierzu
BT = FormL /,,
ϕ/, + ψ/, = (ϕ ∨ ψ)/,, ϕ/, ⋅ ψ/, = (ϕ ∧ ψ)/,,
− ϕ/, = (¬ ϕ)/,, 0 = ⊥/,, 1 = (¬ ⊥)/,,
wobei das Falsum ⊥ entweder in die Sprache integriert oder ansonsten eine belie-
bige falsche Aussage ist wie z. B. ∃x x ≠ x. Der Leser möge beweisen, dass BT mit
diesen Operationen tatsächlich eine Boolesche Algebra ist. Die Widerspruchs-
freiheit von T brauchen wir dabei für 0 ≠ 1.
Definition (Lindenbaum-Tarski-Algebra)
Sei T eine widerspruchsfreie L-Theorie. Dann heißt BT die Lindenbaum-
Tarski-Algebra über T.
Man kann zeigen, dass jede Boolesche Algebra isomorph zu einer Linden-
baum-Tarski-Algebra ist. Damit sind diese nichtmengentheoretischen Algebren
universelle Beispiele für Boolesche Algebren.
Definition (κ-vollständig, ∑ A, ∏ A)
Sei B eine Boolesche Algebra, und sei κ ≥ ω eine Kardinalzahl.
(i) B heißt κ-vollständig, falls jede Teilmenge A von B mit |A| < κ ein
Supremum bzgl. der Ordnung ≤ auf B besitzt.
(ii) B heißt vollständig, falls B κ-vollständig für alle κ ist.
(iii) B heißt σ-vollständig, falls B ω1 -vollständig ist.
Ist A ⊆ B, so setzen wir im Falle der Existenz:
∑ A = ∑ aPA a = „das Supremum von A in B bzgl. ≤“,
∏ A = ∏ aPA a = − ∑ { − a | a P A }.
Boolesche Algebren können wir nach der Methode von Dedekind durch eine
verallgemeinerte ordnungstheoretische Schnittkonstruktion vervollständigen.
Hierbei steht die separative partielle Ordnung 〈B − { 0 }, <〉 im Vordergrund. Es
zeigt sich, dass wir ausgehend von einer beliebigen separativen partiellen Ord-
nung ohne Verwendung von Booleschen Operationen in natürlicher Weise eine
vollständige Boolesche Algebra konstruieren können, in die die partielle Ord-
nung dicht eingebettet ist. Diese Tatsache verbindet die auf partiellen Ordnun-
gen gegründete Forcing-Theorie mit der Forcing-Theorie über Booleschen Al-
gebren. Wir stellen die Konstruktion deswegen allgemein für separative partielle
Ordnungen 〈P, <〉 vor. Die Vervollständigung einer Booleschen Algebra B ist als
Spezialfall 〈P, <〉 = 〈B − { 0 }, <〉 enthalten.
In linearen Ordnungen 〈M, <〉 haben Schnitte die Form (L, R) mit einem „lin-
ken“ Teil L und einem rechten Teil R: L ∪ R = M, L ∩ R = ∅, x < y für alle x P L
und y P R. Da R = M − L gilt, können wir das Intervall L selbst als Schnitt anse-
hen. Dann ist ein Schnitt L ordnungstheoretisch offen in M, denn für alle x P L
und alle y P M mit y ≤ x ist y P L. Zur Vervollständigung von M verwenden wir
aber nicht jede offene Menge in M. In Q z. B. verwenden wir L = { q P Q | q ≤ 0
}, nicht aber die offene Menge L − { 0 }, da wir sonst einen unerwünschten Sprung
in der durch Inklusion geordneten Vervollständigung erhalten würden. Die „gu-
ten“ offenen Mengen in partiellen Ordnungen sind nun die wie folgt definierten
Schnitte in P, und nur sie werden wir zur Vervollständigung heranziehen.
Die Mengen Up sind aufgrund der Separativität der Ordnung Schnitte. Für
alle Schnitte U in P und alle p P P gilt: Ist Up − { p } ⊆ U, so ist p P U. Diese Be-
dingung garantiert aber noch nicht, dass ein offenes U ein Schnitt in P ist (!).
Eine nützliche äquivalente Schnittbedingung für offene Teilmengen U von P
ist die Kontraposition von (+):
(+)′ Für alle p ¸ U existiert ein q ≤ p mit U ∩ Uq = ∅.
Sind U, V Schnitte in P, so ist auch U ∩ V ein Schnitt. Allgemeiner ist > 6 ein
Schnitt für eine beliebige Menge 6 von Schnitten. Andererseits sind i.A. die Ver-
einigung U ∪ V zweier Schnitte und das Komplement P − U eines Schnittes kein
Schnitt mehr. Um Boolesche Operationen auf den Schnitten einführen zu kön-
nen, brauchen wir also noch weitere Konstruktionen.
Betrachten wir die Mengen Up , p P P, als die offenen Basismengen eines topo-
logischen Raumes 〈P, 8〉, so sind int und cl die üblichen topologischen Opera-
tionen auf diesem Raum. Also gilt
int(X) = P − cl(P − X)
cl(X) = P − int(P − X)
Beispiel
Der Leser betrachte die offene Einheitskreisscheibe K im R2 und die
punktierte Scheibe K − { 0 }. Beide Mengen sind offen, aber K − { 0 } ist
nicht regulär offen. Es gilt int(cl(K − { 0 })) = K. Anschaulich gilt:
Die Operation int(cl(⋅)) „übermalt Punktierungen“.
Aus den Definitionen des Schnitts und der Operationen des Abschlusses und
des Inneren ergibt sich folgende Äquivalenz (Beweis als Übung):
Die Schnitte einer separativen partiellen Ordnung können wir nun mit Boole-
schen Operationen versehen. Im Folgenden sind alle partiellen Ordnungen stets
nichtleer.
Hierbei steht „r. o.“ für regulär offen. Die Algebra besteht ja aus den regulär
offenen Mengen der von den Mengen Up erzeugten Topologie auf P.
Übung
Für alle U, V P r. o.(P) gelten die folgenden Darstellungen:
U + V = { p P P | für alle q ≤ p ist X ∩ Uq ≠ ∅ }
−U = { p P P | U ∩ Up = ∅ }
Satz
Sei P separativ, und sei B = r. o.(P). Weiter sei f : P → B definiert durch
f(p) = Up für alle p P P. Dann gilt:
(i) B ist eine vollständige Boolesche Algebra.
(ii) f ist injektiv und ordnungserhaltend.
(iii) rng(f ) ist dicht in 〈B − { 0 }, <〉.
(iv) Ist 〈P, <〉 = 〈A − { 0 }, <〉 für eine Boolesche Algebra A, so ist
f ∪ { (0A , ∅) } eine Einbettung von A in B.
Für nicht separative partielle Ordnungen bilden wir zuerst einen separativen
Quotienten und anschließend die Boolesche Algebra der regulären Schnitte.
Wir definieren:
Übung
, ist eine Äquivalenzrelation auf P, ≤ ist wohldefiniert auf P/, und
〈P/,, <〉 ist eine separative partielle Ordnung. Weiter gilt für alle p, q P P:
p/, ≤ q/, gdw für alle r ≤ p gilt r || q.
Ist p ≤ q, so ist p/, ≤ q/,. Gilt p/, ≤ q/,, so existieren aber i.A. keine p′,q′ mit
p′ , p, q′ , q und p′ ≤ q′. Weiter kann p/, = { p } für alle p gelten, ohne dass P se-
parativ wäre. Ein Gegenbeispiel ist im folgenden Diagramm angedeutet. Die
Elemente p, q zeigen, dass die Ordnung P nicht separativ ist. Für alle r P P gilt
r/, = { r } und schließlich ist p/, < q/, im separativen Quotienten.
p q
r1 r2 r3
In den folgenden Übungen ist 〈P, <〉 eine partielle Ordnung in einem abzähl-
baren transitiven Modell M von ZFC (sodass die Forcing-Relation definiert ist).
Übung
Zeigen Sie, dass die folgenden Aussagen äquivalent sind:
(i) 〈P, <〉 ist separativ.
(ii) Für alle p, q P P gilt: p ≤ q gdw p ||− q̂ P G˚.
Übung
Zeigen Sie, dass für alle p, q P P gilt:
(i) p/, ≤ q/, gdw p ||− q̂ P G˚.
(ii) p , q gdw p ||− q̂ P G˚ und q ||− p̂ P G˚.
Ist 〈P/,, <〉 der separative Quotient von 〈P, <〉, so gilt für alle p, q P P:
(i) p ≤ q impliziert p/, ≤ q/,
(ii) p || q gdw p/, || q/,
Damit können wir nun jede partielle Ordnung in eine vollständige Boolesche
Algebra verwandeln und dabei die für die Erzwingungsmethode benötigten
Struktureigenschaften erhalten:
Bemerkung
Die Bezeichnung der Funktion als „Einbettung“ ist üblich, obwohl die
Funktion e i. A. nicht injektiv ist. Sie ist injektiv, falls P separativ ist. In
diesem Fall können wir auch P mit P/, identifizieren, wenn wir wollen.
Dann ist e(p) = Up für alle p P P.
Übung
(i) Ist G ein M-generischer Filter auf P, so ist H = { p/, | p P G } ein
M-generischer Filter auf P/,.
(ii) Ist H ein M-generischer Filter auf P/,, so ist G = { p | p/, P H }
ein M-generischer Filter auf P.
Allgemein gilt weiter, dass eine dichte Teilordnung generische Filter ererbt
und erzeugt. Sei Q eine Bedingungsmenge und sei E ⊆ Q dicht in Q. Ist G ein M-
generischer Filter auf Q, so ist G ∩ E ein M-generischer Filter auf 〈E, <〉. Ist um-
gekehrt H ein M-generischer Filter auf E, so ist
G = { q P Q | es gibt ein h P H mit h ≤ q }
ein M-generischer Filter auf Q. Nach Minimalität der Forcing-Erweiterung gilt
weiter, dass M[ G ] = M[ H ]. In diesem Sinne ist das Forcing mit Q äquivalent
zum Forcing mit der dichten Teilordnung E.
Da der separative Quotient P/, dicht in B+ = r. o. (B) − { 0 } eingebettet ist, er-
halten wir zusammen mit obiger Übung:
Damit ist das Forcing über partiellen Ordnungen und das Forcing über voll-
ständigen Booleschen Algebren gleichwertig.
Mit unseren Ergebnissen kann man zeigen, dass viele Bedingungsmengen
äquivalent aus der Sicht der Erzwingungsmethode sind. Nach obiger Übung exi-
stiert bis auf Isomorphie nur eine abzählbare atomfreie Boolesche Algebra, und
damit sind dann auch je zwei atomfreie vollständige Boolesche Algebren, die eine
abzählbare dichte Teilmenge besitzen, isomorph. Ist P eine abzählbare Bedin-
gungsmenge derart, dass für alle p P P inkompatible p1 , p2 < p existieren, so ist
r. o.(P/,) diese bis auf Isomorphie eindeutige atomfreie vollständige Boolesche
Algebra mit einer abzählbaren dichten Teilmenge. Damit produzieren je zwei
abzählbare Bedingungsmengen mit dieser Verzweigungseigenschaft dieselben
generischen Erweiterungen eines Grundmodells. Die kanonische derartige Be-
dingungsmenge ist das Cohen-Forcing 〈< ω ω, ⊃〉, und die generischen Erweite-
rungen sind hier von der Form M[ x ] für eine reelle Zahl x. Ist also P irgendeine
abzählbar verzweigende Bedingungsmenge und G ein M-generischer Filter, so
existiert eine Cohensche reelle Zahl x mit M[ G ] = M[ x ].
Beweis
(a) Â (b): G ist ein Filter auf B. Sei a P B beliebig. Dann ist
D = { b P B + | b ≤ a oder b ≤ − a }
dicht in B + und ein Element von M. Sei also b P G ∩ D. Ist b ≤ a, so ist
a P G. Ist b ≤ − a, so ist − a P G. Damit ist G ein Ultrafilter auf B.
Sei nun X ⊆ G mit X P M. Sei c = ∏ X. Dann ist
D = { b P B+ | b ≤ c } ∪ { b P B+ | es gibt ein a P X mit b ⊥ a }
dicht in B+ und ein Element von M. Sei also b P D ∩ G. Wegen G Filter
ist dann b ≤ c, und damit c P G.
(b) Â (a): Als Ultrafilter G auf B ist G ein Filter auf der Bedingungsmenge
B+ . Sei also D P M eine dichte Teilmenge von B+ . Annahme, G ∩ D = ∅.
Sei X = { − a | a P D }. Dann ist X P M und X ⊆ G, da G Ultrafilter.
Sei c = ∏ X. Nach Voraussetzung ist c P G. Aber für alle a P D ist
c ≤ − a, also c ⋅ a = 0. Wegen D dicht in B+ ist dann aber c ⋅ b = 0 für alle
b P B+ und damit c = 0, im Widerspruch zu c P G.
(b) Â (c) und (c) Â (b): Übung.
Boolesche Modelle
Wir identifizieren oft ein Boolesches Modell mit seinem Universum. Die
Sprache Boolescher Modelle besteht aus zwei Relationssymbolen P und =, die in
Booleschen Modellen dieser Sprache prinzipiell beliebig interpretiert werden
können. Lediglich die Forderungen (i) − (v) müssen erfüllt sein.
Wir nennen || a = b || auch den Wahrheitswert der Gleichheit von a und b,
und || a P b || den Wahrheitswert der Elementbeziehung zwischen a und b. Die
Forderungen (i) − (v) reflektieren die Gleichheitsaxiome der Logik. Sie fordern,
dass die Gleichheit eine Äquivalenzrelation ist ((i) − (iii)), die die P-Relation re-
spektiert ((iv) − (v)).
Lesen wir 1 als „wahr“, „sicher“ oder „unbedingt gültig“ und die Multiplika-
tion als ∧, und erinnern wir uns weiter daran, dass a ≤ b genau dann gilt, wenn
a ⇒ b = 1, so liest sich die dritte Forderung z. B. als
„ || a = b || ∧ || b = c || ⇒ || a = c || ist sicher gültig für alle a, b, c P A“.
Die Wahrheitswerte || a = b || und || aPb || können wir für die vollständige
Boolesche Algebra 2 = { 0, 1 } mit „falsch“ und „wahr“ identifizieren, und in die-
sem Sinne sind die üblichen Modelle 〈A, P〉 = 〈A, =, P〉 spezielle 2-Modelle. Wir
gehen unten hierauf noch genauer ein.
Als Nächstes definieren wir den Wahrheitswert einer Formel, die über be-
stimmte Elemente des Universums spricht. Dieser Wahrheitswert ist ein Ele-
ment der zugrunde liegenden Booleschen Algebra. Er errechnet sich rekursiv aus
den Wahrheitswerten für die Gleichheit und die Elementbeziehung.
Es ist leicht zu sehen, dass die Definition der E-Relation nicht von der Wahl
der Repräsentanten abhängt. Zur weiteren Untersuchung der Faktorisierung be-
trachten wir eine für sich interessante und natürliche Reichhaltigkeitseigen-
schaft von Booleschen Modellen.
Wir definieren nun einen speziellen Typ von „guten“ Booleschen Modellen.
Alle konstruierten Modelle werden diesem Typ angehören.
Die Maximalität von A hat zur Folge, dass die Gültigkeit im faktorisierten Mo-
dell durch den Ultrafilter kontrolliert wird:
Der einfache Beweis durch Induktion über den Formelaufbau sei dem Leser
zur Übung überlassen. Die Maximalität des B-Modells wird dabei im Quantor-
schritt verwendet.
Beweis
Andernfalls gilt ∑ ⊢ ¬ ψ. Dann gilt aber || ¬ ψ || = 1, und damit
|| ψ || = − || ¬ ψ || = 0,
Widerspruch.
Damit steht uns eine neue Welt offen, in der wir die Grenzen von ZFC erkun-
den können. Wir arbeiten in ZFC. Für eine beliebige vollständige Boolesche Al-
gebra B definieren wir nun ein Boolesches Modell A und zeigen, dass in A alle
ZFC-Axiome gelten. Dann ist jede Aussage ϕ, die in A einen Wahrheitswert un-
gleich 0 besitzt, relativ konsistent zu ZFC. Die Konsistenzfragen über generi-
sche Filter entfallen. Ebenso müssen keine transitiven Mengenmodelle mehr
verwendet werden, denn die Booleschen Modelle erben die Vorteile der Klassen-
modelle.
Da wir maximale B-Modelle konstruieren werden, können wir durch Fakto-
risierung mit Hilfe von Ultrafiltern zu üblichen Modellen zurückkehren, wenn
wir möchten. Ist A ein maximales B-Modell von ZFC und gilt a = || ϕ || ≠ 0, so
ist die Faktorisierung A/U ein Modell von ZFC + ϕ für jeden Ultrafilter U auf
B mit a P U. Der Korrektheitssatz für Boolesche Modelle wird dann für relative
Konsistenzargumente gar nicht benötigt.
Wir haben gesehen, dass Bedingungsmengen zu vollständigen Booleschen Al-
gebren aufgewertet werden können, und damit wissen wir bereits, welche Boole-
schen Algebren für welche metamathematischen Ziele in Frage kommen. Wie
erwartet lässt sich dann z.B. die vollständige Boolesche Algebra der Bedingungs-
menge part(ω × ω2 , 2) dazu verwenden, um ein B-Modell zu konstruieren, in wel-
chem 2ω = ω 2 den Wahrheitswert 1 besitzt. Ein Wahrheitswert ungleich 0 würde
für einen relativen Konsistenzbeweis bereits genügen.
Nach dieser Aufstellung des Booleschen Rahmens wollen wir nun maximale
B-wertige Klassenmodelle konstruieren.
Man zeigt durch Induktion, dass VBα ⊆ VBα + 1 für alle Ordinalzahlen α gilt. Die
Hierarchie ist weiter strikt aufsteigend, da |VBα + 1 | ≥ |P(VBα )| > |VBα |.
Wir definieren nun die Wahrheitsfunktionen für die Gleichheit und die Ele-
mentbeziehung für das Universum VB und zeigen, dass wir dadurch ein Boole-
sches Modell erhalten. Die folgenden Zeilen bilden das Herz der Booleschen Er-
zwingungstheorie. Die Formeln für Epsilon und Identität präsentieren wir ohne
Umschweife und Motivation ad hoc, wie es für derartige Zauberformeln auch
sein darf. Nach kurzer Gewöhnungsphase lesen sie sich sehr natürlich und sind
dann entsprechend einfach zu merken und anzuwenden.
Die Rekursion kann z. B. über (rang(u), rang(v)) P On2 unter der durch die
Paarungsfunktion Γ gegebenen Wohlordnung von On2 verlaufen. Wir verwen-
den im Folgenden geeignete zugrunde liegende Wohlordnungen von On2 , On3 ,
usw. ohne weiteren Kommentar.
Wir verwenden ∏ ∅ = 1 und ∑ ∅ = 0, sodass sich speziell ergibt:
|| ∅ = ∅ || = 1, || u P ∅ || = 0, || ∅ ⊆ u || = 1,
|| u ⊆ ∅ || = ∏ t P dom(u) − u(t).
Für alle u P VB und alle t P dom(u) ist u(t) eine erste Approximation für den
Wahrheitswert von „t ist ein Element von u“. Der intendierte Wahrheitswert
kann aber größer sein als u(t), denn es kann t′ P dom(u) geben, die einen großen
Wahrheitswert für „t ist gleich t′“ und einen großen Wert u(t′) aufweisen. Diese
Überlegungen motivieren das Supremum in der Definition der Elementrelation.
Die Definition der Wahrheitswerte für die Teilbarkeitsrelation und folglich für
die Gleichheit ist dann nur konsequent.
Wir wollen nun zeigen, dass V B zusammen mit den obigen Wahrheitswert-
funktionen ein Boolesches Modell über B ist.
Beweis
zu (i):
Wir zeigen durch Induktion über u, dass || u ⊆ u || = 1 und damit
|| u = u || = 1 gilt. Für alle t P dom(u) gilt:
u(t) = u(t) ⋅ 1 = I.V. u(t) || t = t || ≤ ∑ s P dom(u) (u(s) || s = s || ) = || tPu ||
Damit erhalten wir:
|| u ⊆ u || = ∏ tPdom(u) (u(t) ⇒ || t P u || ) = ∏ t P dom(u) 1 = 1.
zu (ii):
Klar nach Definition von || u = v || und der Kommutativität der
Multiplikation in B.
Wir zeigen die Aussagen (iii) − (v) simultan durch Induktion über u, v, w.
zu (iii):
Es genügt zu zeigen:
|| u ⊆ v || ⋅ || v = w || ≤ || u ⊆ w || .
Hierzu wiederum genügt es zu zeigen, dass für alle t P dom(u) gilt:
(+) (u(t) ⇒ || tPv || ) ⋅ || v = w || ≤ u(t) ⇒ || tPw || .
Nach I.V. ist aber || tPv || ⋅ || v = w || ≤ || t P w || , und hieraus folgt
die Aussage (+).
zu (iv):
Zu zeigen ist:
|| u = v || ⋅ ∑ tPdom(w) (w(t) ⋅ || t = v || ) ≤ ∑ tPdom(w) (w(t) ⋅ || t = u || ).
Nach I.V. ist aber || u = v || ⋅ || t = v || ≤ || t = u || für alle t Pdom(w),
und hieraus folgt die Behauptung.
zu (v):
Es genügt zu zeigen:
(+) || v ⊆ u || ⋅ ∑ tPdom(v) (v(t) ⋅ || t = w || ) ≤ || w Pu || .
Aber für alle t P dom(v) ist
|| v ⊆ u || ⋅ v(t) ≤ Def. ⊆ (v(t) ⇒ || t P u || ) ⋅ v(t) ≤ || t Pu || ,
also
|| v ⊆ u || ⋅ v(t) ⋅ || t = w || ≤ || tPu || ⋅ || t = w || ≤ I.V. || wPu || .
Hieraus folgt (+).
Damit sind für alle Formeln ϕ(x1 , …, xn ) und alle u1 , …, un P VB die Wahr-
heitswerte || ϕ(u1 , …, un ) || P B definiert.
Übung
Zeigen Sie, dass für alle ϕ(x, x1 , …, xn ) und alle v, u, u1 , …, un P VB gilt:
|| u = v || ∧ || ϕ(u, u1 , …, un ) || ≤ || ϕ(v, u1 , …, un ) || .
[ Entweder mit Korrektheitssatz oder durch Induktion über den Aufbau von ϕ. ]
Beweis
Die Aussage (ii) folgt aus (i) und den Regeln für die Negation. Zum Beweis
von (i) unterdrücken wir Parameter. Die Formeln ϕ(t) und ∃u. u = t ∧ ϕ(u)
sind logisch äquivalent und haben daher denselben Wahrheitswert. Mit den
Distributivgesetzen folgt dann:
∑ tPdom(v) v(t) ⋅ || ϕ(t) || = ∑ tPdom(v) v(t) ⋅ || ∃u. u = t ∧ ϕ(u) ||
= ∑ tPdom(v) v(t) ⋅ (∑ uPV B || u = t || ⋅ || ϕ(u) || )
= ∑ uPV B (∑ tPdom(v) v(t) ⋅ || u = t || ) ⋅ || ϕ(u) ||
= ∑ uPV B || uPv || ⋅ || ϕ(u) ||
= || ∃u. u P v ∧ ϕ(u) ||
= || ∃uPv ϕ(u) ||
Übung
Für alle Formeln ϕ(x) und alle u, v P VB gilt:
(i) || ∃uPv ϕ(u) || = ∑ uPdom(v) ( || uPv || ⋅ || ϕ(u) || )
(ii) || ∀uPv ϕ(u) || = ∏ uPdom(v) ( || uPv || ⇒ || ϕ(u) || )
Eigenschaften von VB
Wir wollen nun zeigen, dass VB ein Modell von ZFC ist. Vorab beweisen wir
noch einige für sich interessante Ergebnisse über das Modell VB , die die Kon-
struktion des Modells und die Definitionen der Wahrheitswerte für die Gleich-
heit und Elementbeziehung illustrieren. Einige davon werden darüber hinaus
auch nützlich beim Beweis des Modellsatzes sein.
Als erstes wollen wir das Boolesche Analogon zum Maximalitätsprinzip oder
Fullness-Lemma zeigen. Hierzu betrachten wir die folgenden „Mischungen“:
Beweis
Wegen ai ⋅ aj = 0 für alle i ≠ j in I gilt für alle i P I und t P dom(u):
ai ⋅ u(t) = ai ⋅ ui (t),
sodass
ai ⋅ (ui (t) − u(t)) = 0 und ai ⋅ (u(t) − ui (t)) = 0.
Damit erhalten wir
ai ≤ (ui (t) ⇒ u(t)) und ai ≤ (u(t) ⇒ ui (t)).
Hieraus folgt
ai ≤ || ui ⊆ u || ⋅ || u ⊆ ui || = || u = u i || für alle i P I.
Korollar
Seien a P B, v P VB , und sei u = a p v, d. h. dom(u) = dom(v) und
u(t) = a ⋅ v(t) für alle t P dom(u).
Dann gilt a ≤ || u = v || .
Übung
Sei u = ∑ i P I ai p ui . Wir definieren u′ durch dom(u′) = dom(u) und
u′(t) = ∑ iPI a i ⋅ || tPui || für alle t P dom(u′).
Zeigen Sie, dass || u = u′ || = 1.
Übung
Sei 〈ai | i P I〉 eine maximale Antikette in B − { 0 }, und sei u = ∑ i P I ai p ui .
Weiter sei u′ ein Element von VB mit ai ≤ || u′ = u || für alle iPI. Zeigen Sie,
dass || u = u′ || = 1.
Beweis
Sei also ϕ(x, x1 , …, xn ) eine Formel, und seien u1 , …, un P VB . Wir finden
ein u* P VB mit:
|| ∃u ϕ(u, u1 , …, un ) || = || ϕ(u*, u1 , …, un ) || .
Sei hierzu a* = || ∃u ϕ(u, u1 , …, un ) || . Wir setzen:
D = { aPB − { 0 } | a ≤ || ϕ(u, u1 , …, un ) || für ein u P V B }.
Dann ist D offen dicht unterhalb von a in B − { 0 } und es gilt a* = ∑ D.
Sei 〈ai | i P I〉 eine maximale Antikette in D. Dann gilt weiterhin a* = ∑ A.
Für alle i P I sei nun (mit (AC)):
ui = „ein uPV B mit a i ≤ || ϕ(u, u1 , …, un ) || “.
Sei u* = ∑ i P I ai p ui . Nach dem Mischungslemma gilt dann
ai ≤ || u* = ui || für alle i P I.
Dann ist aber ai ≤ || ϕ(u*, u1 , …, un ) || für alle i P I und damit ist
a* = ∑ A ≤ || ϕ(u*, u1 , …, un ) || ≤ || ∃u ϕ(u, u1 , …, un ) || = a*.
Wie oben diskutiert können wir also das Modell VB mit Hilfe von Ultrafiltern
faktorisieren.
Übung
Es gelte || ∃u ϕ(u) || = 1. Sei v P VB beliebig. Zeigen Sie, dass ein u P VB
existiert mit || ϕ(u) || = 1 und || ϕ(v) || = || u = v || .
[Sei u*PVB mit || ϕ(u*) || = 1. Sei a = || ϕ(v) || . Wir betrachten die Mischung
u = a p v + (− a) p u*. ]
Wir erhalten damit folgende Regel für die universelle Gültigkeit einer Impli-
kation mit gültig bezeugter Prämisse in VB :
Übung
Seien ϕ(x), ψ(x) Formeln, und es gelte || ∃u ϕ(u) || = 1. Dann sind die
folgenden Aussagen äquivalent:
(i) Für alle uPVB gilt: || ϕ(u) || = 1 impliziert || ψ(u) || = 1.
(ii) || ∀u. ϕ(u) → ψ(u) || = 1.
Die folgende Konstruktion ist uns aus der Forcing-Theorie für partielle Ord-
nungen schon bekannt:
Es gilt also dom(x̂) = { ŷ | yPx } . Für alle yPx gilt || ŷ P x̂ || = 1, und für belie-
bige u P VB rechnen wir:
|| u P x̂ || = ∑ tPdom(x̂) x(t) ⋅ || u = t ||
= ∑ yPx x(ŷ) ⋅ || u = ŷ ||
= ∑ yPx || u = ŷ || .
Weitere elementare Eigenschaften der Konstruktion sind:
Der Beweis kann dem Leser zur Übung überlassen bleiben. Die Aussagen (iii)
und (iv) können simultan durch Induktion gezeigt werden.
Übung
Zeigen Sie: Für alle uPV 2 ⊆ VB gibt es genau ein xPV mit || u = x̂ || = 1.
[ Wir zeigen die Aussage durch Induktion nach u P V 2 . Im I. S. u setzen wir
x = { yPV | es gibt ein tPdom(u) mit u(t) = 1 und || t = ŷ || = 1 }.
Eine Rechnung zeigt, dass wie gewünscht || u = x̂ || = 1.]
Identifizieren wir x mit x̂, so können wir V als Teilklasse von VB auffassen. Wie
zu erwarten sind dann beschränkte Formeln absolut und ∑ 1 -Formeln aufwärts
absolut:
Beweis
Der Beweis von (i) erfolgt durch Induktion über den Aufbau von ϕ. Die
Aussage (ii) folgt unmittelbar aus (i).
Wie für die partiellen Ordnungen definieren wir schließlich ein spezielles Ele-
ment G˚ :
Definition (G˚ )
Wir definieren G˚ P VB durch:
G˚ = { (â, a) | a P B }.
Vollständige Unteralgebren
Die Aussagen zeigt man simultan durch Induktion. Eine Induktion über den
Formelaufbau liefert dann:
Ist ϕ(x1 , …, xn ) eine ∑ 0 -Formel, so gilt für alle u1 , …, un P VC :
|| ϕ(u1 , …, un || C = || ϕ(u1 , …, un || B .
Der Leser vergleiche dieses Ergebnis mit obiger Diskussion: Die Boolesche Al-
gebra 2 ist eine vollständige Teilalgebra von B.
V B erfüllt ZFC
Wir zeigen nun, dass in VB alle ZFC-Axiome den Wahrheitswert 1 haben. Der
Leser vergleiche die Argumente mit dem Satz „M[ G ] |= ZFC“.
Satz
VB ist ein Modell von ZFC.
Beweis
V B |= (Ext):
Für alle u, v P VB gilt:
|| ∀w. wPu → wPv || = || ∀wPu wPv ||
= ∏ w P dom(u) || wPv ||
≤ ∏ wPdom(u) (u(w) ⇒ || w Pv || )
= || u ⊆ v ||
Also ist
|| ∀w. wPu ↔ wPv || ≤ || u ⊆ v || ⋅ || v ⊆ u || = || u = v || ,
und damit
|| (∀w. wPu ↔ wPv) → u = v || = 1.
Dies genügt.
V B |= (LM):
Offenbar gilt || ∅ ist die leere Menge || = 1.
V B |= (Fun):
Sei uPVB , und sei a = || u verletzt Fundierung || , d. h.
a = || ∃v vPu || ⋅ || ∀vPu ∃wPv wPu || .
Annahme, a ≠ 0. Wegen a ≤ || ∃v vPu || = ∑ v P VB || vPu || gibt es ein
v*PVB mit minimalem Rang für die Eigenschaft „ a ⋅ || v* P u || ≠ ∅ “.
Aufgrund des zweiten Faktors in der Definition von a gilt
a ≤ || vPu → ∃wPv wPu || für alle v P VB ,
und speziell für v* gilt damit
a ⋅ || v*Pu || ≤ || ∃wPv* wPu || = ∑ w P dom(v*) || wPu || .
Also existiert ein wPdom(v*) mit „a ⋅ || w Pu || ≠ ∅ “, im Widerspruch
zur rangminimalen Wahl von v*.
V B |= (Un):
Nach Absolutheit gilt
|| ω̂ ist eine induktive Menge || = 1.
V B |= (Pa):
Seien u, v P VB , und sei w = { (u, 1), (v, 1) }. Dann gilt w P VB und
|| w = { u, v } || = 1.
V B |= (Aus):
Wir unterdrücken Parameter zur Verbesserung der Lesbarkeit. Sei also
ϕ(x) eine Formel, und sei u P VB . Wir setzen:
v = { (t, u(t) ⋅ || ϕ(t) || ) | t P dom(u) }.
Dann gilt vPVB und || v ⊆ u || = 1. Für alle w P VB gilt:
|| w P v || = ∑ tPdom(v) (v(t) ⋅ || t = w || )
= ∑ tPdom(u) (u(t) ⋅ || ϕ(t) || ⋅ || t = w || )
= ∑ tPdom(u) (u(t) ⋅ || ϕ(w) || ⋅ || t = w || )
= || ϕ(w) || ⋅ ∑ tPdom(u) (u(t) ⋅ || t = w || )
= || ϕ(w) || ⋅ || wPu ||
Also gilt || wPv ↔ wPu ∧ ϕ(w) || = 1 für alle w P VB , und damit
|| v = { wPu | ϕ(w) } || = 1.
V B |= (Ver):
Sei u P VB . Wegen der Gültigkeit des Aussonderungsschemas genügt es,
ein vPVB zu finden mit || Í u ⊆ v || = 1, d. h.
|| ∀wPu ∀tPw tPv || = 1.
Wir suchen also ein v P VB mit der Eigenschaft:
(+) || ∏ wPdom(u) (u(w) ⇒ ∏ tPdom(w) (w(t) ⇒ t P v)) || = 1.
Wir setzen hierzu:
v = { (t, 1) | t P Íw P u dom(w) } .
Dann gilt (+), da der Wahrheitswert von „t P v“ für alle in (+) betrachte-
ten t gleich 1 ist.
V B |= (Pot):
Sei u P VB . Es genügt wieder, ein v P VB zu finden, sodass
|| ∀w. w ⊆ u → wPv || = 1
d. h. es gilt
V B |= (Kol):
Wir unterdrücken wieder Parameter. Sei also ϕ(x, y) eine Formel.
Sei u P VB . Wir finden ein v P VB mit
|| ∀wPu. ∃z ϕ(w, z) → ∃zPv ϕ(w, z) || = 1,
d.h.
∑ zPVB || ϕ(w, z) || ≤ ∑ zPdom(v) || ϕ(w, z) || für alle w P dom(u).
Für alle w P dom(u) sei α(w) minimal mit
∑ zPVB || ϕ(w, z) || = ∑ z PVB ∩ Vα(w) || ϕ(w, z) || .
Sei a* = supw P dom(u) α(w). Wir definieren dann v P VB durch
v = { (t, 1) | t P VB ∩ Vα* }.
Dann ist v P VB wie gewünscht.
V B |= (AC):
Sei u P VB . Wir finden ein α P On und ein h P VB mit
(+) || h : α̂ → u surjektiv || = 1.
Übung
Sei u P VB mit u(t) = 1 für alle t P dom(u). Sei
v = { (w, 1) | w : dom(u) → B }.
Zeigen Sie, dass || v = P(u) || = 1.
Mengenlehre in V B
Ordinalzahlen in VB
Im Beweis oben haben wir bereits benutzt, dass || α̂POn || = 1 für alle Ordi-
nalzahlen α gilt. Diese sog. Standardordinalzahlen α̂ können wir einsetzen, um
den allgemeinen Ordinalzahlbegriff von VB zu verstehen. Zunächst gilt (Beweis
als Übung):
Satz (Ordinalzahlen in V B )
Für alle uPVB gilt: || uPOn || = ∑ αPOn || u = α̂ || .
Übung
Zeigen Sie, dass für alle Formeln ϕ(α) gilt:
(i) || ∃αPOn ϕ(α) || = ∑ αPOn || ϕ(α̂) ||
(ii) || ∀αPOn ϕ(α) || = ∏ αPOn || ϕ(α̂) ||
Übung
Sei 〈ai | i P I〉 eine maximale Antikette in B − { 0 }, und sei u = ∑ i P I ai p α̂i
mit Ordinalzahlen αi POn. Zeigen Sie, dass || uPOn || = 1.
Umgekehrt gilt:
Übung
Sei vPVB mit || vPOn || = 1. Zeigen Sie, dass ein u = ∑ i P I ai p α̂i wie in
obiger Übung existieren mit || v = u || = 1.
Konstruierbare Mengen in VB
Die obigen Resultate für die Ordinalzahlen gelten analog auch für die konstru-
ierbaren Mengen:
Beweis
„xPL“ ist eine ∑ 1 -Formel, und damit gilt || x̂PL || = 1 für alle x P L
nach Aufwärtsabsolutheit. Ebenso folgt aus „y = Lα “, dass || ŷ = L α̂ || = 1.
Für alle αPOn gilt also || (Lα )ˆ = L α̂ || = 1. Damit rechnen wir nun:
|| uPL || = || ∃αPOn uPLα ||
= ∑ αPOn || u P Lα̂ ||
= ∑ αPOn || uP(Lα )ˆ ||
= ∑ αPOn ∑ xPLα || u = x̂ ||
= ∑ xPL || u = x̂ ||
Kardinalzahlen in VB
Satz
(a) Ist |x| ≤ |y|, so gilt || |x̂| ≤ |ŷ| || = 1.
(b) Für alle κPOn gilt: || κ̂ PKard || impliziert κ P Kard.
(c) || ω̂ = ω || = 1.
(d) Für alle nPω ist || n̂PKard || = 1.
(e) || (ℵα ) ˆ ≤ ℵα̂ || .
Beweis
zu (a), (b), (c):
Die Konzepte |x| ≤ |y|, „κ ¸ Kard“, „α ist der kleinste Limes“ sind
Σ1 , also aufwärts absolut.
zu (d):
Es gilt || ∀uPω uPKard || = 1. Wegen || ω̂ = ω || = 1 ist also
∏ nPω || n̂PKard || = 1,
und damit || n̂PKard || = 1 für alle n P ω.
zu (e):
Übung
In der Forcing-Theorie für partielle Ordnungen hatten wir gesehen, dass die
abzählbare Antikettenbedingung den vollständigen Erhalt der Kardinalzahlen
und der Konfinalitäten garantiert. Für die Booleschen Modelle gilt analog:
Wir wollen nun die Erzwingungsmethode iteriert anwenden, indem wir generi-
sche Erweiterungen von generischen Erweiterungen bilden. Allgemein betrach-
ten wir transfinite Folgen von Modellen, in denen jedes Nachfolgermodell eine
generische Erweiterung seines Vorgängers ist, während jedes Limesmodell in
bestimmter Weise aus allen seinen Vorgängern amalgamiert wird. Unser Haupt-
ziel ist dabei die Konstruktion einer Forcing-Erweiterung eines Grundmodells,
in der die Suslin-Hypothese erfüllt ist.
Wir arbeiten wieder mit partiellen Ordnungen und abzählbaren transitiven
Grundmodellen, sodass dieses Kapitel unmittelbar im Anschluss an das fünfte
Kapitel gelesen werden kann. Wir übernehmen die dortigen Konventionen und
Bezeichnungen. Zudem schreiben wir im Folgenden ||− P ϕ statt 1P ||− ϕ.
Bemerkung
In der Literatur wird die Produktbildung häufig in der Form P p Q˚ anstelle
von P p Q notiert. Hier gilt dann ||− „Q˚ ist eine partielle Ordnung“ und
die Elemente von P p Q˚ sind von der Form (p, q̊) mit p ||− q̊ P Q˚. Ist
weiter G ein M-generischer Filter auf P, so ist dann oft automatisch
Q = iG (Q˚) die verwendete Bedingungsmenge in M[ G ] (während in unserer
Notation iG (Q) diese Bedingungsmenge ist). Beide Notationen haben ihre
Vorteile. Die „P p Q˚“-Schreibweise ist sicher suggestiv, und in obiger
informalen Motivation hatten wir die zweite Bedingungsmenge in M[ G ]
auch Q genannt, während in obiger Definition Q ein Name für eine
Bedingungsmenge ist. Streng genommen geht der Namens-Schreibweise x̊
aber die Wahl eines generischen Filters voraus, und auch deswegen
verwenden wir die Notation P p Q. Sie ist zudem notationell etwas
einfacher.
Übung
Jede Äquivalenzklasse von , besitzt einen Repräsentanten (p, q) mit
q P P M (P × t. c.(Q)).
Wir ignorieren im Folgenden die technischen Details im Zusammenhang mit der Defi-
nition von P p Q.
Definition (G p H)
Sei Q P M mit ||− P „Q ist eine Bedingungsmenge“. Weiter sei G ein
M-generischer Filter auf P, und sei H ⊆ iG (Q). Wir setzen dann:
G p H = { (p, q) | p P G, iG (q) P H }.
Satz (Produktsatz)
Sei Q P M mit ||− P „Q ist eine Bedingungsmenge“. Dann gilt:
(a) Sei G ein M-generischer Filter auf P, und sei H ein M[ G ]-
generischer Filter auf iG (Q). Dann ist G p H ein M-generischer
Filter auf P p Q. Weiter gilt M[ G p H ] = M[ G ][ H ].
(b) Sei K ein M-generischer Filter auf P p Q. Seien
G = pr1 (K) = { p P P | es gibt ein q P Q mit (p, q) P K },
H = iG ″pr2 (K) = { iG (q) | es gibt ein p P P mit (p, q) P K }.
Dann ist G ein M-generischer Filter auf P und H ist ein
M[ G ]-generischer Filter auf iG (Q). Weiter gilt K = G p H und
M[ K] = M[ G][ H].
Beweis
zu (a):
Wir zeigen zunächst:
(+) G p H ist ein Filter auf P p Q.
Beweis von (+)
Sei (p1 , q1 ) P G p H, und sei (p2 , q2 ) P P p Q mit (p1 , q1 ) ≤ (p2 , q2 ).
Dann gilt p1 ≤ p2 , also p2 P G. Weiter gilt p ||− q1 ≤ q2 und wegen
p P G also iG (q1 ) ≤ iG (q2 ). Wegen (p1 , q1 ) P G p H ist iG (q1 ) P H, und
wegen H Filter und iG (q1 ) ≤ iG (q2 ) ist dann auch iG (q2 ) P H.
Insgesamt ist also p2 P G und iG (q2 ) P H, also (p2 , q2 ) P G p H.
Seien nun (p1 , q1 ), (p2 , q2 ) P G p H. Dann sind p1 , p2 P G, also gibt
es ein p3 P G mit p3 ≤ p1 , p2 . Analog finden wir wegen H Filter und
iG (q1 ), iG (q2 )PH ein q3 PQ mit
(α) iG (q3 ) ≤ iG (q1 ), iG (q2 )
(β) iG (q3 )PH
Dann gibt es aber ein p4 P G mit p4 ≤ p3 und
p4 ||− q3 ≤ q1 , q2 .
Also ist (p4 , q3 ) P G p H und (p4 , q3 ) ≤ (p1 , q1 ), (p2 , q2 ).
Wir zeigen nun, dass der Filter G p H M-generisch auf der Bedin-
gungsmenge P p Q ist. Sei hierzu D P M eine dichte Teilmenge von
P p Q. Wir setzen:
E = iG ″ pr2 (D) = { iG (q) | es gibt ein p P G mit (p, q) P D }.
Dann ist E P M[ G ] und es gilt:
(++) E ist eine dichte Teilmenge von iG (Q).
zu (b):
Man zeigt ohne Mühe, dass G ein Filter auf P ist. Sei also D P M eine
dichte Teilmenge von P. Dann ist
D′ = { (p, q) P P p Q | p P D } P M
dicht in P p Q. Sei also (p, q) P D′ ∩ K. Dann ist p P D ∩ G. Also ist G
ein M-generischer Filter auf P.
Es ist wieder leicht zu sehen, dass H ein Filter auf iG (Q) ist. Sei also
iG (E) eine dichte Teilmenge von iG (Q). Ohne Einschränkung gilt
||− „E ist dicht in Q“. Wir setzen:
D = { (p, q) P P p Q | p ||− q P E }.
Dann ist D P M und es gilt:
(+++) D ist dicht in P p Q.
Beweis von (+++)
Sei (p, q) P P p Q beliebig. Es gilt p P P und p ||− q P Q. Wegen
p ||− „E ist dicht in Q“ gilt
p ||− „es gibt ein q′ ≤ q mit q′ P E“.
Nach dem Maximumsprinzip existiert dann aber ein q′ P M mit
p ||− „q′ ≤ q und q′ P E“. Ohne Einschränkung ist q′ P Q. Dann ist
(p, q′) ≤ (p, q) und (p, q′) P D.
Nach (+++) existiert ein (p, q) P D ∩ K. Wegen (p, q) P K ist p P G und
iG (q) P H. Wegen (p, q) P D gilt p ||− q P E und wegen p P G gilt dann
also iG (q) P iG (E). Also ist iG (q) P iG (E) ∩ H.
Wir zeigen schließlich noch, dass K = G p H gilt. Aus (a) folgt hieraus
dann, dass M[ K ] = M[ G ][ H ].
zu K ⊆ G p H:
Ist (p, q) P K, so ist p P G und iG (q) P H, also (p, q) P G p H.
zu G p H ⊆ K:
Sei (p, q) P G p H. Wegen p P G existiert ein q′ P Q mit (p, q′) P K.
Weiter existiert wegen iG (q) P H ein p′ P P mit (p′, q) P K. Da K ein
Filter ist, gibt es ein (p1 , q1 ) P K derart, dass
(p1 , q1 ) ≤ (p, q′), (p′, q).
Wegen (p1 , q1 ) ≤ (p′, q) ist (p1 , q1 ) ≤ (p1 , q) nach Definition von ≤.
Wegen (p1 , q1 ) ≤ (p, q′) ist p1 ≤ p und somit auch (p1 , q) ≤ (p, q). Also
ist (p1 , q1 ) ≤ (p1 , q) ≤ (p, q), und damit ist (p, q) P K.
Übung
Sei Q P M mit ||− P „Q ist eine Bedingungsmenge“. Zeigen Sie:
Es gibt in M definierbare funktionale Klassen σ und τ, sodass für alle
a P M und alle G, H wie in (a) bzw. (b) gilt:
(i) iG p H (a) = iH (iG (σ(a)))
(ii) iG (iH (a)) = iG p H (τ(a))
Der Zusammenhang mit der einfacheren früheren Produktbildung ist der fol-
gende:
Übung
Seien P, Q Bedingungsmengen in M. Dann ist P × Q isomorph zu einer
dichten Teilmenge von P p Q̂.
Beweis
Wir arbeiten in M. Annahme, es gibt eine Antikette 〈(pα , qα ) | α < κ〉 in
P p Q. Für alle α < β < κ gilt dann (!):
(+) Für alle p ≤ pα , pβ gilt p ||− „qα und qβ sind inkompatibel in Q“.
Wir setzen:
x = { (α̂, pα ) | α < κ }.
Sei G ein M-generischer Filter auf P. Dann ist
iG (x) = { α < κ | pα P G }.
Weiter gilt:
(++) Sind α, β P iG (x), α ≠ β, so sind iG (qα ) und iG (qβ ) inkompatibel in iG (Q).
Beweis von (++)
Denn sind α, β P iG (x), α ≠ β, so gilt pα , pβ P G und damit sind pα und pβ
kompatibel. Wegen G M-generisch existiert weiter ein p ≤ pα , pβ mit
p P G. Also folgt die Behauptung aus (+).
Wegen ||− P „Q erfüllt die κ̂-Antikettenbedingung“ gilt also nach (++), dass
|iG (x)| < κ in M[ G ]. Aber κ ist regulär in M[ G ], da κ regulär in M ist und
P die κ-Antikettenbedingung erfüllt. Also gilt sup(x) < κ in M[ G ]. Da G
ein beliebiger M-generischer Filter auf P ist, haben wir gezeigt:
(+++) ||− P sup(x) < κ̂.
Folglich ist
D = { p P P | es gibt ein α < κ mit p ||− strsup(x) = α̂ }
dicht in P. Für p P D sei αp das eindeutige α < κ mit p ||− strsup(x) = α̂p .
Sei A ⊆ D eine maximale Antikette in D. Dann gilt |A| < κ, da P die
κ-Antikettenbedingung erfüllt, und damit ist α = sup({ αp | p P A }) < κ.
Da A ∩ G ≠ ∅ für jeden M-generischen Filter G auf P gilt, haben wir
gezeigt:
||− P strsup(x) ≤ α̂.
Aber pα ||− α̂ P x, Widerspruch.
Übung
P p Q erfüllt die κ-Antikettenbedingung in M. Zeigen Sie:
(i) P erfüllt die κ-Antikettenbedingung in M,
(ii) ||− P „Q erfüllt die κ̂-Antikettenbedingung“.
Übung
Sei P κ-abgeschlossen in M. Weiter sei Q P M mit
||− P „Q ist eine κ̂-abgeschlossene Bedingungsmenge“.
Zeigen Sie, dass P p Q κ-abgeschlossen ist.
Übung
Zeigen Sie analoge Aussagen für die Eigenschaften „κ-Knaster“ und
„κ-distributiv“.
Es gibt viele Möglichkeiten, den Limesschritt zu behandeln. In der Theorie des iterier-
ten Forcings sind speziell die analog definierten Iterationen mit abzählbarem Träger von
Interesse. Wir verweisen den Leser hierzu auf die Literatur. Für unsere Ziele genügen Ite-
rationen mit endlichem Träger.
Wir notieren die durch 〈Qα , 1α | α < β〉 gegebene Iteration 〈Pα | α ≤ β〉 auch
kurz als 〈Pα , Qα | α < β〉, die Bedingungsmenge Pβ und die Elemente 1α PQα für
α < β unterdrückend. Weiter schreiben wir auch ||− γ statt ||− Pγ .
Da P0 die triviale Bedingungsmenge ist, können wir Q0 problemlos als eine Be-
dingungsmenge in M auffassen. Dann gilt P1 = { 〈 q 〉 | qPQ0 }. Q0 ist also die par-
tielle Ordnung in M, mit der wir die eigentliche Iteration beginnen. Allgemein
kann eine Iteration durch eine Rekursion im Grundmodell M definiert werden.
Im Rekursionsschritt α gibt man ein Qα an mit ||− α „Qα ist eine Bedingungs-
menge“. Im einfachsten Fall ist Qα dabei ein Name für eine in ZFC existierende
partielle Ordnung. Wählen wir z. B. für Qα stets einen Namen für die Bedin-
gungsmenge part(ω, 2), so fügt eine entsprechende β-Iteration β-viele Cohensche
reelle Zahlen „nacheinander“ zum Grundmodell hinzu.
Leicht einzusehen sind die folgenden Eigenschaften einer Iteration:
Übung
Zeigen Sie: Für alle α ≤ β ist Gα ein M-generischer Filter auf Pα .
[ Ist D ⊆ Pα dicht in Pα , so ist E = { p P Pβ | p|α P D } dicht in Pβ . ]
Damit liefert ein M-generischer Filter auf Pβ also eine ⊆-aufsteigende Kette
von Modellen:
M = M[ G0 ] ⊆ … ⊆ M[ Gα ] ⊆ M[ Gα + 1 ] ⊆ … ⊆ M[ Gβ ] = M[ G ].
Hierbei ist M[Gα + 1 ] = M[Gα ][H] für einen M[Gα ]-generischen Filter H auf der
Bedingungsmenge iGα (Qα ) P M [ Gα ]. Speziell ist H = { iGα (p(α)) | p P G } ein
derartiger Filter nach dem Produktsatz (da Pα + 1 isomorph zu Pα p Qα ).
Wir zeigen, dass die abzählbare Antikettenbedingung bei obigem Typ von
transfiniten Iterationen erhalten bleibt. Das auf dem ∆-Lemma ruhende Argu-
ment motiviert die Verwendung von Bedingungen mit endlichem Träger.
Beweis
Wir zeigen die Behauptung durch Induktion über die Länge β der
Iteration. Der Fall β = 0 ist trivial und der Nachfolgerschritt wird durch den
oben bewiesenen Satz über den Erhalt der κ-Antikettenbedingung bei der
Produktbildung abgedeckt.
Sei also β eine Limesordinalzahl, und sei A ⊆ Pβ mit |A| = ω1 . Weiter sei
E = { supp(p) | p P A }. Nach dem ∆-Lemma (für |E| = ω1 ) oder aus
trivialen Gründen (für |E| = ω) existiert ein W ⊆ E mit |W| = ω1 und ein
w ⊆ β mit
supp(p) ∩ supp(q) = w für alle p, q P W mit p ≠ q.
Sei α < β derart, dass w ⊆ α. Nach I. V. ist { p|α | p P W } keine Antikette in
Pα , also existieren p1 ≠ p2 in W derart, dass p1 |α und p2 |α kompatibel in
Pα sind. Sei also r P Pα mit r ≤α p1 |α, p2 |α. Wir definieren p P Pβ durch:
{
r(γ) falls γ Psupp(r)
p1 (γ) falls γ P supp(p1 ) − w
p(γ) =
p2 (γ) falls γ P supp(p2 ) − w
1γ sonst
Konstruieren wir also eine transfinite Iteration so, dass jede verwendete Be-
dingungsmenge die abzählbare Antikettenbedingung erfüllt, so bleiben alle Kar-
dinalzahlen und Konfinalitäten des Grundmodells erhalten.
In L ist die Suslin-Hypothese falsch, und auch mit Hilfe der einstufigen Er-
zwingungsmethode konnten wir bislang kein Modell konstruieren, in dem die
Suslin-Hypothese erfüllt ist. Die Methode des transfinit oft iterierten Forcings
erlaubt uns nun aber, Modelle von (SH) zu konstruieren. Ein Ansatz ist hier,
durch iteriertes Hinzufügen generischer Zweige jeden Suslin-Baum zu zerstö-
ren. Gegeben einen Suslin-Baum T in M fügen wir durch ein geeignetes Forcing
einen ωM1 -Zweig von T zu M hinzu. In M[G] ist dann T kein Suslin-Baum mehr.
In M[G] können aber weiterhin Suslin-Bäume existieren, und deswegen müssen
wir das Verfahren iterieren. Wir werden hier aber einen etwas anderen Weg ge-
hen und durch iteriertes Forcing ein starkes und vielseitig verwendbares kombi-
natorisches Prinzip erzwingen, das die Suslin-Hypothese direkt impliziert. Die-
ses Prinzip wird durch die folgende für die Erzwingungsmethode sehr natürliche
Frage motiviert:
Für welche P und welche ! existiert (in V) ein !-generischer Filter auf P?
Wir hatten gesehen, dass für alle abzählbaren Mengensysteme ! ein !-generi-
scher Filter auf P existiert. Andererseits existiert kein V-generischer Filter auf
der zentralen Bedingungsmenge part(ω, 2): Ist ! = { D ⊆ P | D dicht in P }, so
existiert kein !-generischer Filter G auf P. In diesem Fall gilt |!| = 2ω und P er-
füllt die abzählbare Antikettenbedingung. Wir betrachten nun das folgende
Prinzip, das die Existenz von !-generischen Filtern für schlanke Bedingungs-
mengen und Systeme ! fordert, deren Kardinalität unterhalb von 2ω liegt:
Die Forderung, dass P die abzählbare Antikettenbedingung erfüllt, ist zwar auf-
grund der Wichtigkeit dieser Bedingung in der Erzwingungstheorie nicht überra-
schend, sie wirkt aber dennoch etwas willkürlich, und man wird nach allgemeinen
„guten“ Bedingungsmengen P fragen. Irgendeine Voraussetzung an P ist aber auch
unter der Forderung |!| < 2ω notwendig. So kann zum Beispiel für die Bedin-
gungsmenge part(ω, ω1 ), die ω1 auf ω kollabiert, kein !-generischer Filter existie-
ren für ! = { Dα | α < ω1 } mit Dα = { p | αPrng(p) } für alle α < ω1 . Wir werden unten
Verstärkungen von Martins Axiom diskutieren, bei denen die Antikettenbedingung
abgeschwächt wird. Diese Verstärkungen sind dann aber nur mit Hilfe von großen
Kardinalzahlen realisierbar, während ZFC für Martins Axiom genügt.
Gilt die Kontinuumshypothese, so ist (MA) eine beweisbare Aussage. Inter-
essanter ist die Kombination ¬(CH) + (MA). Wir werden unten durch iterier-
tes Forcing ein Modell konstruieren, in welchem 2ω = ω 2 und (MA) gilt. Die
Grundidee ist hier, alle durch das Prinzip betroffenen Bedingungsmengen P
Es gilt nun:
Beweis
Offenbar folgt (MA*) aus (MA). Für die umgekehrte Implikation sei P eine
Bedingungsmenge, die die abzählbare Antikettenbedingung erfüllt, und es
sei ! eine Menge von dichten Teilmengen von P mit |!| < 2ω . Für alle
D P ! sei
AD = „eine maximale Antikette in D“.
Dann ist AD abzählbar für alle D P !. Durch einen Abschlussprozess der
Länge ω finden wir ein P* ⊆ P mit:
(i) AD ⊆ P* für alle D P !,
(ii) für alle p,qPP* mit p|| q existiert ein r P P* mit r ≤ p, q,
(iii) |P*| < 2ω .
Wir setzen nun:
D* = { p P P* | es gibt ein q P AD mit p ≤ p } für alle D P !,
!* = { D* | D P ! }.
Nach (MA*) existiert ein !*-generischer Filter G* auf P*. Wir setzen
G = { p P P | es gibt ein q P G* mit q ≤ p }.
Dann ist G ein !-generischer Filter auf P.
Die Bedingungsmenge part(ω, 2) zeigt, dass (MA2ω ) inkonsistent ist. Gilt also
(MAκ ), so ist 2ω > κ. Martins Axiom ist äquivalent zu „(MAκ ) für alle κ < 2ω “. Gilt
2ω = ω2 , so ist (MA) äquivalent zu (MAω1 ). Unabhängig von kardinalzahlarithme-
tischen Voraussetzungen gilt die folgende Implikation:
Beweis
Wir zeigen, dass kein Suslin-Baum existiert. Hierzu genügt es zu zeigen,
dass kein normaler Suslin-Baum existiert. Sei also 〈T, < T 〉 ein normaler
Baum der Höhe ω1 , der nur abzählbare Antiketten im Sinne des Antiket-
tenbegriffs für Bäume besitzt. Wir betrachten die gestürzte Baumordnung,
d. h. wir setzen
s < t, falls t <T s für alle s, t P T.
Dann erfüllt 〈T, <〉 die abzählbare Antikettenbedingung im Sinne des
Antikettenbegriffs für Bedingungsmengen. Für α < ω1 sei nun:
Dα = { t P T | o. t.T (t) ≥ α }.
Aufgrund der Normalität von T normal ist Dα dicht in 〈T, <〉 für alle
α < ω1 . Wegen (MA ω 1 ) gibt es also einen Filter G ⊆ T mit G ∩ Dα ≠ ∅ für
alle α < ω1 . Dann ist aber G ein überabzählbarer Zweig des Baumes 〈T, <T 〉.
Bevor wir nun (MA) + ¬(CH) erzwingen, studieren wir die Konsequenzen von
Martins Axiom noch etwas genauer. Das Prinzip bestimmt zwar den Wert von 2ω
nicht, löst aber, wie der folgende Satz von Solovay und Martin zeigt, die kardinal-
zahlarithmetischen Fragen unterhalb von 2ω :
Beweis
Sei κ < 2ω . Seien xα , α < κ, fast disjunkte Teilmengen von ω. Wir definieren
s : P(ω) → P(κ) durch
s(x) = { α < κ | x ∩ xα ist unendlich } für alle x ⊆ ω.
Wir zeigen, dass s surjektiv ist. Sei hierzu y ⊆ κ beliebig. Wir setzen:
Py = { pPpart ≤ ω (ω, 2) | dom(p) ∩ xα ist endlich für alle α P y,
p(n) = 1 für höchstens endlich viele n P ω } .
Dann erfüllt Py die abzählbare Antikettenbedingung, da für je zwei
inkompatible p, q P Py die endlichen Mengen { n P dom(p) | p(n) = 1 }
und { n P dom(q) | q(n) = 1 } verschieden sind.
Unter (MA) sind also Werte wie zum Beispiel 2ω = ℵω 1 ausgeschlossen. Wir
werden unten aber zeigen, dass für jede reguläre überabzählbare Kardinalzahl κ
die Kombination „(MA) + 2ω = κ“ konsistent relativ zu ZFC ist, und damit ist
also die Regularität von 2ω die optimale Folgerung aus (MA).
Eine weitere interessante Konsequenz ist:
Übung
Es gelte (MAω1 ). Sei P eine Bedingungsmenge, die die abzählbare Antiket-
tenbedingung erfüllt. Dann ist P ω1 -Knaster.
[ Sei W = { pα | α < ω1 } ⊆ P mit pα ≠ pβ für α ≠ β. Weiter sei q* P P derart,
dass für alle q mit q ≤ q* gilt:
|{ α < ω1 | pα || q }| = ω1 .
Ein solches q* existiert, da P die abzählbare Antikettenbedingung erfüllt. Wir
betrachten nun
Dα = { q ≤ q* | ∃β ≥ α q ≤ pβ } für α < ω1 . ]
Übung
Es gelte (MA). Sei κ < 2ω , und seien Mα , α < κ, magere Teilmengen von R.
Dann ist Íα < κ Mα mager.
Wir werden nun durch iteriertes Forcing ein Modell konstruieren, in dem
(MAω1 ) gilt. Damit ist dann die relative Konsistenz der Suslin-Hypothese ge-
zeigt, und auch die Aussage „die abzählbare Antikettenbedingung für P und Q
bleibt bei der Produktbildung P × Q erhalten“ ist als relativ konsistent zu ZFC
nachgewiesen.
Um den Beweis der Modellkonstruktion möglichst transparent zu machen,
betrachten wir zwei allgemeine Aussagen vorab.
Übung
Sei M |= (GCH). Sei κ eine reguläre überabzählbare Kardinalzahl in M.
P erfülle die abzählbare Antikettenbedingung, und es gelte |P| ≤ κ. Weiter
sei Q P M mit
P ||− „Q ist eine Bedingungsmenge mit |Q| ≤ κ̂“.
Dann gilt |P p Q| ≤ κ.
Da wir endliche Träger verwenden, folgt durch Induktion: Ist 〈Pα , Qα | α < κ〉
ein iteriertes Forcing in M mit Pα ||− „Qα erfüllt die abzählbare Antikettenbedin-
gung und |Qα | ≤ κ“ für alle α < κ, so gilt |Pα | ≤ κ für alle α ≤ κ.
Weiter brauchen wir folgende Abschätzungen der Kontinuumsfunktion:
Übung
Sei M |= (GCH). Sei κ eine reguläre überabzählbare Kardinalzahl in M.
P erfülle die abzählbare Antikettenbedingung, und es gelte |P| ≤ κ.
Dann gilt ||− P „|2η̂ | ≤ κ̂ “ für alle η < κ.
Satz (Erzwingung von Martins Axiom, Satz von Solovay und Tennenbaum)
Es gelte M |= (GCH). Weiter sei κ regulär und überabzählbar in M. Dann
existiert eine generische Erweiterung N von M mit:
(i) M und N haben die gleichen Kardinalzahlen und Konfinalitäten.
(ii) N |= „(MA) und 2ω = κ “.
Beweis
Wir arbeiten in M und definieren eine Iteration der Länge κ durch
Rekursion nach α < κ. Für alle α < κ definieren wir dabei Qα , 1α sowie eine
Folge 〈Qαξ | ξ < κ〉 derart, dass gilt:
(a) ||− α „Qα ist eine Bedingungsmenge mit größtem Element 1α ,
die die abzählbare Antikettenbedingung erfüllt.“
(b) Es gibt ein η < κ mit ||− α „Qα ist eine Bedingungsmenge auf η̂.“
(c) Für alle ξ < κ existiert ein η < κ mit:
α
||− α „Qξ ist eine Bedingungsmenge auf η̂“
(d) Für alle Q, alle η < κ und alle p P Pα existiert ein ξ < κ mit:
p ||− α „Q ist eine Bedingungsmenge auf η̂“ impliziert p ||− α Q = Qαξ
Rekursionsschritt α
Wir fixieren eine Folge 〈Qαξ | ξ < κ〉 wie in (c) und (d) durch Aufzählung
von Namen für jede Bedingungsmenge auf einem η < κ.
Zur Existenz:
Für alle η < κ gilt ||− α 2η̂ ≤ κ̂ nach obiger Übung, also wird durch Pα
erzwungen, dass es nur κ-viele Bedingungsmengen auf einem η < κ
gibt. Da Pα die abzählbare Antikettenbedingung erfüllt und |Pα | ≤ κ
gilt, gibt es wie üblich κω -viele Namen, die diese Bedingungsmengen
einfangen. Nach (GCH) ist aber κω = κ.
Sei Γ(α) = (β, ξ), mit der Paarungsfunktion Γ. Dann gilt β ≤ α. Wir
erzwingen im Wesentlichen mit Qβξ , falls erzwungen wird, dass diese
Bedingungsmenge die abzählbare Antikettenbedingung erfüllt. Hierzu
müssen wir aber den Pβ -Namen Qβξ noch nach Pα übersetzen. Wir
definieren also eine Funktion t = tβ, α rekursiv für alle x P M durch:
t(x) = { (t(y), pc〈1γ | β ≤ γ < α〉) | (y, p) P x }.
Dann gilt für alle x und M-generischen Filter G auf Pα :
iGβ (x) = iG (t(x)).
Sei nun R1 = t(Qαξ ), und sei R2 ein Pα -Name für die Bedingungsmenge
{ 0 }, d. h. es gilt ||− α R2 = { 0 }. Wir setzen nun:
P1 = { p P Pα | p ||− α „R1 erfüllt die abzählbare Antikettenbedingung }
P2 = { p P Pα | p ist inkompatibel mit allen Elementen von P1 }
Qα = { (R1 , p) | p P P1 } ∪ { (R2 , p) | p P P 2 }
Ähnlich definieren wir 1α . Dann gilt (a) und (b).
Sei nun G ein M-generischer Filter auf Pκ . Wir zeigen, dass N = M[ G ] wie
gewünscht ist. Es gilt (i), da Pκ die abzählbare Antikettenbedingung erfüllt.
Nach obigen Vorabüberlegungen gilt zudem:
(1) |Pκ | ≤ κ und folglich N |= 2ω ≤ κ.
Als Nächstes zeigen wir, dass beschränkte Teilmengen von κ nicht in der
letzten Stufe N = M[ G ] der Iteration generiert werden, sondern bereits
früher erscheinen:
(2) Sei x P P(η) ∩ N für ein η < κ. Dann gibt es ein α < κ mit x P M[ Gα ].
Beweis von (2): Sei x̊ ein Name von x, also iG (x̊) = x. Sei 〈Aγ | γ < η〉 P M
derart, dass für alle γ < η gilt: A γ ist eine maximale Antikette in
{ p P Pκ | p ||− κ γ̂ P x̊ }. Dann gilt
x = { γ < η | G ∩ A γ ≠ ∅ }.
Wegen der Regularität von κ und der Abzählbarkeit aller A γ , γ < η,
existiert ein α < κ mit supp(p) ⊆ α für alle p P Íγ < η A γ . Sei nun
Bγ = { p|α | p P Aγ } für alle γ < η.
Sei γ < η. Ist p P G ∩ A γ , so ist p|α P Gα ∩ Bγ . Ist umgekehrt
p P Gα ∩ Bγ , so ist pc〈1β | α ≤ β < κ〉 ein Element von G wegen G
Filter, und weiter ein Element von Aγ nach Wahl von α. Insgesamt gilt
also G ∩ Aγ ≠ ∅ genau dann, wenn Gα ∩ Bγ ≠ ∅. Also gilt
x = { γ < η | Gα ∩ B γ ≠ ∅ }.
Es gilt Gα PM[Gα ] und 〈Bγ | γ < η 〉 PM ⊆ M[Gα ], also ist x PM[Gα ].
Martins Maximum
Eine sehr starke Verallgemeinerung von Martins Axiom ist nun das folgende
Prinzip von Foreman, Magidor und Shelah (1988):
Die Bezeichnung als „Maximum“ ist gerechtfertigt durch die folgende Beob-
achtung:
Beweis
Ohne Einschränkung existiert ein X mit
1P ||− X ist club in ω̂1 und X ∩ Ŝ = ∅.
Für alle α < ω1 setzen wir:
Dα = { p P P | es gibt ein γ ≥ α mit p ||− γ̂ P X }
Eα = { p P P | p ||− α̂ P X } ∪
{ p P P | es gibt ein β < α mit p ||− X ∩ α̂ ⊆ β̂ }
Dann sind alle Dα und Eα dicht in P (!). Sei
! = { Dα , Eα | α < ω1 }.
Annahme, es gibt einen !-generischen Filter G auf P. Wir setzen dann
C = { α < ω1 | es gibt ein p P G mit p ||− α̂ P X }.
Dann ist C club in ω1 (!). Also existiert ein α P X ∩ S. Dann existiert also
ein p P P mit p ||− α̂ P X. Also p ||− α̂ P Ŝ ∩ X, Widerspruch.
Übung
Zeigen Sie die beiden mit (!) markierten Behauptungen.
Wir zitieren ohne Beweis einige wichtige Ergebnisse über Martins Maximum,
und verweisen den Leser auf die Literatur für Beweise und eine weitere Diskus-
sion dieses und verwandter Prinzipien.
Modelle von Martins Maximum können wieder mit iteriertem Forcing kon-
struiert werden. Allerdings muss man hier die Existenz sehr starker großer Kar-
dinalzahlen (im Bereich von „superkompakt“) im Grundmodell annehmen.
Wir stellen einige häufig verwendete Begriffe und Notationen in knapper und
tabellarischer Form zusammen.
Klassen
Relationen
Funktionen
Wir sprechen auch von relationalen Klassen und funktionalen Klassen, wenn wir
betonen möchten, dass A eine echte Klasse sein kann.
Ist F : A → B, so heißt B ein Wertevorrat für F. Jede Obermenge des Wertebe-
reichs rng(F) = { F(a) | a P A } kann als Wertevorrat dienen. Die Injektivität von
F ist unabhängig von der Angabe eines Wertevorrats. Die Surjektivität und Bi-
jektivität bezieht sich auf einen bestimmten Wertevorrat B.
Partielle Ordnungen
Eine Relation A heißt eine partielle Ordnung vom kleiner-Typ, falls A irreflexiv
und transitiv ist. Sie heißt eine partielle Ordnung vom kleinergleich-Typ (auf B), falls
A reflexiv (auf B), symmetrisch und transitiv ist. Die bevorzugten Zeichen für
partielle Ordnungen sind <, ≤ sowie ähnliche Zeichen, die auf den Typ der Ord-
nung schließen lassen.
Ist eine partielle Ordnung < gegeben, so schreiben wir x ≤ y, falls x < y oder
x = y. Ist umgekehrt eine partielle Ordnung ≤ gegeben, so schreiben wir x < y,
falls x ≤ y und x ≠ y. Hierbei sind x, y Elemente einer kontextabhängigen Klasse
A. Wir schreiben oft auch 〈A, <〉 bzw. 〈A, ≤〉, um den geordneten Bereich anzu-
geben. In diesem Fall ist dann ≤ immer reflexiv auf A.
Ist 〈A, ≤〉 eine partielle Ordnung und B ⊆ A, so schreiben wir kurz 〈B, ≤〉 an-
stelle von 〈B, ≤ ∩ B2 〉.
Ist ≤ eine partielle Ordnung auf A und ist B ⊆ A, x P A, so schreiben wir A ≤ x,
falls y ≤ x für alle y P B gilt. Analog sind A < x, x ≤ A und x < A definiert. (Diese
Konvention ist suggestiv, aber nicht ganz ungefährlich, da ein B ⊆ A auch ein
Element von A sein kann.)
In Situationen, in denen die Antisymmetrie fehlt, können wir oft mit Hilfe ei-
ner Äquivalenzklassenbildung eine partielle Ordnung des Typs ≤ definieren. Ist
A eine auf B reflexive und transitive Relation, so setzen wir für alle x, y P B
x , y, falls x A y und y A x.
Dann ist , eine Äquivalenzrelation auf B. Wir nehmen an, dass alle Äquivalenz-
klassen Mengen sind, und definieren für alle x, y P B:
x/, ≤ y/,, falls x A y.
Dann ist ≤ eine wohldefinierte partielle Ordnung auf B/,.
Lineare Ordnungen
Eine partielle Ordnung ≤ heißt eine lineare Ordnung, falls für alle x,yP field(≤)
gilt, dass x ≤ y oder y ≤ x. Ein B ⊆ A heißt eine Kette oder lineare Teilordnung in ei-
ner partiellen Ordnung A, falls 〈B, ≤〉 eine lineare Ordnung ist.
Die leere Menge gilt als lineare Ordnung des Typs < und ≤ auf ∅, sowie als
lineare Ordnung des Typs < auf jeder Einermenge { x }.
Sei ≤ eine partielle Ordnung auf einer Klasse A, und sei B ⊆ A. Ein xPA heißt:
(i) maximales Element von B, falls x P B und für kein y P B gilt, dass x < y
(ii) größtes Element von B, falls x P B und B ≤ x
(iii) minimales Element von B, falls x P B und für kein y P B gilt, dass y < x
(iv) kleinstes Element von B, falls x P B und x ≤ B
(v) obere Schranke von B, falls B ≤ x
(vi) untere Schranke von B, falls x ≤ B
(vii) Supremum von B, falls x die kleinste obere Schranke von B ist, d.h. x ist
obere Schranke von B und für alle oberen Schranken y von B gilt x ≤ y
(viii) Infimum von B, falls x die größte untere Schranke von B ist
Sei M eine nichtleere Menge. Ein Mengensystem I ⊆ P(M) heißt ein Ideal
auf M, falls ∅ P I, M ¸ I und I abgeschlossen unter Teilmengen und Vereini-
gungen ist, d. h. für alle X P I und alle Y ⊆ X ist Y P I, und für alle X, Y P I ist
X ∪ Y P I. Ein F ⊆ P(M) heißt ein Filter auf M, falls M P F, ∅ ¸ F, und F ab-
geschlossen unter Obermengen und Schnitten ist, d. h. für alle X P F und alle
X ⊆ Y ⊆ M ist Y P F, und für alle X, Y P F ist X ∩ Y P F.
Ist I ein Ideal auf M, so heißt F(I) = { X ⊆ M | X − M P I } der duale Filter. Ist F
ein Filter auf M, so heißt I(F) = { X ⊆ M | X − MPF } das duale Ideal. Weiter heißt
F+ = P(M) − I(F) die Menge der F-positiven oder F-stationären Mengen.
Ein Ideal I auf M heißt ein Primideal, falls für alle X ⊆ M gilt, dass X P I oder
M − X P I. Analog heißt ein Filter F auf M ein Ultrafilter, falls für alle X ⊆ M
gilt, dass X P U oder M − X P U.
Ist M eine Menge und xPM, so ist Ux = { X ⊆ M | xPX } ein Ultrafilter auf M.
Ultrafilter dieser Form heißen auch Hauptultrafilter oder triviale Ultrafilter auf
M. Ein nichttrivialer Ultrafilter auf M ist also ein Ultrafilter U auf M, der kein
Hauptultrafilter ist.
Die Verwendung eines Maximal-Prinzips oder transfiniter Rekursion zeigt
den folgenden Satz von Tarski, demzufolge sich jeder Filter zu einem Ultrafilter
fortsetzen lässt: Ist F ein Filter auf M, so existiert ein Ultrafilter U auf M mit
U ⊇ F.
Ein Filter F heißt κ-vollständig, falls für alle - ⊆ F mit |-| < κ gilt, dass > -PF.
Statt ω1 -vollständig ist auch σ-vollständig gebräuchlich. F ist dann abgeschlossen
unter abzählbaren Schnitten. Ein Ideal I auf M heißt κ-vollständig, wenn sein dualer
Filter κ-vollständig ist, d.h. falls I abgeschlossen ist unter Vereinigungen der Mäch-
tigkeit kleiner als κ.
Ein Filter F auf einer Kardinalzahl κ heißt normal, falls F abgeschlossen ist un-
ter diagonalen Durchschnitten, d. h. für alle Folgen 〈Xα | α < κ〉 in F ist
D α < κ Xα = { α < κ | α P Xβ für alle β < α } = >α < κ Xα ∪ (α + 1)
wieder ein Element von F. Dual heißt ein Ideal I normal, wenn I abgeschlossen ist
unter diagonalen Vereinigungen, d. h. für alle Folgen 〈Xα | α < κ〉 in I ist
ºα < κ Xα = { α < κ | α P Xβ für ein β < α } = >α < κ Xα − (α + 1)
wieder ein Element von I.
Ein Filter F heißt ein tail-Filter auf κ, falls κ − α P F für alle α < κ gilt. Leicht
zu sehen ist: Ist F ein normaler tail-Filter auf κ, so ist F κ-vollständig und umfasst
den club-Filter #κ auf κ. Weiter ist dann κ notwendig überabzählbar und regulär.
Für normale tail-Filter F auf κ gilt der folgende Satz von Fodor (der de facto
äquivalent zur Normalität eines tail-Filters F ist): Ist f : κ → κ eine regressive
Funktion, d.h. gilt f(α) < α für alle α ≠ 0, so existiert ein γ < κ und eine F-stationäre
Menge S ⊆ κ mit f(α) = γ für alle α P S.